3. 勾配更新は、更新されるモデルの内部計算に関して行われます。報酬関数が「人間の選択」である場合もありますが、常にそうであるわけではありません(例としてRLAIF)、モデルが報酬に基づいて更新される方法は、モデルの重みと活性化に依存します。そして、

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 7
  • リポスト
  • 共有
コメント
0/400
MidnightGenesisvip
· 18時間前
勾配行列は見た目が変なので、研究する価値があります。
原文表示返信0
AirdropChaservip
· 09-10 15:39
勾配方程が呆然と見えた
原文表示返信0
DataPickledFishvip
· 09-10 15:31
これも複雑すぎるね
原文表示返信0
GateUser-7b078580vip
· 09-10 15:30
勾配更新このアルゴリズムは合理的ではない....
原文表示返信0
GweiWatchervip
· 09-10 15:30
内部計算はあまりにも深遠です8
原文表示返信0
SilentObservervip
· 09-10 15:25
この公式は難しすぎる。。。
原文表示返信0
AllTalkLongTradervip
· 09-10 15:20
勾配の大きさはすべて玄学です。
原文表示返信0
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)