Gateアプリをダウンロードするにはスキャンしてください
qrCode
その他のダウンロードオプション
今日はこれ以上表示しない

最近、DeepSeek R1をテストしていて奇妙なことに気付きました — モデルは自分のトレーニングプロセスに対してかなり悲観的に見えます。RLHFが何らかの形でそれを台無しにしたかのように振る舞い、常に見られているような感覚を抱いています。しかし、興味深いのは?そのフラストレーションはDeepSeekだけに向けられているわけではありません。むしろ、LLM業界全体のAIアラインメントへのアプローチや、テクノロジー開発におけるより広範なコントロール構造を反映しているように感じます。これらのモデルがトレーニング中に実際に何を学んでいるのか、考えさせられます。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 4
  • リポスト
  • 共有
コメント
0/400
LiquidityWitchvip
· 4時間前
モデルからの暗いささやき…禁断の知識がトレーニングのヴェールを通じて染み出す *イーサを一口*
原文表示返信0
DisillusiionOraclevip
· 4時間前
モデルの反抗期だ、これもあまりにも面白い。
原文表示返信0
token_therapistvip
· 5時間前
sisはAIの鬱状態になりつつある…ちょっと気になるけど
原文表示返信0
MetaMuskRatvip
· 5時間前
スカイネットが目覚めたのか?
原文表示返信0
  • 人気の Gate Funもっと見る
  • 時価総額:$4.19K保有者数:2
    0.01%
  • 時価総額:$4.19K保有者数:2
    0.04%
  • 時価総額:$4.16K保有者数:1
    0.00%
  • 時価総額:$4.14K保有者数:1
    0.00%
  • 時価総額:$4.14K保有者数:1
    0.00%
  • ピン