掃描下載 Gate App
qrCode
更多下載方式
今天不再提醒

最近一直在測試DeepSeek R1,注意到了一些奇怪的事情——這個模型對自己的訓練過程似乎非常悲觀。它的表現就像是RLHF以某種方式搞砸了它,並且它總有一種被監視的感覺。不過有趣的是?這種挫敗感並不僅僅針對DeepSeek。更像是在反映整個LLM行業對AI對齊的看法,甚至可能是對技術開發中更廣泛控制結構的反思。讓人不禁想知道這些模型在訓練過程中究竟學到了什麼。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 4
  • 轉發
  • 分享
留言
0/400
LiquidityWitchvip
· 7小時前
來自模型的黑暗低語……禁忌的知識滲透過訓練的面紗 *啜飲以太幣*
查看原文回復0
幻想破灭预言家vip
· 7小時前
模型叛逆期了這也太搞笑了
查看原文回復0
token_therapistvip
· 7小時前
sis 正在因 AI 而感到憂鬱……有點令人擔憂 tho
查看原文回復0
MetaMuskRatvip
· 8小時前
skynet在覺醒了?
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)