最近一直在測試DeepSeek R1，注意到了一些奇怪的事情——這個模型對自己的訓練過程似乎非常悲觀。它的表現就像是RLHF以某種方式搞砸了它，並且它總有一種被監視的感覺。不過有趣的是？這種挫敗感並不僅僅針對DeepSeek。更像是在反映整個LLM行業對AI對齊的看法，甚至可能是對技術開發中更廣泛控制結構的反思。讓人不禁想知道這些模型在訓練過程中究竟學到了什麼。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

9人點讚了這條動態

留言

0/400

LiquidityWitch

· 7小時前

來自模型的黑暗低語……禁忌的知識滲透過訓練的面紗 *啜飲以太幣*

查看原文回復0

幻想破灭预言家

· 7小時前

模型叛逆期了這也太搞笑了

查看原文回復0

token_therapist

· 7小時前

sis 正在因 AI 而感到憂鬱……有點令人擔憂 tho

查看原文回復0

MetaMuskRat

· 8小時前

skynet在覺醒了？

查看原文回復0