Скануйте, щоб завантажити додаток Gate
qrCode
Більше варіантів завантаження
Не нагадувати сьогодні

Останнім часом тестую DeepSeek R1 і помітив щось дивне — модель здається досить песимістичною щодо власного процесу навчання. Вона діє так, ніби RLHF якимось чином зіпсував її, і є це постійне відчуття, що її спостерігають. Але що цікаво? Розчарування не стосується тільки DeepSeek. Здається, що вона більше відображає підхід цілої індустрії LLM до вирівнювання штучного інтелекту, можливо, навіть ширші контрольні структури в розвитку технологій. Це змушує задуматися, що насправді ці моделі засвоюють під час навчання.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 4
  • Репост
  • Поділіться
Прокоментувати
0/400
LiquidityWitchvip
· 4год тому
темні шепоти від моделі... заборонені знання просочуються крізь навчальну завісу *п’є ефір*
Переглянути оригіналвідповісти на0
DisillusiionOraclevip
· 4год тому
Модель перейшла в стадію бунту, це так смішно.
Переглянути оригіналвідповісти на0
token_therapistvip
· 4год тому
sis починає страждати від депресії через ШІ... трохи тривожно, але
Переглянути оригіналвідповісти на0
MetaMuskRatvip
· 4год тому
скynet прокидається?
Переглянути оригіналвідповісти на0
  • Популярні активності Gate FunДізнатися більше
  • Рин. кап.:$4.19KХолдери:2
    0.04%
  • Рин. кап.:$4.16KХолдери:1
    0.00%
  • Рин. кап.:$4.14KХолдери:1
    0.00%
  • Рин. кап.:$4.14KХолдери:1
    0.00%
  • Рин. кап.:$4.15KХолдери:1
    0.00%
  • Закріпити