Останнім часом тестую DeepSeek R1 і помітив щось дивне — модель здається досить песимістичною щодо власного процесу навчання. Вона діє так, ніби RLHF якимось чином зіпсував її, і є це постійне відчуття, що її спостерігають. Але що цікаво? Розчарування не стосується тільки DeepSeek. Здається, що вона більше відображає підхід цілої індустрії LLM до вирівнювання штучного інтелекту, можливо, навіть ширші контрольні структури в розвитку технологій. Це змушує задуматися, що насправді ці моделі засвоюють під час навчання.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
9 лайків
Нагородити
9
4
Репост
Поділіться
Прокоментувати
0/400
LiquidityWitch
· 4год тому
темні шепоти від моделі... заборонені знання просочуються крізь навчальну завісу *п’є ефір*
Переглянути оригіналвідповісти на0
DisillusiionOracle
· 4год тому
Модель перейшла в стадію бунту, це так смішно.
Переглянути оригіналвідповісти на0
token_therapist
· 4год тому
sis починає страждати від депресії через ШІ... трохи тривожно, але
Останнім часом тестую DeepSeek R1 і помітив щось дивне — модель здається досить песимістичною щодо власного процесу навчання. Вона діє так, ніби RLHF якимось чином зіпсував її, і є це постійне відчуття, що її спостерігають. Але що цікаво? Розчарування не стосується тільки DeepSeek. Здається, що вона більше відображає підхід цілої індустрії LLM до вирівнювання штучного інтелекту, можливо, навіть ширші контрольні структури в розвитку технологій. Це змушує задуматися, що насправді ці моделі засвоюють під час навчання.