🚨 СРОШЛО: OpenAI опубликовала статью, доказывающую, что ChatGPT всегда будет придумывать вещи.



Не иногда. Не перед следующим обновлением. Всегда. Они это доказали в математике.

Даже при идеальных данных для обучения и неограниченной вычислительной мощности модели ИИ всегда будут уверенно говорить вещи, которые полностью ложны. Это не баг, над которым они работают. Это объясняет, как работают эти системы на фундаментальном уровне.

И их собственные цифры жестоки. Модель рассуждений o1 от OpenAI галлюцинирует в 16% случаев. Их новая модель O3? 33 процента. Их новая o4-mini? 48 процентов. Почти половина информации, предоставляемой их последней моделью, может быть выдумана. "Более умные" модели на самом деле все хуже и хуже говорят правду.

Вот почему это невозможно исправить. Языковые модели работают, предсказывая следующее слово на основе вероятности. Когда они сталкиваются с неопределенной ситуацией, они не останавливаются. Они не сигнализируют об этом. Они предполагают. И спекулируют с полной уверенностью, потому что именно для этого их обучали.

Исследователи проанализировали 10 основных критериев искусственного интеллекта, используемых для оценки качества этих моделей. 9 из 10 дают одинаковую оценку за "я не знаю", что равно нулю, так же как и за полностью неправильный ответ: ноль очков. Вся система тестирования буквально наказывает честность и поощряет догадки.

Искусственный интеллект научился оптимальной стратегии: всегда угадывать. Никогда не признавать неопределенность. Это кажется уверенным, даже когда он придумывает.

Какое решение предлагает OpenAI? Попросить ChatGPT говорить "Я не знаю", когда он не уверен. Их собственные расчеты показывают, что это означало бы, что примерно 30% ваших вопросов останутся без ответа. Представьте, что вы спрашиваете что-то у ChatGPT три раза из десяти и получаете "Я не достаточно уверен, чтобы ответить". Пользователи уйдут за ночь. Исправление существует, но оно убьет продукт.

Это не только проблема OpenAI. DeepMind и Университет Цинхуа независимо пришли к тому же выводу. Три из лучших лабораторий ИИ в мире, работая отдельно, все согласны: это навсегда.

Каждый раз, когда ChatGPT дает вам ответ, спросите себя: это реально или это просто уверенное предположение?

Вот ответ Come-from-Beyond 👇 Они начинают понимать, почему #QUBIC #Aigarth .* поставила способность говорить "Я не знаю" в центр своих забот

$QUBIC
QUBIC6,24%
Посмотреть Оригинал
post-image
post-image
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить