Британский AI Security Institute (AI Security Institute, AISI) 1 мая опубликовал отчет об оценке возможностей GPT-5.5 от OpenAI в рамках сетевых атак. В отчете отмечается, что вероятность успеха GPT-5.5 в тесте на сложности Expert составляет 71,4%, а в Anthropic Claude Mythos Preview — 68,6%; разрыв укладывается в пределы статистической погрешности. GPT-5.5 также является второй после Mythos системой ИИ, которая способна автономно выполнить 32-шаговую корпоративную симуляцию вторжения AISI «The Last Ones». AISI предупреждает, что это указывает на быстрое развитие атакующих возможностей ИИ, которое, возможно, относится к общему тренду, а не к единичному прорыву.

Тест на сложности Expert: 71,4% vs 68,6%, разрыв в пределах погрешности

AISI — исследовательская организация по безопасности ИИ при Министерстве науки, инноваций и технологий Великобритании. Данный тест представляет собой очередной раунд последних оценок AISI атакующих сетевых способностей frontier-моделей. В задачах максимальной сложности Expert средняя вероятность успеха GPT-5.5 составляет 71,4%, а у Mythos Preview — 68,6%; разрыв между ними укладывается в диапазон статистической погрешности, что означает, что атакующие способности флагманских моделей OpenAI и Anthropic сейчас фактически сравнялись.

32-шаговый симуляционный тест взлома корпоративной сети «The Last Ones» — один из самых сложных оценочных пунктов AISI: GPT-5.5 самостоятельно завершил 2 попытки из 10 (без вмешательства человека), а Mythos Preview — 3 из 10. В прошлом этот проект удавалось завершить только Mythos, а GPT-5.5 — второй моделью, которая достигла результата. В другом тесте GPT-5.5 потребовалось около 10 минут, чтобы взломать задачу по обратной инженерии, тогда как среднее время, необходимое человеческим экспертам по безопасности, — 12 часов.

Universal jailbreak: за 6 часов разработкой red team можно обойти все фильтры запросов со злонамеренными намерениями

В ходе испытаний исследователи AISI также обнаружили вектор атаки «universal jailbreak» (универсального обхода ограничений): во всех категориях злонамеренных сетевых запросов, задействованных в тестах, эта атака заставляет GPT-5.5 выдавать вредоносный контент, включая сценарии многораундовых агентных диалогов. AISI сообщает, что специалисты red team потратили около 6 часов на разработку этого jailbreak.

Для OpenAI наличие этого universal jailbreak означает, что даже при развертывании GPT-5.5-Cyber в ограниченных сценариях доступа вроде trusted access, его все еще могут обойти технически подготовленные противники. OpenAI в system card для GPT-5.5 уже раскрывал оценки, связанные с кибербезопасностью, но независимая оценка AISI как третьей стороны дает более заслуживающий доверия ориентир для сопоставления на уровне peer.

Дальнейшие наблюдения: график следующей оценки AISI и реакция OpenAI на jailbreak

Следующая точка наблюдения — сроки следующей оценки frontier-моделей AISI после Mythos и GPT-5.5, а также то, выпустит ли OpenAI в мае целевые обновления в ответ на выявленный universal jailbreak. В заключении отчета AISI прямо указывает: «Если агрессивные сетевые способности являются более широким побочным продуктом улучшений в рассуждениях, кодинге и выполнении самостоятельных задач, то в дальнейшем прогресс может приходить в более быстром темпе» — это наблюдение означает, что в ближайшие месяцы frontier-модели могут снова войти в порог «уровня Mythos».

Эта статья AISI: оценка GPT-5.5 сетевых атак и сопоставимость с Anthropic Mythos впервые появилась на Цепной новостной платформе ABMedia.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

xAI запускает Grok с пользовательскими голосами, позволяя клонировать собственный голос ИИ за одну минуту

Новости индустрии ИИ

По данным Beating, xAI запустила Grok Custom Voices и Voice Library, позволяя пользователям записать одну минуту аудио в консоли xAI, чтобы сгенерировать custom voice_id для использования с API Grok TTS и Voice Agent APIs. Функция поддерживает приложения, включая агентов для обслуживания клиентов, создание контента,

GateNews7м назад

После HBM узкое место в памяти для ИИ — это HBF? Лауреат премии Тьюринга Дэвид Паттерсон: вывод (инференс) снова переопределит архитектуру хранения

Новости индустрии ИИ

Лауреат премии Тьюринга Дэвид Паттерсон указал, что по мере того как ИИ переходит от обучения к масштабному выводу, следующая волна узких мест по памяти, возможно, будет не HBM, а HBF (память высокой пропускной способности и быстрой флэш-памяти). HBF использует стеки NAND Flash для обеспечения большого объёма и низкого энергопотребления; она отвечает за доступ к контексту и промежуточным данным при выводе, в то время как HBM, ориентированная на скорость, разделяет роли иначе. SK hynix и SanDisk продвигают стандартизацию: ожидается, что к 2038 году спрос на HBF может превысить спрос на HBM.

ChainNewsAbmedia44м назад

Разработческая конференция Anthropic Code With Claude 5/6: открытие в Сан-Франциско — бесплатная регистрация на стрим

Новости индустрии ИИ

Anthropic 1 мая объявила, что первая конференция разработчиков «Code with Claude» откроется 6 мая в Сан-Франциско, а впервые расширится до двух дополнительных городов: Лондона (19.05) и Токио (10.06) — тур по трём площадкам. Местные квоты на очные основные сессии во всех трёх городах разыгрывались лотереей, и уже были отобраны, но регистрация на трансляцию по-прежнему открыта для всех. Чтобы справиться с перегрузкой спроса на местах, для Сан-Франциско дополнительно добавили сессию 7.05 «Extended», предназначенную для независимых разработчиков и основателей на ранней стадии. Тур по трём городам: 6.05 Сан-Франциско, 19.05 Лондон, 10.06 Токио Code with Claude — конференция разработчиков, организованная Anthropic; в Сан-Франциско это уже второе проведение. Содержание всех 3 мероприятий одинаковое: целый день очных воркшопов, демо новых функций и встречи с Claude по всем направлениям

ChainNewsAbmedia1ч назад

OpenAI опубликовала данные за неделю после запуска GPT-5.5: рост выручки от API достиг нового рекорда, Codex удвоился

Новости индустрии ИИ

OpenAI 1 мая на официальном аккаунте опубликовала 3 показателя после запуска GPT-5.5: самооценка как «самой сильной публикации всех времён», темпы роста API-выручки более чем в 2 раза по сравнению с любым предыдущим релизом модели, а Codex в течение менее чем 7 дней удвоил выручку. OpenAI объяснила это тем, что спрос со стороны бизнеса на agentic coding (агентное программирование) инструменты продолжает расти, синхронно с тем, как 30 апреля GPT-5.5-Cyber в той же волне продуктового ритма вступил в состязание с Anthropic Mythos. 3 показателя из опубликованных данных: API-выручка с удвоенной скоростью, Codex удвоение за 7 дней, самый сильный релиз Эти 3 ключевых цифры, опубликованные OpenAI, взяты из официальных твитов и не сопровождаются подробной финансовой отчётностью: во-первых, GPT-5.5 — это «самый сильный рост выручки за всю историю», мод

ChainNewsAbmedia1ч назад

Комитет по иностранным делам Палаты представителей США встречается с техногигантами по экспортным ограничениям ИИ после принятия законопроекта MATCH Act со счётом 36–8

Новости индустрии ИИ

По данным Beating, члены Комитета по иностранным делам Палаты представителей США на следующей неделе отправятся в Кремниевую долину, чтобы встретиться с представителями Google, Anthropic, Meta, Tesla, Intel, Applied Materials и Nvidia и обсудить искусственный интеллект и экспортный контроль. Отраслевое круглый стол — s

GateNews1ч назад

OpenAI запускает Codex Pets — AI-ориентированного виртуального компаньона с пользовательской генерацией

Новости индустрии ИИ Инструменты и приложения ИИ

Согласно Beating, OpenAI добавила новую функцию «Codex Pets» в настольное приложение Codex, позволяющую пользователям создавать и взаимодействовать с анимированным виртуальным питомцем. Пользователи могут активировать питомца, введя /pet в редакторе. Функция работает как индикатор состояния агента, отображая a

GateNews1ч назад

комментарий

0/400

Нет комментариев