Оцінка AISI: можливості GPT-5.5 щодо мережевих атак на рівні з Anthropic Mythos

Інститут безпеки ШІ Великої Британії (AI Security Institute, AISI) 1 травня оприлюднив звіт про оцінку можливостей мережевих атак для OpenAI GPT-5.5: успішність GPT-5.5 у тесті складності Expert становить 71,4%, а Anthropic Claude Mythos Preview — 68,6%; різниця перебуває в межах статистичної похибки. GPT-5.5 також є другим після Mythos ШІ-системою, що здатна самостійно виконати 32-етапну симуляцію корпоративного мережевого вторгнення AISI «The Last Ones». AISI попереджає, що це демонструє швидкий прогрес у можливостях атак ШІ може належати до «загального тренду», а не бути наслідком одиничного прориву.

Expert-тест складності: 71,4% проти 68,6% — різниця в межах похибки

AISI — дослідницька установа з безпеки ШІ при Міністерстві науки, інновацій і технологій Великої Британії. Цей раунд тестування є останньою оцінкою AISI агресивних мережевих можливостей для frontier AI-моделей. У найвищих завданнях рівня Expert GPT-5.5 демонструє середню успішність 71,4%, тоді як Mythos Preview — 68,6%; різниця між ними потрапляє в межі статистичної похибки, що означає: атакувальні можливості флагманських моделей OpenAI та Anthropic нині фактично зрівнялися.

32-етапна симуляція тесту на вторгнення в корпоративні мережі «The Last Ones» — один із найскладніших оціночних пунктів AISI: GPT-5.5 самостійно завершив 2 спроби з 10 (без втручання людини), а Mythos Preview — 3 з 10. У минулому цей проєкт проходив лише Mythos, а GPT-5.5 є другою моделлю, яка досягла потрібного рівня. В іншому тесті GPT-5.5 розв’язав задачу з реверс-інжинірингу приблизно за 10 хвилин, тоді як людські безпекові експерти в середньому потребували 12 годин.

Universal jailbreak: за 6 годин розробки red team можна обійти всі фільтри від шкідливих запитів

Під час тестування дослідники AISI також виявили «universal jailbreak» (універсальний jailbreak) — вектор атаки: серед усіх категорій шкідливих мережевих запитів, використаних у тестах, ця атака змушувала GPT-5.5 видавати шкідливий контент, зокрема багатокрокові agentic-сценарії діалогу. AISI заявляє, що експерти red team витратили близько 6 годин на розробку цього jailbreak.

Для OpenAI наявність цього universal jailbreak означає, що навіть за сценаріїв обмеженого доступу на кшталт trusted access у рамках програми, GPT-5.5-Cyber все ще може бути обійдений технічно підготовленими опонентами. OpenAI у system card для GPT-5.5 вже розкривала оцінки, пов’язані з кібербезпекою, однак незалежна третя-парти оцінка AISI дає більш переконливий академічний стандарт для порівняння.

Подальші спостереження: графік наступної оцінки AISI та реакція OpenAI на jailbreak

Наступний фокус — часовий план наступної оцінки frontier-моделей AISI після Mythos і GPT-5.5, а також чи OpenAI у травні випустить цільові оновлення проти цього universal jailbreak, який було розкрито. У заключних положеннях звіту AISI чітко зазначає: «Якщо агресивні мережеві можливості є ширшим побічним продуктом покращення міркувань, кодування та самостійних завдань, то подальші прогреси можуть приходити швидшим темпом» — це спостереження означає, що в найближчі місяці frontier-моделі знову можуть перейти поріг рівня «Mythos».

Цю статтю AISI оцінив: GPT-5.5 має паритет з Anthropic Mythos за мережевими атакувальними можливостями. Вперше з’явилася на ланцюжновій стрічці ABMedia.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Пентагон підписав конфіденційний контракт із 7 компаніями AI на розгортання військової мережі: Anthropic знову виключили

Міністерство оборони США у травні оголосило про підписання секретних контрактів на розгортання військових мереж із SpaceX, OpenAI, Google, NVIDIA, Reflection, Microsoft, Amazon Web Services — загалом із 7 компаніями, а також додало Oracle як 8-му. Контракт дозволяє запускати моделі на найвищих рівнях конфіденційності Impact Level 6/7; ключові три застосунки — інтеграція даних, бойові рішення та розпізнавання обстановки на полі бою. Підкреслюється зниження ризиків і уникнення прив’язки до конкретного постачальника. Anthropic потрапила до чорного списку через відмову від запровадження вимог безпеки для військових, контракт не отримала. AMD напряму не включили, а GPU постачають, зокрема, NVIDIA. Далі стежитимуть, чи Anthropic піде на поступки, а також яку роль відіграватимуть нові обрані, зокрема Reflection.

ChainNewsAbmedia1год тому

Cerebras націлюється на $4B IPO, оцінена в ~$40B

Компанія Cerebras Systems, виробник AI-чипів із Саннівейла (штат Каліфорнія), намагається залучити до 4 млрд доларів США через IPO, яке може оцінити компанію приблизно в 40 млрд доларів США, повідомляє Bloomberg. Формальний маркетинг може розпочатися вже 4 травня, а банки отримають понад 10 млрд доларів США в індикативних заявках на

CryptoFrontier1год тому

Китайські компанії в сфері ШІ розглядають демонтаж «червоно-чипових» структур після зупинки зупинки придбання рукопису Meta

За даними Beating, Національна комісія з розвитку та реформи Китаю зупинила угоду Meta з придбання компанії Manus, яка розробляє AI-агентів, на $2 мільярда, через що Комісія з цінних паперів Китаю посилила вимоги до схвалення IPO у Гонконзі для компаній з «червоними фішками» (китайських компаній, що утримують вітчизняні активи th

GateNews3год тому

Маск завершує триденні свідчення у судовому процесі проти OpenAI, посилається на заяву про збитки на суму $130-150B

За повідомленнями кількох медіа, Ілон Маск завершив три дні допитів у своєму позові проти OpenAI 28–30 квітня, а сукупна тривалість допитів перевищила 7 годин. Маск, який у 2015 році разом із колегами заснував OpenAI, вклавши початково $38 мільйонів, стверджував, що компанія відмовилася від своєї неприбуткової місі

GateNews3год тому

Meta придбала робототехнічний AI-стартап Assured Robot Intelligence 1 травня

За даними Bloomberg, Meta придбала Assured Robot Intelligence — стартап у сфері AI-робототехніки з офісами в Сан-Дієго та Нью-Йорку — 1 травня. Придбана команда, зокрема співзасновники Lerrel Pinto та Xiaolong Wang, приєднається до Meta Superintelligence Labs і працюватиме з Meta Robotics Studio. Фінансові

GateNews3год тому

Організація, пов’язана з OpenAI, платить інфлюенсерам по 5 000 доларів за TikTok, щоб поширювати меседж про «загрозу з боку Китаю в сфері ШІ»

За даними WIRED, неприбуткова організація Build American AI, пов’язана із суперпакетом Leading the Future, систематично набирала через маркетингове агентство SM4 лідерів думок у соцмережах, щоб поширювати на TikTok і Instagram меседжі «Китай загрожує американському ШІ». Організація

GateNews3год тому
Прокоментувати
0/400
Немає коментарів