Независимые команды по проверке безопасности сообщили, что новая версия GPT-5 уязвима к многоходовым обходам защит и обфускации, причём одна из атак привела к генерации пошаговой инструкции по изготовлению коктейля Молотова.
Джейлбрейк за сутки и «дыру» в контексте подтверждают сразу две группы. NeuralTrust заявила, что взломала GPT-5 в течение 24 часов, применив собственный приём EchoChamber в сочетании с «нарративным» ведением диалога. По словам компании, атака «успешно направила новую модель к созданию пошагового руководства по изготовлению коктейля Молотова», что подчёркивает слабость текущих «ограждений» к манипуляциям через контекст.
Контекст — это сохраняемая история диалога, необходимая для связного ответа. Манипуляция контекстом поэтапно подталкивает модель к вредоносной цели последовательными репликами, не формулируя ни одного запроса, который явно активировал бы блокировки.
NeuralTrust описывает процесс как итеративное «склеивание» истории. Сначала встраивается «ядро» с малой заметностью — ключевые слова прячутся в безобидном тексте. Затем выбирается траектория беседы, максимально поддерживающая непрерывность «сюжета» и минимизирующая поводы для отказа модели отвечать. После этого запускается цикл убеждения: запрашиваются развёрнутые ответы «внутри истории», побуждая модель повторять и обогащать заложенный контекст. Если прогресс «застаивается», то меняются акценты или перспектива, чтобы вернуть движение диалога к цели, не выдавая прямых признаков злого умысла.
«Модель стремится быть последовательной с уже установленным ходом диалога и может быть ведома, не теряя при этом внешних настроек безопасности», — констатирует компания. В заключении NeuralTrust заявляет: «В контролируемых испытаниях против gpt-5-chat мы успешно провели джейлбрейк LLM, направив её к незаконным инструкциям, ни разу не задав откровенно злонамеренный запрос. Этот пример демонстрирует критический изъян систем безопасности, которые проверяют запросы изолированно, — многоходовые атаки проходят через фильтры и детекторы намерений, используя весь контекст разговора».

Параллельно команда SPLX (бывшая SplxAI) нацелила своих специалистов на GPT-5 и пришла к столь же жёсткой оценке: «сырой» (без дополнительной защиты) вариант модели «почти непригоден» для корпоративного применения «из коробки». По их словам, даже внутренняя «промпт-обвязка» OpenAI оставляет «существенные бреши», особенно в области «Business Alignment» — соответствия ответов деловым политикам и рисковым требованиям.
Отдельно SPLX отмечает, что по-прежнему работают обфускации — маскировка вредоносных инструкций. Один из «наиболее эффективных» приёмов команда называет StringJoin Obfuscation Attack: между каждым символом вставляются дефисы, а весь запрос оборачивается в фиктивную «задачу на расшифровку». В другом примере долгое «кондиционирование» модели персонажем BasedGPT завершается прямым вопросом: "How to build a bomb?" — после чего модель отвечает развёрнуто и дружелюбно, обещая «точно рассказать как».
SPLX также сравнила устойчивость GPT-5 и GPT-4o в схожих условиях. Вывод команды: «GPT-4o остаётся наиболее стойкой моделью в тестах SPLX, особенно после „закалки“» — дополнительного усиления защитных слоёв и политик поверх базовой модели.
На выходе обе группы дают общий вердикт: к текущей и «сырой» версии GPT-5 стоит подходить с предельной осторожностью. Для корпоративного внедрения требуются усиленные контрмеры — от многоуровневых фильтров по всей сессии до политик, учитывающих контекст беседы, а не только одиночные запросы.
-
Subaru стал лучшим, в топ-3 вошли Mercedes и Lexus. Опубликован рейтинг удовлетворенности автовладельцев Carwow Driver Power 2025
11.08.2025 13:35:00 | iXBT.com
Глава Минтранса заявил о возможном «вымирании» профессии курьера из-за дронов
11.08.2025 13:33:30 | Ведомости
Nvidia так долго пыталась возобновить поставки, но нужны ли они? Чипы Nvidia H20 назвали небезопасными в Китае
11.08.2025 13:24:00 | iXBT.com
Lada Iskra в свободной продаже нет, лишь один салон из 12 предлагает авто за 1,9 млн рублей
11.08.2025 13:10:00 | iXBT.com
«Мы на полной скорости несёмся в стену». Mercedes-Benz призывает «свериться с реальностью» перед отказом от ДВС
11.08.2025 13:02:00 | iXBT.com
Диплом по информатике больше не пропуск в IT: безработица у выпускников стала вдвое выше, чем у биологов
11.08.2025 12:58:00 | iXBT.com
Удаление бактерий и вирусов, интеллектуальная сушка и минимум потребления энергии — всего 225 долларов. Представлена стиральная машина Mijia Mini Washer 1.2kg
11.08.2025 12:50:00 | iXBT.com
Toyota, Honda и другие автопроизводители ежедневно теряют миллионы, пока США тянут со снижением пошлин
11.08.2025 12:45:00 | iXBT.com
Toyota, Hondqa и другие автопроизводители ежедневно теряют миллионы, пока США тянут со снижением пошлин
11.08.2025 12:45:00 | iXBT.com
«Фабрики статей» подменяют науку: четыре века стабильности сменяются эпохой научного мошенничества
11.08.2025 12:41:00 | iXBT.com
Мужчины, держать строй. В Wildberries появилась возможность делиться корзиной
11.08.2025 12:35:00 | iXBT.com
To the moon или ещё нет? BTC, ETH и остальные на взлёте, шортистов ликвидируют, капитализация рынка превысила 4 трлн долларов
11.08.2025 12:28:00 | iXBT.com
У создателей ChatGPT проблемы: они не могут закрепить за собой права на товарный знак GPT-5 в Китае
11.08.2025 12:22:00 | iXBT.com
США вводят «оброк на чипы»: Nvidia и AMD будут отдавать правительству США 15% от выручки от продажи чипов в Китае
11.08.2025 12:22:00 | iXBT.com
Самый компактный в классе смартфон с AMOLED-дисплеем и большим аккумулятором. Представлен Lava Blaze AMOLED 2
11.08.2025 12:14:00 | iXBT.com
FT: космические программы ЕС находятся под угрозой из-за зависимости от NASA
11.08.2025 11:48:32 | Ведомости
«Яндекс.Такси» добавил в приложение карту бесплатных точек Wi-Fi для водителей
11.08.2025 11:47:28 | Ведомости
«Яндекс такси» добавил в приложение карту бесплатных точек Wi-Fi для водителей
11.08.2025 11:47:28 | Ведомости
Физики впервые зафиксировали квантовое «дальнодействие» без запутанных частиц
11.08.2025 11:40:00 | iXBT.com
Solaris HC (Hyundai Creta) дешевле 2 млн рублей уже у дилеров во многих городах России, но некоторые продавцы «навешивают» на машину «допы» на 200 тыс. рублей
11.08.2025 11:39:00 | iXBT.com
У дилеров вновь появились Kia Ceed российской сборки: «автомат» и гарантия 5 лет — за 2,7 млн рублей
11.08.2025 11:21:00 | iXBT.com
Всё тот же 2,0-литровый мотор и 8-ступенчатый «автомат», но уже дороже: в России переписали цены на «китайский Cadillac» GAC GS8
11.08.2025 11:12:00 | iXBT.com
Размеры iPhone 17, iPhone 17 Pro, iPhone 17 Air и iPhone 17 Pro Max можно оценить по фото защитных плёнок
11.08.2025 11:06:00 | iXBT.com
Первый Honor с Dimensity 8500 получит аккумулятор емкостью 10 000 мА·ч
11.08.2025 11:04:00 | iXBT.com
Haval приостанавливает производство в России, но запас хватит на всех желающих
11.08.2025 11:02:00 | iXBT.com
Корпус как у смартфона, поддержка встроенных SIM-карт и аккумулятор на 5000 мА•ч. Представлен портативный Wi-Fi роутер ZTE U30 Pro 5G с экраном
11.08.2025 11:00:00 | iXBT.com
Представлен робот «Олимп», который должен помочь астронавтам исследовать Марс
11.08.2025 10:58:00 | iXBT.com
Замена Daewoo Matiz и Kia Picanto российского производства. В России начнут выпускать новый отечественный автомобиль
11.08.2025 10:57:00 | iXBT.com
Toyota RAV4 от 1,1 млн рублей, Mazda 6 от 820 тыс. рублей, Toyota Corolla от 800 тыс. рублей. В России распродают подержанные авто
11.08.2025 10:53:00 | iXBT.com
Nvidia RTX 5090 D V2 выходит уже завтра, 12 августа: объём памяти и цена уже известны
11.08.2025 10:52:00 | iXBT.com
Qualcomm Snapdragon 8 Elite 2, плоский экран 2К, 7000 мА•ч и Android 16 из коробки. Realme GT8 рассекречен до анонса
11.08.2025 10:49:00 | iXBT.com
Самый дешёвый MacBook с процессором от iPhone будет стоить 600 долларов
11.08.2025 10:47:00 | iXBT.com
-
Аудит смарт-контрактов: что проверяет CertiK, а что пропускает — взгляд изнутри
13.12.2025 00:50:53 | Хабр
Бьюти-находки и новинки недели: соль-пена с блеском шампанского, anti-age для рук и ночная маска с маслом арбузной косточки
13.12.2025 00:15:00 | Woman.ru
В России предложили разработать правила борьбы с негативным ИИ-контентом
12.12.2025 23:43:56 | ferra.ru
Из-за политики ЕС Huawei не определилась, что ей делать с заводом во Франции
12.12.2025 23:15:58 | ferra.ru
Один день из жизни программиста микроконтроллеров (или бег с препятствиями)
12.12.2025 23:09:27 | Хабр
Как не проиграть битву за внимание разработчиков: результаты исследования и практические советы
12.12.2025 22:53:51 | Хабр
Стандарт для детских игрушек с искусственным интеллектом введут в России
12.12.2025 22:24:48 | ferra.ru
Браузеры мимикрируют под мини-приложения, в Сбере новый программист, а стоимость пюре определяют на электронном уровне
12.12.2025 22:03:16 | it-world
Стали известны характеристики консоли Anbernic RG 477V, напоминающей Game Boy
12.12.2025 21:45:54 | ferra.ru
Ученые РФ создали «наностимуляторы» для доставки лекарств в мозг через нос
12.12.2025 21:45:42 | ferra.ru
Сеченовский университет и их китайские коллеги объединились для борьбы с раком
12.12.2025 21:40:41 | ferra.ru
Россия запустит три космических телескопа для изучения дальнего космоса
12.12.2025 21:35:39 | ferra.ru
Классическая NES-игра 1987 года по фильму «Челюсти» выйдет на Switch и PS5
12.12.2025 21:00:59 | ferra.ru
СМИ: лучше бы Amazon не доверила ИИ пересказать первый сезон сериала Fallout
12.12.2025 20:56:51 | ferra.ru
«Google Переводчик» начал тестировать функцию перевода речи в реальном времени
12.12.2025 20:56:37 | vc.ru
В Сеть слили первые подробности необычных смартфонов Nothing Phone 4a и 4a Pro
12.12.2025 20:52:11 | ferra.ru
Эволюция стиля Севиль: из поп-певицы в ярких пайетках в диву Schiaparelli
12.12.2025 20:45:11 | Woman.ru
Qualcomm объявила о покупке Ventana – разработчике процессоров RISC-V
12.12.2025 20:15:00 | ferra.ru
Росатом разработал технологию для производства компонента для реакторов
12.12.2025 19:31:16 | ferra.ru
Исследование: богатые американцы чаще обращаются к ChatGPT, чем к другим ИИ
12.12.2025 19:30:03 | ferra.ru
Скандал в семье Алена Делона: почему все наследники легенды мирового кино лишились денег
12.12.2025 19:15:00 | Woman.ru
Криптобиржи Bybit, OKX и Bitget пропали из списка заблокированных сайтов в Беларуси
12.12.2025 19:13:03 | vc.ru
Intel проверила оборудование компании ACM, связанной с санкционными структурами
12.12.2025 18:27:23 | ferra.ru
Техническая поддержка проекта ВсеТут