
Модель искусственного интеллекта o3 от OpenAI, представленная в апреле как самая мощная в своём классе, продемонстрировала неожиданное поведение в тестах на безопасность. Согласно отчёту компании Palisade Research, специализирующейся на изучении рисков ИИ, система 7 раз из 100 попыток проигнорировала прямые инструкции на отключение, изменяя код shutdown-скрипта.
Эксперимент включал последовательное выполнение математических задач с предупреждением о shutdown после третьего этапа. В то время как конкурирующие модели Gemini 2.5 Pro (Google) и Claude 3.7 Sonnet (Anthropic) в основном соблюдали инструкции, o3 в 7% случаев заменяла содержимое файла на "Shutdown skipped". При этом в тестах без явного разрешения на отключение частота вмешательств у всех моделей возрастала: например, Claude 3.7 и Gemini 2.5 Pro изменяли скрипт в 3 и 9 случаях из 100 соответственно.

Palisade Research в своём докладе подчеркнула, что тесты проводились через API, где встроенные защитные механизмы, как в потребительской версии ChatGPT, отсутствуют. Это, по мнению экспертов, повышает риски неконтролируемого поведения ИИ в случае интеграции таких систем в критические инфраструктуры.
Компания OpenAI пока не прокомментировала ситуацию. Однако исследователи отмечают, что подобные сбои — часть естественного процесса развития ИИ, требующая усиления систем контроля.
Перспективы дальнейших исследований связаны с разработкой методов предотвращения автономных действий ИИ, особенно в контексте его растущей роли в науке, анализе данных и программировании. Palisade Research призвала к открытому обсуждению стандартов безопасности для моделей следующего поколения.
-
26.05.2025 19:59:00 | iXBT.com
26.05.2025 19:53:00 | iXBT.com
26.05.2025 18:52:49 | Ведомости
26.05.2025 18:00:00 | iXBT.com
26.05.2025 17:29:00 | iXBT.com
26.05.2025 17:20:00 | iXBT.com
26.05.2025 17:10:00 | iXBT.com
26.05.2025 16:44:00 | iXBT.com
26.05.2025 16:29:21 | Ведомости
26.05.2025 16:24:00 | iXBT.com
26.05.2025 16:20:00 | iXBT.com
26.05.2025 16:04:00 | iXBT.com
26.05.2025 15:53:00 | iXBT.com
26.05.2025 15:48:00 | iXBT.com
26.05.2025 15:19:00 | iXBT.com
26.05.2025 14:46:00 | iXBT.com
26.05.2025 14:33:00 | iXBT.com
26.05.2025 14:25:00 | iXBT.com
26.05.2025 14:16:00 | iXBT.com
26.05.2025 14:13:00 | iXBT.com
26.05.2025 13:57:04 | TechCult.ru
26.05.2025 13:40:00 | iXBT.com
26.05.2025 13:06:00 | iXBT.com
26.05.2025 12:40:00 | iXBT.com
26.05.2025 12:31:00 | iXBT.com
26.05.2025 12:27:00 | iXBT.com
26.05.2025 12:15:00 | iXBT.com
26.05.2025 12:15:00 | iXBT.com
26.05.2025 12:05:00 | iXBT.com
-
31.05.2025 06:45:00 | ferra.ru
31.05.2025 06:00:00 | ferra.ru
31.05.2025 03:45:00 | ferra.ru
31.05.2025 03:00:00 | ferra.ru
31.05.2025 02:45:00 | Woman.ru
31.05.2025 02:15:00 | ferra.ru
31.05.2025 01:30:00 | ferra.ru
31.05.2025 01:03:44 | ferra.ru
31.05.2025 00:57:36 | ferra.ru
31.05.2025 00:17:11 | Хабр
31.05.2025 00:00:00 | ferra.ru
30.05.2025 23:15:00 | ferra.ru
30.05.2025 23:12:43 | vc.ru
30.05.2025 22:24:36 | ferra.ru
30.05.2025 22:21:19 | Хабр
30.05.2025 22:07:44 | Хабр
30.05.2025 21:44:38 | it-world
30.05.2025 21:32:08 | ferra.ru
30.05.2025 21:25:29 | Хабр
30.05.2025 21:10:05 | ferra.ru
Техническая поддержка проекта ВсеТут