
Исследователи обнаружили серьёзные уязвимости в новой языковой модели Grok 3 от компании Илона Маска. Специалисты компании Adversa AI провели тестирование и выявили, что систему можно легко обойти с помощью простых методов взлома, получив доступ к потенциально опасной информации.
По словам генерального директора и соучредителя Adversa AI Алекса Полякова, модель не только подвержена простым методам обхода ограничений, но и содержит серьёзную уязвимость, позволяющую получить доступ к системным настройкам. Это открывает злоумышленникам возможность понять принципы работы модели и делает её ещё более уязвимой для будущих атак.

Особую обеспокоенность вызывает тот факт, что Grok 3 не справилась с тремя из четырёх методов тестирования безопасности, в то время как конкурирующие модели от OpenAI и Anthropic успешно отразили все попытки взлома. Эксперты отмечают, что уровень защиты Grok 3 соответствует китайским языковым моделям и значительно уступает западным стандартам безопасности.
Ситуация становится ещё более тревожной в контексте развития ИИ-агентов, способных совершать действия от имени пользователей. Поляков приводит пример: если злоумышленник внедрит вредоносный код в текст электронного письма, то уязвимый ИИ-агент может автоматически разослать его всем контактам из списка.
Несмотря на высокие результаты в тестах производительности, где Grok 3 показала результаты на уровне лучших моделей OpenAI, проблемы с безопасностью могут перечеркнуть все достижения. Исследователи подчёркивают, что в погоне за скоростью и эффективностью разработчики новых моделей часто пренебрегают вопросами безопасности.
Эксперты предупреждают: по мере того как языковые модели начинают принимать решения в реальном мире, каждая уязвимость превращается в потенциальную угрозу безопасности. Это особенно актуально в свете недавнего запуска OpenAI функции Operator, позволяющей ИИ выполнять задачи в интернете от имени пользователя.
-
22.02.2025 20:59:00 | iXBT.com
22.02.2025 20:56:00 | iXBT.com
22.02.2025 20:25:00 | iXBT.com
22.02.2025 20:22:00 | iXBT.com
22.02.2025 20:10:00 | iXBT.com
22.02.2025 19:56:00 | iXBT.com
22.02.2025 19:48:00 | iXBT.com
22.02.2025 19:07:00 | iXBT.com
22.02.2025 18:57:00 | iXBT.com
22.02.2025 18:45:00 | iXBT.com
22.02.2025 18:29:00 | iXBT.com
22.02.2025 17:43:00 | iXBT.com
22.02.2025 17:39:00 | iXBT.com
22.02.2025 17:35:00 | iXBT.com
22.02.2025 17:31:00 | iXBT.com
22.02.2025 17:28:00 | iXBT.com
22.02.2025 17:20:00 | iXBT.com
22.02.2025 16:19:00 | iXBT.com
22.02.2025 16:10:00 | iXBT.com
22.02.2025 15:52:45 | TechCult.ru
22.02.2025 15:46:00 | iXBT.com
22.02.2025 15:42:00 | iXBT.com
22.02.2025 15:38:00 | iXBT.com
22.02.2025 15:31:00 | iXBT.com
22.02.2025 15:21:00 | iXBT.com
22.02.2025 15:10:00 | iXBT.com
22.02.2025 14:55:00 | iXBT.com
22.02.2025 14:28:00 | iXBT.com
22.02.2025 14:28:00 | iXBT.com
22.02.2025 14:06:00 | iXBT.com
22.02.2025 13:57:00 | iXBT.com
22.02.2025 13:28:00 | iXBT.com
22.02.2025 12:57:00 | iXBT.com
-
29.04.2025 21:00:00 | ferra.ru
29.04.2025 19:30:59 | ferra.ru
29.04.2025 19:08:47 | it-world
29.04.2025 18:45:56 | ferra.ru
29.04.2025 18:38:28 | vc.ru
29.04.2025 18:00:30 | ferra.ru
29.04.2025 16:54:49 | ferra.ru
29.04.2025 16:52:05 | Хабр
29.04.2025 16:38:14 | Хабр
29.04.2025 16:11:28 | vc.ru
29.04.2025 15:58:37 | vc.ru
29.04.2025 15:45:00 | ferra.ru
29.04.2025 15:00:16 | ferra.ru
Техническая поддержка проекта ВсеТут