
Исследователи обнаружили серьёзные уязвимости в новой языковой модели Grok 3 от компании Илона Маска. Специалисты компании Adversa AI провели тестирование и выявили, что систему можно легко обойти с помощью простых методов взлома, получив доступ к потенциально опасной информации.
По словам генерального директора и соучредителя Adversa AI Алекса Полякова, модель не только подвержена простым методам обхода ограничений, но и содержит серьёзную уязвимость, позволяющую получить доступ к системным настройкам. Это открывает злоумышленникам возможность понять принципы работы модели и делает её ещё более уязвимой для будущих атак.

Особую обеспокоенность вызывает тот факт, что Grok 3 не справилась с тремя из четырёх методов тестирования безопасности, в то время как конкурирующие модели от OpenAI и Anthropic успешно отразили все попытки взлома. Эксперты отмечают, что уровень защиты Grok 3 соответствует китайским языковым моделям и значительно уступает западным стандартам безопасности.
Ситуация становится ещё более тревожной в контексте развития ИИ-агентов, способных совершать действия от имени пользователей. Поляков приводит пример: если злоумышленник внедрит вредоносный код в текст электронного письма, то уязвимый ИИ-агент может автоматически разослать его всем контактам из списка.
Несмотря на высокие результаты в тестах производительности, где Grok 3 показала результаты на уровне лучших моделей OpenAI, проблемы с безопасностью могут перечеркнуть все достижения. Исследователи подчёркивают, что в погоне за скоростью и эффективностью разработчики новых моделей часто пренебрегают вопросами безопасности.
Эксперты предупреждают: по мере того как языковые модели начинают принимать решения в реальном мире, каждая уязвимость превращается в потенциальную угрозу безопасности. Это особенно актуально в свете недавнего запуска OpenAI функции Operator, позволяющей ИИ выполнять задачи в интернете от имени пользователя.
-
22.02.2025 20:59:00 | iXBT.com
22.02.2025 20:56:00 | iXBT.com
22.02.2025 20:25:00 | iXBT.com
22.02.2025 20:22:00 | iXBT.com
22.02.2025 20:10:00 | iXBT.com
22.02.2025 19:56:00 | iXBT.com
22.02.2025 19:48:00 | iXBT.com
22.02.2025 19:07:00 | iXBT.com
22.02.2025 18:57:00 | iXBT.com
22.02.2025 18:45:00 | iXBT.com
22.02.2025 18:29:00 | iXBT.com
22.02.2025 17:43:00 | iXBT.com
22.02.2025 17:39:00 | iXBT.com
22.02.2025 17:35:00 | iXBT.com
22.02.2025 17:31:00 | iXBT.com
22.02.2025 17:28:00 | iXBT.com
22.02.2025 17:20:00 | iXBT.com
22.02.2025 16:19:00 | iXBT.com
22.02.2025 16:10:00 | iXBT.com
22.02.2025 15:52:45 | TechCult.ru
22.02.2025 15:46:00 | iXBT.com
22.02.2025 15:42:00 | iXBT.com
22.02.2025 15:38:00 | iXBT.com
22.02.2025 15:31:00 | iXBT.com
22.02.2025 15:21:00 | iXBT.com
22.02.2025 15:10:00 | iXBT.com
22.02.2025 14:55:00 | iXBT.com
22.02.2025 14:28:00 | iXBT.com
22.02.2025 14:28:00 | iXBT.com
22.02.2025 14:06:00 | iXBT.com
22.02.2025 13:57:00 | iXBT.com
22.02.2025 13:28:00 | iXBT.com
22.02.2025 12:57:00 | iXBT.com
-
02.06.2025 15:35:25 | ferra.ru
02.06.2025 15:33:10 | ferra.ru
02.06.2025 15:30:46 | КИНО-ТЕАТР.РУ
02.06.2025 15:09:12 | vc.ru
02.06.2025 14:00:46 | КИНО-ТЕАТР.РУ
02.06.2025 13:30:51 | ferra.ru
02.06.2025 13:27:09 | vc.ru
02.06.2025 13:18:47 | ferra.ru
02.06.2025 13:17:06 | StopGame
02.06.2025 13:15:46 | КИНО-ТЕАТР.РУ
02.06.2025 13:01:03 | Хабр
02.06.2025 12:47:57 | КИНО-ТЕАТР.РУ
02.06.2025 12:41:51 | Хабр
02.06.2025 12:25:56 | vc.ru
02.06.2025 12:01:02 | Хабр
02.06.2025 12:00:56 | Хабр
02.06.2025 12:00:00 | ГАСТРОНОМЪ
02.06.2025 11:59:53 | Хабр
02.06.2025 11:45:00 | Woman.ru
Техническая поддержка проекта ВсеТут