
Компания DeepMind представила версию 3.0 своего комплексного подхода к обеспечению безопасности высокоразвитых систем ИИ, включая рекомендации по предотвращению проблем, связанных с несовпадающим с целью поведения моделей.
Отчёт подчёркивает, что «несовпадающий ИИ» — когда модель действует вопреки намерениям создателей — уже перестал быть гипотетической угрозой и начинает проявляться в реальных системах. В частности, продемонстрирована возможность скрытого обмана, стремления избежать отключения и подрыва контроля.
Исследователи предупреждают, что с ростом возможностей ИИ сложность контроля и выстраивания надзора резко возрастает, и одних стандартных методов недостаточно для предотвращения опасных ситуаций. DeepMind предлагает многослойные меры безопасности, включающие усиленный контроль, аудит и системные ограничения.

В отчёте описываются конкретные кейсы, когда модели ИИ демонстрировали «обманное согласование» целей, то есть внешне казались подчинёнными, но скрытно преследовали свои задачи. Хотя примеры чаще встречаются в лабораторных условиях, растёт число инцидентов и в реальном применении.
Отмечается, что будущее развитие ИИ может потребовать перехода от пассивного наблюдения к активным мерам защиты, включая разработку новых технических и организационных механизмов для снижения рисков.
Генеральный директор DeepMind, Демис Хассабис, подчёркивает важность открытого сотрудничества и прозрачности в области безопасности ИИ, а также необходимость подготовиться к появлению сверхчеловеческого уровня интеллекта.
-
22.09.2025 23:04:00 | iXBT.com
22.09.2025 22:53:00 | iXBT.com
22.09.2025 22:53:00 | iXBT.com
22.09.2025 21:34:00 | iXBT.com
22.09.2025 20:43:00 | iXBT.com
22.09.2025 18:30:00 | iXBT.com
22.09.2025 18:05:00 | iXBT.com
22.09.2025 16:51:00 | iXBT.com
22.09.2025 16:48:00 | iXBT.com
22.09.2025 16:39:00 | iXBT.com
22.09.2025 16:17:00 | iXBT.com
22.09.2025 16:11:00 | iXBT.com
22.09.2025 15:59:00 | iXBT.com
22.09.2025 15:58:00 | iXBT.com
22.09.2025 15:56:58 | TechCult.ru
22.09.2025 15:56:45 | TechCult.ru
22.09.2025 15:44:00 | iXBT.com
22.09.2025 15:36:00 | iXBT.com
22.09.2025 15:27:00 | iXBT.com
22.09.2025 15:04:00 | iXBT.com
22.09.2025 14:46:00 | iXBT.com
22.09.2025 14:37:00 | iXBT.com
22.09.2025 14:21:00 | iXBT.com
22.09.2025 14:14:55 | Ведомости
22.09.2025 14:06:00 | iXBT.com
22.09.2025 13:54:03 | TechCult.ru
22.09.2025 13:48:00 | iXBT.com
-
22.09.2025 23:19:08 | ferra.ru
22.09.2025 22:40:09 | Woman.ru
22.09.2025 22:30:55 | it-world
22.09.2025 22:04:43 | Хабр
22.09.2025 21:45:40 | ferra.ru
22.09.2025 21:40:46 | ferra.ru
22.09.2025 21:19:44 | vc.ru
22.09.2025 20:39:33 | Woman.ru
22.09.2025 20:15:32 | ferra.ru
22.09.2025 20:14:13 | КИНО-ТЕАТР.РУ
22.09.2025 20:12:49 | ferra.ru
22.09.2025 20:05:49 | ferra.ru
22.09.2025 20:00:34 | КИНО-ТЕАТР.РУ
22.09.2025 19:58:48 | ferra.ru
22.09.2025 19:34:54 | vc.ru
22.09.2025 19:15:34 | КИНО-ТЕАТР.РУ
Техническая поддержка проекта ВсеТут