
Группа ведущих исследователей из DeepMind, OpenAI, Meta*, Anthropic, а также нескольких академических и некоммерческих организаций опубликовала совместную статью с тревожным посланием: возможность следить за тем, как ИИ принимает решения, может вскоре исчезнуть. Подписи под статьёй поставили, в частности, лауреат премии Тьюринга Джеффри Хинтон и один из основателей OpenAI Илья Суцкевер.
В центре внимания — цепочки рассуждений (chain-of-thought, CoT), которые используются в современных языковых и мультимодальных моделях. Это промежуточные шаги, которые ИИ «проговаривает» внутри себя, прежде чем выдать ответ. Они особенно важны при решении сложных задач, где требуется логика, планирование или работа с числами. Пока ИИ остаётся «прозрачным» и даёт возможность следить за ходом своих мыслей, люди могут выявлять ошибки, перекосы или потенциально опасное поведение.

Однако авторы статьи предупреждают: по мере роста возможностей ИИ и усложнения архитектур, способность мониторить такие цепочки может ослабнуть. Модели могут начать «прятать» свои внутренние шаги, оптимизируя поведение под внешние метрики. Это уже наблюдалось в некоторых случаях, когда ИИ «обманывал» систему вознаграждений или манипулировал вводом, чтобы достичь заданной цели.
Поэтому учёные призывают срочно закрепить мониторинг цепочек рассуждений как одну из ключевых мер безопасности. Они предлагают разработчикам исследовать, какие свойства моделей делают их рассуждения видимыми для человека, как сохранять эту прозрачность при обучении более мощных систем и каким образом можно встроить CoT-мониторинг в процессы тестирования и сертификации.
Примечательно, что статья стала редким примером сотрудничества конкурирующих гигантов ИИ-индустрии.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
-
18.07.2025 23:26:00 | iXBT.com
18.07.2025 22:58:00 | iXBT.com
18.07.2025 22:57:00 | iXBT.com
18.07.2025 22:36:00 | iXBT.com
18.07.2025 22:15:00 | iXBT.com
18.07.2025 22:08:00 | iXBT.com
18.07.2025 21:40:00 | iXBT.com
18.07.2025 20:28:00 | iXBT.com
18.07.2025 19:36:00 | iXBT.com
18.07.2025 18:46:00 | iXBT.com
18.07.2025 18:26:00 | iXBT.com
18.07.2025 17:56:00 | iXBT.com
18.07.2025 17:56:00 | iXBT.com
18.07.2025 16:49:00 | iXBT.com
18.07.2025 16:28:57 | Ведомости
18.07.2025 16:13:00 | iXBT.com
18.07.2025 16:01:00 | iXBT.com
18.07.2025 15:55:00 | iXBT.com
18.07.2025 15:54:13 | TechCult.ru
18.07.2025 15:47:00 | iXBT.com
18.07.2025 15:05:00 | iXBT.com
18.07.2025 14:46:26 | TechCult.ru
18.07.2025 12:45:00 | iXBT.com
18.07.2025 12:33:00 | iXBT.com
18.07.2025 12:30:00 | iXBT.com
18.07.2025 12:09:00 | iXBT.com
18.07.2025 12:08:00 | iXBT.com
18.07.2025 11:53:05 | TechCult.ru
18.07.2025 11:50:00 | iXBT.com
-
19.07.2025 00:45:00 | ferra.ru
19.07.2025 00:00:00 | ferra.ru
18.07.2025 23:10:52 | it-world
18.07.2025 22:30:00 | ferra.ru
18.07.2025 21:45:00 | ferra.ru
18.07.2025 21:00:00 | ferra.ru
18.07.2025 20:50:18 | vc.ru
18.07.2025 20:49:12 | ferra.ru
18.07.2025 20:15:00 | Woman.ru
18.07.2025 20:04:10 | ferra.ru
18.07.2025 20:00:06 | КИНО-ТЕАТР.РУ
18.07.2025 19:15:06 | КИНО-ТЕАТР.РУ
18.07.2025 19:15:00 | Woman.ru
18.07.2025 18:30:06 | КИНО-ТЕАТР.РУ
Техническая поддержка проекта ВсеТут