Группа ведущих исследователей из DeepMind, OpenAI, Meta*, Anthropic, а также нескольких академических и некоммерческих организаций опубликовала совместную статью с тревожным посланием: возможность следить за тем, как ИИ принимает решения, может вскоре исчезнуть. Подписи под статьёй поставили, в частности, лауреат премии Тьюринга Джеффри Хинтон и один из основателей OpenAI Илья Суцкевер.
В центре внимания — цепочки рассуждений (chain-of-thought, CoT), которые используются в современных языковых и мультимодальных моделях. Это промежуточные шаги, которые ИИ «проговаривает» внутри себя, прежде чем выдать ответ. Они особенно важны при решении сложных задач, где требуется логика, планирование или работа с числами. Пока ИИ остаётся «прозрачным» и даёт возможность следить за ходом своих мыслей, люди могут выявлять ошибки, перекосы или потенциально опасное поведение.

Однако авторы статьи предупреждают: по мере роста возможностей ИИ и усложнения архитектур, способность мониторить такие цепочки может ослабнуть. Модели могут начать «прятать» свои внутренние шаги, оптимизируя поведение под внешние метрики. Это уже наблюдалось в некоторых случаях, когда ИИ «обманывал» систему вознаграждений или манипулировал вводом, чтобы достичь заданной цели.
Поэтому учёные призывают срочно закрепить мониторинг цепочек рассуждений как одну из ключевых мер безопасности. Они предлагают разработчикам исследовать, какие свойства моделей делают их рассуждения видимыми для человека, как сохранять эту прозрачность при обучении более мощных систем и каким образом можно встроить CoT-мониторинг в процессы тестирования и сертификации.
Примечательно, что статья стала редким примером сотрудничества конкурирующих гигантов ИИ-индустрии.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
-
Танки грязи не боятся: внедорожники Tank 300 и Tank 400 возглавили ралли «Шёлковый путь» в классе «Гранд Тур»
18.07.2025 23:26:00 | iXBT.com
Представлена совершенно новая Lada Sport — с мотором мощностью 145 л.с, 6-ступенчатой коробкой передач и разгоном до 100 км/ч за 10 секунд
18.07.2025 22:58:00 | iXBT.com
Даже самые слабые процессоры Intel получат большие ядра. «Атомная» линейка Wildcat Lake будет сильно отличаться от Alder Lake-N
18.07.2025 22:57:00 | iXBT.com
Самый чудовищный чип Apple в Cyberpunk 2077 — это примерно уровень GeForce RTX 5070 Ti. M3 Ultra показывает всю мощь своего iGPU
18.07.2025 22:36:00 | iXBT.com
Этот странный 11-ядерный процессор AMD с гигантским iGPU может быть сердцем PlayStation 6 либо новой Xbox. Чип называется Magnus
18.07.2025 22:15:00 | iXBT.com
Китайские учёные разработали одношаговую технологию получения метана и кислорода из лунного реголита
18.07.2025 22:08:00 | iXBT.com
Не ждите от новых процессоров Intel ничего, кроме немного повышенных частот. Arrow Lake Refresh не получат более мощный NPU
18.07.2025 21:40:00 | iXBT.com
Обсерватория Gemini North получила первые спектры межзвёздной кометы 3I/ATLAS
18.07.2025 20:28:00 | iXBT.com
Россияне начали скупать Rolls-Royce: продажи машин этого люксового бренда в годовом выражении выросли на 56% — при том, что рынок в целом упал 27%
18.07.2025 19:36:00 | iXBT.com
Россияне распробовали Lada Aura: продажи выросли почти вдвое во втором квартале 2025 года
18.07.2025 18:46:00 | iXBT.com
Похоже, Intel уже не догнать AMD на рынке HEDT. Флагманский Threadripper PRO 9995WX оказался на 46% быстрее Ryzen Threadripper PRO 7995WX в Cinebench R23
18.07.2025 18:26:00 | iXBT.com
Обновлённый Mercedes-Benz A-класса от AMG доступен для заказа в России: 421 л.с., полный привод и режимом дрифта за 8,5 млн рублей
18.07.2025 17:56:00 | iXBT.com
Обновлённый Mercedes-Benz A-класса от AMG доступен для заказа в России: 421 л.с., полный привод и режим дрифта за 8,5 млн рублей
18.07.2025 17:56:00 | iXBT.com
Бюджетные процессоры Intel Core Ultra 5 225F и Core Ultra 5 225 сильно подешевели по всему миру. Компания пытается оживить продажи Arrow Lake-S скидками, но только поможет ли?
18.07.2025 16:49:00 | iXBT.com
Количество активных аккаунтов в Яндекс ID достигло 136 млн ежедневно
18.07.2025 16:28:57 | Ведомости
Родственник российского Volkswagen Polo, только гораздо доступнее. Представлен Jetta VA3 2025 — в 2,5 раза дешевле, чем Jetta VA3 2024 в России
18.07.2025 16:13:00 | iXBT.com
Российский оператор T2 запустил роуминг VoLTE в новых регионах Европы и Азии
18.07.2025 16:01:00 | iXBT.com
Китай впереди планеты всей: в КНР уже более 1,1 миллиарда пользователей 5G и 4,55 миллиона базовых станций 5G
18.07.2025 15:55:00 | iXBT.com
Космические агентства США и Японии испытывают модель малошумного сверзвукового миниджета X-59
18.07.2025 15:54:13 | TechCult.ru
А вот это уже интересно: Xiaomi разрешила разгонять свой флагманский процессор Xring O1, пользователи могут выжать все соки из Xiaomi 15S Pro
18.07.2025 15:47:00 | iXBT.com
От утечек на производство до диагностики диабета: в России создают миниатюрный детектор для обнаружения молекул опасных газов
18.07.2025 15:05:00 | iXBT.com
В Стэнфорде разработали анализ крови для определения скорости старения отдельных органов
18.07.2025 14:46:26 | TechCult.ru
Кому дубайский шоколад, а кому редкий Maybach 62 S из коллекции шейха Катара. Уникальный лимузин Mercedes продают в России дешевле нового Aurus Senat
18.07.2025 12:45:00 | iXBT.com
Заменитель Toyota RAV4 с полным приводом и 8-ступенчатым «автоматом» — уже скоро. GAC GS4 появится в России в сентябре, его очень ждут в Сибири
18.07.2025 12:33:00 | iXBT.com
Обгоняет DeepSeek и Qwen3: «Т-Банк» выпустил модель с гибридным режимом рассуждений T-Pro 2.0
18.07.2025 12:30:00 | iXBT.com
OpenAI запустила агента ChatGPT для выполнения компьютерных задач от имени пользователя
18.07.2025 12:09:00 | iXBT.com
Hyundai Santa Fe 2026 станет комфортнее и надежнее: Hyundai отказывается от «робота» в пользу классического «автомата»
18.07.2025 12:08:00 | iXBT.com
27-дюймовый мобильный дисплей LG StanbyME 2 может стать центром развлечений для всей семьи
18.07.2025 11:53:05 | TechCult.ru
8300 мАч, 80-ваттная зарядка, защита IP69K, немерцающий экран 1,5К, Snapdragon 6 Gen 4 — всего 165 долларов. Стартовали продажи Honor X70
18.07.2025 11:50:00 | iXBT.com
-
Смарт-часы Galaxy Watch начали уверять пользователей в «высоком уровне стресса»
05.11.2025 23:25:05 | ferra.ru
Российские ученые создали сверхпрочный материал из металла и керамики
05.11.2025 23:21:20 | ferra.ru
Необъяснимые изменения веса и другие признаки, что вам пора сдавать кровь
05.11.2025 22:30:09 | ferra.ru
75% российских рыболовецких судов подключились к системе связи «Гонец»
05.11.2025 22:28:51 | ferra.ru
Motorola представила бюджетный телефон G57 Power с аккумулятором на 7000 мАч
05.11.2025 21:41:05 | ferra.ru
Инсайдер: Samsung вернёт более острые углы корпуса в Galaxy S26 Ultra
05.11.2025 21:28:31 | ferra.ru
Новый биокерамический имплантат из диоксида циркония создали в Краснодаре
05.11.2025 21:05:56 | ferra.ru
Российские ученые выявили новый механизм защиты клеток от вирусов и опухолей
05.11.2025 20:53:10 | ferra.ru
Новый стартап соосновательницы сервиса Replika с ИИ-компаньонами привлёк $20 млн
05.11.2025 20:46:38 | vc.ru
Старшая дочь Джоли и Питта превращается в точную копии мамы — такой красивой Шайло еще не видели
05.11.2025 20:30:00 | Woman.ru
Детёныш чиновницы: Надежда Михалкова, Ирина Розанова и Марина Зудина
05.11.2025 20:19:17 | КИНО-ТЕАТР.РУ
Учёные выяснили, что некоторые кишечные бактерии распространяются так же быстро, как и вирусы
05.11.2025 20:15:57 | ferra.ru
Техническая поддержка проекта ВсеТут