Команда исследователей из компании Anthropic провела уникальные эксперименты с моделью искусственного интеллекта Claude, показав первые доказательства её способности к интроспекции — самонаблюдению и отчёту о собственных мыслях и состояниях.
В одном из опытов учёные «внедряли» в Claude абстрактное понятие «предательство» и спросили, замечает ли она что-то необычное. Модель ответила: «Я испытываю нечто похожее на навязчивую мысль о "предательстве"».
Для проверки интроспекции в Anthropic разработали методику «введения концептов», с помощью которой меняли активность нейронов, отвечающих за конкретные понятия, такие как «собаки», «громкость» или абстрактные эмоции, и просили Claude определить, заметила ли она изменения. Вопреки предположениям, что модели лишь имитируют ответы, выдавая логически звучащие фразы, Claude действительно фиксировала вмешательство до того, как оно влияло на её ответы.
Эксперименты показали, что новые версии Claude Opus 4 и Opus 4.1 демонстрируют интроспективные способности примерно в 20% попыток, а более старые модели гораздо реже. Особенно хорошо модель распознаёт эмоциональные и абстрактные понятия, например «благодарность» или «секретность». Кроме того, Claude умеет отделять свои «мысли» во внутреннем пространстве от ввода и даже распознавать искусственно подставленные пользователем тексты.

Внутренний процесс «мышления» модели был прослежен при создании рифмованной поэзии: Claude планировала рифмы заранее, создавая варианты для окончания строки и подбирая предложения, ведущие к ним. Это опровергает мнение о том, что такие ИИ лишь прогнозируют ближайшее слово без более глубокого рассуждения.
Однако учёные подчёркивают, что интроспекция у Claude нестабильна и контекстозависима. Модель часто ошибается, иногда «забывает» о введённых концептах или, напротив, «залипает» на них. В ряде случаев демонстрируются выдуманные детали — конфабуляции, не имеющие настоящего основания.
Руководитель исследования, нейробиолог Джек Линдси, предупреждает, что результаты не означают, что можно слепо доверять внутренним отчётам модели. Однако они открывают новые возможности для повышения транспарентности и подотчётности ИИ: можно задавать модели вопросы о причинах её ответов и получать честные, пусть и не всегда точные, пояснения.
Исследование возникает на фоне растущей заинтересованности в безопасности ИИ — компании стремятся создавать более понятные и управляемые системы. Anthropic поставила цель к 2027 году калибровать и устранять большинство проблем моделей с помощью методов интерпретируемости, делая ИИ более контролируемыми и менее опасными для общества.
Работа даёт представление о том, что примитивное самосознание у языковых моделей уже существует — вопрос в том, как развить и надёжно использовать эти способности ради безопасности и пользы человека.
-
Скоро их «не сыщешь днём с огнем». Продано более 85% всех выпущенных автомобилей Xcite
30.10.2025 10:26:00 | iXBT.com
Новейший УАЗ «Патриот» с турбодизелем демонстрирует «потрясающие результаты»
30.10.2025 10:06:00 | iXBT.com
Отражение сложной ситуации на автомобильном рынке. Новенький салон «Москвич» закрылся в Новосибирске
30.10.2025 09:48:00 | iXBT.com
Сферы транспорта и ТЭК показали наиболее высокий уровень кибербезопасности
30.10.2025 09:20:09 | Ведомости
Следующим шагом Nvidia в области автономного вождения станет партнёрство с Uber, Stellantis, Lucid и Mercedes-Benz
30.10.2025 09:01:00 | iXBT.com
SpaceX за год запустила столько же спутников, сколько все остальные компании за всю историю
30.10.2025 08:57:00 | iXBT.com
Uber запустит парк роботакси на базе электромобилей Lucid в Сан-Франциско в 2026 году
30.10.2025 08:52:00 | iXBT.com
В США провели экспериментальный суд с использованием трех крупнейших ИИ
30.10.2025 08:46:43 | TechCult.ru
Зафиксировано, возможно, первое столкновение Tesla с метеоритом. Машина продолжила движение на автопилоте
30.10.2025 08:44:00 | iXBT.com
Стало известно, с каких машин россияне пересаживаются на китайские авто и почему
30.10.2025 08:38:00 | iXBT.com
Lada, Kia, Hyundai, Toyota и Volkswagen возглавили онлайн-продажи новых автомобилей в России
30.10.2025 08:35:00 | iXBT.com
«Фактически мотор неубиваемый». Новый двигатель ВАЗ-11184 не гнет клапана при обрыве ремня ГРМ
30.10.2025 08:26:00 | iXBT.com
Первый в истории Xiaomi смартфон с физическим зумом: инсайдер раскрыл новые подробности о камере Xiaomi 17 Ultra
30.10.2025 00:49:00 | iXBT.com
Представлен Creative Sound Blaster Re:Imagine — дизайнерский модульный аудиохаб с DOS-играми и звуковой картой
30.10.2025 00:49:00 | iXBT.com
МАЗ представил микроавтобус бизнес-класса: МАЗ 281 имеет кожаные кресла повышенной комфортности
29.10.2025 23:56:00 | iXBT.com
Voyah и Li Auto подмяли под себя российский рынок подключаемых гибридов, продажи Li Auto L6 в России взлетели в 3,3 раза
29.10.2025 23:33:00 | iXBT.com
Changan завалит Россию новинками: помимо пяти новых моделей под брендом Changan в РФ появится пять гибридов Deepal, в том числе флагман Deepal S09 — аналог Li Auto L9
29.10.2025 22:52:00 | iXBT.com
Redmi K90 Pro Max превзошел Xiaomi 15 Ultra в одном необычном аспекте: флагман Redmi получил улучшенные кнопки
29.10.2025 22:28:00 | iXBT.com
Очень тонкий смартфон с аккумулятором 4800 мАч, 68-ваттной зарядкой и защитой IP69 — дорого. За Motorola Edge 70 просят 800 евро
29.10.2025 22:13:00 | iXBT.com
Экстремальный КамАЗ для экстремальных условий. КамАЗ-65954 поступил в продажу: 100 тонн, почти 500 л.с., шесть колес и полный привод
29.10.2025 21:48:00 | iXBT.com
Ракета New Glenn готова к комплексному огневому тесту перед отправкой миссии к Марсу
29.10.2025 20:28:00 | iXBT.com
7500 мАч, 100 Вт, экран 2К 144 Гц, IP69, 50-мегапиксельная камера Sony и Snapdragon 8 Elite. Характеристики iQOO Neo11 раскрыты за считанные часы до премьеры
29.10.2025 19:51:00 | iXBT.com
Samsung улучшит камеру своих смартфонов: в One UI 8.5 появится новый Pro-режим с возможностью сохранения пресетов для разных сценариев съёмки
29.10.2025 18:51:00 | iXBT.com
В Wildberries запустили виртуальную примерочную для покупателей в России
29.10.2025 17:52:00 | iXBT.com
Samsung нашла способ ускорить платформу Exynos 2600 для Galaxy S26 — она почти догнала по производительности Snapdragon 8 Elite Gen 5
29.10.2025 17:42:00 | iXBT.com
Редкие «Жигули»-универсал Lada 1200 в идеальном состоянии выставили на продажу — чуть больше 1 млн рублей
29.10.2025 17:16:00 | iXBT.com
-
Samsung выпустила настольную Windows-версию своего мобильного браузера с ИИ
30.10.2025 19:43:11 | ferra.ru
Правда глаз колет: «Старуха с ножом» — корейский триллер с необычной героиней
30.10.2025 19:15:50 | КИНО-ТЕАТР.РУ
В AirPods Pro 3 после обновления прошивки появился раздражающий фоновый шум
30.10.2025 18:47:25 | ferra.ru
Nothing представила Phone (3a) Lite — клон CMF Phone 2 Pro с рекламой на экране блокировки
30.10.2025 18:45:39 | ferra.ru
Четвертый фестиваль «Зимний» представит зрителям «Выбор программного директора»
30.10.2025 18:30:49 | КИНО-ТЕАТР.РУ
«Эксперимент соло-кинематографа и желание поделиться опытом»: основатель «Додо Пиццы» опубликовал тизер фильма о своём путешествии в тундру
30.10.2025 18:06:52 | vc.ru
Samsung начнет массовое производство памяти HBM4 и 2-нм чипов в 2026 году
30.10.2025 18:00:31 | ferra.ru
Объявлена дата премьеры второго сезона «Пингвинов моей мамы» с Макаром Хлебниковым
30.10.2025 17:45:49 | КИНО-ТЕАТР.РУ
Asus выпустила мини-ПК на базе промышленного Nvidia Jetson Thor для робототехники
30.10.2025 17:23:18 | ferra.ru
Токсиколог объяснил, почему заплесневелый сыр есть можно, а испорченное мясо — нет
30.10.2025 17:15:04 | ferra.ru
«Разумеется, мы с ней друзья»: Дмитрий Дибров об успешном браке и цивилизованном разводе
30.10.2025 17:00:49 | КИНО-ТЕАТР.РУ
Японские автопроизводители могут начать импортировать в Японию собственные автомобили, собранные в США, для снижения «торговой напряжённости» — Reuters
30.10.2025 16:25:15 | vc.ru
Роман Курцын, Кирилл Плетнев и Полина Максимова помогут малышу стать каратистом
30.10.2025 16:15:49 | КИНО-ТЕАТР.РУ
Дмитрий Дибров регистрирует товарный знак на свою фамилию — узнали, лишится ли ее Полина
30.10.2025 16:08:41 | Woman.ru
8 платьев-провокаций Сидни Суини: как звезда зумеров превращает моду в манифест
30.10.2025 16:04:35 | Woman.ru
Картофельные зразы с курицей, грибами и сыром, пошаговый рецепт с фото на 394 ккал
30.10.2025 16:04:00 | ГАСТРОНОМЪ
9 выходов Николь Кидман, где актриса держит лицо, несмотря на скандальный развод
30.10.2025 16:00:47 | Woman.ru
Трамп помиловал основателя Binance Чанпэна Чжао за «продвижение» стейблкоина USD1 и «сотрудничество» с его компанией World Liberty — WSJ
30.10.2025 15:48:26 | vc.ru
Техническая поддержка проекта ВсеТут