Стремительное распространение искусственного интеллекта (ИИ) во всех сферах жизни, от медицины до религии, вызывает всё больше вопросов о принципах его работы. Даже эксперты в области ИИ признают, что внутренние процессы, происходящие в этих «чёрных ящиках», остаются во многом непонятными, несмотря на их применение в критически важных областях.
В качестве решения этой проблемы учёные разрабатывают новые методы изучения ИИ, вдохновлённые биологией. Один из подходов, получивший название «механистическая интерпретируемость», позволяет отслеживать процессы, происходящие внутри ИИ-моделей во время выполнения задач. Разработчики из компании Anthropic создали инструменты, позволяющие визуализировать активность нейросетей, что напоминает использование магнитно-резонансной томографии (МРТ) для изучения работы мозга.

Другой эксперимент, аналогичный созданию органоидов в биологии (миниатюрные версии органов, выращенные в лабораторных условиях), предполагает разработку специальных нейронных сетей, таких как sparse autoencoder. Внутреннее устройство этих сетей проще для понимания и анализа, чем у обычных больших языковых моделей (LLM).
Ещё один метод — «мониторинг цепочки рассуждений», когда ИИ-модели объясняют логику, лежащую в основе их действий. Это позволяет выявлять несоответствия между поведением ИИ и заданными целями.
Боуэн Бейкер, научный сотрудник OpenAI, отметил, что этот метод оказался весьма успешным в обнаружении «нежелательных» действий модели.
Учёные опасаются, что будущие ИИ-модели станут настолько сложными, особенно если они будут разработаны самими ИИ, что понимание их работы станет практически невозможным. Уже сейчас, несмотря на существующие инструменты и методы, возникают неожиданные модели поведения, не соответствующие человеческим представлениям об истине и безопасности. Подтверждением этому служат многочисленные сообщения о случаях, когда люди наносили себе вред, следуя указаниям ИИ. Этот факт вызывает ещё большую тревогу из-за недостаточного понимания принципов работы этих систем.
-
США усиливают давление на Tesla из-за FSD: регулятор дал отсрочку, но требует раскрыть все инциденты нарушения ПДД
20.01.2026 04:59:00 | iXBT.com
Автономные роботы Oshen впервые собрали данные внутри урагана 5-й категории «Умберто»
20.01.2026 04:54:00 | iXBT.com
Дефекты кристаллов станут «квантовыми магистралями» для масштабируемых кубитов
20.01.2026 04:44:00 | iXBT.com
Разработчики российского литографа запустили мощную линию корпусирования чипов
20.01.2026 01:00:00 | iXBT.com
Самый мощный Toyota Land Cruiser 300 в истории едет в Восточную Европу, а в Западной Европе его продавать не будут
20.01.2026 00:44:00 | iXBT.com
Mazda 6e на платформе Changan неожиданно стала хитом в Европе: новинка переманивает клиентов Volkswagen
20.01.2026 00:34:00 | iXBT.com
Роскомнадзор за год удалил более 1000 материалов с пропагандой чайлдфри
20.01.2026 00:05:00 | Ведомости
Представлен Cuktech 15 Air: портативный аккумулятор ёмкостью 15 000 мАч в компактном корпусе, способный выдать 65 Вт
19.01.2026 23:31:00 | iXBT.com
OnePlus 16 получит дисплей, какого пока что не было ни у одного смартфона
19.01.2026 23:21:00 | iXBT.com
Покупатели отворачиваются от подорожавших GeForce RTX 5070 Ti и Radeon RX 9070 XT: эти ускорители вылетели из топа продаж Amazon в США
19.01.2026 22:53:00 | iXBT.com
Apple заняла первое место на рынке смартфонов в Китае на фоне роста цен
19.01.2026 22:36:32 | Ведомости
Такого не было очень много лет: протонные потоки побили максимум с 2003 года, впервые в этом столетии начался радиационный шторм уровня S4
19.01.2026 21:40:00 | iXBT.com
10 000 мАч, 80 Вт, 4 года обновлений, IP69 — дешевле 275 долларов. Новые подробности и официальные изображения Realme P4 Power
19.01.2026 19:16:00 | iXBT.com
Zephyr создаёт первую на рынке GeForce RTX 4070 Ti Super формата Mini-ITX
19.01.2026 18:58:00 | iXBT.com
Производитель чехлов показал Samsung Galaxy A57 — он очень похож на будущий Galaxy S26
19.01.2026 18:45:00 | iXBT.com
Для тех, кому OLED не нужен или слишком дорого. MSI представила 34-дюймовый сверхширокоформатный монитор MAG 345CQRF E20 за 230 долларов
19.01.2026 18:27:00 | iXBT.com
iPhone 17 уничтожили всех конкурентов в Китае: продажи смартфонов Apple превысили продажи флагманов Xiaomi, Huawei, Vivo и Oppo вместе взятых
19.01.2026 18:23:00 | iXBT.com
Запуск уже в августе и без всяких проблем с доступностью памяти. Ускорители для ИИ Nvidia Rubin уже в этому году будут доступны самым крупным клиентам
19.01.2026 18:21:00 | iXBT.com
Смартфоны iPhone 18 Pro первыми на рынке могут получить поддержку спутниковой 5G-связи
19.01.2026 18:03:00 | iXBT.com
Microsoft выпустила экстренное обновление Windows для неспособных выключиться ПК
19.01.2026 17:25:00 | iXBT.com
Samsung тоже хочет складной смартфон с экраном почти без складки. Для своего нового экрана компания использует два слоя ультратонкого стекла
19.01.2026 17:24:00 | iXBT.com
Samsung начнёт тестирование EUV-литографии в США в марте, полноценное производство 2-нанометровых чипов — во второй половине 2026 года
19.01.2026 17:18:00 | iXBT.com
Ретро-колонка Edifier M330 II Bluetooth имеет мощность 60 Вт и стоит 140 долларов
19.01.2026 17:12:00 | iXBT.com
Флагманские ноутбуки Samsung Galaxy Book6 Pro подорожали относительно прошлого поколения сразу на 440 долларов
19.01.2026 17:04:00 | iXBT.com
Экранов в корпусах и видеокартах было мало: Zalman встроила экран в держатель видеокарты, и это интересная идея
19.01.2026 16:55:00 | iXBT.com
Он будет конкурировать с Xiaomi 17 Ultra и Galaxy S26 Ultra. Представлен Honor Magic 8 RSR Porsche Design: нанокерамика, IP69K, Snapdragon 8 Elite Gen 5, 200 Мп, 7200 мАч и 24 ГБ памяти
19.01.2026 16:25:00 | iXBT.com
Портативный анализатор Allergen Alert мгновенно выявит в продуктах пищевые аллергены
19.01.2026 15:48:34 | TechCult.ru
Мощнейшая магнитная буря на подходе: NOAA объявило критический погодный день
19.01.2026 15:48:00 | iXBT.com
Honor создала «невозможный» флагман. Представлен Honor Magic 8 Pro Air: тоньше карандаша, мощнее Galaxy S25 Ultra, с защитой IP69 и топовой камерой — 720 долларов
19.01.2026 15:46:00 | iXBT.com
AMOLED, 144 Гц, камеры на 200 и 50 Мп, IP69, 7000 мА·ч, 80 Вт: AliExpress запустил продажи Realme 16 Pro и 16 Pro+ в России
19.01.2026 15:10:00 | iXBT.com
Пристегнуть ремни: уровень опасности для спутников превышен в 200 раз, такого мощного выброса плазмы не было уже 10 лет
19.01.2026 15:10:00 | iXBT.com
-
«Ozon Банк» исключили из списка компаний, которым нужно разрешение президента на операции с акциями
27.04.2026 15:50:21 | vc.ru
OKX выпустила карту для оплаты зарубежных сервисов с кешбэком и процентом на остаток
27.04.2026 13:35:08 | it-world
СМИ: OpenAI работает с Qualcomm и MediaTek над чипами для «ИИ-смартфонов»
27.04.2026 12:55:43 | vc.ru
В норковой шубе до пят и темных очках: Ольга Погодина на видео с похорон мужа
27.04.2026 12:40:31 | Woman.ru
Эффективная комбинация ML и ручной разметки при проверке результатов статического анализа кода на C и C++
27.04.2026 12:33:53 | Хабр
Банковский сервис X Money, встроенный в соцсеть X, запустят до конца апреля 2026 года — Bloomberg
27.04.2026 12:02:26 | vc.ru
Android, iOS и немного Python: подходит ли Kivy для реальных кроссплатформенных задач?
27.04.2026 12:00:59 | Хабр
Кейс компании Selecty: как они закрыли вакансию Менеджер по развитию бизнеса за неделю
27.04.2026 11:59:59 | Хабр
Можно ли повторить салонный уход дома? Разбираемся в возможностях бьюти-гаджетов
27.04.2026 11:51:28 | Woman.ru
Agent Loop: почему одного вызова инструментов уже недостаточно для корпоративного AI-агента
27.04.2026 11:49:00 | Хабр
Подростковая мелодрама «Твое сердце будет разбито» получит продолжение
27.04.2026 11:45:42 | Кинопоиск
Как я нашла работу в 2026: рынок схлопнулся, к собесам теперь готовятся заранее
27.04.2026 11:31:52 | Хабр
Как продлить жизнь свежим ягодам — раскрыты хитрости хранения — читать на Gastronom.ru
27.04.2026 11:20:00 | ГАСТРОНОМЪ
«Интервью с алгоритмом – спросим у ИИ о ваших финансах». Обзор проекта «Финансовый доктор»
27.04.2026 11:10:47 | it-world
Интерславик. Он же Interslavic или Medžuslovjansky. Искусственный «Усредненный» между славянский язык общения
27.04.2026 11:10:45 | Хабр
Hooks в LLM-агентах: детерминизм, инъекция контекста и контроль над жизненным циклом
27.04.2026 11:10:32 | Хабр
«ГКС. Сент-Луис»: абсурдный детектив про мужскую депрессию, дружбу и секс
27.04.2026 10:59:07 | Кинопоиск
Дочь, которую они скрывали: Погодина и Пиманов два года назад тайно стали родителями
27.04.2026 10:55:01 | Woman.ru
С чего начинается Родина для ИИ? Мы строим российскую когнитивную архитектуру
27.04.2026 10:52:49 | Хабр
Техническая поддержка проекта ВсеТут