Скрытые сигналы: как модели учатся тому, чего нет в данных

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Скрытые сигналы: как модели учатся тому, чего нет в данных

05.01.2026 07:05:33 | Хабр

Хабы: Блог компании Beget, Искусственный интеллект, Научно-популярное, Алгоритмы, Читальный зал

LLM учатся не только тому, чему мы пытаемся их научить. Вместе с задачами, метками и инструкциями они усваивают и побочные сигналы, которые мы воспринимаем как шум или случайность. Исследование международной группы учёных показало, что такие подпороговые сигналы могут работать как канал передачи поведения между моделями. Даже если убрать все явные инструкции, то стиль рассуждений, стратегии ответов и другие поведенческие признаки все равно просочатся через данные, которые семантически с ними никак не связаны.

Авторы называют этот эффект сублиминальным обучением. Мы можем удалить метки, отфильтровать инструкции и проверить датасет вручную, и всё равно передать модели поведение, которое не планировали передавать.

Читать далее

Подробнее

Читайте также

Двухканальная паяльная станция на базе STM32
05.01.2026 06:15:27 | Хабр

Можно ли собрать кубик Рубика случайно? 10 фактов о вероятности, стремящейся к нулю
05.01.2026 06:04:46 | Хабр

[Перевод] Если в LinkedIn у CEO открыт номер телефона — считайте, компания уже взломана
05.01.2026 05:55:20 | Хабр

[Перевод] Что мы теряем, когда ИИ пишет за нас
05.01.2026 05:44:56 | Хабр

Веб-кейсы: лучшие сайты для привлечения клиентов в авторском топ-10 онлайн-бизнеса
05.01.2026 04:51:31 | Хабр

Kubernetes 1.29 → 1.33 за 30 минут: реальный апгрейд кластера с помощью ИИ под контролем инженера
05.01.2026 04:25:02 | Хабр

[Перевод] Внедрение Spec-Driven Development в существующие кодовые базы
04.01.2026 22:01:42 | Хабр

[Перевод] Внедрение Spec-Driven Development в существующие проекты
04.01.2026 22:01:42 | Хабр

[Перевод] Внутри Spec-Driven Development: на что способен GitHub Spec Kit в эпоху AI-инжиниринга
04.01.2026 21:14:06 | Хабр

[Перевод] Внутри Spec-Driven Development: на что способен Spec Kit
04.01.2026 21:14:06 | Хабр

Реактивность без React или как обойтись без id в html элементах
04.01.2026 21:05:42 | Хабр

Кроим ДНК на Python — CRISPR gRNA finder, Часть II: Скоринг, off-target и реальный ген
04.01.2026 20:29:54 | Хабр

Zeroth Robotics представил в США робота-компаньона в стиле WALL-E и человекоподобного робота размером с куклу
04.01.2026 20:18:38 | vc.ru

Как изучить программирование за 7 дней (до конца новогодних праздников)?
04.01.2026 20:16:38 | Хабр

Как начать путь в кибербезопасности: от первых шагов до осознанной карьеры
04.01.2026 20:15:38 | Хабр

Автоматы, потоки. Логические схемы. Задержка распространения
04.01.2026 19:54:19 | Хабр

Физика vs коллекционирование марок: что на самом деле имел в виду Резерфорд и при чём здесь геология
04.01.2026 19:15:27 | Хабр

«(Не)послушные рынки. Фрактальная революция в финансах» (ч.1)
04.01.2026 18:47:43 | Хабр

Новый вид мошенничества
04.01.2026 18:45:19 | Хабр

Как AI сократил финансовую сверку стоимости закупочных материалов с 6 часов до 1 часа
04.01.2026 18:16:15 | Хабр

Сделай удобно: подборка UI/UX-кейсов из цифровых и нецифровых продуктов (#23)
04.01.2026 18:13:58 | Хабр

Livestream как двигатель интернет-торговли. Приживутся ли продающие стримы в России?
04.01.2026 18:11:00 | it-world

Как сделать новогоднюю открытку в стиле СССР с помощью нейросети: 30 готовых промптов
04.01.2026 18:02:24 | Хабр

СМИ рассказали, чего ждать от главной выставки технологий CES 2026
04.01.2026 18:00:24 | ferra.ru

Айзек Азимов: уроки, извлеченные из его книг, и полезные выводы для современного человечества в эпоху ИИ и роботов
04.01.2026 17:16:09 | Хабр

Есть ли толк от E-ядер в OpenMP приложениях?
04.01.2026 17:15:55 | Хабр

Рекуррентные платежи ≠ раз в месяц списать деньги
04.01.2026 17:15:43 | Хабр

Сооснователь Twitter Биз Стоун и соучредитель Pinterest Эван Шарп привлекли $29 млн на свой новый проект — соцсеть «для осознанной жизни»
04.01.2026 17:00:02 | vc.ru

Microsoft закроет специальную версию Windows, созданную для школ
04.01.2026 16:30:19 | ferra.ru

Личный лайфхак 2025 года по декомпозиции задач
04.01.2026 16:29:40 | Хабр

Xbox Seriex X. Консоль разрушенных надежд
04.01.2026 16:22:46 | Хабр

Xbox Series X. Консоль разрушенных надежд
04.01.2026 16:22:46 | Хабр

AI-безопасность: зачем нужен слой на C рядом с Python-детекторами
04.01.2026 16:12:00 | Хабр

День 1410: «Простоквашино» и «Буратино» собрали по 1 млрд рублей в первые дни проката
04.01.2026 15:27:00 | vc.ru

Установка Netbox на Debian-12. Пошаговое руководство
04.01.2026 15:15:54 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Tasnim: КСИР Ирана с начала конфликта уничтожил три американских РЛС AN/TPY-2
04.03.2026 22:23:36 | ТАСС

Ученики школы при МГУ после инцидента на химии чувствуют себя удовлетворительно
04.03.2026 22:23:10 | ТАСС

Гаглоев и Кириенко обсудили вопросы повышения денежного довольствия сотрудников МВД
04.03.2026 22:23:05 | ТАСС

Ушедший из России фастфуд зарегистрировал товарный знак
04.03.2026 22:23:02 | Lenta.ru

Создан прототип безопасной терапии для лечения синдрома Ретта
04.03.2026 22:22:10 | ТАСС

Слава отменила тур по России после скандального концерта
04.03.2026 22:20:00 | Lenta.ru

Шахматист Непомнящий лидирует за тур до окончания "Аэрофлот опен"
04.03.2026 22:19:51 | ТАСС

Зумеры выходят на улицу реже заключённых из-за зависимостей и онлайн-жизни
04.03.2026 22:19:42 | Life.ru

США настроены поддерживать стратегическую стабильность в отношениях с КНР
04.03.2026 22:19:41 | ТАСС

Венгрия обеспокоена данными о подготовке Украиной терактов на "Турецком потоке"
04.03.2026 22:19:28 | ТАСС

Власти Ирака объяснили отключение электричества по всей стране
04.03.2026 22:18:41 | Lenta.ru

Белый дом прокомментировал удар по школе для девочек в Иране
04.03.2026 22:17:06 | Lenta.ru

Болгарские борцы потребовали отставки президента федерации
04.03.2026 22:16:19 | ТАСС

"СВ": Из ВСУ массово бежит "элита", речь идет о нацистах с опытом АТО
04.03.2026 22:15:00 | Российская Газета

ВСУ ударили дронами-камикадзе по двум сёлам в Брянской области
04.03.2026 22:14:31 | Life.ru

В ООН признали атаки на Иран противоречащими Уставу организации
04.03.2026 22:14:00 | Российская Газета

Трамп рассматривает участие США в судьбе Ирана после конфликта
04.03.2026 22:12:39 | ТАСС

Суд обязал вернуть матери деньги за iPhone, случайно купленный её трёхлетним сыном
04.03.2026 22:11:56 | Life.ru

Для танкеров прервали цепочки поставок нефти из Ирака, проходящие через Ормузский пролив
04.03.2026 22:11:29 | ТАСС

ВСУ атаковали российские курорты
04.03.2026 22:11:00 | Lenta.ru

МИД Испании опроверг утверждения США о намерении Мадрида сотрудничать с военными
04.03.2026 22:10:13 | ТАСС

Посольство США призвало американцев срочно покинуть Ирак или запастись припасами
04.03.2026 22:09:13 | Life.ru

В Сочи силы ПВО отражают атаку беспилотников
04.03.2026 22:06:21 | Life.ru

Разведка США следит за избранием нового лидера Ирана, Белый дом хочет выждать
04.03.2026 22:06:00 | Российская Газета

Испания после угроз Трампа согласилась помогать США против Ирана
04.03.2026 22:06:00 | Lenta.ru

Глава горсобрания Курска подал в отставку после критики Хинштейна
04.03.2026 22:05:14 | Life.ru

Белый дом: разведка США следит за избранием верховного лидера Ирана
04.03.2026 22:04:46 | ТАСС

Al Arabiya: штаб КСИР в Бокане на северо-западе Ирана подвергся обстрелу
04.03.2026 22:04:40 | ТАСС

Число погибших при ударах Израиля по Ливану выросло до 72, ранены 437 человек
04.03.2026 22:02:54 | Life.ru

Операторы отвергли предложение банков об их исключении из спам-звонков
04.03.2026 22:01:40 | Ведомости

Госдеп: Более 17 тысяч американцев покинули Ближний Восток
04.03.2026 22:01:36 | Life.ru

Пентагон: США считают выгодным для себя усиление оборонного потенциала Украины
04.03.2026 22:01:23 | ТАСС

В Белом доме заявили, что предлагали Ирану бесплатное ядерное топливо
04.03.2026 22:00:07 | ТАСС

На Украине создали центр для решения проблем регионов в энергетике
04.03.2026 21:59:33 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro