Я измерил «личность» 6 open-source LLM (7B-9B), заглянув в их hidden states. Вот что получилось

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Я измерил «личность» 6 open-source LLM (7B-9B), заглянув в их hidden states. Вот что получилось

10.02.2026 10:00:50 | Хабр

Хабы: Машинное обучение, Искусственный интеллект, Исследования и прогнозы в IT, Научно-популярное

У LLM есть устойчивый стиль ответов даже без системного промпта. Я построил инструмент, который измеряет этот «характер» через проекции скрытых состояний на 7 контрастных осей (тёплый/холодный, многословный/лаконичный и др.) и протестировал его
на 6 open-weight моделях 7–9B. Главный результат: alignment-тренировка сжимает поведенческое пространство моделей — подавляет оси позиции (уверенность, прямолинейность), сохраняя оси стиля (креативность, многословность). Llama 3.1 8B — самая
ограниченная (4/7 осей в слабой зоне), DeepSeek 7B сохраняет наибольшую независимость осей. Сравнение base vs instruct для 5 организаций подтверждает паттерн. Код и данные открыты.

Читать далее

Подробнее

Читайте также

От манифеста к практике: как Agile меняет мир
10.02.2026 09:54:46 | Хабр

Ксаверий, Терминус и языковые модели против кодировщиков
10.02.2026 09:40:07 | Хабр

[Перевод] Как выстроить границы, не говоря «нет»: скрипты и принципы
10.02.2026 09:37:28 | Хабр

Что будет, если собрать компьютер в холодильнике? Да, в настоящем холодильнике
10.02.2026 09:35:51 | Хабр

Один primary в поле среди 800 миллионов пользователей — надо ли так делать?
10.02.2026 09:30:37 | Хабр

В чем разница между ремастером и ремейком
10.02.2026 09:29:23 | Хабр

День 1448: объём сделок по слиянию и поглощению на российском рынке в 2025 году упал до минимума за 20 лет
10.02.2026 09:26:42 | vc.ru

Единая цифровая платформа: как мы строили импортозамещенную экосистему для банка
10.02.2026 09:25:15 | Хабр

Глобальная область видимости в JavaScript
10.02.2026 09:22:51 | Хабр

Юрист нашёл в договоре 32 проблемы, AI — 41. Разбираю, кто что пропустил
10.02.2026 08:51:16 | Хабр

Как сделать приложение без программиста: личный опыт контент-редактора Рунити
10.02.2026 08:45:50 | Хабр

Книжные клубы — новый (старый) тренд вдумчивого чтения
10.02.2026 08:43:53 | Хабр

China Mobile отказалась от ИИ-ускорителей Nvidia и закупила аналоги Huawei на $22 млн
10.02.2026 08:37:01 | ferra.ru

Офлайн режим в Notion и решение конфликтов
10.02.2026 08:20:57 | Хабр

Время выполнения заданий в немодерируемых UX-тестах: как измерить и проверить?
10.02.2026 08:15:15 | Хабр

[Перевод] Планировщик Go
10.02.2026 08:05:17 | Хабр

SSR vs CSR vs гибрид. Сравниваем подходы к рендерингу страниц Django-приложения
10.02.2026 08:01:15 | Хабр

Обзор лучших API для распознавания речи 2026
10.02.2026 08:01:14 | Хабр

Как мы учим роботов понимать физический мир: путь от специалистов к генералистам
10.02.2026 08:00:25 | Хабр

Cucumber должен умереть: Как с помощью BDR превратить код в отчеты без регулярок и регистрации?
10.02.2026 07:49:28 | Хабр

SaaSpocalypse: технологии AI ломают бизнес-модель SaaS?
10.02.2026 07:45:45 | Хабр

Как витамин для зрения научился лечить прыщи и стирать морщины
10.02.2026 07:45:10 | Хабр

Таймтрекеры как диагноз: почему это красный флаг работодателя
10.02.2026 07:44:19 | Хабр

Zero Trust и LLM в корпорации, что это и зачем надо
10.02.2026 07:36:43 | Хабр

План-график для проекта внедрения ERP-системы на примере 1С и SAP
10.02.2026 07:30:06 | Хабр

Дизайн или функциональность: как мы разрабатывали внешний вид серверного безеля
10.02.2026 07:30:03 | Хабр

Работа над ошибками. Как я ускорял Next.js приложение. React Compiler, Redis и многослойное кеширование
10.02.2026 07:00:47 | Хабр

МИСиС: как сталевары научились квантовой физике
10.02.2026 07:00:46 | Хабр

nanoCAD Механика PRO: принципы параметрического моделирования и автоматизации создания машиностроительной документации
10.02.2026 07:00:44 | Хабр

Исследование процесса обновления UEFI BIOS H2O фирмы Insyde Software
10.02.2026 07:00:43 | Хабр

Приложение на Go шаг за шагом. Часть 4: отправка сообщений об ошибках
10.02.2026 07:00:40 | Хабр

ПСБ + НСПК = сервис мгновенного обмена счетами и их оплаты «Запрос о платеже». Как это устроено?
10.02.2026 06:44:37 | Хабр

Как защитить ключи LUKS с помощью Рутокен ЭЦП 3.0 и алгоритмов ГОСТ Р 34.10-2012. Часть 2
10.02.2026 06:42:35 | Хабр

Конфиденциальные вычисления
10.02.2026 06:38:00 | Хабр

Ваше собеседование уже слили. Рынок, где работают «волки»
10.02.2026 06:37:32 | Хабр

Смотреть все

НОВОСТИ

Вербное воскресенье в 2026 году: смысл и традиции православного праздника
13.04.2026 00:10:00 | Lenta.ru

Самолет "Судного дня" США взлетел с базы на фоне ультиматума Трампа Ирану
07.04.2026 16:13:00 | Российская Газета

Опубликован первый четкий снимок Моря Восточного с обратной стороны Луны
07.04.2026 16:08:51 | ТАСС

Хуснуллин заявил о росте объема запусков новых жилищных проектов в РФ
07.04.2026 16:08:26 | ТАСС

В Подмосковье похитили немецкого ягдтерьера Рагнара, сняв ошейник с GPS
07.04.2026 16:07:04 | Life.ru

На Запорожье назвали цинизмом удар по школе в праздник Благовещения
07.04.2026 16:07:01 | ТАСС

Обвиняемая в колдовстве женщина высушила собаку и сохранила ее сублимированное тело
07.04.2026 16:06:39 | Lenta.ru

Эксперт оценил последствия удара по острову Харк для нефтяного экспорта Ирана
07.04.2026 16:06:00 | Российская Газета

Карасин: Заявления о запуске дронов РФ через Румынию стоят «минус одну копейку»
07.04.2026 16:05:35 | Life.ru

Вице-губернатор Кубани Коробка не признал за собой право на поместье за 1 млрд рублей
07.04.2026 16:05:35 | ТАСС

Карпина предложили отправить в монастырь
07.04.2026 16:04:49 | Lenta.ru

Число пострадавших при ударе ВСУ по школе на Запорожье увеличилось до 10
07.04.2026 16:04:40 | ТАСС

Орбан: Венгрия по-прежнему готова принять саммит РФ и США по Украине
07.04.2026 16:04:16 | ТАСС

Вэнс поблагодарил Венгрию за готовность провести саммит США и России
07.04.2026 16:03:53 | ТАСС

Экс-министра тарифной политики Красноярского края Ананьева отправили в СИЗО
07.04.2026 16:03:23 | ТАСС

Иран хочет ввести плату за проход судов через Ормузский пролив
07.04.2026 16:02:53 | Life.ru

Два Рождества и одна Пасха: Почему Киев не решился «перенести» воскресение Христа
07.04.2026 16:02:51 | Life.ru

Минфин 8 апреля проведет аукционы по размещению ОФЗ двух выпусков
07.04.2026 16:02:49 | ТАСС

В ГД предложили предоставлять кредитные каникулы фермерам при неурожае
07.04.2026 16:02:19 | ТАСС

Международные резервы РФ в марте снизились до $748,984 млрд
07.04.2026 16:01:52 | ТАСС

Press TV: США спасением пилота прикрыли попытку проникнуть на ядерный объект Ирана
07.04.2026 16:00:56 | ТАСС

Ведомый дрон F-35 разбился в США
07.04.2026 16:00:43 | Lenta.ru

Шоковая экономическая терапия: может ли Европа отказаться от товаров из Китая?
07.04.2026 16:00:01 | ТАСС

Новый тип ядерного топлива впервые загрузили в крупный коммерческий реактор в России
07.04.2026 16:00:00 | iXBT.com

Тест: «Что ж ты, фраер, сдал …»? Продолжите строки из 6 песен Михаила Круга, докажите, что фанат!
07.04.2026 16:00:00 | Life.ru

Российский бизнес сможет строить корпоративную ИИ-инфраструктуру в одной экосистеме
07.04.2026 15:59:08 | Lenta.ru

Fars: в Тегеране из-за удара по рынку погибли три человека
07.04.2026 15:58:17 | ТАСС

Сорвавший гособоронзаказ глава российского завода заплатит штраф в два миллиарда рублей
07.04.2026 15:57:57 | Lenta.ru

Попавшим в трудную жизненную ситуацию российским детям устроили показ макетов оружия
07.04.2026 15:57:30 | Lenta.ru

В Молдавии приостановили инфраструктурные проекты из-за роста цен на топливо
07.04.2026 15:57:15 | ТАСС

В Румынии работают над кризисным сценарием по снабжению топливом
07.04.2026 15:56:48 | ТАСС

Ненецкий АО поможет атакованному ВСУ району в Запорожской области
07.04.2026 15:56:32 | ТАСС

Цена российской нефти Urals достигла максимума за 13 лет
07.04.2026 15:56:02 | Ведомости

Дегтярёв: Российские олимпийцы всё же получат смартфоны, которые «зажал» Samsung
07.04.2026 15:55:35 | Life.ru

Вучич: продолжение войны на Ближнем Востоке вызовет мировой кризис промышленности
07.04.2026 15:54:59 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro