Как устроен Representation Finetuning, родившийся из идеи интерпретируемости LLM

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Как устроен Representation Finetuning, родившийся из идеи интерпретируемости LLM

30.05.2024 12:04:44 | Хабр

Хабы: Машинное обучение, Искусственный интеллект

Black box AI is bad AI — гласит слоган исследовательской группы Pr(AI)2R (Practical AI Alignment and Interpretability Research). Её основал прошлым летом стэнфордский автор Аттикус Гигер (Atticus Geiger). Своей миссией группа считать превратить AI в “хороший AI”, то есть сделать его интерпретируемым.

Пока авторы выпустили три работы: Rigorously Assessing Natural Language Explanations of Neurons (лучшая статья 2023 по версии BlackBoxNLP), в которой попытались провести интерпретацию на уровне нейронов, Linear Representations of Sentiment in Large Language Models, где исследовали репрезентацию настроения в LLM и RAVEL: Evaluating Interpretability Methods on Disentangling Language Model Representations, где представили бенчмарк для оценки интерпретируемости. Есть и более ранние работы Гигера, в частности, он предложил исследовать внутренности LLM с помощью интервенций (изменения внутренних состояний). Суть проста: если зафиксировать скрытое состояние, и выход модели поменяется так, как будто какой-либо компонент производил это состояние, то это даёт нам право установить причинно-следственную связь. Но тут расскажем о том, к каким конструктивным идеям приводит исследование интерпретируемости. Как говорится, критикуешь — предлагай.

Читать далее

Подробнее

Читайте также

Стала известна причина «краткосрочного» увольнения Сэма Альтмана из OpenAI
30.05.2024 12:00:00 | ferra.ru

Лондонский ИИ-стартап Exactly.ai бывшей сотрудницы «Яндекса» привлёк $4 млн
30.05.2024 11:58:21 | vc.ru

Здравый смысл «вне закона»?
30.05.2024 11:54:44 | Хабр

Повышенный спрос в такси или как работает сурдж: от данных до моделей
30.05.2024 11:53:37 | Хабр

Доступ к Docker Hub из России. Как подключиться к Docker Hub после блокировки
30.05.2024 11:49:15 | Хабр

ФАС выявила картель продавцов беспроводных наушников на маркетплейсах
30.05.2024 11:41:06 | vc.ru

[Перевод] «Тёмная звезда»: как сверхдешёвый студенческий фильм навсегда изменил научную фантастику
30.05.2024 11:36:43 | Хабр

Как в Канаде судились с компаниями и простыми пользователями из-за авторского права
30.05.2024 11:36:15 | Хабр

Книга «Микросервисы и API»
30.05.2024 11:35:11 | Хабр

Интересный пример кода на Go и зашоренность мышления
30.05.2024 11:31:00 | Хабр

Делегация Турции примет участие в ПМЭФ-2024
30.05.2024 11:28:20 | it-world

Как улучшать эффективность разработки через метрики? Фреймворк метрик
30.05.2024 11:26:42 | Хабр

Зачем была создана DNS: история появления и решенные проблемы
30.05.2024 11:19:30 | Хабр

Японские ученые создали деревянный спутник для испытаний в космосе
30.05.2024 11:15:00 | ferra.ru

«МТС Юрент», Whoosh и «Яндекс» ввели единые штрафы за нарушения правил безопасности при управлении электросамокатами
30.05.2024 11:14:34 | vc.ru

Результаты большого техписательского опроса. География, демография, зарплаты
30.05.2024 11:10:08 | Хабр

Cognitive Pilot представила беспилотный мини-трактор без кабины
30.05.2024 10:55:50 | vc.ru

Как делать бинарно-совместимые API на компилируемых языках
30.05.2024 10:48:19 | Хабр

Путь к DRY валидации в Laravel
30.05.2024 10:35:18 | Хабр

Создан материал, способный бороться с нефтяными разливами
30.05.2024 10:30:00 | ferra.ru

ИБП для дома и бизнеса, которые чаще всего покупают в XCOM-SHOP.RU
30.05.2024 10:27:00 | Хабр

Нетворкинг, знания и лут: почему я люблю IT-конференции больше, чем отпуск
30.05.2024 10:24:34 | Хабр

Ужасно подробные ошибки в API: пишем на Go инструмент для работы с ними
30.05.2024 10:23:16 | Хабр

Крупнейшая в России издательская группа «Эксмо-АСТ» прекратила отгружать книги интернет-магазину «Лабиринт» из-за долгов
30.05.2024 10:09:34 | vc.ru

История подростка, взломавшего Twitter и укравшего миллионы
30.05.2024 09:57:18 | Хабр

«Восход» с партнёрами запустил фонд для инвестиций в технологические компании, которые нацелены выйти на публичный рынок
30.05.2024 09:56:09 | vc.ru

Ученые разработают ИИ для быстрого поиска действий в видеороликах
30.05.2024 09:45:00 | ferra.ru

Сквозная аналитика: комплексный подход к эффективности бизнеса
30.05.2024 09:38:12 | Хабр

Обзор сканеров безопасности для проверки конфигурации Terraform
30.05.2024 09:36:10 | Хабр

Европейский парламент принял исторический закон об искусственном интеллекте
30.05.2024 09:31:25 | it-world

Стандарты. Титульная часть. Раздел с терминами и сокращениями
30.05.2024 09:18:23 | Хабр

Redis UI для администрирования сотен Redis инстансов
30.05.2024 09:12:44 | Хабр

Два года ждали: новый релиз «FreeBSD для Mac» — операционной системы ravynOS
30.05.2024 09:11:51 | Хабр

Kion добавил возможность заходить в профиль по биометрии — не вводя PIN-код
30.05.2024 09:08:58 | vc.ru

Как я проходил собеседование в Тинькофф
30.05.2024 09:07:26 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Сийярто: Украина снимет нефтяную блокаду Венгрии после выборов в парламент
21.03.2026 16:38:45 | ТАСС

Лавров: На Ближнем Востоке подход «рубить с плеча» никогда не сработает
21.03.2026 16:38:31 | Life.ru

Telegram не стал по запросу РФ удалять каналы с пробивом и вербовкой террористов
21.03.2026 16:37:00 | Life.ru

Лавров: США должны уважать Россию и "за пределами российских богатств"
21.03.2026 16:35:40 | ТАСС

КСИР сообщил об уничтожении израильского истребителя F-16 в небе над Ираном
21.03.2026 16:34:34 | Life.ru

«Говорил от души»: Лыжник Голубков рассказал о встрече с Путиным в Кремле
21.03.2026 16:34:10 | Life.ru

Дачникам рассказали, какие культуры можно сажать уже в апреле
21.03.2026 16:33:06 | Life.ru

Офис Орбана жестко прокомментировал атаки Киева на "Турецкий поток"
21.03.2026 16:32:00 | Российская Газета

КСИР заявил об уничтожении израильского F-16 в небе над Ираном
21.03.2026 16:31:18 | Lenta.ru

В МИД России осудили атаку на ядерный объект в Иране
21.03.2026 16:31:13 | Lenta.ru

В Башкирии бьют тревогу из-за 11-летней девочки-маугли в многодетной семье
21.03.2026 16:31:05 | Life.ru

Орбан обвинил Брюссель в упадке демократии в Европе
21.03.2026 16:29:00 | Российская Газета

Петросян исполнила четверной тулуп на Кубке Первого канала
21.03.2026 16:27:45 | ТАСС

На Западе удивились изменениям в поведении Зеленского
21.03.2026 16:27:26 | Lenta.ru

Российские учёные создали из клеток «живую» альтернативу кардиостимулятору
21.03.2026 16:26:42 | Life.ru

Пострадавший в ДТП в Ростовской области находится в тяжелом состоянии
21.03.2026 16:23:58 | ТАСС

В Госдуме оценили влияние украинцев на Европу
21.03.2026 16:23:38 | Lenta.ru

Лавров раскритиковал подход США к переговорам по Ближнему Востоку
21.03.2026 16:21:06 | Lenta.ru

УПЦ Киевского патриархата избрала новым главой архиепископа Никодима
21.03.2026 16:20:56 | Life.ru

В Офисе Орбана сравнили силы России и Украины
21.03.2026 16:19:46 | Lenta.ru

Сын экс-президента Боливии Марсело Арсе задержан по делу о коррупции
21.03.2026 16:17:45 | Life.ru

Крупнейший из найденных в Торжке кладов золотых монет передали в фонд ВИЭМ
21.03.2026 16:17:18 | ТАСС

Армия Израиля заявила о новой серии ударов по ракетным объектам в Тегеране
21.03.2026 16:14:16 | ТАСС

Минспорт официально признал женские ММА видом спорта
21.03.2026 16:12:52 | ТАСС

Израильская полиция напала на журналистов в Иерусалиме
21.03.2026 16:12:00 | Российская Газета

В Иране обвинили США и Израиль в ударах по судам в Персидском заливе
21.03.2026 16:11:55 | Lenta.ru

Иран заявил об ударах США и Израиля по гражданским судам в Персидском заливе
21.03.2026 16:11:49 | Life.ru

В Белгородской области при обстреле ВСУ погибли два человека
21.03.2026 16:11:05 | ТАСС

В Совфеде оспорили заявление Вучича о начале третьей мировой войны
21.03.2026 16:10:04 | Lenta.ru

В Москве наградили победителей конкурса "История России моими глазами"
21.03.2026 16:08:10 | ТАСС

21 марта в Майами пройдет встреча США и Украины по урегулированию конфликта
21.03.2026 16:08:00 | Российская Газета

В России обнаружили девочку-маугли
21.03.2026 16:08:00 | Lenta.ru

Минцифры опровергло подготовку введения "белых списков" у домашних интернет-провайдеров
21.03.2026 16:07:54 | ТАСС

Минцифры опровергло подготовку "белых списков" для домашнего интернета
21.03.2026 16:07:54 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro