RLHF. История становления идеи — 4. HHH: helpful, honest, harmless, Instruct LLM, Constitutional AI

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

RLHF. История становления идеи — 4. HHH: helpful, honest, harmless, Instruct LLM, Constitutional AI

10.08.2024 06:00:21 | Хабр

Хабы: Машинное обучение, Искусственный интеллект, Natural Language Processing

Заканчиваем разбирать части пайплайна RLHF с точки зрения исторической ретроспективы, чтобы понять, как сформировалась идея, которая сегодня лежит в основе самых популярных LLM.

В первой части мы ознакомились с общим пайплайном RLHF, LLM, KL-контролем и необходимостью предобучения на пусть и грязных, но больших данных

Во второй - сравнили Offline RL и Online RL, увидели их ограничения, попробовали имитировать Online RL через self-play и непрерывную обратную связь от среды через Reward Modelling. А еще первый раз задумались о сборе непротиворечивой но достаточно полной обратной связи от человека.

В третьей - добавили этап дообучения с учителем на качественных демонстрациях и осознали важность контроля за сбором человеческой обратной связи.

В этой, финальной части, мы узнаем современное и будто бы общепринятое понятие и определение "согласованной модели" - HHH: helpful, honest, harmless, поиграемся с различными комбинациями RM для представления HHH моделей, а еще увидим, как обогащать и собирать обратную связь не от человека, а от LLM.

Читать далее

Подробнее

Читайте также

Репликация: создание кластера, подключение, изменения настроек таблицы в кластере
10.08.2024 05:35:28 | Хабр

Нейросети на практике
10.08.2024 05:35:11 | Хабр

Зачем лабораториям кастомные решения и как мы их создаем
10.08.2024 04:40:05 | Хабр

Кастомная тема Jetpack Compose
10.08.2024 03:53:09 | Хабр

Нарколог объяснил вред алкоголя для людей с болезнями сердца
10.08.2024 01:01:18 | ferra.ru

Приложение Rutube удалили из App Store
10.08.2024 00:44:03 | vc.ru

Популярный подсластить эретрит оказался опасен из-за риска тромбоза
09.08.2024 23:58:43 | ferra.ru

Как решать IELTS: часть Reading
09.08.2024 23:41:24 | Хабр

Кто из релокантов возвращается, с кем соперничает Zoom, и рассказы о серверах Google
09.08.2024 23:29:26 | it-world

Врач порекомендовала есть сёмгу при похудении
09.08.2024 23:11:04 | ferra.ru

Настраиваем дампы ядра в Linux
09.08.2024 22:40:52 | Хабр

Правительство разрешило запускать беспилотные грузоперевозки по трассе М-12 «Восток» и ЦКАД
09.08.2024 21:15:07 | vc.ru

Google начала разработку очередной версии ОС для смарт-часов
09.08.2024 21:00:00 | ferra.ru

Венесуэла запретила соцсеть Х после стычки Маска и президента Мадуро
09.08.2024 20:15:00 | ferra.ru

Роскомнадзор сообщил о блокировке мессенджера Signal
09.08.2024 19:30:00 | ferra.ru

Роскомнадзор заблокировал мессенджер Signal
09.08.2024 19:04:39 | vc.ru

От Intel до Cisco: Масштабные увольнения охватывают ИТ-рынок
09.08.2024 18:59:03 | it-world

Все дороги ведут в ГТА, на этот раз в мой браузерный вариант
09.08.2024 18:49:38 | Хабр

В США предложили разработать курительные устройства для борьбы с астмой
09.08.2024 18:45:00 | ferra.ru

В совете директоров OpenAI появился ученый
09.08.2024 18:17:32 | it-world

Экспорт сайта БЕСПЛАТНО с Webflow
09.08.2024 18:15:20 | Хабр

data.ai: за июль 2024 года приложение Rutube скачали 952 тысячи раз, «VK Видео» — 694 тысячи раз
09.08.2024 18:13:37 | vc.ru

NASA сообщило о приближении к Земле сразу пяти астероидов
09.08.2024 18:00:00 | ferra.ru

Выручка TSMC выросла в июле на 45%, руководство планирует повышать цены
09.08.2024 17:18:14 | it-world

В России начались сбои в работе мессенджера Signal
09.08.2024 17:15:00 | ferra.ru

Дополненная реальность в Scratch для детей: гайд
09.08.2024 16:56:26 | Хабр

Лишь 16% уехавших за рубеж ИТ-специалистов вернулись на родину
09.08.2024 16:34:16 | it-world

Китай переходит на стандарт связи 5G-A, 5G — вчерашний день
09.08.2024 16:31:49 | it-world

Microsoft обвинила иранских хакеров в попытках взломать почту политиков США
09.08.2024 16:30:00 | ferra.ru

Биткоин снова подорожал свыше $60 тысяч
09.08.2024 15:50:45 | ferra.ru

Сбой в Signal — пользователи в России пожаловались, что мессенджер не работает
09.08.2024 15:44:59 | vc.ru

Профайлинг: сбор и анализ информации
09.08.2024 15:44:20 | Хабр

COMMO Immersive с шумодавом: чего да как
09.08.2024 15:26:04 | Хабр

У китайца буквально позеленела кровь из-за алкоголизма и болезней печени
09.08.2024 15:00:00 | ferra.ru

Названы 5 лучших умных часов Apple для покупки в 2024 году
09.08.2024 14:58:40 | ferra.ru

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Бортников назвал тенденцией вербовку российских детей мошенниками с Украины
19.03.2026 19:50:21 | Коммерсантъ

Россиянка отменила поездку и отсудила у турагента сумму в 2,5 раза больше заплаченной
19.03.2026 19:48:48 | Lenta.ru

Тренер Назаров на встрече с Путиным призвал объединиться ради паралимпийцев
19.03.2026 19:47:12 | ТАСС

В МВФ ожидают ослабления экономического роста в странах Персидского залива
19.03.2026 19:46:35 | ТАСС

Зеленский потребовал от ЕС €5 млрд на энергетику
19.03.2026 19:45:37 | ТАСС

Зеленский закатил истерику перед лидерами ЕС из-за недостаточного давления на Россию
19.03.2026 19:43:40 | Life.ru

В Брянской области при атаке ВСУ повреждено здание школы
19.03.2026 19:42:02 | ТАСС

«Радиостанция Судного дня» передала четыре странных шифровки за день
19.03.2026 19:41:15 | Lenta.ru

Премьер Бельгии пошутил, что ЕС неэффективностью стал похож на его страну
19.03.2026 19:41:10 | ТАСС

Украинская артиллерия ударила по жилым домам в российском регионе
19.03.2026 19:41:10 | Lenta.ru

В Латвии завели дело о доведении до самоубийства бывшего мужа Седоковой
19.03.2026 19:41:04 | Life.ru

МИД России вызовет посла Израиля из-за атаки на сотрудников российского телеканала
19.03.2026 19:40:54 | Lenta.ru

Право на единое пособие сохранится, если у семьи один автомобиль и один мотоцикл
19.03.2026 19:40:49 | ТАСС

УЕФА включил Сафонова в команду недели Лиги чемпионов
19.03.2026 19:39:44 | ТАСС

Дегтярев: символы РФ постепенно возвращаются на международные соревнования
19.03.2026 19:39:27 | ТАСС

Трамп ответил на вопрос об отправке сухопутных войск в Иран
19.03.2026 19:39:19 | Life.ru

Трамп обвинил союзников по НАТО в нежелании защищать Ормузский пролив
19.03.2026 19:38:09 | ТАСС

Британия вывела из-под санкций транспортировку "Роснефтью" казахстанского сырья
19.03.2026 19:37:45 | ТАСС

"Автостат" заявил о сокращении стоков новых авто в РФ в начале года
19.03.2026 19:37:07 | ТАСС

Участники СВО из Белгородской области получат землю для строительства домов
19.03.2026 19:37:03 | ТАСС

Эксперт Ильинский рассказал о роли США в парламентских выборах в Венгрии
19.03.2026 19:37:00 | Российская Газета

Иран нанёс удар по нефтеперерабатывающему заводу на севере Израиля
19.03.2026 19:35:44 | Life.ru

Тренер паралимпийцев Назаров рассказал Путину о дружеском отношении на Играх
19.03.2026 19:34:19 | ТАСС

Экс-главу Звездного городка Баришевского арестовали
19.03.2026 19:34:11 | ТАСС

КСИР показал кадры c ОЭС подбитого F-35
19.03.2026 19:34:08 | Lenta.ru

Трамп ответил на вопрос о войне с Ираном шуткой про Перл-Харбор
19.03.2026 19:34:03 | Lenta.ru

МИД РФ вызовет посла Израиля из-за атаки на журналистов RT в Ливане
19.03.2026 19:33:46 | ТАСС

В Тверской области арестовали председателя "НИСЭГ Содействие" по делу о мошенничестве
19.03.2026 19:33:21 | ТАСС

Союзники США заявили о готовности помочь с безопасностью в Ормузском проливе
19.03.2026 19:32:00 | Российская Газета

Врач предупредила об опасности одного предмета на кухне
19.03.2026 19:31:27 | Lenta.ru

В Кремле прокомментировали атаку на сотрудников российского телеканала в Ливане
19.03.2026 19:31:08 | Lenta.ru

Иран впервые подбил американский истребитель F-35
19.03.2026 19:30:51 | Life.ru

Создан тест для диагностики микробиоты
19.03.2026 19:30:41 | ТАСС

В России предрекли украинские провокации против Венгрии
19.03.2026 19:30:29 | Lenta.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro