[Перевод] Что такое supervised fine-tuning?

24.07.2024 08:36:49 | Хабр

Хабы: Big Data, Data Engineering, Data Mining, Искусственный интеллект, Машинное обучение
Supervised fine-tuning (SFT) — это методика, применяемая для адаптации предварительно обученных Large Language Model (LLM) под конкретную задачу при помощи размеченных данных.

В процессе SFT предварительно обученные LLM подвергаются fine-tuning на основе размеченного датасета при помощи методик обучения с учителем. Веса модели выравниваются на основании градиентов, полученных из функции потерь конкретной задачи, измеряющей разность между прогнозами LLM и эталонной разметкой.

Этот процесс позволяет модели обучаться паттернам и нюансам конкретной задачи, адаптируя её параметры в соответствии с распределением конкретных данных и требований задачи.

SFT, обычно выполняемый после предварительного обучения модели, применяется для того, чтобы научить модель следовать переданным пользователем инструкциям. Он более вычислительно затратен, чем fine-tuning без учителя, но и имеет больше шансов достичь повышенной точности.

Объём необходимого дообучения зависит от сложности задачи и размера датасета. В случае простого переноса стиля с использованием моделей OpenAI наподобие GPT-3.5 или GPT-4 для получения превосходных результатов обычно достаточно 30-50 высококачественных примеров.

Чтобы преобразовать базовую Large Language Model (LLM) в выполняющую инструкции LLM (например, превратить Mistral в Mistral Instruct), обычно требуется обучение на десятках тысяч примеров.

Дообучение Zephyr 7b выполнялось на 16 GPU Nvidia A100 в течение примерно четырёх часов. Это можно считать примером отправной точки для модели с 7 миллиардами параметров.
Читать дальше →

Подробнее

Читайте также

3D-печать для чайников. Часть 1: Подготовка
24.07.2024 08:30:46 | Хабр

На что обратить внимание при выборе ИТ-партнера? 7 критериев, которые не стоит упускать
24.07.2024 08:27:33 | Хабр

Слух: Nvidia представит флагманские видеокарты GeForce RTX 50 не раньше 2025 года
24.07.2024 08:15:00 | ferra.ru

Ученые нашли напиток возрастом 2300 лет и выпили его
24.07.2024 08:14:26 | ferra.ru

Смартфоны Samsung Galaxy получат новую бету Android 15 уже на следующей неделе
24.07.2024 08:06:25 | ferra.ru

Первая частная российская аэрокосмическая компания выходит на Мосбиржу
24.07.2024 08:02:28 | it-world

В Photoshop появились новые ИИ-кисти
24.07.2024 07:58:25 | ferra.ru

Почему иногда лучше оценить задачу в размерах майки, чем в часах
24.07.2024 07:56:16 | Хабр

Российские компании начнут поощрять за переход на отечественное ПО
24.07.2024 07:50:24 | ferra.ru

Кластер из 100 тыс NVIDIA H100 запустили для обучения самого мощного ИИ от Илона Маска
24.07.2024 07:41:22 | ferra.ru

Флагманский Huawei Mate 70 выйдет позже ожидаемого
24.07.2024 07:36:38 | ferra.ru

Из Москвы в Сочи на электромобиле: к чему готовиться
24.07.2024 07:34:39 | Хабр

Делегировать или нет? Как нейросеть может помочь в работе PR-специалиста
24.07.2024 07:32:24 | Хабр

Доказано: стресс у человека влияет на эмоции у собак
24.07.2024 07:30:00 | ferra.ru

Ученые из Google создали самовоспроизводящуюся искусственную жизнь на языке программирования Brainfuck
24.07.2024 07:27:21 | ferra.ru

Какие камеры получат Xiaomi 14T и 14T Pro
24.07.2024 07:16:20 | ferra.ru

Новый убийца Си опроверг арифметику
24.07.2024 07:15:35 | Хабр

Создатели «Ведьмак 4» избавят будущие игры на движке Unreal Engine 5 от тормозов
24.07.2024 07:08:20 | ferra.ru

Редкий картридж для прародителя консоли Dendy выставили на аукцион
24.07.2024 07:01:19 | ferra.ru

Как эффективно решить дизайн-задачу: задаём продакт-менеджеру правильные вопросы
24.07.2024 07:00:32 | Хабр

Ученые выяснили, что хронически высокое давление повышает риск инсульта
24.07.2024 06:45:00 | ferra.ru

Как мы внедрили ИИ на сайте одного из гуру «Международного общества сознания Кришны»
24.07.2024 06:41:37 | Хабр

Контроль срока службы и биоразложения: имплантируемая электроника
24.07.2024 06:30:04 | Хабр

Как реализовать и оптимизировать UPSERT в Greenplum 6
24.07.2024 06:25:51 | Хабр

Шифровальщики – волшебные твари и где они обитают
24.07.2024 06:25:27 | Хабр

Выпускные проекты участников senior-буткемпа «кодИИм» (июль 2024 г.)
24.07.2024 06:16:24 | Хабр

Зачем на самом деле нужны программисты?
24.07.2024 06:12:17 | Хабр

Инсульт провоцирует долгосрочные проблемы с сердцем, показало исследование
24.07.2024 06:00:00 | ferra.ru

Как устроено Pre-IPO, или где еще российским технологическим компаниям сейчас брать деньги
24.07.2024 05:57:07 | Хабр

Дата-сайентистам: рецензия на книгу “Машинное обучение с PyTorch и Scikit-Learn”
24.07.2024 05:53:52 | Хабр

Случайные блуждания: связь с резистивным расстоянием (часть 2)
24.07.2024 05:35:24 | Хабр

Слабоумие и отвага: Разработка игры Disciples 2 на Avalonia и WPF
24.07.2024 05:16:40 | Хабр

Создан портативный прибор для экспресс-диагностики инфекций
24.07.2024 05:15:00 | ferra.ru

Кто такой Data Engineer | Дата Инженер
24.07.2024 05:00:14 | Хабр

[Перевод] Мышечная дистрофия Дюшенна. Разработка протокола генной терапии для людей
24.07.2024 04:46:03 | Хабр

Смотреть все

НОВОСТИ

Зеленский назвал состав делегации на встречу с Трампом
27.12.2025 16:49:46 | РЕН ТВ

Раскрыт секрет древней славянской крепости
27.12.2025 16:47:08 | ТАСС

Швейцарский депутат: Запад веками использует фейки, чтобы оправдать атаки на РФ
27.12.2025 16:47:04 | ТАСС

Захарова раскритиковала «языческое Рождество» на Украине из-за маскарада
27.12.2025 16:46:24 | Life.ru

Стало известно о шоке в НАТО из-за российских ударов по Украине
27.12.2025 16:45:27 | Life.ru

Воспитанника футбольного ЦСКА избили и обстреляли в потасовке в Подмосковье
27.12.2025 16:44:33 | РЕН ТВ

Дети из ЛНР и ДНР посетили Кремлевскую новогоднюю елку
27.12.2025 16:41:35 | ТАСС

Юлия Меньшова опубликовала выпуск своего шоу впервые после смерти Веры Алентовой
27.12.2025 16:41:26 | Life.ru

Во Франции экс-советника Макрона обвинили в подстрекательстве к войне с Россией
27.12.2025 16:41:02 | Lenta.ru

Екатерина Климова удивила публику, выйдя в свет с 23-летней дочерью
27.12.2025 16:40:01 | Life.ru

Махачев продолжит выступать в UFC даже в случае ограничения времени в партере
27.12.2025 16:39:54 | ТАСС

Саркози, Трамп и фон дер Ляйен получили антипремии газеты Politico
27.12.2025 16:38:54 | Lenta.ru

В Ужгороде военкомы похитили из больницы священника УПЦ
27.12.2025 16:38:10 | Life.ru

Фетисов оценил недопуск сборной России на молодежный чемпионат мира
27.12.2025 16:37:42 | Lenta.ru

ТАСС: футболист Адамс пострадал во время драки со стрельбой в Подмосковье
27.12.2025 16:37:33 | ТАСС

Глава Росавиации рассказал о сертификационных полетах отечественных самолетов в 2025 году
27.12.2025 16:36:26 | ТАСС

РФ сможет предложить отечественные авиасистемы мировому рынку
27.12.2025 16:35:00 | ТАСС

В ФРГ заявили о нахождении страны в самом длительном кризисе
27.12.2025 16:34:57 | Lenta.ru

Захарова прокомментировала поведение украинцев на праздновании Рождества
27.12.2025 16:34:53 | ТАСС

Алиханов: в 2026 году есть возможности производства восьми самолетов Ту-214
27.12.2025 16:34:43 | ТАСС

RT: Коломойский* через «ПриватБанк» финансировал батальоны, разграбив Украину
27.12.2025 16:34:34 | Life.ru

Командир Колосс: ВСУ нет и не может быть на комбинате в Купянске
27.12.2025 16:34:10 | ТАСС

Зеленский заявил о наличии "красных линий" перед переговорами с Трампом
27.12.2025 16:33:58 | РЕН ТВ

Оставшийся один дома 12-летний мальчик помог поймать вора
27.12.2025 16:33:21 | Lenta.ru

Из ФНБ выделят более 25 млрд рублей на льготный лизинг для 70 вертолетов
27.12.2025 16:31:10 | ТАСС

Глава Минпромторга сообщил о договоренностях с возможными покупателями Ту-214
27.12.2025 16:31:07 | ТАСС

В СПЧ назвали главное правило безопасности в Новый год
27.12.2025 16:29:09 | Lenta.ru

Артемьев обыграл Карлсена и является лидером чемпионата мира по рапиду
27.12.2025 16:28:35 | ТАСС

НАБУ заявило о сопротивлении со стороны охраны при обысках в Верховной раде
27.12.2025 16:27:29 | Life.ru

Назван самый высокооплачиваемый артист 2025 года
27.12.2025 16:24:31 | Lenta.ru

В аэропорту Внуково ввели временные ограничения на приём и выпуск самолётов
27.12.2025 16:22:39 | Life.ru

Четыре человека погибли в ДТП с фурой под Нижним Новгородом
27.12.2025 16:22:16 | Life.ru

В постсоветской стране откроется граница спустя 32 года
27.12.2025 16:19:45 | Lenta.ru

Во Внуково ввели ограничения на полеты
27.12.2025 16:19:44 | Lenta.ru

На Западе заметили смягчение позиции Макрона по России на фоне воинствующего Мерца
27.12.2025 16:17:57 | Life.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro