[Перевод] Как дообучать LLM с помощью Supervised Fine-Tuning

info@vsetut.pro

Стать автором

Вернуться

12.08.2024 13:34:21 | Хабр

Хабы: Big Data, Data Engineering, Data Mining, Искусственный интеллект, Машинное обучение

Обычно большие языковые модели (large language model, LLM) обучают в несколько этапов, включающих предварительное обучение и множество этапов fine-tuning (см. ниже). Предварительное обучение — это дорогостоящий процесс (например, требующий многих сотен тысяч долларов на вычислительные ресурсы), однако fine-tuning модели LLM (или контекстное обучение) по сравнению с этим гораздо дешевле (например, сотни долларов или даже меньше). Учитывая широкую доступность и бесплатность (даже для коммерческого использования) предварительно обученных LLM (например, MPT, Falcon или LLAMA-2), мы можем создавать большой спектр мощных приложений благодаря fine-tuning моделей под нужные задачи.

Этапы обучения LLM

На текущем этапе исследований ИИ одним из самых широко применяемых видов fine-tuning моделей LLM стал supervised fine-tuning (SFT). При этой методике курируемый датасет высококачественных выходных данных LLM применяется для непосредственного fine-tuning модели. SFT прост и дёшев в использовании, это полезный инструмент выравнивания языковых моделей, ставший популярным даже за пределами исследовательского сообщества опенсорсных LLM. В этой статье мы вкратце расскажем о принципах SFT, рассмотрим исследования по этой теме и приведём примеры того, как практикующие специалисты могут с лёгкостью пользоваться SFT, написав всего несколько строк кода на Python.
Читать дальше →

Подробнее

Читайте также

Сеченовский университет разработал новый метод лечения пузырчатки
12.08.2024 13:30:00 | ferra.ru

Макросы в tentacli. Часть один
12.08.2024 13:16:27 | Хабр

Почему хомяки играют в хомяка и кто на этом реально заработает
12.08.2024 13:06:00 | Хабр

Мой умный свет: или как я разработал свой модуль управления освещением
12.08.2024 13:05:49 | Хабр

[Перевод] Любой может получить доступ к удалённым и приватным данным репозиториев GitHub
12.08.2024 13:00:45 | Хабр

Провайдеры получат доступ в каждый дом
12.08.2024 12:51:16 | it-world

Видео: робот-гуманоид LimX Dynamics переставляет контейнеры с бутылками на складе
12.08.2024 12:48:57 | vc.ru

В России создан ультразвуковой спирограф для диагностики заболеваний легких
12.08.2024 12:45:00 | ferra.ru

Открытый проект Wi-Fi Bluetooth микророутера
12.08.2024 12:44:06 | Хабр

[Перевод] Полный гайд по тестированию на Flutter. Часть 7: Ошибки, которые усложняют написание тестов
12.08.2024 12:36:55 | Хабр

Ural Digital Weekend 2024. Подводим итоги
12.08.2024 12:33:54 | Хабр

Перфоманс-маркетинг или медийка? You choose
12.08.2024 12:26:50 | Хабр

Вы сами это читали: как стать лучшим автором месяца
12.08.2024 12:15:40 | Хабр

Сетевые протоколы и модели OSI: как всё устроено
12.08.2024 12:08:12 | Хабр

У Neuralink вторая успешная операция: как нейрочип меняет жизнь парализованных людей к лучшему
12.08.2024 12:00:36 | Хабр

Тренер объяснил, как часто нужно плавать для похудения
12.08.2024 12:00:00 | ferra.ru

Cloudlink. Умное управление облачной инфраструктурой. Часть 1: обзор процесса установки платформы
12.08.2024 11:46:33 | Хабр

Успешный Руководитель проектов: Что за зверь и как им стать?
12.08.2024 11:46:17 | Хабр

Что могут построить дроны
12.08.2024 11:44:59 | Хабр

Как мы делали гибридную обработку звука: всё об аудиософте в SberBoom и почему просто годных излучателей недостаточно
12.08.2024 11:42:39 | Хабр

[Перевод] Ботнет Mirai: как три тинейджера создали ботнет, способный отключить Интернет
12.08.2024 11:38:36 | Хабр

Что такое сознание и психика человека, и почему мы никогда не сможем в них разобраться. Подробнейший разбор (Ч. 1)
12.08.2024 11:32:32 | Хабр

Google отключит сервис контекстной рекламы AdSense для всех пользователей из России
12.08.2024 11:31:33 | vc.ru

Нейроэкономика — как люди принимают решения о покупках, инвестициях, смене работы
12.08.2024 11:28:39 | Хабр

О философии и книгах Вернера Гейзенберга
12.08.2024 11:15:42 | Хабр

Раскрыто, вызывает ли пластик аутизм
12.08.2024 11:15:00 | ferra.ru

Первыми смотрите лучшие доклады TechLead Conf 2024 в Санкт-Петербурге
12.08.2024 11:12:53 | Хабр

Минфин и ЦБ отказались переносить сроки вступления в силу новой страховки для перевозчиков такси
12.08.2024 10:54:35 | vc.ru

Провайдеры теряют клиентов из-за блокировки YouTube
12.08.2024 10:41:48 | it-world

Винтажные пиксели: как энтузиасты сохраняют классические видеоигры
12.08.2024 10:35:11 | Хабр

Симметрии СМ-модели, идемпотенты. Часть V
12.08.2024 10:31:34 | Хабр

В 2023 году российские компании потратили рекордные 329 млрд рублей на ПО
12.08.2024 10:30:00 | ferra.ru

Приложение «Ингосстрах Банка» пропало из App Store
12.08.2024 10:26:03 | vc.ru

Эффективные и актуальные методы для быстрого увеличения конверсии вашего лендинга
12.08.2024 10:00:07 | Хабр

Жизненный цикл activity в Android для QA
12.08.2024 10:00:05 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Аргентинскому конгрессмену сломали нос при раздаче гуманитарной помощи
19.03.2026 09:37:09 | Life.ru

Дмитриев двумя словами оценил заявление Трампа об ударах по газовым объектам
19.03.2026 09:36:16 | Lenta.ru

Названа причина вспышек пастереллеза у скота в Новосибирской области
19.03.2026 09:35:00 | Lenta.ru

Женщинам перечислили симптомы выпадения органов малого таза
19.03.2026 09:34:29 | Lenta.ru

В российских городах обнаружили сеть украинских кол-центров
19.03.2026 09:33:00 | Lenta.ru

Экс-чиновник Нацразведки США: решения по Ирану принимались под влиянием Израиля
19.03.2026 09:32:31 | ТАСС

ВТБ: предприниматели РФ на 68% увеличили обороты трансграничных платежей
19.03.2026 09:32:09 | ТАСС

Раскрыта личность отдавшего приказ убивать жителей Сопычи комбата ВСУ
19.03.2026 09:32:02 | Lenta.ru

Погибший в Севастополе и 138 БПЛА. Последствия атаки на российские регионы
19.03.2026 09:31:25 | ТАСС

От полимеров до дефицита чипов и еды: как блокада Ормуза вызывает цепную реакцию
19.03.2026 09:30:01 | ТАСС

Юмористка пожаловалась на подглядывавшего за ней в спальне пожилого мужчину
19.03.2026 09:29:32 | Lenta.ru

Спикер Мажилиса: новая конституция Казахстана защищена от частых изменений
19.03.2026 09:29:28 | ТАСС

В Энергодаре начали поэтапное подключение микрорайонов к электроэнергии
19.03.2026 09:27:47 | ТАСС

Меркачева хотела бы в следующий раз просить Путина о помиловании инвалидов
19.03.2026 09:27:36 | ТАСС

Красивая преступница из банды наркобарона прославилась после ареста благодаря внешности
19.03.2026 09:27:10 | Lenta.ru

Постпред при ООН: Иран потребовал компенсации от ОАЭ за ущерб от ударов США
19.03.2026 09:27:03 | ТАСС

Живут по 10 дней: Рота ВСУ на Сумщине полностью уничтожена, а на её место бросают насильно мобилизованных
19.03.2026 09:25:53 | Life.ru

В ЕС захотели заставить Венгрию «расплатиться»
19.03.2026 09:25:06 | Lenta.ru

Начальник российской колонии брал взятки и эксплуатировал заключенных
19.03.2026 09:25:00 | Lenta.ru

Правительство расширило схему территориального планирования России в энергетике
19.03.2026 09:24:51 | ТАСС

В Бурятии арестовали экс-зампреда правительства Луковникова
19.03.2026 09:24:00 | ТАСС

Дмитриев прокомментировал слова Трампа об ударе Израиля по Южному Парсу
19.03.2026 09:23:00 | Российская Газета

Отели Турции начали делать россиянам скидки до 50 процентов
19.03.2026 09:22:23 | Lenta.ru

На Камчатке с помощью ИИ создадут корпус корякского языка
19.03.2026 09:21:13 | ТАСС

МЧС: Номер «112» только для экстренных ситуаций, где счёт идёт на секунды
19.03.2026 09:20:29 | Life.ru

Пэн Лиюань призвала к глобальным усилиям по борьбе с туберкулезом
19.03.2026 09:20:00 | Российская Газета

Новосибирское заксобрание одобрило очередные концессии на объекты ТКО
19.03.2026 09:18:37 | ТАСС

Памятник Говорухину на "Мосфильме" откроют 29 марта 2027 года
19.03.2026 09:18:09 | ТАСС

МО Белоруссии сообщило о проведении учений войск Западного оперативного командования
19.03.2026 09:18:02 | ТАСС

В Москве продлят время работы ЗАГСов в самые популярные даты года
19.03.2026 09:17:18 | ТАСС

Хватит быть вежливыми: как не стать жертвой наглых мошенников в Турции и не попасть в ловушку
19.03.2026 09:16:41 | Life.ru

Азербайджан ждет расследования атаки дронов на Нахичевань
19.03.2026 09:14:59 | ТАСС

Анутхина Чанвиракуна переизбрали на пост премьера Таиланда
19.03.2026 09:14:39 | ТАСС

В Пекине прошла встреча Си Цзиньпина с Гурбангулы Бердымухамедовым
19.03.2026 09:14:00 | Российская Газета

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro