Поиск данных, прокачанная тренировка и судейская оценка. Как с минимальными ресурсами улучшить качество дообучения LLM

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Поиск данных, прокачанная тренировка и судейская оценка. Как с минимальными ресурсами улучшить качество дообучения LLM

19.09.2024 13:16:52 | Хабр

Хабы: Блог компании МТС, Машинное обучение, Искусственный интеллект, Natural Language Processing

Привет, Хабр! Меня зовут Анна Щеникова, я аналитик в Центре RnD в МТС Диджитал. Почти всегда при адаптации LLM-моделей встает вопрос нехватки ресурсов на проверку гипотез. Обычно у меня есть собственное рабочее время и две карточки GPU, а распределяются они на несколько задач. Бизнес же просит приемлемый результат как можно быстрее.

В прошлом посте я рассказала про разделение адаптации open-source-моделей на четыре уровня, а в этом раскрою работу с последним из них — дообучением. Под катом покажу, как быстро получить приемлемое качество, когда базовые подходы не помогают.

Читать далее

Подробнее

Читайте также

Придумала схему продаж для тех, кто ненавидит продавать: мой опыт с 2014 года
19.09.2024 13:16:48 | Хабр

Владиславу Бакальчуку предъявили обвинения в убийстве, покушении на убийство и самоуправстве
19.09.2024 13:13:16 | vc.ru

Как я 20 лет назад забрал мебельный бизнес за долги и сейчас делаю кухни за 850 тыс. рублей
19.09.2024 13:11:44 | Хабр

Криптообменник против Криптобиржи: где лучше обменять криптовалюту
19.09.2024 13:09:57 | Хабр

В Alibaba Cloud сушат ЦОД после пожара, потом будут пытаться восстановить данные
19.09.2024 13:02:54 | it-world

Небольшой хит-парад интересных устройств
19.09.2024 13:00:40 | Хабр

Обход блокировки YouTube для любых Smart TV — Docker Desktop + Xray
19.09.2024 12:58:20 | Хабр

Платёжная система PayPal начнёт собирать комиссионные с неактивных счетов россиян
19.09.2024 12:51:33 | ferra.ru

Zynga оштрафовали за нарушение связанного с технологией IBM патента 80-х годов
19.09.2024 12:45:44 | ferra.ru

Когда и почему крупным компаниям удобнее работать с аутсорсерами
19.09.2024 12:33:38 | Хабр

Почему когнитивной-поведенческая терапия (КПТ) не работает
19.09.2024 12:28:21 | Хабр

JPA Entity Graph и нюансы его использования
19.09.2024 12:03:17 | Хабр

Новой OLED-технологии нашли применение в очках ночного видения
19.09.2024 12:00:35 | ferra.ru

Промпт-инжиниринг: как найти общий язык с ИИ
19.09.2024 11:59:27 | Хабр

Не потеряться в данных: оптимизируем аналитику с помощью DataHub
19.09.2024 11:54:08 | Хабр

Как рисовать пиктограммы, если сроки поджимают: пошаговая инструкция
19.09.2024 11:49:07 | Хабр

Таксисты попросили снизить штрафы за отсутствие новой страховки для перевозчиков
19.09.2024 11:47:11 | vc.ru

Мини-гайд по стилям в Qt (PySide6)
19.09.2024 11:43:33 | Хабр

Все, что думают профессиональные исполнители об ошибках тимлидов и руководителей — 33 пункта, полных слез и отчаяния
19.09.2024 11:40:56 | Хабр

Все аккаунты подростков в Instagram* стали приватными
19.09.2024 11:15:33 | ferra.ru

Ещё одна статья про макросы. Часть 1
19.09.2024 11:07:44 | Хабр

Что такое AndroidManifest.xml, его структура и важность
19.09.2024 11:02:16 | Хабр

Бывшие сотрудники российской «дочки» Oracle попросили Путина и госведомства не лишать их премий, которые якобы необоснованно выплатили в 2022 году — РБК
19.09.2024 11:01:47 | vc.ru

Революция в стратегировании: переход от ремесленничества к технологии
19.09.2024 10:56:26 | Хабр

[Перевод] Цифровой и физический мир без границ: пространственные вычисления и промышленная метавселенная
19.09.2024 10:55:31 | Хабр

Почему Луна больше у горизонта и при чем тут Гете
19.09.2024 10:47:33 | Хабр

PayPal с 7 октября 2024 года введёт комиссию за обслуживание неактивных счетов россиян
19.09.2024 10:43:36 | vc.ru

Broadcom исправила критическую уязвимость в своих виртуальных серверах
19.09.2024 10:30:00 | ferra.ru

ИМХО про импортозамещение
19.09.2024 10:07:20 | Хабр

Управление памятью в JavaScript с помощью WeakRef и FinalizationRegistry
19.09.2024 10:00:30 | Хабр

Веб-версию OK адаптировали для незрячих пользователей
19.09.2024 10:00:00 | ferra.ru

Конец фотокомпактов. Взгляд их эпохи “вычислительной фотографии”
19.09.2024 09:45:38 | Хабр

Регулятор США захотел оштрафовать SpaceX за нарушения при запуске
19.09.2024 09:45:31 | ferra.ru

«Lada конкурирует со всеми, кто не Lada»: президент «АвтоВАЗа» — об «агрессии» китайского автопрома, стоимости новой Lada Aura и росте цен
19.09.2024 09:33:29 | vc.ru

[Перевод] Как сделать так, чтобы ваши открытые данные были никому не интересны
19.09.2024 09:28:24 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

В Московской области наблюдалось полярное сияние
21.03.2026 07:25:40 | ТАСС

Гол Никишина в овертайме принес "Каролине" победу над "Торонто" в НХЛ
21.03.2026 07:23:57 | ТАСС

Сальдо: в Херсоне используют женщин-"волонтеров" для мобилизации мужчин
21.03.2026 07:23:35 | ТАСС

Экс-премьер Украины оценил влияние «бусификации» на пополнение ВСУ
21.03.2026 07:23:13 | Lenta.ru

Гутерриш заявил, что ООН активно взаимодействует с Советом мира
21.03.2026 07:20:33 | ТАСС

На Западе заявили о шатком положении Зеленского
21.03.2026 07:19:00 | Lenta.ru

Над Ростовской областью отразили массированную атаку ВСУ, сбив около 90 БПЛА
21.03.2026 07:17:47 | Life.ru

Эксперт Кент: США и Иран были близки к сделке по атому в июне 2025 года
21.03.2026 07:17:08 | ТАСС

В Бельгии украинским беженцам надо приложить усилия, чтобы получить пособие
21.03.2026 07:15:00 | Российская Газета

Пассажиропоток между Крымом, Донбассом и Новороссией в 2025 году вырос на 9%
21.03.2026 07:14:07 | ТАСС

В РФ разработали пресс для разных видов сыра, работающий без участия человека
21.03.2026 07:13:35 | ТАСС

Билан раскрыл причину отсутствия новых песен
21.03.2026 07:13:09 | Lenta.ru

На большей части юга РФ из-за погоды сдвинулось начало пожароопасного сезона
21.03.2026 07:13:02 | ТАСС

Теннисист Хачанов вышел в третий круг "Мастерса" в Майами
21.03.2026 07:11:52 | ТАСС

"Русский стандарт": больше всего зимой россияне тратили деньги на супермаркеты
21.03.2026 07:10:00 | ТАСС

США назвали пять стран основными государственными угрозами
21.03.2026 07:09:00 | Lenta.ru

Силы ПВО сбили более 90 БПЛА в Ростовской области
21.03.2026 07:06:07 | Коммерсантъ

Синоптик Макарова: дефицит осадков в Москве привел к ухудшению качества воздуха
21.03.2026 07:06:03 | ТАСС

Парламент Молдавии одобрил выход из СНГ в первом чтении
21.03.2026 07:05:58 | Life.ru

Боец Карта: "Север" поразил более 50 пунктов управления БПЛА ВСУ с начала марта
21.03.2026 07:05:37 | ТАСС

Овечкин не набрал очков в матче НХЛ с "Нью-Джерси"
21.03.2026 07:03:26 | ТАСС

Азаров: "бусификация" на Украине обеспечивает до 90% мобилизуемых
21.03.2026 07:02:15 | ТАСС

Герой России Палазник назвал Шольца и Мерца "потомками эсэсовцев"
21.03.2026 07:01:43 | ТАСС

Названо возможное место начала наземной операции США против Ирана
21.03.2026 07:00:59 | Lenta.ru

В США высказались о сроках конфликта с Ираном
21.03.2026 07:00:50 | Lenta.ru

В России рассказали о прощании Зеленского с Донбассом
21.03.2026 07:00:39 | Lenta.ru

Врач предупредила о влиянии стресса и скачков давления на зрение
21.03.2026 07:00:25 | Lenta.ru

В девяти районах Ростовской области ночью отразили атаку около 90 дронов
21.03.2026 06:59:58 | РБК

Армия Израиля заявила об очередной ракетной атаке со стороны Ирана
21.03.2026 06:57:46 | ТАСС

CORE.XP: спрос на рынке новостроек в Сочи сократился почти вдвое
21.03.2026 06:57:04 | ТАСС

Землю накрыла длительная магнитная буря, прошли мощные полярные сияния
21.03.2026 06:56:00 | iXBT.com

В Ростовской области отразили порядка 90 БПЛА
21.03.2026 06:54:42 | ТАСС

Kyodo: Иран готов пропустить японские суда через Ормузский пролив
21.03.2026 06:54:00 | Российская Газета

Эксперт Шапошников: спрос на сталь в 2026 году может снизиться до 33-35 млн тонн
21.03.2026 06:53:51 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro