LLM — 3 «семёрки» против SOTA, строим «градиентный бустинг» из SLM моделей

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

LLM — 3 «семёрки» против SOTA, строим «градиентный бустинг» из SLM моделей

31.01.2026 18:00:47 | Хабр

Хабы: Python

Превращаем LLM в CatBoost: как ансамбль из маленьких моделей (7B) пытается побить Gemini 3 flash

Почему не классическое MOE?

Я проанализировал свои промпты за последние два месяца и заметил паттерн: современные задачи к LLM стали мульти-итентными . Я прошу в одном сообщении: "Возьми данные X, примени логику Y, напиши код Z и оформи в JSON". Архитектура MoE в таких случаях плывет (если мы говорим о single-turn конечно). Single-pass модели часто не справляются, так как не могут реверснуть свой ответ и перепроверить себя перед ответом. К тому же роутер может отдать запрос не тому "эксперту", может неправильно чанковать (условно), в целом мы это и наблюдаем в gemini 3. Текущая предложенная архитектура бустинга решает эту проблему через последовательную ответственность. Первая модель (черновик) пытается сделать всё сразу (и ошибается), вторая (Критик) проверяет выполнение условий постфактум, третья (фиксер) работает с тз критика и исправляет ответ. Такой цикл может длиться от 2 до множества операций, что может значительно экономить ресурсы и улучшать качество ответа (изначальный тезис). При этом даже SOTA-модели пытаются решить всё в один проход, и именно поэтому они «плывут» на сложных мульти-интентных задачах. Текущий подход - итеративное улучшение ответа между разными моделями. Но, пожалуйста, держите в голове что это не классический бустинг и к тому же этап инференса, а не обучения.

Пару ремарок которые можно пропустить если вы и так знакомы с терминами и dl/ml и не интересуетесь архитектурой:

Читать далее

Подробнее

Читайте также

Microsoft пересмотрит планы по «повсеместному» внедрению ИИ-функций в Windows 11 — Windows Central
31.01.2026 17:05:11 | vc.ru

Заветные энциклопедии — ламповый мир знаний из советского детства
31.01.2026 17:02:08 | Хабр

Утечка раскрыла цены международных версий смартфонов Xiaomi 17 с двумя экранами
31.01.2026 16:55:25 | ferra.ru

[Перевод] Феномен творчества. Искусственный интеллект и человек. Противостояние или аугментация?
31.01.2026 16:52:02 | Хабр

Вышел планшет Redmi Pad 2 Pro в дизайне по «Гарри Поттеру»
31.01.2026 15:35:34 | ferra.ru

Sennheiser показала недорогие проводные наушники для тех, кто «устал от TWS»
31.01.2026 14:55:28 | ferra.ru

Используем технологии будущего ради самого будущего — об опыте Sci-Fi клуба NX-01
31.01.2026 14:54:52 | Хабр

Паттерны кеширования: от Cache-Aside до Write-Behind. Как выбрать стратегию для своего сервиса
31.01.2026 14:46:53 | Хабр

Когда вернусь, я напишу про вас статью на Хабр
31.01.2026 14:06:12 | Хабр

Флагман с мощной камерой: что стало известно о Huawei Pura 90 Ultra
31.01.2026 13:35:35 | ferra.ru

Топ-14 бесплатных нейросетей для генерации и создания видео с помощью ИИ в 2026 году
31.01.2026 13:12:48 | Хабр

Камера, которая меня удивила: Sony DSC-F828
31.01.2026 13:02:41 | Хабр

Синтезатор на PSP с подключением MIDI клавиатуры
31.01.2026 13:01:57 | Хабр

Kafka для начинающих: обработка ошибок и Dead Letter Queues
31.01.2026 13:00:39 | Хабр

Вычислительная фотография как предчувствие: от фейковой Луны до смерти реальности
31.01.2026 12:57:04 | Хабр

Amazon нашла запрещённый контент с участием детей в данных для обучения ИИ
31.01.2026 12:55:26 | ferra.ru

[Перевод] Дырявая броня ИИ‑фильтров и почему они не станут лучше
31.01.2026 12:00:27 | Хабр

Снег, порох и последний шанс царя Бориса
31.01.2026 11:35:50 | Хабр

Google представила инструмент для создания полноценных 3D-миров с помощью текста
31.01.2026 11:35:37 | ferra.ru

Оптоволокно XIX века: как Александр Белл изобрел фотофон, передававший речь по лучу света
31.01.2026 11:21:28 | Хабр

CDC своими руками: Kafka + Debezium в домашней лаборатории
31.01.2026 11:01:21 | Хабр

iPhone показал лучший квартал в истории Apple
31.01.2026 10:55:21 | ferra.ru

Как изобретение Отиса привело к появлению небоскрёбов
31.01.2026 10:29:13 | Хабр

Moltbook: архитектурный разбор социального поведения LLM-агентов
31.01.2026 10:25:41 | Хабр

Большой бенчмарк: ROCm vs Vulkan в LM Studio 0.4 и добавление параллельных запросов
31.01.2026 10:22:15 | Хабр

Как чуть не накрылись самые классные кубики
31.01.2026 09:39:25 | Хабр

Разбор Urban VPN Proxy: как браузерное расширение превращается в перехватчик трафика и данных
31.01.2026 09:06:28 | Хабр

История создания Ведьмака: «Убийцы королей»
31.01.2026 09:05:03 | Хабр

Universal Ambient Light: Как я создал современное приложение для Ambilight под Android
31.01.2026 09:01:02 | Хабр

Почему не взлетели дирижабли? Часть 7: пламя в небесах
31.01.2026 09:01:01 | Хабр

Как я делала pet-дашборд для портфолио: кейс аналитики путешествий
31.01.2026 09:00:58 | Хабр

MVVM-курильщика: почему ваша ViewModel — это помойка на 2000 строк, и как это исправить
31.01.2026 08:40:41 | Хабр

Почему у треугольника три стороны?
31.01.2026 08:40:23 | Хабр

NexPhone — смартфон с тремя операционками. Что это за чудо?
31.01.2026 08:01:45 | Хабр

Понты, ИРА и кокаин: как создавалась самая быстрая машина времени
31.01.2026 07:40:55 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Эксперт Мкртчян: порядка 72% купивших туры в Дубай россиян отказались от поездки
06.03.2026 02:38:02 | ТАСС

Al Hadath: Израиль ударил по западным провинциям Ирана
06.03.2026 02:36:26 | ТАСС

В Петрозаводске ликвидировали пожар в краеведческом музее
06.03.2026 02:35:37 | Life.ru

Девушка предала лучшую подругу ради должности и моментально пожалела об этом
06.03.2026 02:33:30 | Lenta.ru

Etihad Airways частично возобновит полеты 6 марта
06.03.2026 02:33:07 | ТАСС

Глава CENTCOM объявил, что операция США против Ирана переходит в новую фазу
06.03.2026 02:31:48 | ТАСС

В США металлодетектор лишил женщину спинномозгового импланта
06.03.2026 02:30:12 | Life.ru

Мозг в режиме перегрева: Нарколог — о том, что реально происходит с человеком во время запоя
06.03.2026 02:30:00 | Life.ru

В Госдуме предложили установить минимальный размер почасовой оплаты труда
06.03.2026 02:27:40 | ТАСС

Появилось видео гигантского взрыва в иранском Бушере после ударов США и Израиля
06.03.2026 02:27:37 | Life.ru

Трамп назвал «немыслимое» препятствие миру на Украине
06.03.2026 02:25:09 | Lenta.ru

Институт Гайдара: доля ЕС в российском экспорте снизилась до 7,4% в 2025 году
06.03.2026 02:24:52 | ТАСС

«Политически и иначе». МИД Ирана рассказал о помощи России и Китая на фоне ударов Запада
06.03.2026 02:24:30 | Lenta.ru

Число пострадавших при атаке ВСУ на Севастополь выросло до девяти
06.03.2026 02:21:19 | Life.ru

Губернатор Севастополя показал страшные кадры последствий атаки ВСУ
06.03.2026 02:16:43 | Lenta.ru

Саудовская Аравия заявила о перехвате трех баллистических ракет
06.03.2026 02:13:41 | ТАСС

IRIB: Силы ПВО сбили истребитель F-15 над Басрой на юге Ирака
06.03.2026 02:13:00 | Российская Газета

CENTCOM: более 50 тыс. военных США участвуют в операции против Ирана
06.03.2026 02:11:07 | ТАСС

CENTCOM: в операции против Ирана участвуют более 50 тыс. военных США
06.03.2026 02:11:07 | ТАСС

WSJ: США попросят КНР сократить закупки российской нефти
06.03.2026 02:09:47 | ТАСС

США стремятся вытеснить российскую нефть с китайского рынка
06.03.2026 02:09:41 | Life.ru

Иран заявил, что с начала конфликта выпустил 600 ракет по Израилю и целям США
06.03.2026 02:06:43 | ТАСС

В Севастополе после атаки ВСУ за медпомощью обратились девять человек
06.03.2026 02:06:30 | ТАСС

На северо-востоке Индии разбился истребитель Су-30МКИ индийских ВВС
06.03.2026 02:05:01 | ТАСС

Устраивавшую секс-вечеринки для 14-летних школьников женщину признали виновной
06.03.2026 02:03:47 | Lenta.ru

В США объяснили провал «Леопардов» на Украине
06.03.2026 02:03:26 | Lenta.ru

Эксперт Мкртчян: логистику для вывоза туристов РФ из ОАЭ не удалось наладить
06.03.2026 02:02:03 | ТАСС

Эксперт Железняков: полет Терешковой стал значимым шагом в развитии космонавтики
06.03.2026 02:01:56 | ТАСС

Хегсет утверждает, что Иран не сбивал истребитель F-15
06.03.2026 02:01:54 | ТАСС

В ГД внесут законопроект о совместном воспитании детей после развода родителей
06.03.2026 02:01:50 | ТАСС

В ГД внесут законопроект о совместном воспитании детей после развода
06.03.2026 02:01:50 | ТАСС

Луна в безопасности. Астероид 2024 YR4 не столкнется с Луной в 2032 году — в NASA все рассчитали
06.03.2026 02:00:00 | iXBT.com

Кому достанется друг: Адвокат рассказал, как не потерять питомца при разводе
06.03.2026 02:00:00 | Life.ru

Премьер страны ЕС жестко высказался о проделках Зеленского
06.03.2026 02:00:00 | Lenta.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro