Маленькая модель обыграла большие: почему Nanbeige4-3B меняет правила игры

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Маленькая модель обыграла большие: почему Nanbeige4-3B меняет правила игры

27.12.2025 10:54:51 | Хабр

Хабы: Python

В ноябре вышла модель Nanbeige4-3B-25-11 (а 6 декабря они выложили статью об обучении на arxiv). Её размер всего лишь 3 миллиарда параметров. Это почти в 100 раз меньше, чем GPT-4, и даже меньше, чем большинство открытых моделей.

Но вот парадокс: на тестах она достигает показателей выше, чем модели в 10 раз больше, а на бенчмарке WritingBench и вовсе держится на уровне проприетарных моделей занимая место между Gemini-2.5-Pro и Deepseek-R1-0528.

В своей предыдущей публикации я уже затрагивал тему того, что качество обучающих данных важнее, чем их количество. Данная модель этому очередное подтверждение.

Читать далее

Подробнее

Читайте также

Художники объявили бойкот соцсети Х из-за «умного» фоторедактора
27.12.2025 10:30:00 | ferra.ru

Отец современного инвестирования. Гарри Марковиц. Оптимальный портфель по Марковицу
27.12.2025 09:51:35 | Хабр

Фрейд для LLM. Разбор очередной статьи на arXive
27.12.2025 09:05:21 | Хабр

Как селёдка сделала Нидерланды великой державой, а в СССР обзавелась шубой
27.12.2025 09:01:15 | Хабр

Asus начнёт выпускать собственную оперативную память на фоне кризиса полупроводников
27.12.2025 09:00:00 | ferra.ru

Merge Request как транзакция
27.12.2025 08:16:08 | Хабр

Trino в Авито два года спустя: от движка к полноценной экосистеме
27.12.2025 08:11:06 | Хабр

Большой гайд по настройке двух видов балансировщиков трафика
27.12.2025 08:05:04 | Хабр

Что подарить геймеру и техногику на Новый год: топ-20 идей
27.12.2025 07:50:02 | Хабр

Samsung оснастит будущие серии Galaxy S OLED-дисплеями от китайской BOE, — инсайдер
27.12.2025 07:30:00 | ferra.ru

tRNS: Как инженерный азарт привёл к самодельному транскраниальному стимулятору
27.12.2025 07:16:11 | Хабр

Самая важная задача тимлида: как предотвратить коллективные выгорания на больших объемах коммуникации
27.12.2025 07:06:05 | Хабр

TSP трансформеры
27.12.2025 06:41:40 | Хабр

«Дозорные» итоги года, часть 2: неприступный периметр – усиленный контроль мессенджеров, облаков и корпоративной почты
27.12.2025 06:25:59 | Хабр

Дыра в безопасности
27.12.2025 06:15:54 | Хабр

Закрыть гештальт: запустить первую публикацию на Хабре до Нового года
27.12.2025 05:15:43 | Хабр

Топ-8 лучших таск-трекеров 2026 года, которые легко внедрить
27.12.2025 05:11:40 | Хабр

Ученые из Томска создали композит для выделения водорода при 86 °C
26.12.2025 23:56:04 | ferra.ru

Павел и Телега: яркий SMM-маркетинг на грязной теме. Личный опыт Павла из первых уст
26.12.2025 23:43:22 | Хабр

Деньги без купюр, ИИ без работы и почти покупка за $20 миллиардов
26.12.2025 23:43:17 | it-world

Российские ученые ускорят выпуск деталей для протезов в 9 раз
26.12.2025 23:16:29 | ferra.ru

Страх и ненависть в подъезде. Видеоглазок из трубы и палок на raspberry pi
26.12.2025 22:41:10 | Хабр

Не сгинул: Apple всё же представит iPhone Air 2 осенью 2026 года, — инсайдер
26.12.2025 22:30:00 | ferra.ru

Яндекс Go добавил возможность покупки абонементов на карту «Тройка»
26.12.2025 22:08:43 | ferra.ru

Новогодняя игрушка
26.12.2025 21:40:22 | Хабр

WP: Instagram* для привлечения молодой аудитории организовывал в офисах «музеи» с фотографиями популярных у подростков мест и памятками, как делать смешные селфи
26.12.2025 21:20:27 | vc.ru

Созданы самые маленькие автономные и программируемые роботы
26.12.2025 21:00:06 | ferra.ru

В России создали прототип инжектора для нового термоядерного реактора
26.12.2025 20:46:21 | ferra.ru

От данных к доказательству: может ли статистическая инвариантность стать ключом к Гипотезе Римана?
26.12.2025 20:04:08 | Хабр

Как создать елочную игрушку из фото через нейросеть: топ ИИ и промты для новогоднего тренда
26.12.2025 19:49:48 | Хабр

Apple, Qualcomm и MediaTek представят первые 2-нм чипы в сентябре
26.12.2025 19:30:52 | ferra.ru

Как Работать с UART на Микроконтроллерах ( UART + FIFO = LOG )
26.12.2025 19:21:13 | Хабр

Как Работать с UART на Микроконтроллерах (UART + FIFO = LOG )
26.12.2025 19:21:13 | Хабр

Как Работать с UART на Микроконтроллерах (UART + FIFO = LOG)
26.12.2025 19:21:13 | Хабр

Прокачка генератора сигналов
26.12.2025 18:43:58 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Эксперт Мкртчян: порядка 72% купивших туры в Дубай россиян отказались от поездки
06.03.2026 02:38:02 | ТАСС

Al Hadath: Израиль ударил по западным провинциям Ирана
06.03.2026 02:36:26 | ТАСС

В Петрозаводске ликвидировали пожар в краеведческом музее
06.03.2026 02:35:37 | Life.ru

Девушка предала лучшую подругу ради должности и моментально пожалела об этом
06.03.2026 02:33:30 | Lenta.ru

Etihad Airways частично возобновит полеты 6 марта
06.03.2026 02:33:07 | ТАСС

Глава CENTCOM объявил, что операция США против Ирана переходит в новую фазу
06.03.2026 02:31:48 | ТАСС

В США металлодетектор лишил женщину спинномозгового импланта
06.03.2026 02:30:12 | Life.ru

Мозг в режиме перегрева: Нарколог — о том, что реально происходит с человеком во время запоя
06.03.2026 02:30:00 | Life.ru

В Госдуме предложили установить минимальный размер почасовой оплаты труда
06.03.2026 02:27:40 | ТАСС

Появилось видео гигантского взрыва в иранском Бушере после ударов США и Израиля
06.03.2026 02:27:37 | Life.ru

Трамп назвал «немыслимое» препятствие миру на Украине
06.03.2026 02:25:09 | Lenta.ru

Институт Гайдара: доля ЕС в российском экспорте снизилась до 7,4% в 2025 году
06.03.2026 02:24:52 | ТАСС

«Политически и иначе». МИД Ирана рассказал о помощи России и Китая на фоне ударов Запада
06.03.2026 02:24:30 | Lenta.ru

Число пострадавших при атаке ВСУ на Севастополь выросло до девяти
06.03.2026 02:21:19 | Life.ru

Губернатор Севастополя показал страшные кадры последствий атаки ВСУ
06.03.2026 02:16:43 | Lenta.ru

Саудовская Аравия заявила о перехвате трех баллистических ракет
06.03.2026 02:13:41 | ТАСС

IRIB: Силы ПВО сбили истребитель F-15 над Басрой на юге Ирака
06.03.2026 02:13:00 | Российская Газета

CENTCOM: более 50 тыс. военных США участвуют в операции против Ирана
06.03.2026 02:11:07 | ТАСС

CENTCOM: в операции против Ирана участвуют более 50 тыс. военных США
06.03.2026 02:11:07 | ТАСС

WSJ: США попросят КНР сократить закупки российской нефти
06.03.2026 02:09:47 | ТАСС

США стремятся вытеснить российскую нефть с китайского рынка
06.03.2026 02:09:41 | Life.ru

Иран заявил, что с начала конфликта выпустил 600 ракет по Израилю и целям США
06.03.2026 02:06:43 | ТАСС

В Севастополе после атаки ВСУ за медпомощью обратились девять человек
06.03.2026 02:06:30 | ТАСС

На северо-востоке Индии разбился истребитель Су-30МКИ индийских ВВС
06.03.2026 02:05:01 | ТАСС

Устраивавшую секс-вечеринки для 14-летних школьников женщину признали виновной
06.03.2026 02:03:47 | Lenta.ru

В США объяснили провал «Леопардов» на Украине
06.03.2026 02:03:26 | Lenta.ru

Эксперт Мкртчян: логистику для вывоза туристов РФ из ОАЭ не удалось наладить
06.03.2026 02:02:03 | ТАСС

Эксперт Железняков: полет Терешковой стал значимым шагом в развитии космонавтики
06.03.2026 02:01:56 | ТАСС

Хегсет утверждает, что Иран не сбивал истребитель F-15
06.03.2026 02:01:54 | ТАСС

В ГД внесут законопроект о совместном воспитании детей после развода родителей
06.03.2026 02:01:50 | ТАСС

В ГД внесут законопроект о совместном воспитании детей после развода
06.03.2026 02:01:50 | ТАСС

Луна в безопасности. Астероид 2024 YR4 не столкнется с Луной в 2032 году — в NASA все рассчитали
06.03.2026 02:00:00 | iXBT.com

Кому достанется друг: Адвокат рассказал, как не потерять питомца при разводе
06.03.2026 02:00:00 | Life.ru

Премьер страны ЕС жестко высказался о проделках Зеленского
06.03.2026 02:00:00 | Lenta.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro