HAI LLM: Как DeepSeek снизил стоимость обучения и генерации в разы без потери качества?

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

HAI LLM: Как DeepSeek снизил стоимость обучения и генерации в разы без потери качества?

02.02.2025 10:07:33 | Хабр

Хабы: Блог компании BotHub, Искусственный интеллект, Машинное обучение

Компания HighFlyer внедрила в свою LLM такие архитектурные фишки как Multi-Head Latent Attention, Mixture of Experts (MoE) with Auxiliary-Loss-Free Load Balancing и Multi-Token Predict. Однако все эти новшества уже были ранее представлены в других LLM: GPT-4, Llama, Mistrall и других.

Полистав WhitePaper HighFlyer, можно наткнуться на описание собственного непубличного тренировочного фреймворка HAI LLM, эксплуатирующего действительно новые фишки, которые позволяют значительно сэкономить на обучении модели. Именно в фреймворке и кроется, как мне кажется, одна из основных инноваций DeepSeek, о чем мне бы и хотелось поговорить далее.

Приятного прочтения)

Читать далее

Подробнее

Читайте также

Мой друг написал статью, ее задизили, он расстроился, а я проанализировал 6000 статей, и понял, за что ненавидят на Хабр
02.02.2025 10:02:18 | Хабр

WhatsApp-пользователей вновь атаковали израильским шпионским ПО
02.02.2025 09:45:44 | ferra.ru

Как техспецу зарабатывать больше: 10 советов начинающим
02.02.2025 09:16:04 | Хабр

[Перевод] Операционная система в 1 000 строках кода (часть 5)
02.02.2025 09:01:49 | Хабр

iPod-подобные устройства назвали ненужными этому миру
02.02.2025 09:00:43 | ferra.ru

Minimal Phone: смартфон, который вас не отвлекает. E-ink экран и никаких мессенджеров
02.02.2025 08:43:31 | Хабр

В Сети нашли способ отключения ИИ в Google Поиске — начните материться
02.02.2025 08:15:42 | ferra.ru

Китайская грамота: как выучить язык Поднебесной и насколько он в действительности сложен
02.02.2025 08:00:17 | Хабр

Apple прекратила разработку очков дополненной реальности
02.02.2025 07:30:40 | ferra.ru

Что не так с дизайном, или почему я переориентировал свое агентство на веб-разработку полного цикла
02.02.2025 07:15:53 | Хабр

Ностальгические игры: Final Fantasy VIII
02.02.2025 07:05:52 | Хабр

По анализу крови предложили определять тип инсульта «на месте»
02.02.2025 06:45:39 | ferra.ru

Как самостоятельно выявить бессознательные установки, которые мешают вам больше зарабатывать?
02.02.2025 06:39:58 | Хабр

Визуализация современного поколения человекоподобных роботов
02.02.2025 06:21:36 | Хабр

Многофакторное аппроксимирование на платформе .Net. Часть первая. Теория
02.02.2025 06:16:23 | Хабр

OpenAI наносит ответный удар: вышла ChatGPT o3-mini для конкуренции с DeepSeek
02.02.2025 06:00:37 | ferra.ru

Я: экстремально композиционный язык программирования
02.02.2025 05:34:10 | Хабр

Я размышляю о языке Rust: почему он может стать языком будущего
02.02.2025 05:15:47 | Хабр

Google в последнем обновлении Pixel 4a ограничила его зарядную емкость
02.02.2025 05:15:36 | ferra.ru

Paint в Windows получил кнопку вызова ИИ Microsoft Copilot
02.02.2025 04:30:35 | ferra.ru

Как создать хакатон? Полезный чек-лист
02.02.2025 04:16:09 | Хабр

YouTube стал ещё больше похож на Discord
02.02.2025 03:45:33 | ferra.ru

Мой Shadow Ban на Хабре
02.02.2025 03:44:39 | Хабр

Для медицинских исследований в США наступили кризисные времена
02.02.2025 03:00:32 | ferra.ru

Большинство мужчин женились бы на ИИ-девушках, если бы это было законно: опрос
02.02.2025 02:15:30 | ferra.ru

К генеративному ИИ обратились ради борьбы с болезнями, не поддающихся лечению
02.02.2025 01:30:29 | ferra.ru

Почему Agile теперь везде, даже если так не называется
02.02.2025 00:47:30 | Хабр

США продлят время службы ядерных баллистических ракет Trident II
02.02.2025 00:45:28 | ferra.ru

Включаем функции сбора статистики в ESP32-arduino
02.02.2025 00:35:26 | Хабр

Оператор дрона протаранил тушивший пожар самолет
02.02.2025 00:00:26 | ferra.ru

В Linux-терминале Android 16 запустили Doom
01.02.2025 23:15:25 | ferra.ru

Эндокринолог причислила сою к опасным для щитовидки продуктам
01.02.2025 23:08:09 | ferra.ru

Стоматолог опровергла пользу отбеливания зубов содой и лимонным соком
01.02.2025 22:54:16 | ferra.ru

Врач: отказ от жирного мяса — одно из правил питания для снижения холестерина
01.02.2025 22:41:54 | ferra.ru

Инсайдеры: Intel выпустит процессоры Panther Lake во второй половине 2025 года
01.02.2025 22:30:00 | ferra.ru

Смотреть все

СТАТЬ АВТОРОМ

НОВОСТИ

Ничушкин вышел на 35-е место по голам в НХЛ среди россиян
14.12.2025 07:53:04 | ТАСС

За ночь над 14 регионами России сбит 141 беспилотник
14.12.2025 07:52:49 | Коммерсантъ

Изъятые в Артемовске у украинских мародеров иконы разместили в полевом храме ВДВ
14.12.2025 07:46:47 | ТАСС

В России запретили водить самоходные машины при одном условии
14.12.2025 07:43:00 | Lenta.ru

Финиш Югорского лыжного марафона может пройти в центре Ханты-Мансийска
14.12.2025 07:41:56 | ТАСС

Эксперт Потехин: в РФ рынок корпоративных коммуникаций вырастет на 20%
14.12.2025 07:40:25 | ТАСС

В Думе рассказали об ответственности за проживание без оформления регистрации
14.12.2025 07:39:50 | Life.ru

Над Россией за ночь сбили более сотни беспилотников
14.12.2025 07:38:22 | Lenta.ru

За ночь расчёты ПВО уничтожили 235 украинских дронов над регионами России
14.12.2025 07:36:05 | Life.ru

В Госдуме призвали запретить детское шампанское
14.12.2025 07:35:23 | РЕН ТВ

Трампа призвали принять тяжелое для Украины решение
14.12.2025 07:35:00 | Lenta.ru

Вратарь "Флориды" Бобровский провел 52-й матч "на ноль" в НХЛ
14.12.2025 07:33:31 | ТАСС

В США сообщили о плохих новостях в зоне СВО
14.12.2025 07:33:13 | Lenta.ru

Подмосковье лидирует в РФ по числу роботов на промпроизводствах
14.12.2025 07:32:26 | ТАСС

Бойцы 11-й бригады ВДВ открыли в зоне СВО полевой храм в честь Илии Пророка
14.12.2025 07:30:52 | ТАСС

Россиянам рассказали об опасных последствиях неправильной заморозки мяса
14.12.2025 07:30:13 | Lenta.ru

В России высказались о вводе миротворческих войск других стран на Украину
14.12.2025 07:30:10 | Lenta.ru

Нападающий "Эдмонтона" Подколзин забросил 2 шайбы в матче НХЛ с "Торонто"
14.12.2025 07:28:23 | ТАСС

Суд заочно приговорил экс-совладельца «Траста» Фетисова к восьми годам колонии
14.12.2025 07:23:58 | Коммерсантъ

"Рейнджерс" обыграли "Монреаль" в НХЛ. Панарин забросил одну шайбу
14.12.2025 07:21:56 | ТАСС

Российские силы ПВО за ночь сбили 141 украинский беспилотник
14.12.2025 07:21:54 | РЕН ТВ

Над регионами России за ночь сбили 235 украинских БПЛА
14.12.2025 07:21:38 | ТАСС

Жертвами стрельбы в Брауновском университете стали его студенты
14.12.2025 07:21:02 | Life.ru

Инцидент с самолетом Boeing 777 спровоцировал пожар в аэропорту Вашингтона
14.12.2025 07:21:00 | Российская Газета

"Вашингтон" проиграл "Виннипегу" в НХЛ. Овечкин отдал голевой пас
14.12.2025 07:17:01 | ТАСС

В Одессе начали штрафовать за нежелание школьников говорить на украинском языке
14.12.2025 07:13:00 | Lenta.ru

Подполье рассказало об «очень активной работе» порта в Измаиле
14.12.2025 07:12:19 | Lenta.ru

Подполье рассказало об «очень активной» работе порта в Измаиле
14.12.2025 07:12:00 | Lenta.ru

Над Смоленской областью сбили БПЛА
14.12.2025 07:11:41 | ТАСС

Трамп пригрозил Таиланду и Камбодже
14.12.2025 07:10:10 | Lenta.ru

В Одессе сотрудники ТЦК стали проводить рейды по-новому, речь идет о найме цыган
14.12.2025 07:10:00 | Российская Газета

Более 300 палестинцев погибли от атак Израиля после прекращения огня в Газе
14.12.2025 07:09:11 | Life.ru

В Испании оформили около 40 виз для разделяющих ценности РФ граждан
14.12.2025 07:06:57 | Life.ru

Юрист рассказал, когда наблюдение за соседями может грозить уголовным делом
14.12.2025 07:03:41 | ТАСС

Юрист Чанышев рассказал, когда наблюдение за соседями грозит уголовным делом
14.12.2025 07:03:41 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2025 - vsetut.pro