Triton FP8: реализация и автотюнинг GEMM/Attention под RTX 40xx/Blackwell

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Triton FP8: реализация и автотюнинг GEMM/Attention под RTX 40xx/Blackwell

06.10.2025 07:08:26 | Хабр

Хабы: Блог компании OTUS, Программирование, Python, Машинное обучение

Привет, Хабр!

Я тут на досуге решил разобраться с 8-битными числами с плавающей запятой (FP8) и попробовать написать под них свои GPU-ядра на Triton. Зачем? Ну, новые ускорители от NVIDIA обещают невиданную ранее производительность на FP8 — вдвое больше операций, чем на FP16. Для тренировки огромных нейросетей это прям манна небесная: меньше памяти, больше скорость. Но, конечно, всё не так просто.

Сам по себе FP8 формат капризный, требует тщательного подхода: два разных варианта чисел (E4M3 и E5M2), масштабирование (скейлинг) тензоров, аккуратное накопление сумм в FP16/FP32, разбиение вычислений на тайлы под размер быстрого SRAM (shared memory) и даже специальные меры против переполнения. В общем, нюансов хватает. Расскажу, что узнал и как реализовал GEMM (умножение матриц) и внимание (Attention) в FP8 на языке Triton, да ещё и с автотюнингом.

Перейти к материалу

Подробнее

Читайте также

Программист embedded лезет в FPGA (часть 3, чего не может ардуинка)
06.10.2025 07:07:09 | Хабр

В Китае испытали робособак, которые заменят луноходы в миссиях на Луне
06.10.2025 07:01:38 | ferra.ru

Воскресная барахолка под Валенсией: винтажная аудиотехника, ноутбуки и много чего еще
06.10.2025 07:00:24 | Хабр

EDA в Python для новичков: что почитать и где попрактиковаться
06.10.2025 07:00:23 | Хабр

Как создать TUI утилиту на GO
06.10.2025 06:55:22 | Хабр

[Перевод] Повторное использование шаблонов элементов и коннекторов для стандартизации процессов
06.10.2025 06:49:38 | Хабр

AI Review кода за 30 минут: локальная LLM прямо в CI/CD
06.10.2025 06:37:18 | Хабр

[Перевод] Создаем иммерсивную трехмерную визуализацию погоды с помощью React Three Fiber
06.10.2025 06:35:27 | Хабр

Дом в облаке, которое твое: запускаем личный сервер на UmbrelOS с полным шифрованием
06.10.2025 06:19:16 | Хабр

От LPT_Print до IaC: Хроника Эволюции Системных Администраторов в России. Наша 25-летняя «Одиссея»
06.10.2025 06:17:29 | Хабр

B2B-платформа для ВЭД: от double-blind маркетплейса до платёжного клиринга
06.10.2025 06:00:13 | Хабр

Kick для QA-инженеров
06.10.2025 06:00:11 | Хабр

Секреты мультиклауд-FinOps: Как не спускать миллионы рублей впустую при использовании нескольких облаков
06.10.2025 05:36:46 | Хабр

Виртуальный гаджет эпохи ИИ-революции
06.10.2025 05:14:05 | Хабр

[Перевод] Понимание оценки LLM: детальный разбор 4 основных подходов
06.10.2025 05:10:03 | Хабр

Шатдаун правительства США, а также Грокипедия от Илона Маска
06.10.2025 05:04:58 | Хабр

Проведено исследование термоядерного синтеза протон–бор, при котором не выделяются нейтроны
06.10.2025 05:04:01 | Хабр

Стоит ли игра свеч? Менее кратко о Single SPA (часть 2)
06.10.2025 04:47:15 | Хабр

Как камеры с ИИ помогают бизнесу
06.10.2025 04:13:15 | Хабр

Как мы сократили отчёты по Jira с 2 часов до 1 клика: Jira Automation to Telegram
06.10.2025 04:10:56 | Хабр

Гайд по автотестам, часть 2. Юнит-тесты
06.10.2025 04:00:51 | Хабр

Постоянно мёрзнете? Возможно, вам не хватает этих питательных веществ
05.10.2025 23:15:29 | ferra.ru

Управляем зависимостями Cи и C++ через Nix
05.10.2025 22:37:44 | Хабр

Облегчение ПМС и другие преимущества магния для женского здоровья
05.10.2025 22:30:13 | ferra.ru

Перепады настроения и не только: что произойдёт с организмом, если вы перестанете тренироваться
05.10.2025 21:45:25 | ferra.ru

Джони Айв и OpenAI столкнулись с «техническими проблемами» при разработке ИИ-устройства — FT
05.10.2025 21:38:37 | vc.ru

Рубрика: выскажи свое мнение как продакт или что бы я хотела знать в начале карьеры
05.10.2025 21:20:24 | Хабр

Бесконечность в ваших данных – power laws
05.10.2025 21:17:24 | Хабр

Киви и не только: кожура этих фруктов и овощей даст вам больше всего питательных веществ
05.10.2025 21:00:15 | ferra.ru

Новая бюджетная RTX 5050 оказалась быстрее старой бюджетной RX 580 в 2-3 раза
05.10.2025 20:15:47 | ferra.ru

Новый мост через Москву-реку назовут Гагаринским
05.10.2025 20:10:31 | ferra.ru

Сделай удобно: подборка UI/UX-кейсов из цифровых и нецифровых продуктов (#22)
05.10.2025 20:08:42 | Хабр

Российские ученые предложили новый метод лечения наследственных заболеваний
05.10.2025 20:05:33 | ferra.ru

Учебный кластер ClickHouse на Docker Compose: от нуля к работающему стенду
05.10.2025 20:04:16 | Хабр

Ростех разработал доступные матрицы на квантовых точках для ИК-камер дронов
05.10.2025 20:00:37 | ferra.ru

Смотреть все

СТАТЬ АВТОРОМ

НОВОСТИ

Арестович* заявил о готовности "отдать четыре области и Крым"
06.10.2025 12:43:30 | РЕН ТВ

Актрисе-иноагенту Яне Трояновой утвердили обвинение
06.10.2025 12:40:24 | Коммерсантъ

Силуанов оценивает вклад от повышения НДС в инфляцию на уровне порядка 1 п.п.
06.10.2025 12:38:34 | ТАСС

Правительство Оренбургской области намерено расширить сотрудничество со Сбером
06.10.2025 12:37:20 | ТАСС

Тело женщины в огромной картонной коробке нашли в пустыне
06.10.2025 12:37:18 | РЕН ТВ

В Приморском крае готовятся к проведению Дней Беларуси
06.10.2025 12:37:00 | Российская Газета

В Кремле назвали огульными заявления в ЕС о связях полетов дронов с Россией
06.10.2025 12:36:36 | Lenta.ru

Во Владивостоке приостановили прием отходов после пожара на полигоне ТБО
06.10.2025 12:36:35 | ТАСС

Зеленский наложил вето на закон о штрафах для министров за неявку в парламент
06.10.2025 12:36:25 | ТАСС

В российском регионе разгромили могилы бойцов СВО
06.10.2025 12:36:21 | Lenta.ru

Возлюбленная Джейсона Стэйтема вышла в свет в платье с разрезом до бедра
06.10.2025 12:35:53 | Lenta.ru

Песков увидел повод для оптимизма в ответе Трампа на предложение Путина
06.10.2025 12:35:52 | Life.ru

Матвиенко призвала направлять в региональные бюджеты доходы от лицензий на табак
06.10.2025 12:35:21 | ТАСС

В ЦБ назвали лидирующие символы для новой банкноты в 500 рублей
06.10.2025 12:35:20 | Life.ru

Шум, вонь и курение в домах: Какие штрафы грозят жильцам в 2025 году
06.10.2025 12:35:03 | Life.ru

В Омске завели уголовное дело о незаконном майнинге на ТЭЦ
06.10.2025 12:34:56 | ТАСС

Ле Пен сочла новые выборы единственным решением после отставки премьера Франции
06.10.2025 12:34:48 | ТАСС

Силуанов: поступления от налоговых изменений в 2026 году составят 2,3 трлн рублей
06.10.2025 12:34:46 | ТАСС

Назван самый большой фактор риска болезни Альцгеймера
06.10.2025 12:34:42 | Lenta.ru

В России сохраняется прогноз по урожаю зерна в 2025 году в 135 млн тонн
06.10.2025 12:34:31 | ТАСС

Доктор Мясников призвал не слушать «придурков из телевизора»
06.10.2025 12:34:25 | Lenta.ru

Шахта группы «Распадская» приостановила добычу угля после обрушения породы
06.10.2025 12:34:17 | Коммерсантъ

Нобелевскую премию по медицине получат Мэри Брунков, Фред Рамсделл и Шимон Сакакучи
06.10.2025 12:34:01 | ТАСС

В Кремле приветствуют слова Трампа о ДСНВ
06.10.2025 12:34:00 | Российская Газета

Песков раскрыл, как внуки обычно поздравляют Путина с днём рождения
06.10.2025 12:33:41 | Life.ru

Сотрудничество РФ и ОПЕК показывает важность диалога для будущего нефтяного сектора
06.10.2025 12:33:07 | ТАСС

В Коми откроют мотосекции для снижения аварий на дорогах с участием подростков
06.10.2025 12:33:06 | ТАСС

Стало известно об одной просьбе США к Израилю по Газе
06.10.2025 12:33:04 | Lenta.ru

Фетисов рассказал о состоянии Овечкина перед началом сезона НХЛ
06.10.2025 12:31:37 | ТАСС

"Украинская правда": Сырский ликвидировал группировку ВСУ "Днепр"
06.10.2025 12:30:50 | ТАСС

Путин 6 октября встретится с Патрушевым
06.10.2025 12:30:41 | ТАСС

Российские МиГ-31 с пикирующими ракетами «‎Кинжал» поставили в тупик ПВО Украины
06.10.2025 12:30:29 | Life.ru

В КБР завели дело о служебном подлоге против главы селения Благовещенка
06.10.2025 12:30:23 | ТАСС

Комитет ГД одобрил продление моратория на единую уплату налогов и зарплат в ГОЗ
06.10.2025 12:30:13 | ТАСС

В Кремле прокомментировали реакцию Трампа на предложение Путина по ДСНВ
06.10.2025 12:30:00 | Lenta.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2025 - vsetut.pro