Развитие искусственного интеллекта всё сильнее упирается в ограничения аппаратуры. Современные нейросетевые ускорители — Neural Processing Units (NPU) — выполняют колоссальное число операций с числами с плавающей запятой. Однако стандарт IEEE 754, лежащий в основе большинства таких вычислений, оказался не слишком удобным для специализированных ИИ-процессоров: он требует сравнительно сложной логики и увеличивает энергопотребление чипов. Для дата-центров даже небольшая экономия энергии на каждой операции становится заметной на уровне всего кластера.
Эта проблема особенно заметна при переходе к низкобитным форматам — например, 8-битному FP8 или OCP MX. Чтобы избежать переполнений при работе нейросетей, такие форматы обычно используют механизм блокового масштабирования (AMAX), который усложняет аппаратную реализацию и увеличивает задержки. По сути, процессору приходится постоянно отслеживать максимальные значения в блоках данных и пересчитывать масштаб чисел.
Автор новой работы, Кэйта Морисаки (Keita Morisaki), предложил альтернативный подход — семейство форматов чисел AetherFloat, специально разработанное для ускорителей ИИ. В основе архитектуры лежит использование четырёхзначной шкалы экспоненты (Base-4) и явной мантиссы. Такая схема позволяет отказаться от скрытого бита и сложных процедур нормализации, которые обычно применяются в классических форматах с плавающей запятой.
По расчётам, это заметно упрощает аппаратную реализацию вычислительных блоков. В частности, площадь ядра умножения-накопления (MAC) уменьшается примерно на 33%, энергопотребление — на 22%, а задержка критического пути сокращается примерно на 12% по сравнению с типичными реализациями FP8. Поскольку именно MAC-блоки составляют основу вычислений нейросетей, такие изменения могут заметно повлиять на эффективность всего ускорителя.

Формат AetherFloat-8 (AF8) предназначен прежде всего для инференса нейросетей. Он обладает расширенным динамическим диапазоном — примерно от 1,2×10-4 до 57 344. Благодаря этому формат способен обрабатывать редкие экстремальные значения в активациях больших языковых моделей без дополнительного аппаратного масштабирования. В результате отпадает необходимость в механизме AMAX, который используется в ряде существующих FP8-реализаций.
При этом AF8 требует применения квантования с учётом обучения (QAT, Quantization-Aware Training) — подхода, при котором модель изначально обучается с учётом будущего перехода на низкобитные представления чисел.
Второй формат семейства — AetherFloat-16 (AF16) — рассматривается как возможная альтернатива широко используемому формату bfloat16. По результатам экспериментов AF16 обеспечивает сопоставимую точность вычислений, но требует меньших аппаратных ресурсов.
Оба формата используют оригинальную схему кодирования — Lexicographic One’s Complement. Она позволяет сравнивать числа как обычные целые значения, без дополнительных преобразований, что упрощает и ускоряет аппаратную реализацию операций вроде функции активации ReLU или операции уменьшения размерности MaxPooling. В свою очередь, это означает более простые и быстрые схемы логических сравнений.
Автор протестировал новую архитектуру на задачах обучения и инференса LLM Qwen2.5-7B. Эксперименты показали, что AF8 демонстрирует стабильную сходимость при использовании QAT и оказывается устойчивее к потере градиентов, чем стандартные FP8-форматы. Формат AF16, в свою очередь, практически не уступает bfloat16 по точности вычислений.
Исследователь также опубликовал в открытом доступе код архитектуры, чтобы другие разработчики могли воспроизводить результаты и тестировать формат в собственных системах. При этом Морисаки отмечает, что для окончательных выводов потребуется проверка на реальных чипах и расширение экспериментов на другие типы моделей.
Если предложенный подход подтвердит свою эффективность в аппаратной реализации, то форматы AetherFloat могут заметно упростить архитектуру будущих ИИ-ускорителей. Это позволит снизить энергопотребление и стоимость специализированных процессоров, сохранив точность вычислений даже при использовании низкобитных числовых форматов.
-
Samsung запустила продажи магнитного мобильного аккумулятора для Galaxy S26, но есть нюанс: непосредственно к Galaxy S26 он не магнитится
14.03.2026 16:21:00 | iXBT.com
Уже нашёлся умелец, который создал MacBook Neo с SSD объёмом 1 ТБ. Для этого он перепаял чип памяти
14.03.2026 16:05:00 | iXBT.com
Vivo X300 Ultra предложит не только крутую камеру, но также и расширенные возможности работы со звуком
14.03.2026 15:48:00 | iXBT.com
Почему в ноутбуках Chuwi вместо Ryzen 5 7430U обнаруживается старый Ryzen 5 5500U? Расследование Notebookcheck говорит о том, что Chuwi может быть и не виновата
14.03.2026 15:42:00 | iXBT.com
Instagram* без лишнего шума отказывается от сквозного шифрования сообщений. В теории это значит, что все личные переписки будут доступны Meta*
14.03.2026 15:36:00 | iXBT.com
Китай разрабатывает недорогие грузовые системы для расширяющейся лунной программы
14.03.2026 15:33:00 | iXBT.com
Пока пользователи осваивают PCIe 5.0, компания Synopsys уже демонстрирует возможности PCIe 8.0
14.03.2026 15:27:00 | iXBT.com
Гамма-всплеск вне галактик: телескопы отследили столкновение нейтронных звёзд в «запретной» области Вселенной
14.03.2026 15:25:00 | iXBT.com
После GPU и памяти дорожает уже само сырьё для чипов: вольфрам, тантал и молибден подорожали в два раза, галлий — на 123%
14.03.2026 15:25:00 | iXBT.com
Google каким-то образом смогла заметно улучшить автономность Pixel 10a по сравнению с Pixel 9a, хотя по параметрам они идентичны
14.03.2026 15:19:00 | iXBT.com
Современный компьютер за бесценок: в США пользователь за 87 долларов купил 6-ядерный Ryzen 5 7600X, материнскую плату Gigabyte B850M Eagle, 32 ГБ ОЗУ DDR5 и СЖО Cooler Master
14.03.2026 15:12:00 | iXBT.com
Китайская видеокарта с 24 ГБ памяти и поддержкой DirectX 12. Lisuan Tech опубликовала новые подробности о своих ускорителях, для игр вполне подходит версия LX Pro
14.03.2026 14:55:00 | iXBT.com
Из-за роста уровня океанов скорость вращения Земли снижается рекордными темпами за последние миллионы лет
14.03.2026 14:51:00 | iXBT.com
Может ли FSR 4.1 быть лучше DLSS 4.5? Большое сравнение показывает сильные и слабые стороны новой версии апскейлера AMD
14.03.2026 14:51:00 | iXBT.com
Чат-боты массово провалили тест на предотвращение насилия среди подростков
14.03.2026 14:41:00 | iXBT.com
Чтобы видеокарты с 16-контактным разъёмом не горели. Thermal Grizzly выпустила белую версию своего защитного адаптера WireView Pro II
14.03.2026 14:34:00 | iXBT.com
Можно ли будет на MacBook Neo запускать Windows 11? Разработчики Parallels говорят, что в рамках их тестирования всё работает
14.03.2026 14:19:00 | iXBT.com
13 000 мАч, большой экран и Snapdragon 8 Elite Gen5: Oppo готовит по-настоящему мощный планшет Pad 5 Pro
14.03.2026 14:03:00 | iXBT.com
В Макао гуманоидный робот Unitree G1 был задержан полицией после того, как напугал 70-летнюю женщину
14.03.2026 13:52:00 | iXBT.com
Энтузиаст полгода перезаписывал DVD-диски и нашёл самый живучий: TDK вне конкуренции, худшие — Verbatim и Memorex
14.03.2026 13:48:00 | iXBT.com
Энтузиаст запустил настольный компьютер на 64 батарейках АА — за полчаса удалось прогнать Cinebench, установить и поиграть в Minecraft
14.03.2026 13:34:00 | iXBT.com
Синий экран смерти, циклические перезагрузки, зависания системы и вылеты приложений: пользователи жалуются на обновление KB5079473 для Windows 11
14.03.2026 13:21:00 | iXBT.com
Магнитная «турбина» для смартфона, которая может и заряжать, и охлаждать: OPPO представила магнитную беспроводную зарядку Small Turbine 2 мощностью 50 Вт
14.03.2026 13:11:00 | iXBT.com
Солнце могло мигрировать из внутренней части Млечного Пути — новая гипотеза астрономов
14.03.2026 12:49:00 | iXBT.com
Xiaomi запустила в Китае новую стиральную машину на 10 кг с интеграцией в умный дом и гарантией 10 лет на мотор — она стоит 175 долларов
14.03.2026 12:42:00 | iXBT.com
Nvidia нашла оригинальный способ выбивать низкие цены на чипы памяти: компания давит на Samsung и других поставщиков через жёсткие аудиты
14.03.2026 12:26:00 | iXBT.com
Huawei Enjoy 90 Pro Max с батареей 8500 мА·ч уже доступен для заказа в Китае
14.03.2026 12:08:00 | iXBT.com
Робот-сыщик использует 3D-зрение для умного поиска потерянных предметов
14.03.2026 10:48:43 | TechCult.ru
Землю накрыла первая продолжительная магнитная буря весны 2026: как долго она продлится
14.03.2026 09:28:00 | iXBT.com
Ещё недавно в этой стране за использование Starlink могли посадить в тюрьму. Доступ к спутниковому интернету Илона Маска официально открыли на Ниуэ
14.03.2026 09:05:00 | iXBT.com
«Здесь нет запасного механизма. Эта машина либо едет сама, либо нет». Tesla с самого начала готова выпускать сотни дешёвых Cybercab еженедельно
14.03.2026 08:49:00 | iXBT.com
-
В Перми создали программу для прогноза пробок за 20−40 минут до их появления
18.04.2026 21:25:29 | ferra.ru
Пост через 100 лет: как американцы возвращались к Луне и по дороге построили канцелярию
18.04.2026 18:39:12 | Хабр
Что такое искусственный интеллект (не нейросети) и какие у него есть виды
18.04.2026 18:31:18 | Хабр
Лисовец назвал 2 вещи, которые помогут каждой стать Кэролин Бессетт-Кеннеди, — и это не одежда
18.04.2026 18:00:00 | Woman.ru
Axelot X5 не умеет считать производительность сотрудников. Поэтому я написал свой отчёт
18.04.2026 17:18:13 | Хабр
Opus 4.7, Codex управляет ПК, TTS от Google, бренд кроссовок «переобулся» в ИИ-компанию
18.04.2026 17:05:09 | Хабр
Салат с консервированным тунцом и грибами, пошаговый рецепт с фото на 553 ккал
18.04.2026 17:00:00 | ГАСТРОНОМЪ
Clean Architecture + DDD в Go: как не превратить проект в 200 файлов ни о чём
18.04.2026 16:58:25 | Хабр
Как сделать SEO для телеграмм-канала и бесплатный кросспостинг в VK и MAX
18.04.2026 16:50:35 | Хабр
Все женщины Артемия Лебедева: правда ли скандальный дизайнер предпочитает «лесных нимф»?
18.04.2026 16:17:28 | Woman.ru
Российский двигатель ПД-8 для наработал более 6100 часов на испытаниях
18.04.2026 16:07:04 | ferra.ru
Игровое ядро процесса. Комментарий к манифесту Хаммера и Чампи «Реинжиниринг корпорации»
18.04.2026 15:59:02 | Хабр
NASA возобновила подготовку к отправке ровера ЕС на Марс после задержек
18.04.2026 15:55:54 | ferra.ru
Автоматизация физических задач и формул, а так же расчет продуктивности мозга написанная на Python
18.04.2026 15:45:57 | Хабр
В Москве прошло мероприятие от Яндекса: митап About:Cloud — Infrastructure
18.04.2026 15:38:22 | Хабр
Лучшие нейросети для генерации изображений: Тестируем и выбираем ТОП ИИ для картинок и фото
18.04.2026 15:37:45 | Хабр
Техническая поддержка проекта ВсеТут