Развитие искусственного интеллекта всё сильнее упирается в ограничения аппаратуры. Современные нейросетевые ускорители — Neural Processing Units (NPU) — выполняют колоссальное число операций с числами с плавающей запятой. Однако стандарт IEEE 754, лежащий в основе большинства таких вычислений, оказался не слишком удобным для специализированных ИИ-процессоров: он требует сравнительно сложной логики и увеличивает энергопотребление чипов. Для дата-центров даже небольшая экономия энергии на каждой операции становится заметной на уровне всего кластера.
Эта проблема особенно заметна при переходе к низкобитным форматам — например, 8-битному FP8 или OCP MX. Чтобы избежать переполнений при работе нейросетей, такие форматы обычно используют механизм блокового масштабирования (AMAX), который усложняет аппаратную реализацию и увеличивает задержки. По сути, процессору приходится постоянно отслеживать максимальные значения в блоках данных и пересчитывать масштаб чисел.
Автор новой работы, Кэйта Морисаки (Keita Morisaki), предложил альтернативный подход — семейство форматов чисел AetherFloat, специально разработанное для ускорителей ИИ. В основе архитектуры лежит использование четырёхзначной шкалы экспоненты (Base-4) и явной мантиссы. Такая схема позволяет отказаться от скрытого бита и сложных процедур нормализации, которые обычно применяются в классических форматах с плавающей запятой.
По расчётам, это заметно упрощает аппаратную реализацию вычислительных блоков. В частности, площадь ядра умножения-накопления (MAC) уменьшается примерно на 33%, энергопотребление — на 22%, а задержка критического пути сокращается примерно на 12% по сравнению с типичными реализациями FP8. Поскольку именно MAC-блоки составляют основу вычислений нейросетей, такие изменения могут заметно повлиять на эффективность всего ускорителя.

Формат AetherFloat-8 (AF8) предназначен прежде всего для инференса нейросетей. Он обладает расширенным динамическим диапазоном — примерно от 1,2×10-4 до 57 344. Благодаря этому формат способен обрабатывать редкие экстремальные значения в активациях больших языковых моделей без дополнительного аппаратного масштабирования. В результате отпадает необходимость в механизме AMAX, который используется в ряде существующих FP8-реализаций.
При этом AF8 требует применения квантования с учётом обучения (QAT, Quantization-Aware Training) — подхода, при котором модель изначально обучается с учётом будущего перехода на низкобитные представления чисел.
Второй формат семейства — AetherFloat-16 (AF16) — рассматривается как возможная альтернатива широко используемому формату bfloat16. По результатам экспериментов AF16 обеспечивает сопоставимую точность вычислений, но требует меньших аппаратных ресурсов.
Оба формата используют оригинальную схему кодирования — Lexicographic One’s Complement. Она позволяет сравнивать числа как обычные целые значения, без дополнительных преобразований, что упрощает и ускоряет аппаратную реализацию операций вроде функции активации ReLU или операции уменьшения размерности MaxPooling. В свою очередь, это означает более простые и быстрые схемы логических сравнений.
Автор протестировал новую архитектуру на задачах обучения и инференса LLM Qwen2.5-7B. Эксперименты показали, что AF8 демонстрирует стабильную сходимость при использовании QAT и оказывается устойчивее к потере градиентов, чем стандартные FP8-форматы. Формат AF16, в свою очередь, практически не уступает bfloat16 по точности вычислений.
Исследователь также опубликовал в открытом доступе код архитектуры, чтобы другие разработчики могли воспроизводить результаты и тестировать формат в собственных системах. При этом Морисаки отмечает, что для окончательных выводов потребуется проверка на реальных чипах и расширение экспериментов на другие типы моделей.
Если предложенный подход подтвердит свою эффективность в аппаратной реализации, то форматы AetherFloat могут заметно упростить архитектуру будущих ИИ-ускорителей. Это позволит снизить энергопотребление и стоимость специализированных процессоров, сохранив точность вычислений даже при использовании низкобитных числовых форматов.
-
Samsung запустила продажи магнитного мобильного аккумулятора для Galaxy S26, но есть нюанс: непосредственно к Galaxy S26 он не магнитится
14.03.2026 16:21:00 | iXBT.com
Уже нашёлся умелец, который создал MacBook Neo с SSD объёмом 1 ТБ. Для этого он перепаял чип памяти
14.03.2026 16:05:00 | iXBT.com
Vivo X300 Ultra предложит не только крутую камеру, но также и расширенные возможности работы со звуком
14.03.2026 15:48:00 | iXBT.com
Почему в ноутбуках Chuwi вместо Ryzen 5 7430U обнаруживается старый Ryzen 5 5500U? Расследование Notebookcheck говорит о том, что Chuwi может быть и не виновата
14.03.2026 15:42:00 | iXBT.com
Instagram* без лишнего шума отказывается от сквозного шифрования сообщений. В теории это значит, что все личные переписки будут доступны Meta*
14.03.2026 15:36:00 | iXBT.com
Китай разрабатывает недорогие грузовые системы для расширяющейся лунной программы
14.03.2026 15:33:00 | iXBT.com
Пока пользователи осваивают PCIe 5.0, компания Synopsys уже демонстрирует возможности PCIe 8.0
14.03.2026 15:27:00 | iXBT.com
Гамма-всплеск вне галактик: телескопы отследили столкновение нейтронных звёзд в «запретной» области Вселенной
14.03.2026 15:25:00 | iXBT.com
После GPU и памяти дорожает уже само сырьё для чипов: вольфрам, тантал и молибден подорожали в два раза, галлий — на 123%
14.03.2026 15:25:00 | iXBT.com
Google каким-то образом смогла заметно улучшить автономность Pixel 10a по сравнению с Pixel 9a, хотя по параметрам они идентичны
14.03.2026 15:19:00 | iXBT.com
Современный компьютер за бесценок: в США пользователь за 87 долларов купил 6-ядерный Ryzen 5 7600X, материнскую плату Gigabyte B850M Eagle, 32 ГБ ОЗУ DDR5 и СЖО Cooler Master
14.03.2026 15:12:00 | iXBT.com
Китайская видеокарта с 24 ГБ памяти и поддержкой DirectX 12. Lisuan Tech опубликовала новые подробности о своих ускорителях, для игр вполне подходит версия LX Pro
14.03.2026 14:55:00 | iXBT.com
Из-за роста уровня океанов скорость вращения Земли снижается рекордными темпами за последние миллионы лет
14.03.2026 14:51:00 | iXBT.com
Может ли FSR 4.1 быть лучше DLSS 4.5? Большое сравнение показывает сильные и слабые стороны новой версии апскейлера AMD
14.03.2026 14:51:00 | iXBT.com
Чат-боты массово провалили тест на предотвращение насилия среди подростков
14.03.2026 14:41:00 | iXBT.com
Чтобы видеокарты с 16-контактным разъёмом не горели. Thermal Grizzly выпустила белую версию своего защитного адаптера WireView Pro II
14.03.2026 14:34:00 | iXBT.com
Можно ли будет на MacBook Neo запускать Windows 11? Разработчики Parallels говорят, что в рамках их тестирования всё работает
14.03.2026 14:19:00 | iXBT.com
13 000 мАч, большой экран и Snapdragon 8 Elite Gen5: Oppo готовит по-настоящему мощный планшет Pad 5 Pro
14.03.2026 14:03:00 | iXBT.com
В Макао гуманоидный робот Unitree G1 был задержан полицией после того, как напугал 70-летнюю женщину
14.03.2026 13:52:00 | iXBT.com
Энтузиаст полгода перезаписывал DVD-диски и нашёл самый живучий: TDK вне конкуренции, худшие — Verbatim и Memorex
14.03.2026 13:48:00 | iXBT.com
Энтузиаст запустил настольный компьютер на 64 батарейках АА — за полчаса удалось прогнать Cinebench, установить и поиграть в Minecraft
14.03.2026 13:34:00 | iXBT.com
Синий экран смерти, циклические перезагрузки, зависания системы и вылеты приложений: пользователи жалуются на обновление KB5079473 для Windows 11
14.03.2026 13:21:00 | iXBT.com
Магнитная «турбина» для смартфона, которая может и заряжать, и охлаждать: OPPO представила магнитную беспроводную зарядку Small Turbine 2 мощностью 50 Вт
14.03.2026 13:11:00 | iXBT.com
Солнце могло мигрировать из внутренней части Млечного Пути — новая гипотеза астрономов
14.03.2026 12:49:00 | iXBT.com
Xiaomi запустила в Китае новую стиральную машину на 10 кг с интеграцией в умный дом и гарантией 10 лет на мотор — она стоит 175 долларов
14.03.2026 12:42:00 | iXBT.com
Nvidia нашла оригинальный способ выбивать низкие цены на чипы памяти: компания давит на Samsung и других поставщиков через жёсткие аудиты
14.03.2026 12:26:00 | iXBT.com
Huawei Enjoy 90 Pro Max с батареей 8500 мА·ч уже доступен для заказа в Китае
14.03.2026 12:08:00 | iXBT.com
Робот-сыщик использует 3D-зрение для умного поиска потерянных предметов
14.03.2026 10:48:43 | TechCult.ru
Землю накрыла первая продолжительная магнитная буря весны 2026: как долго она продлится
14.03.2026 09:28:00 | iXBT.com
Ещё недавно в этой стране за использование Starlink могли посадить в тюрьму. Доступ к спутниковому интернету Илона Маска официально открыли на Ниуэ
14.03.2026 09:05:00 | iXBT.com
«Здесь нет запасного механизма. Эта машина либо едет сама, либо нет». Tesla с самого начала готова выпускать сотни дешёвых Cybercab еженедельно
14.03.2026 08:49:00 | iXBT.com
-
В Ярославле создали гидрогель для ускоренного заживления ран и ожогов
18.03.2026 23:02:46 | ferra.ru
Российские инженеры создали ИИ-систему для посадки дронов с точностью до сантиметра
18.03.2026 22:15:00 | ferra.ru
Российские ученые нашли связь между стрессоустойчивостью и уровнем цинка в слюне
18.03.2026 22:07:42 | ferra.ru
Сотрудники уходят тихо, Минцифры борется с анонимностью, а кто-то продает «Авто.ру»
18.03.2026 22:05:40 | it-world
Инсайдер: складной смартфон Huawei Pura X2 удивит своим аккумулятором
18.03.2026 21:36:19 | ferra.ru
Как я каждый месяц пишу рассылку для 50+ продавцов и не схожу с ума (иногда схожу)
18.03.2026 20:55:19 | Хабр
Ozon анонсировал запуск подписки для продавцов для работы с отзывами с 1 апреля 2026 года
18.03.2026 20:53:48 | vc.ru
[Перевод] Почему «квантовые белки» могут стать следующим большим прорывом в биологии
18.03.2026 20:18:32 | Хабр
Российские ученые снизили ошибку прогнозов свойств молекулНовый метод учитывает 3D-структуру веществ
18.03.2026 20:12:17 | ferra.ru
FARA CRM — бесплатная open-source CRM на Python (FastAPI) + React с PWA и Push-уведомлениями
18.03.2026 20:09:32 | Хабр
Учёные СПбПУ создали «шеф-повара» для подбора материалов под арктические стройки
18.03.2026 20:00:00 | ferra.ru
Владелец старейшей англоязычной универсальной энциклопедии подал в суд на OpenAI
18.03.2026 19:36:20 | ferra.ru
Увидеть благородных оленей, застать цветение маральника и пройти по самой красивой дороге мира: чем встречает туристов Алтай
18.03.2026 19:29:54 | Woman.ru
Синоптик Леус: магнитная буря может затянуться до первой половины 20 марта
18.03.2026 19:15:00 | ferra.ru
В России разработают термоядерный двигатель для дальних полетов в космос
18.03.2026 19:10:48 | ferra.ru
Красноярские ученые создали систему для гибридных сетей связи со спутниками
18.03.2026 18:59:35 | ferra.ru
12 полезных материалов HubSpot по нейросетям для бизнеса, маркетинга и продаж
18.03.2026 18:55:50 | Хабр
Техническая поддержка проекта ВсеТут