С ростом популярности больших языковых моделей (LLM) нагрузка на облачные вычислительные системы значительно увеличилась, что требует поиска новых подходов к обработке запросов. Исследование, проведённое группой учёных, предлагает метрику «интеллект на ватт» (IPW), которая оценивает эффективность локальных систем, объединяя точность выполнения задач и энергопотребление. Это позволяет сравнивать производительность различных моделей и ускорителей.
В рамках исследования было протестировано более 20 локальных языковых моделей на 8 аппаратных ускорителях, включая устройства от Nvidia, AMD и Apple. Для анализа использовался массив из миллиона реальных запросов, охватывающих задачи общения, рассуждений и проверки знаний. Результаты показали, что локальные модели способны успешно обрабатывать 88,7% запросов, а их эффективность (IPW) выросла в 5,3 раза с 2023 по 2025 год благодаря улучшениям в алгоритмах и аппаратных решениях.
Одним из ключевых выводов стало то, что локальные ускорители, такие как Apple M4 Max, уже могут обеспечивать интерактивную обработку запросов, хотя их эффективность пока что уступает облачным решениям. Например, ускорители Nvidia B200 и SambaNova SN40L демонстрируют на 40-78% более высокую эффективность по сравнению с локальными устройствами. Тем не менее, локальные системы позволяют перераспределить до 71,3% запросов, снижая энергопотребление на 60-80% при использовании гибридного подхода.

Исследование также показало, что локальные модели особенно эффективны для творческих и гуманитарных задач, где их точность превышает 90%. Однако в технических областях, таких как архитектура и инженерия, точность падает до 68%, что подчёркивает необходимость дальнейших улучшений. Тем не менее, даже в этих условиях локальные модели способны обрабатывать значительную часть запросов, снижая нагрузку на облачные системы.
Важным аспектом работы стало внедрение маршрутизации запросов между локальными и облачными системами. Оптимальное распределение запросов позволяет достичь значительной экономии ресурсов без потери качества ответов. Например, при точности маршрутизации 80% энергопотребление снижается на 64%, а затраты — на 59%.
Кроме того, исследование подчёркивает важность дальнейшего развития локальных ускорителей. Хотя они уже достигли значительного прогресса, облачные решения сохраняют преимущество благодаря специализированным аппаратным оптимизациям. Это создаёт потенциал для будущих улучшений локальных систем, которые смогут ещё больше сократить разрыв в эффективности.
Результаты подчёркивают потенциал локальных языковых моделей как дополнения к облачным системам. С дальнейшим развитием архитектур моделей и ускорителей эффективность локальных систем будет только расти, что позволит перераспределить ещё большую часть нагрузки. Авторы работы также выпустили открытый инструмент для оценки IPW, чтобы стимулировать дальнейшие разработки в этой области.
-
Прототипы международного проекта GRAND помогли продвинуться в разгадке происхождения самых энергетически мощных частиц космоса
29.03.2026 14:24:00 | iXBT.com
Наклон магнитного поля формирует сложные истечения газа в молодых звёздах
29.03.2026 14:11:00 | iXBT.com
У Chery появился просторный гибридный кроссовер с автопилотом, 510 л.с. и запасом хода 2000 км за 170 тыс. юаней (2,0 млн рублей). Это Chery Fulwin T9L
29.03.2026 13:41:00 | iXBT.com
Больше никаких секретов: Vivo официально раскрыла ключевые характеристики новых флагманов Vivo X300 Ultra и Vivo X300s за считанные часы до официальной премьеры
29.03.2026 13:20:00 | iXBT.com
Такая удача бывает раз в жизни: пользователь купил комплект памяти DDR5 64 ГБ за 7 долларов, в реальности он стоит около 1000 долларов
29.03.2026 13:03:00 | iXBT.com
Независимое измерение на Большом адронном коллайдере подтвердило существование топония — редкого объединения топ-кварка и антикварка
29.03.2026 12:35:00 | iXBT.com
Представлен Jeep Renegade 2027: внедорожник стал «мягким» гибридом и подешевел
29.03.2026 12:34:00 | iXBT.com
В СПЧ заявили о высокой вероятности возобновления работы Telegram в России
29.03.2026 12:22:35 | Ведомости
Электрический кроссовер с мотором 367 л.с., передовой батареей и почти полной зарядкой за 9 минут — 152 тыс. юаней (1,8 млн рублей). BYD Song Ultra EV вышел на рынок в Китае
29.03.2026 12:08:00 | iXBT.com
Искусственный интеллект на уровне наносекунд: CERN внедряет ультракомпактные модели искусственного интеллекта
29.03.2026 12:00:00 | iXBT.com
Блокнот, смекалка и опыт: 91-летний геймер прошел Resident Evil Requiem самым «олдскульным» способом
29.03.2026 11:52:44 | TechCult.ru
Toyota Alphard, подвинься. В Китае начали принимать заказы на новый BYD Denza D9 — просторный гибридный полноприводный минивэн, который в три раза дешевле Alphard
29.03.2026 11:35:00 | iXBT.com
Meta* инвестирует $27 млрд на крупнейший дата-центр, финансируя строительство газовых и возобновляемых электростанций
29.03.2026 11:29:00 | iXBT.com
Астрофизики уточнили природу квазипериодических колебаний в блазаре PG 1553+113
29.03.2026 11:08:00 | iXBT.com
В Сеть утекли характеристики Honor X80i — и у него очень большая батарея
29.03.2026 10:55:00 | iXBT.com
Два Samsung Galaxy S26, но такие разные: версия смартфона на Exynos 2600 сильно уступает версии на Snapdragon 8 Elite Gen5 по автономности
29.03.2026 10:42:00 | iXBT.com
От первого iPhone до iPhone 17: как изменилась камера самого популярного смартфона в мире за почти 20 лет, сравнил Маркес Браунли
29.03.2026 09:42:00 | iXBT.com
Крошечный ПК с возможностью установки дискретной видеокарты и выводом картинки на 4 экрана. Представлен мини-ПК Topfeel Next 2
29.03.2026 09:34:00 | iXBT.com
Каждый смартфон этой серии в таком цвете будет уникальным из-за углеродного волокна аэрокосмического класса. Появились подробности Oppo K15 Pro
29.03.2026 09:29:00 | iXBT.com
Процессор Intel Core Ultra X7 358H, 64 ГБ оперативной памяти LPDDR5X-8533 и SSD до 16 ТБ. Мини-ПК GMKtek EVO-T2s поступил в продажу в Китае
29.03.2026 09:12:00 | iXBT.com
В Муромском институте разработали систему видеонаблюдения, работающую в пыли и дыму
29.03.2026 09:10:43 | TechCult.ru
S — значит Super: смартфон Vivo X300s получит экран 144 Гц, топовую камеру Zeiss, улучшенный звук, MediaTek Dimensity 9500
29.03.2026 08:50:00 | iXBT.com
Илон Маск: Grok уже создаёт больше изображений и видео, чем все конкуренты вместе взятые. Следующий этап — генерация видео в реальномвремени
29.03.2026 08:40:00 | iXBT.com
На бывшем заводе Volkswagen началось производство новых технологичных Volga. Названы отличия Volga K50 от Geely Monjaro
29.03.2026 08:26:00 | iXBT.com
Tesla выпустила зарядное устройство с четырьмя разъёмами USB-C для новых Model 3 и Model Y за 65 долларов в США
29.03.2026 08:17:00 | iXBT.com
Недорогой Huawei Enjoy 90 Pro Max с поддержкой сети 5A Speed значительно опережает другие смартфоны с поддержкой 5G
29.03.2026 08:07:00 | iXBT.com
Huawei вернулась с триумфом и накопила большой запас микросхем памяти задолго до повышения цен
29.03.2026 08:00:00 | iXBT.com
Экран 120 Гц, камера 50 Мп с ИИ, дизайн в стиле iPhone и влагозащита. Характеристики смартфона Lava Bold N2 Pro 4G раскрыли до анонса
29.03.2026 07:47:00 | iXBT.com
NASA разработало нейтронный спектрометр для поиска водорода под поверхностью Луны
29.03.2026 00:24:00 | iXBT.com
Samsung признала проблему экрана Galaxy S26 Ultra — но считает её несущественной
29.03.2026 00:23:00 | iXBT.com
-
OKX выпустила карту для оплаты зарубежных сервисов с кешбэком и процентом на остаток
27.04.2026 13:35:08 | it-world
СМИ: OpenAI работает с Qualcomm и MediaTek над чипами для «ИИ-смартфонов»
27.04.2026 12:55:43 | vc.ru
Банковский сервис X Money, встроенный в соцсеть X, запустят до конца апреля 2026 года — Bloomberg
27.04.2026 12:02:26 | vc.ru
Android, iOS и немного Python: подходит ли Kivy для реальных кроссплатформенных задач?
27.04.2026 12:00:59 | Хабр
Кейс компании Selecty: как они закрыли вакансию Менеджер по развитию бизнеса за неделю
27.04.2026 11:59:59 | Хабр
Можно ли повторить салонный уход дома? Разбираемся в возможностях бьюти-гаджетов
27.04.2026 11:51:28 | Woman.ru
Agent Loop: почему одного вызова инструментов уже недостаточно для корпоративного AI-агента
27.04.2026 11:49:00 | Хабр
Как я нашла работу в 2026: рынок схлопнулся, к собесам теперь готовятся заранее
27.04.2026 11:31:52 | Хабр
«Интервью с алгоритмом – спросим у ИИ о ваших финансах». Обзор проекта «Финансовый доктор»
27.04.2026 11:10:47 | it-world
Интерславик. Он же Interslavic или Medžuslovjansky. Искусственный «Усредненный» между славянский язык общения
27.04.2026 11:10:45 | Хабр
Hooks в LLM-агентах: детерминизм, инъекция контекста и контроль над жизненным циклом
27.04.2026 11:10:32 | Хабр
«ГКС. Сент-Луис»: абсурдный детектив про мужскую депрессию, дружбу и секс
27.04.2026 10:59:07 | Кинопоиск
Дочь, которую они скрывали: Погодина и Пиманов два года назад тайно стали родителями
27.04.2026 10:55:01 | Woman.ru
С чего начинается Родина для ИИ? Мы строим российскую когнитивную архитектуру
27.04.2026 10:52:49 | Хабр
Онбордили, онбордили, да не доонбордили: как не терять людей после адаптации
27.04.2026 10:42:03 | Хабр
Mode collapse в авто-блоге: четыре пятницы подряд LLM приносила нам один и тот же «спорный вопрос про ИИ»
27.04.2026 10:41:44 | Хабр
Как выбирать площадки для GEO-продвижения: источники как основа роста в ответах нейросетей
27.04.2026 10:41:40 | Хабр
Рерайт текстов в 2026: большой разбор сервисов для редакций от SEO-помоек начала 10-х до мультиагентных систем
27.04.2026 10:38:21 | Хабр
Некоторые правообладатели начали предупреждать зрителей российских онлайн-кинотеатров о вырезанных из фильмов и сериалов сценах
27.04.2026 10:31:30 | vc.ru
Организация производства Информационных систем. Часть 9. Современные подходы
27.04.2026 10:29:58 | Хабр
Ольга Погодина у гроба Алексея Пиманова: «Я воспитаю нашу доченьку так, чтобы тебе понравилось»
27.04.2026 10:18:36 | Woman.ru
Я работал по 12 часов в день и через месяц понял, что проблема была не в часах
27.04.2026 10:13:36 | Хабр
Коммуникабельность, адаптивность и навык выступлений: какие софты помогут вырасти в зарплате на 30%
27.04.2026 10:01:06 | Хабр
Олег Виллард — победитель шоу «Титаны. Битва сезонов»: как мачо со стальным прессом оказался сильнее всех
27.04.2026 09:53:29 | Woman.ru
Техническая поддержка проекта ВсеТут