Как устроена языковая модель без перемножения матриц

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Как устроена языковая модель без перемножения матриц

03.09.2024 11:07:54 | Хабр

Хабы: Машинное обучение, Искусственный интеллект

Нейросети любой архитектуры построены на перемножении матриц. Например, трансформеры из входного вектора создают (тоже перемножением) три матрицы, Q, K и V, которые затем несколько раз перемножаются на пути к получению выходного вектора. Именно умножение матриц с его кубической сложностью (если не прибегать к разного рода ухищрениям) занимает большую часть вычислительных мощностей.

Поэтому возникает естественное желание облегчить эту самую массивную часть вычислений и ускорить таким образом любую архитектуру. Периодически возникают новые подходы и идеи, тут расскажем о последней громкой статье по этой теме — Scalable MatMul-free Language Modeling.

Читать далее

Подробнее

Читайте также

Инвесторы компании Arenum Эдуарда Гуриновича потребовали поделиться с ними прибылью от игры Hamster Kombat — «Ведомости»
03.09.2024 11:02:48 | vc.ru

Эволюция службы поддержки сотрудников: почему так непросто сделать просто
03.09.2024 10:57:27 | Хабр

Геймификация продукта: простое решение для старта геймификации. Мотивация без призового бюджета и сложных механик
03.09.2024 10:52:07 | Хабр

Российские банки начали запрашивать у импортёров заверения, что в Китае примут их платежи — «Ведомости»
03.09.2024 10:48:44 | vc.ru

В ДЭГ на президентских выборах проголосовало на 211 тысяч больше, чем было избирателей. Что это значит?
03.09.2024 10:40:10 | Хабр

Видеокарты mall Form Factor новинки от Infinity 3
03.09.2024 10:35:15 | it-world

Kata Containers для Docker в 2024
03.09.2024 10:34:12 | Хабр

[Перевод] Обзор бенчмарков для тестирования LLM (больших языковых моделей)
03.09.2024 10:33:04 | Хабр

Исследование показали уязвимость ИИ в беспилотных автомобилях
03.09.2024 10:30:00 | ferra.ru

IDP и OCR в вопросах и ответах: Главное, что нужно знать
03.09.2024 10:24:07 | Хабр

Почему ваш сайт резко упал в позициях Яндекса
03.09.2024 10:22:38 | Хабр

Многократные переплаты в ИТ и где они возникают. Ч.2
03.09.2024 10:05:38 | Хабр

Не дай мозгу себя обмануть: 5 когнитивных искажений, распространённых в IT
03.09.2024 09:50:06 | Хабр

Кратко про low-code библиотеку для ML Pycaret
03.09.2024 09:49:04 | Хабр

Новая структура снизит вибрации в инженерных устройствах
03.09.2024 09:45:00 | ferra.ru

Explor-им GitLab
03.09.2024 09:36:01 | Хабр

Как ускорить A/B тесты: несколько способов
03.09.2024 09:23:29 | Хабр

VK разрабатывает маркетплейс для закупки нативной рекламы у блогеров
03.09.2024 09:21:03 | vc.ru

[Перевод] CORS — это тупо
03.09.2024 09:16:48 | Хабр

Дайджест Облака Рег.ру за август
03.09.2024 09:11:58 | Хабр

[Перевод] Как неожиданный мюон произвёл революцию в физике частиц
03.09.2024 09:08:57 | Хабр

Big Data в моде: как мы внедрили 1-to-1 персонализацию в каталоге и поиске
03.09.2024 09:00:35 | Хабр

Microsoft: ИИ поможет бизнесу сэкономить, но требует доработок
03.09.2024 09:00:00 | ferra.ru

В детстве собирал советский конструктор, а теперь продаю инженерные решения для бизнеса
03.09.2024 08:45:48 | Хабр

День 923: Минпромторг объявил конкурс на разработку станка для производства заготовок из кремниевых пластин
03.09.2024 08:32:40 | vc.ru

Ну, пусть будут. Самые абсурдные изобретения
03.09.2024 08:31:46 | Хабр

Индекс твоего города — Всего города
03.09.2024 08:31:30 | Хабр

Скорость зарядки недорогого флагмана Samsung Galaxy S24 FE разочарует
03.09.2024 08:20:29 | ferra.ru

Правда ли, что в Windows 11 24H2 Ryzen работают быстрее, чем в Windows 10 и старой версии Windows 11
03.09.2024 08:15:00 | ferra.ru

Санкции не помешали Китаю потратить на производство чипов больше Южная Кореи, Тайваня и США вместе взятых
03.09.2024 08:14:28 | ferra.ru

Экономическая система мира Гарри Поттера
03.09.2024 08:11:52 | Хабр

NVIDIA обновила слоган видеокарт линейки RTX
03.09.2024 08:08:20 | ferra.ru

[Перевод] Создание гигабитного коммутатора на Linux
03.09.2024 08:06:59 | Хабр

Таролог в тестировании
03.09.2024 08:06:32 | Хабр

Сложно о простом. Самые популярные заголовки уровня L2 модели OSI в Ethernet
03.09.2024 08:05:49 | Хабр

Смотреть все

СТАТЬ АВТОРОМ

НОВОСТИ

Федеральный закон от 27 октября 2025 г. N 380-ФЗ "О ратификации Договора между Российской Федерацией и Боливарианской Республикой Венесуэла о стратегическом партнерстве и сотрудничестве"
30.10.2025 03:00:00 | Российская Газета

Федеральный закон от 27 октября 2025 г. N 382-ФЗ "О ратификации Соглашения между Российской Федерацией и Государством Кувейт о выдаче"
30.10.2025 03:00:00 | Российская Газета

Федеральный закон от 27 октября 2025 г. N 381-Ф3 "О ратификации Соглашения между Правительством Российской Федерации и Правительством Китайской Народной Республики о поощрении и взаимной защите инвестиций"
30.10.2025 03:00:00 | Российская Газета

Грузовая фура рухнула с моста через железнодорожные пути в Симферополе
29.10.2025 23:21:22 | РЕН ТВ

«Радиостанция Судного дня» передала новое сообщение после заявления Путина о «Посейдоне»
29.10.2025 23:18:10 | Lenta.ru

Экс-дипломат Прауд: Зеленский рассматривает военные действия как бизнес
29.10.2025 23:17:28 | ТАСС

Ларионов рассказал, кто порекомендовал ему в СКА тренера Бабенко
29.10.2025 23:14:32 | ТАСС

The European Conservative: конфискация активов РФ подорвет доверие к банкам ЕС
29.10.2025 23:13:27 | ТАСС

У Алеппо погибли не менее двух сирийских военных из-за атаки курдов
29.10.2025 23:11:37 | ТАСС

В Симферополе фура упала с моста и пробила железнодорожное полотно
29.10.2025 23:11:10 | ТАСС

Bild: в Киеве считают, что предстоящая зима может стать катастрофической
29.10.2025 23:09:59 | ТАСС

ВСУ с помощью дронов атаковали территории шести районов Белгородской области
29.10.2025 23:09:19 | ТАСС

В Танзании ввели войска из-за протестов после президентских выборов
29.10.2025 23:07:55 | РЕН ТВ

Лучшим рестораном Казани по версии Wheretoeat стал "Умай"
29.10.2025 23:06:13 | ТАСС

В Пермском крае задержали экс-депутата Заксобрания Константина Окунёва
29.10.2025 23:06:10 | Life.ru

Проевропейское движение "Демократы-66" лидирует на выборах в Нидерландах
29.10.2025 23:03:48 | ТАСС

В России количество случаев заражения ВПЧ выросло в 2,5 раза за 10 лет
29.10.2025 23:03:04 | ТАСС

Вершинин обсудил с послом Израиля развитие политического диалога
29.10.2025 23:02:26 | ТАСС

В Киеве прошёл митинг родственников военных ВСУ с требованием эвакуировать тела
29.10.2025 23:02:14 | Life.ru

Черкизовский мясоперерабатывающий завод получил статус промкомплекса
29.10.2025 23:02:09 | ТАСС

В Германии предрекли скорую катастрофу на Украине
29.10.2025 23:01:00 | Lenta.ru

Politico узнал о блокировке Венгрией заявления ЕС о вторжении метеозондов
29.10.2025 22:59:51 | РБК

В США назвали сроки создания «Золотого купола»
29.10.2025 22:58:00 | Lenta.ru

Грушко: Угрозы Бельгии Москве являются проявлением «военного психоза»
29.10.2025 22:56:25 | Life.ru

Раскрыты подробности о встрече американской делегации с депутатами Госдумы
29.10.2025 22:56:00 | Lenta.ru

ПСЖ сыграл вничью с "Лорьяном", Сафонов вновь остался в запасе
29.10.2025 22:55:57 | ТАСС

Два человека пострадали в результате атаки дронов ВСУ в российском регионе
29.10.2025 22:55:00 | Lenta.ru

Медведев заявил, что "Посейдон" может уничтожить страну вроде Бельгии
29.10.2025 22:54:30 | ТАСС

Замерзший мужчина устроил дебош в Петербурге, чтобы погреться под арестом
29.10.2025 22:53:26 | РЕН ТВ

Орбан объявил о начале антивоенной кампании и митингов в городах Венгрии
29.10.2025 22:52:34 | ТАСС

Changan завалит Россию новинками: помимо пяти новых моделей под брендом Changan в РФ появится пять гибридов Deepal, в том числе флагман Deepal S09 — аналог Li Auto L9
29.10.2025 22:52:00 | iXBT.com

В Конгрессе заявили, что экономика США может потерять до $14 млрд из-за шатдауна
29.10.2025 22:50:51 | ТАСС

Конгрессвумен Луна заявила о планах провести конференцию правых политиков из ЕС
29.10.2025 22:50:28 | ТАСС

В российском городе учительница получила звонок из «спецслужб» и потеряла квартиру
29.10.2025 22:50:01 | Lenta.ru

Депутаты смягчили реформу медобразования ко второму чтению
29.10.2025 22:49:59 | РБК

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2025 - vsetut.pro