Трансформер своими руками: с нуля до Numpy реализации и обучения

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Трансформер своими руками: с нуля до Numpy реализации и обучения

17.02.2026 01:00:17 | Хабр

Хабы: Python, Искусственный интеллект, Машинное обучение, Алгоритмы, Математика

В этой статье пойдет речь об одной из самых сложных и интересных архитектур — трансформере, лежащей в основе современных моделей от OpenAI и Google DeepMind. И это не научпоп для обывателя с наивным уровнем объяснения, а полноценный учебный материал, который поможет вам понять работу трансформера на фундаментальном уровне без черных ящиков типа TensorFlow и Pytorch.

А для того чтобы лучше вникнуть, давайте напишем настоящий мини-трансформер на процедурном Python и обучим его!

Данный материал можно изучать в разных режимах:

* Как объяснение архитектуры для общего представления;

* Как полноценный гайд с чтением кода и самостоятельной практикой;

* Как основу для собственных экспериментов.

Вы сами можете выбрать тот режим, который нужен для ваших целей на данный момент.

Наш трансформер будет довольно простым: со статическим графом и одноблочными энкодером и декодером. Сам код написан в парадигме процедурного программирования (за исключением некоторых модулей) и может быть прочитан на любом уровне и без знания ООП. И все же это будет полноценный обучаемый трансформер с мультиголовым вниманием, батчами данных, параллельным вычислением и множеством параметров.

Для закрепления материала, выполните Домашнее задание, которое ждет вас в конце статьи.

Напишем трансформер!

Подробнее

Читайте также

Видео: человекоподобные роботы Unitree исполнили номер с элементами боевых искусств на празднике в Китае
16.02.2026 22:29:00 | vc.ru

Новейшие наушники Huawei FreeBuds Pro 5 покинут Китай незадолго до MWC 2026
16.02.2026 22:26:21 | ferra.ru

Минэк предложил обязать маркетплейсы устанавливать комиссии для иностранных продавцов не ниже, чем для российских — РБК
16.02.2026 21:15:06 | vc.ru

Выйдет ли что-то из дачного хобби: строим WiFi-косилку
16.02.2026 21:12:56 | Хабр

Три часа для соцсетей, 74 вируса для финсектора, и «большая стирка» в Telegram
16.02.2026 21:03:31 | it-world

ChatGPT: от истоков до нынешнего времени. Таймлайн успеха OpenAI в 35 шагах
16.02.2026 20:45:39 | Хабр

Как я купил наушники AirPods 4 ANC и нарвался на подделку
16.02.2026 20:32:55 | Хабр

Инсайдер: Apple начала тесты своей первой раскладушки
16.02.2026 20:26:13 | ferra.ru

Суд решит судьбу вышек сотовой связи в Сестрорецке
16.02.2026 20:13:53 | it-world

mutex vs atomic<bool>
16.02.2026 19:40:07 | Хабр

mutex vs futex
16.02.2026 19:40:07 | Хабр

Обзор Sora 2 и Sora 2 Pro: Как использовать нейросеть для генерации видео в России
16.02.2026 19:27:43 | Хабр

Некоторые живущие в ЕС россияне рассказали о проверках Revolut старых переводов из стран СНГ в Европу
16.02.2026 19:22:32 | vc.ru

Гальваника и нюансы цифровизации
16.02.2026 19:18:37 | Хабр

Telegram‑бот для дисциплины: как я перестал «просто писать код» и начал делать продукт
16.02.2026 19:09:52 | Хабр

OpenAI переманила разработчика ИИ-приложения, который управляет ПК пользователя
16.02.2026 18:36:26 | ferra.ru

Некоторые пользователи пожаловались на исчезновение комментариев и описания под видео на YouTube — предполагают, что дело снова в блокировщиках рекламы
16.02.2026 18:29:30 | vc.ru

Февральский исход и реклама в ChatGPT. Safety First приказал долго жить
16.02.2026 17:47:25 | Хабр

Бесплатный LLM делает игру на Godot
16.02.2026 17:38:31 | Хабр

Сервис доставки еды Uber Eats в 2026 году начнёт работать ещё в семи европейских странах, включая Австрию, Чехию и Финляндию
16.02.2026 17:33:59 | vc.ru

HackTheBox. Прохождение FluxCapacitor. Уровень — Средний
16.02.2026 17:31:57 | Хабр

Сбой у X: пользователи сообщают о проблемах с приложением и загрузкой лент
16.02.2026 17:08:18 | vc.ru

ИИ-трансформация 2026: от хайпа к инфраструктуре. 5 структурных сдвигов, которые меняют стек технологий
16.02.2026 17:00:31 | Хабр

Уже появился список устройств Poco, которые получат Android 17
16.02.2026 16:51:59 | ferra.ru

[Перевод] $10 миллиардов на Starship впустую: SpaceX возвращается к Falcon Heavy для космических колоний
16.02.2026 16:45:27 | Хабр

«Важно доставлять, а не понимать» — идеальный способ работы с нейросетями
16.02.2026 16:41:24 | Хабр

Бесплатные нейросети в 2026: ТОП ИИ — создать видео, оживить фото, сгенерировать текст и музыку в одном обзоре
16.02.2026 16:20:04 | Хабр

Backend-driven UI в Авито: от идеи к проду
16.02.2026 16:19:25 | Хабр

Может ли ИИ заменить QA?
16.02.2026 16:11:23 | Хабр

Индия дает соцсетям три часа на удаление контента
16.02.2026 16:08:56 | it-world

«Не учись на программиста» — что бы я сказал своему ребёнку в 2026-м
16.02.2026 16:01:17 | Хабр

«Яндекс Маркет» запустил «Фулфилмент» — сторонние продавцы смогут использовать склады и другую инфраструктуру маркетплейса
16.02.2026 15:33:13 | vc.ru

Стартап The Biological Computing привлёк $25 млн на разработку биологической вычислительной платформы на основе органических нейронов
16.02.2026 15:31:25 | vc.ru

Офлайн-мессенджер Джека Дорси BitChat добавит возможность делиться приложением с другими пользователями без подключения к интернету
16.02.2026 15:23:40 | vc.ru

Ушел из жизни «отец» консолей Sega — Хидэки Сато
16.02.2026 14:54:56 | ferra.ru

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

США разрешили покупку российской нефти. Почему Вашингтон ослабил санкции?
13.03.2026 07:51:35 | Lenta.ru

Популярную привычку связали со снижением риска психических расстройств
13.03.2026 07:48:59 | Lenta.ru

Блогерша назвала восемь вызывающих недоумение у иностранцев вещей в российских домах
13.03.2026 07:48:54 | Lenta.ru

Привычка женщины в обращении со смартфоном создала пикантную проблему в туалете
13.03.2026 07:48:00 | Lenta.ru

В Минске на следующей неделе пройдут две технологические выставки
13.03.2026 07:48:00 | Российская Газета

Роспатент зарегистрировал два товарных знака от Christian Dior
13.03.2026 07:46:07 | Life.ru

Москва выставила на торги помещение для бизнеса в Хамовниках
13.03.2026 07:41:48 | ТАСС

Reuters: США могут одобрить поставки оружия Тайваню после визита Трампа в Китай
13.03.2026 07:41:07 | ТАСС

Мощное землетрясение произошло в Турции
13.03.2026 07:40:21 | Lenta.ru

Эксперт Волков: ситуация на Ближнем Востоке не вызвала ажиотаж на туризм в РФ
13.03.2026 07:40:14 | ТАСС

Аэропорт Надыма возобновил работу
13.03.2026 07:39:54 | ТАСС

За ночь расчёты ПВО уничтожили 176 украинских дронов над регионами России
13.03.2026 07:39:02 | Life.ru

Спиридонов: разрушения монастыря в Горнале невозможно оценить очно
13.03.2026 07:38:56 | ТАСС

Армия Израиля сообщила о нанесении удара по боевику "Хезболлах" в Бейруте
13.03.2026 07:38:53 | ТАСС

В Крыму число прошедших социальную адаптацию иммигрантов за год выросло в 4 раза
13.03.2026 07:37:36 | ТАСС

The Times of India: Пакистан нанес авиаудары по Кабулу и Кандагару
13.03.2026 07:37:24 | ТАСС

Угроза атаки БПЛА в Чувашии отменена
13.03.2026 07:37:19 | ТАСС

Супружескую пару россиян заподозрили в десятках автоподстав
13.03.2026 07:37:00 | Lenta.ru

"Кион": онлайн-кинотеатры объединят подписки из-за роста стоимости контента
13.03.2026 07:36:33 | ТАСС

Даниил Медведев вышел в полуфинал "Мастерса" в Индиан-Уэллсе
13.03.2026 07:36:32 | ТАСС

Всех спортсменов РФ проверили на допинг во время Паралимпиады в Италии
13.03.2026 07:36:27 | ТАСС

Несколько десятков человек пострадали из-за нападения на американскую синагогу
13.03.2026 07:35:30 | Lenta.ru

В России захотели изменить размер алиментов
13.03.2026 07:35:13 | Lenta.ru

Кучеров стал четвертым россиянином, набравшим 1 100 и более очков в НХЛ
13.03.2026 07:34:55 | ТАСС

Средний возраст учителя в школах Москвы составляет 44 года
13.03.2026 07:34:36 | ТАСС

"Авито": россияне тратят на трендовые вещи в среднем 24 тыс. рублей в год
13.03.2026 07:34:29 | ТАСС

Для четырех городов Татарстана отменили угрозу БПЛА
13.03.2026 07:32:38 | ТАСС

Ещё в четырёх аэропортах России ввели ограничения на полёты
13.03.2026 07:32:36 | Life.ru

"Север" обезвредил более 700 взрывных устройств ВСУ в Сумской области
13.03.2026 07:32:22 | ТАСС

Уголовник годами насиловал несовершеннолетнюю падчерицу
13.03.2026 07:31:46 | Lenta.ru

В Приморье расторгли соглашение с пользователем охотничьих угодий через суд
13.03.2026 07:31:46 | ТАСС

Раскрыты детали налета ВСУ на Россию на фоне отказа Зеленского от поиска компромиссов
13.03.2026 07:31:01 | Lenta.ru

ВСУ изменили тактику в приграничье и начали охоту на расчёты БПЛА
13.03.2026 07:29:23 | Life.ru

Бобровский сравнялся с Хабибулиным по числу матчей в НХЛ
13.03.2026 07:28:32 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro