Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Геометрия превосходства: Почему DeepSeek-V4 и Moonshot AI убили AdamW, и как оптимизатор Muon меняет физику обучения

18.05.2026 18:53:11 | Хабр

Хабы: Машинное обучение

Долгие 10 лет индустрия молилась на оптимизатор AdamW, слепо применяя его ко всем параметрам нейросети. Но весной 2026 года вышли DeepSeek-V4 и Kimi K2 от Moonshot AI, которые переписали правила игры. В их основе лежит Muon оптимизатор, который снижает затраты на обучение в два раза. В этой статье мы разберем, почему AdamW стал архитектурным рудиментом, как Muon использует итерации Ньютона-Шульца для ортогонализации градиентов, и почему этот алгоритм работает только с 2D-матрицами. Если вы все еще пытаетесь объяснить ИИ через философию, добро пожаловать в реальный мир спектральной нормализаци

Читать далее

Подробнее

Читайте также

Сбой у «Делимобиля»: пользователи не могут войти в аккаунт и завершить аренду
18.05.2026 18:46:21 | vc.ru

Код Telegram iOS — лучший в индустрии. Почему же он так лагает на флагманах?
18.05.2026 18:40:21 | Хабр

AI-помощник для технической поддержки: новый этап в TG Support Bot 7.1.0
18.05.2026 18:10:11 | Хабр

«2ГИС» запустил в приложении оплату проезда в метро — пилот проводят в Нижнем Новгороде
18.05.2026 18:06:39 | vc.ru

Сможет ли Иран получить деньги за работу интернет-кабелей в Ормузе?
18.05.2026 17:48:15 | it-world

Складывающийся втрое Huawei Mate XT 2 получит «серьёзные изменения в дизайне»
18.05.2026 17:42:38 | ferra.ru

Vercel выкатил язык программирования для агентов. Я пытаюсь понять, нужен ли он мне
18.05.2026 17:26:47 | Хабр

Bloomberg: xAI в начале 2026-го предлагала сотрудникам предоставить свои налоговые декларации для обучения Grok за вознаграждение в $420 — деньги до сих пор не выплатили
18.05.2026 17:12:24 | vc.ru

Почему ваши логи бесполезны и как это починить за полчаса
18.05.2026 16:50:24 | Хабр

Попавший в организм до рождения свинец ухудшает здоровье даже через 60 лет
18.05.2026 16:10:50 | ferra.ru

Самый настоящий FP64 для ядерных расчетов? Анонс AMD Instinct MI430X
18.05.2026 15:57:27 | Хабр

В Cеть слили характеристики OnePlus Ace 7: до 240 Гц, 9000 мА·ч
18.05.2026 15:53:51 | ferra.ru

[Перевод] Каждая AI-подписка — это бомба замедленного действия для корпоративного сектора
18.05.2026 15:52:48 | Хабр

Security Week 2621: три уязвимости нулевого дня в Windows
18.05.2026 15:51:44 | Хабр

Роботизация заводов приносит миллиарды производителям комплектующих
18.05.2026 15:50:10 | it-world

Генерация дипломной работы нейросетью: какие ИИ помогают студентам в 2026 году
18.05.2026 15:22:21 | Хабр

Mimo V2 Pro от Xiaomi — что умеет нейросеть от производителя смартфонов? 4 интересных теста
18.05.2026 15:17:00 | Хабр

Дайджест: топ-5 инструментов Сбер2В для роста продаж на маркетплейсах и в интернет-магазине
18.05.2026 15:14:11 | Хабр

Рейтинг технологий для мобильной разработки для банков в 2026 году
18.05.2026 15:06:33 | Хабр

Собрал MCP-сервер для Windows-администрирования: 42 инструмента, от Event Viewer до диагностики служб
18.05.2026 14:52:11 | Хабр

Тестирование случайности самодельного ГПСЧ и сравнение с эталонами
18.05.2026 14:40:23 | Хабр

Таксы и постапокалипсис. Как я сделала первую визуальную новеллу на Ren’Py с помощью ИИ
18.05.2026 14:23:24 | Хабр

Путь интроверта от ИТР до руководителя. Библиотека руководителя-интроверта
18.05.2026 14:11:54 | Хабр

Вайлдберриз режет селлеров. Кажется я следующий
18.05.2026 14:09:50 | Хабр

Installer на стероидах. Модификация установочных образов Astra linux
18.05.2026 14:07:54 | Хабр

Чек-лист по онбордингу: как геймифицировать первые 30 дней сотрудника, чтобы он остался в компании на годы
18.05.2026 13:59:35 | Хабр

Чек-лист по онбордингу: как геймифицировать первые 30 дней сотрудника, //чтобы он остался в компании на годы
18.05.2026 13:59:35 | Хабр

Человек как кластер MCP-серверов, общество как симбиоз людей, организаций и их клонов – к чему всё идёт
18.05.2026 13:43:31 | Хабр

Как сделать перевод в США из России в 2026 году, даже если нет ВНЖ и казахстанской карты
18.05.2026 13:39:16 | Хабр

15 приёмов EDA на Python, которые работают лучше красивого дизайна
18.05.2026 13:30:41 | Хабр

Итоги 3-го этапа RISC-V DEVBOARDS: что показали проекты на базе Baikal-U
18.05.2026 13:29:42 | Хабр

Как мы автоматизировали завод, где штрих-коды играют в прятки
18.05.2026 13:28:31 | Хабр

Как технология LayerScale спасает сверхглубокие трансформеры (и почему о ней молчат туториалы)
18.05.2026 13:25:05 | Хабр

Решение задачи удаления избыточных терминов в заданном контекте без потери информации. Примеры в Colab
18.05.2026 13:24:14 | Хабр

Антидетект-браузеры: почему мультиаккаунтинг вообще работает
18.05.2026 13:24:09 | Хабр

Смотреть все

НОВОСТИ

В московской многоэтажке произошел взрыв
11.07.2026 09:26:09 | Lenta.ru

Лантратова помогла родителям погибшего на СВО получить документы для выплат
11.07.2026 09:24:07 | ТАСС

Дуров сравнил Евросоюз с банановыми республиками
11.07.2026 09:20:31 | ТАСС

Эксперт Захаренкова: болезни коллег не являются основанием для переноса отпуска
11.07.2026 09:19:23 | ТАСС

Артемьев считает, что в онлайн-шахматах много грязи
11.07.2026 09:18:57 | ТАСС

Berliner Zeitung: Зеленский всё чаще применяет санкции против граждан Украины
11.07.2026 09:18:23 | Life.ru

Сигал назвал Путина величайшим лидером в мире
11.07.2026 09:17:27 | ТАСС

Роспотребнадзор начал расследование после отравления 19 человек в Зарайске
11.07.2026 09:16:25 | Life.ru

Сестра Гуцул заявила, что в Гагаузии остались патриоты, которые отстоят автономию
11.07.2026 09:15:53 | ТАСС

В Татарстане назвали возможную причину съезда автобуса в кювет
11.07.2026 09:14:01 | ТАСС

Кенийский бегун побил державшийся 27 лет мировой рекорд
11.07.2026 09:10:36 | Lenta.ru

После ДТП с автобусом в Татарстане возбуждено уголовное дело
11.07.2026 09:10:17 | Коммерсантъ

Прятали в дорожной сумке: Беженка рассказала, как в Константиновке скрывали детей от ВСУ
11.07.2026 09:09:00 | Life.ru

Через пункт пропуска Кани-Курган въехал первый иностранец по электронной визе
11.07.2026 09:06:00 | Российская Газета

Пушилин заявил, что ВСУ долгие годы создавали в Константиновке укрепрайон
11.07.2026 09:02:04 | ТАСС

В Москве при взрыве пиротехники в жилом доме погиб человек
11.07.2026 09:01:33 | Life.ru

В МВД России назвали признаки "опасного" банкомата
11.07.2026 09:01:04 | ТАСС

Доходность 60% на падающем рынке: 10 лучших акций с начала 2026 года
11.07.2026 09:00:21 | РБК

У Венеры туберкулёз, у Давида — грыжа: Какие болезни мы не замечали в шедеврах мирового искусства
11.07.2026 09:00:00 | Life.ru

Кристофер Нолан посвятил "Одиссею" Дэвиду Кили - специалисту по IMAX, с которым он проработал более 20 лет
11.07.2026 08:58:09 | PlayGround.ru

В Белгородской области при атаке БПЛА пострадали два человека
11.07.2026 08:57:40 | Коммерсантъ

Под Белгородом при атаке дрона ВСУ на автомобиль пострадали два человека
11.07.2026 08:56:30 | ТАСС

Косачев заявил, что конфликт на Украине закончится переговорами
11.07.2026 08:55:41 | ТАСС

В Сочи спрос на квартиры снизился почти на 80% за семь лет
11.07.2026 08:53:09 | ТАСС

Военкор Стешин заявил об угрозе автономных дронов с искусственным интеллектом
11.07.2026 08:51:31 | Life.ru

Финляндия захотела продлить закон о выдворении беженцев до конца 2028 года
11.07.2026 08:48:52 | Life.ru

Над Россией сбили 178 беспилотников за ночь
11.07.2026 08:47:41 | РБК

На Багамах при крушении легкомоторного самолета погибли 10 человек
11.07.2026 08:45:57 | ТАСС

"Купол Донбасса" за сутки сбил 31 беспилотник над ДНР
11.07.2026 08:45:29 | ТАСС

Названо число сбитых за ночь над территорией России беспилотников
11.07.2026 08:45:07 | Lenta.ru

Пол Фиг признался, что спустя 10 лет его продолжают травить из-за "Охотников за привидениями"
11.07.2026 08:44:48 | PlayGround.ru

ВТБ: покупатели вернулись на рынок акций РФ к пятнице
11.07.2026 08:43:09 | ТАСС

В Кызыле началось прощание с утонувшими в Енисее девочками
11.07.2026 08:42:14 | Life.ru

CNN назвал условие США для окончательной сделки с Ираном
11.07.2026 08:41:32 | РБК

В Ассоциации автомотуризма назвали стоимость покупки автодома в 2026 году
11.07.2026 08:41:10 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro