Команда Яндекса внедрила в фирменный поиск гибридную архитектуру искусственного интеллекта, разработанную на основе научных исследований. Технический директор «Яндекс Поиска» Екатерина Серажим рассказала на конференции «День Поиска 2026», что компания объединила подходы «смеси экспертов» (Mixture of Experts, MoE) и «энкодер-декодер» (encoder-decoder). Это позволило повысить качество генеративных ответов и снизить стоимость их обработки в три раза.
_large.png)
По словам Серажим, генеративные ответы — важная функция поиска, они должны быть быстрыми и лаконичными. Для этого Яндекс создал семейство моделей Alice AI Search, оптимизированных под задачи поиска. В них используется архитектура «энкодер-декодер», где одна часть модели анализирует запрос и документы, а другая формирует ответ. Чтобы ускорить работу без потери качества, компания применила подход MoE, который задействует только часть модели для генерации каждого следующего токена.
Екатерина Серажим подвела итог:
В поиске модель должна одновременно работать с большим объёмом данных и укладываться в жёсткие ограничения по скорости и стоимости на каждом запросе. Нам удалось модифицировать архитектуру, добавив слои MoE. В совокупности все улучшения, включая создание гибридной архитектуры, позволили нам повысить качество и совокупно снизить стоимость инференса в 3 раза. В результате покрытие ИИ-ответами в поиске (доля запросов, на которые поиск сразу даёт генеративный ответ) выросло за год в 1,5 раза.
-
«Яндекс» за год сэкономил 4,5 млрд рублей от внедрения в поиск ИИ-технологий
07.04.2026 15:05:56 | Ведомости
Huawei представила телевизоры Vision Smart Screen 6 SE с 288-герцевыми панелями Mini-LED
07.04.2026 14:55:00 | iXBT.com
Кот владельца GeForce RTX 4090 «позвал» хозяина из туалета, когда карта загорелась
07.04.2026 14:45:00 | iXBT.com
Российские интернет-компании выступили против обязательного двойного подтверждения «значимых действий» через SMS и Max
07.04.2026 14:20:00 | iXBT.com
Финальная One UI 8.5 для Samsung Galaxy S25, Galaxy S25 Plus и Galaxy S25 Ultra уже на подходе: названа дата релиза ожидаемого многими обновления
07.04.2026 13:41:00 | iXBT.com
Представлена новейшая бритва Xiaomi Mijia Electric Shaver Pro Set с плавающей головкой, которая работает до трёх месяцев без подзарядки
07.04.2026 13:40:00 | iXBT.com
SSD Samsung и Western Digital резко подорожали вдвое. Цены в Южной Корее подскочили вплоть до 3000 долларов за старшие версии
07.04.2026 13:37:00 | iXBT.com
В России испытывают двигатель, который в будущем может использоваться для полетов на Марс
07.04.2026 13:29:00 | iXBT.com
Даже базовый MacBook Pro M5 такого не предлагает. Asus Zenbook A16 на топовой SoC Snapdragon X2 Elite Extreme c 48 ГБ ОЗУ вышел с ценой 1600 долларов
07.04.2026 13:18:00 | iXBT.com
Redmi K90 Max с дизайном в духе iPhone 17 Pro показали изнутри: система охлаждения — как у ноутбука
07.04.2026 13:10:00 | iXBT.com
Банк рекомендует установить как можно скорее: приложение Сбера для детей вернулось в App Store под новым названием
07.04.2026 13:04:00 | iXBT.com
Российскую лунную программу снова отодвинули: запуски «Луны-28», «Луны-29» и «Луны-30» перенесли на 2032–2036 годы
07.04.2026 12:55:00 | iXBT.com
Иск на $100 млрд может парализовать работу OpenAI: компания призывает власти провести расследование «антиконкурентного поведения» Илона Маска
07.04.2026 12:48:00 | iXBT.com
«Яндекс» внедрил переключение между диалогом с Алисой AI и поисковой выдачей
07.04.2026 12:45:00 | Ведомости
7000 мАч, IP69 и без AMOLED при цене от 290 долларов. Oppo представила недорогой смартфон A6k 5G
07.04.2026 12:38:00 | iXBT.com
Проект «Космическая наука» позволит запустить 16 российских космических кораблей
07.04.2026 12:37:00 | iXBT.com
На рынок вернуться новые системные платы с поддержкой DDR3. Colorful готовит небольшую партию на чипсете Intel H81
07.04.2026 12:33:00 | iXBT.com
МКС может задержаться на орбите: США выделили деньги на работу станции до 2032 года
07.04.2026 12:26:00 | iXBT.com
Новейшая ракета «Союз-5» готова к запуску: её установили на стартовый стол
07.04.2026 12:13:00 | iXBT.com
Россия готовит атомную станцию для Луны: впервые названы размеры «Селены»
07.04.2026 12:06:00 | iXBT.com
Складной iPhone столкнулся с серьёзными проблемами, презентацию и начало продаж могут отложить
07.04.2026 11:47:00 | iXBT.com
Проектный облик российского ядерного двигателя для полётов к другим планетам создадут в 2026 году
07.04.2026 11:43:00 | iXBT.com
Самый большой в истории завод по выпуску микросхем: свежее изображение Terafab показали на обновлённом веб-сайте
07.04.2026 11:30:00 | iXBT.com
Больше никаких секретов: точные макеты iPhone Fold, iPhone 18 Pro и iPhone 18 Pro Max показали на фото
07.04.2026 11:23:00 | iXBT.com
-
256 ГБ с двух планок, скорость 8000 МГц: Origin Code и GIGABYTE создали DDR5-память
02.06.2026 16:30:47 | ferra.ru
Песков: белые списки расширят для работы сервисов при отключениях интернета
02.06.2026 16:25:00 | ferra.ru
«Яндекс Пэй» запустил функцию подтверждения переводов выше установленного лимита через доверенное лицо
02.06.2026 15:56:26 | vc.ru
Xiaomi добавила поддержку AirDrop в функцию обмена файлами Quick Share на своих смартфонах — сначала на Xiaomi 17T Pro
02.06.2026 15:32:55 | vc.ru
Changan испытали новый автомобиль на самой старой гоночной трассе России
02.06.2026 15:02:18 | ferra.ru
До 50 ч. работы, двойной ЦАП, переводчик: Realme Buds Air8 Pro оценили в 8990 рублей
02.06.2026 14:33:06 | ferra.ru
Функции управления цифровыми активами автомобильных дорог. Часть 2 – маппинг
02.06.2026 13:45:22 | Хабр
Имитационное моделирование (DES): оптимизация бизнес-процессов по-настоящему, или почему интуиция не работает
02.06.2026 13:44:52 | Хабр
Service desk системы в 2026 году: сравниваем 10 решений для российского бизнеса
02.06.2026 13:40:56 | Хабр
Пятипальцевые балетки — странная обувь, за которую ваши ноги скажут спасибо
02.06.2026 13:30:00 | Woman.ru
Fine Day Online 2026: пять докладов про то, почему BI не работает и что с этим делать
02.06.2026 13:22:07 | Хабр
Загадочная гибель неизвестной женщины в Долине смерти: дело, которое не могут раскрыть уже полвека
02.06.2026 13:15:00 | Woman.ru
Как я разогнал Qwen3.6-27B до 73 токен/с в llama.cpp: параметры, которые реально работают
02.06.2026 12:57:44 | Хабр
Ускоряем в 10+ раз вычисление расстояния Хаусдорфа на упорядоченных контурах
02.06.2026 12:43:57 | Хабр
10 лет в индустрии: как Авроре удалось сделать лучшую поддержку разработчиков в России
02.06.2026 12:42:29 | Хабр
Юридические коллизии внутренних регламентов IRecommend и федерального законодательства об авторском праве
02.06.2026 12:38:50 | Хабр
Видеокарты AMD Radeon RX 9070 GRE перестали быть китайским эксклюзивом
02.06.2026 12:36:13 | ferra.ru
Web-pentest skill в Hermes Agent: как агент проводит пентест веб-приложений
02.06.2026 12:31:30 | Хабр
Техническая поддержка проекта ВсеТут