Retrieval в 2026: как RAG переехал с энкодеров на LLM (и что с этим делать в своём проекте)

20.06.2026 09:27:09 | Хабр

Хабы: Natural Language Processing, Open source, Искусственный интеллект, Машинное обучение, Поисковые технологии

Если вы строили RAG в 2023, ваш стек выглядел плюс-минус одинаково. BERT-семейство (BGE, e5) для семантики, BM25 для буквальных совпадений, cross-encoder для реранкинга, какой-нибудь Qdrant сверху. Этим жили два года, и многие до сих пор так живут.

Но если посмотреть, кто реально гоняется в продакшене у команд, которые ушли вперёд, ландшафт другой. Энкодеров там почти нет. Эмбеддит файнтюненная LLM. Реранкер — тоже LLM. Инференс на SGLang, а не на ONNX. И вся обвязка перестроилась под это.

Эта статья про то, что поменялось и как переиспользовать этот стек у себя. Особенно если вы работаете в узком домене, где готовых датасетов нет.

Подробнее

Читайте также

ИИ заменяет программиста, а не компилятор
20.06.2026 09:18:21 | Хабр

От Кремниевой долины к техно-фашизму: почему облачные LLM — это ловушка, и как я собрал свой локальный ИИ на коленке
20.06.2026 09:11:21 | Хабр

Альбер Робида: человек, нарисовавший стимпанк и предсказавший киберпанк в XIX веке. Часть 1
20.06.2026 09:02:07 | Хабр

Fable (2027) — чего ожидать от релиза и стоит ли предзаказывать?
20.06.2026 09:00:04 | Хабр

Важные нюансы апгрейда ноутбука Thinkpad P16 Gen 2 для его превращения в почти ультимативную мобильную рабочую станцию
20.06.2026 08:38:01 | Хабр

[Перевод] Что будет со звездой, если она поглотит первичную чёрную дыру?
20.06.2026 08:16:53 | Хабр

Все тесты зелёные, а байты разные: как я проверяю порты бинарных форматов
20.06.2026 08:12:01 | Хабр

История разработки Arduboy WOW
20.06.2026 08:05:50 | Хабр

Как ИИ помогает Linux возвращать к жизни двадцатилетние видеокарты
20.06.2026 08:00:46 | Хабр

Расчёт электрических цепей. Первая часть
20.06.2026 07:49:46 | Хабр

Amazon попытается стать конкурентом Nvidia в сфере ИИ-ускорителей
20.06.2026 07:30:24 | ferra.ru

От «Туманности Андромеды» к «Часу Быка»: как Иван Ефремов показывал роль науки и технологий и чего им не хватает
20.06.2026 07:10:38 | Хабр

Спиральная активность специфических нейронов буквально координирует мозг в пространстве-времени
20.06.2026 07:07:48 | Хабр

Разработка в 2026 году: что изменилось на рынке и на что сейчас смотрят работодатели
20.06.2026 07:01:36 | Хабр

Ну и пригодились тебе твои синусы?
20.06.2026 06:55:32 | Хабр

Django-согласия и cookies под 152-ФЗ: версии документов, аудит и экспорт вместо одного чекбокса
20.06.2026 06:41:26 | Хабр

Физическая калибровка спектрального разложения интервала в Cl(4,0)
20.06.2026 04:00:18 | Хабр

Пишем чат с ИИ девушкой на Python: LLM-роутинг, долгосрочная память и голос за выходные
20.06.2026 03:22:15 | Хабр

Как удалить объект на фото с помощью нейросети — Сравниваем ТОП-9 ИИ с промптами для ретуши
20.06.2026 00:06:32 | Хабр

В Югре запустят модуль по критическому использованию ИИ
19.06.2026 23:31:53 | ferra.ru

Тернарный KAN: не баг, а фича — почему дискретные веса работают лучше
19.06.2026 22:56:57 | Хабр

Samsung придумала складной телефон, превращающийся в «брусок»
19.06.2026 22:30:22 | ferra.ru

Почему AI-агент ищет по коду неправильно, и как это чинит cocoindex-code за две команды
19.06.2026 22:25:06 | Хабр

Оказалось, что Apple записывает каждое нажатие в App Store
19.06.2026 21:59:38 | ferra.ru

Ростех начал серийный выпуск LC-фильтров для космической техники
19.06.2026 21:34:18 | ferra.ru

В России запустили платформу курсов от ведущих вузов
19.06.2026 21:17:44 | ferra.ru

Как я собрал top-down шутер на Phaser 4 с помощью AI: архитектура, ассеты, Tiled и оптимизация
19.06.2026 20:53:00 | Хабр

Как я, не будучи фронтендером, сделал игру на Phaser 4 с помощью нейросетей
19.06.2026 20:53:00 | Хабр

LongConspectWriter: автоматическая генерация структурированных конспектов лекций на потребительском GPU
19.06.2026 20:37:04 | Хабр

Российский школьник создал биоразлагаемую упаковку с индикатором свежести
19.06.2026 20:33:58 | ferra.ru

Vivo раскрыла детали батареи и защиты складного X Fold6
19.06.2026 20:30:22 | ferra.ru

Микроразметка на Tilda: внедрение JSON-LD, проверка и типовые ошибки
19.06.2026 20:12:55 | Хабр

Google сделала ИИ-аватары для видео бесплатными, но с нюансом
19.06.2026 19:59:40 | ferra.ru

Югра будет системно внедрять ИИ в образование
19.06.2026 19:27:42 | ferra.ru

Делаем свой QML-компонент для Lottie-анимаций с помощью rlottie
19.06.2026 19:17:11 | Хабр

Смотреть все

НОВОСТИ

Стало известно, на каких машинах сконцентрируется марка Volga
24.06.2026 17:40:00 | За рулем

Профессор Саква: Украинский конфликт - это прокси-война между НАТО и Россией
23.06.2026 14:19:00 | Российская Газета

Лавров: Украина - единственная страна, где есть запрет на язык
23.06.2026 14:15:00 | Российская Газета

В Минфине сообщили об обсуждении с маркетплейсами токенизации товаров на складах
23.06.2026 14:14:43 | ТАСС

Реваншизм в Европе и ответ на угрозы в адрес Минска. Заявления Лаврова
23.06.2026 14:14:25 | ТАСС

«Не волноваться и не беспокоиться»: Лукашенко успокоил жителей Гомельщины на фоне угроз Зеленского
23.06.2026 14:14:24 | Life.ru

Оман и Иран создадут группу для обсуждения управления судоходством в Ормузском проливе
23.06.2026 14:13:10 | ТАСС

Россиянам раскрыли эффективность присадок для топлива в таблетках и баллонах
23.06.2026 14:13:09 | Lenta.ru

Более 700 материалов и 8 спецкоров. История корпункта ТАСС на МКС
23.06.2026 14:13:03 | ТАСС

"Зеленые" предложили давать эковолонтерам дополнительные три дня к отпуску
23.06.2026 14:13:01 | ТАСС

В Польше заявили, что не будут платить за строительство дорог на Украине
23.06.2026 14:12:49 | ТАСС

Россиянин хотел вывезти из страны стратегически важные товары
23.06.2026 14:12:24 | Lenta.ru

Минфин предложил изменить расчет срока владения жильем при изъятии для выдачи нового
23.06.2026 14:11:49 | ТАСС

«Решительно бороться»: Путин выступил перед выпускниками силовых вузов с важным наказом
23.06.2026 14:11:24 | Life.ru

Подполковник заявил о вогнанной в паралич Украине из-за нефтебазы в Запорожье
23.06.2026 14:10:56 | Lenta.ru

В Крыму хотят увеличить провоз топлива через Крымский мост до 200 л на машину
23.06.2026 14:10:42 | ТАСС

Лавров объяснил послам значение упомянутой Путиным фразы "работайте, братья"
23.06.2026 14:10:33 | ТАСС

Мобилизованные солдаты ВСУ в Красном Лимане боятся сдаваться из-за угроз командования
23.06.2026 14:10:04 | ТАСС

Лавров заявил о готовности возобновить переговоры по Украине в любой момент
23.06.2026 14:09:22 | Life.ru

Энергодар начали подключать к электроснабжению после полного обесточивания
23.06.2026 14:09:20 | ТАСС

Лавров указал на "свободу слова" в Европе после отказа публиковать его статью
23.06.2026 14:09:20 | ТАСС

Число раненных при ударе ВСУ по автобусу в Горловке 22 июня увеличилось до 18
23.06.2026 14:08:25 | ТАСС

На Украине высказались о возможности угрозы со стороны Белоруссии
23.06.2026 14:08:10 | Lenta.ru

Внешность Вали Карнавал на новом видео описали фразой «от оригинала ничего не осталось»
23.06.2026 14:08:08 | Lenta.ru

Генсек СНГ оценил угрозы Зеленского в адрес Белоруссии
23.06.2026 14:08:05 | Lenta.ru

Названо преимущество новой СВЧ
23.06.2026 14:07:46 | Lenta.ru

Вместо Зеленского в Гданьск приедет Свириденко на фоне конфликта Польши и Украины
23.06.2026 14:07:30 | ТАСС

Бык сбежал от мясника и покалечил трех человек
23.06.2026 14:07:16 | Lenta.ru

В Чехии водителю грозит три года тюрьмы за символику Z
23.06.2026 14:07:00 | Российская Газета

Только место занимают: «Роскачество» назвало продукты, которые нельзя держать в холодильнике
23.06.2026 14:06:45 | Life.ru

Только место занимают: Роскачество назвало продукты, которые нельзя держать в холодильнике
23.06.2026 14:06:45 | Life.ru

Еврокомиссар Кубилюс: ЕС истратит €7 трлн на оружие, чтобы обогнать Россию
23.06.2026 14:06:34 | ТАСС

Ослабление рубля к доллару объяснили
23.06.2026 14:06:30 | Lenta.ru

В Чечне стартовали кампании по выборам главы и парламента региона
23.06.2026 14:05:52 | ТАСС

Путин дал совет выпускникам военных вузов
23.06.2026 14:05:40 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro