RAG Testing: как не сломать retrieval

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

RAG Testing: как не сломать retrieval

20.02.2026 04:15:08 | Хабр

Хабы: Тестирование IT-систем, Искусственный интеллект, Информационная безопасность

RAG ломается не так, как обычный LLM. У голой языковой модели одна поверхность отказа - генерация. У RAG-системы таких поверхностей две: retrieval и generation. И ломаются они по-разному.

Retriever может вернуть нерелевантные чанки, потерять нужные документы или ранжировать их неправильно. Генератор может проигнорировать контекст и ответить из собственных весов. Стандартные LLM-метрики не ловят проблемы retrieval - они оценивают только финальный ответ.

В статье - практический гайд по тестированию обеих поверхностей:

6 метрик RAGAS с production-порогами: Faithfulness ≥ 0.80, Context Precision ≥ 0.70, Context Recall ≥ 0.70, Answer Relevancy ≥ 0.70

Классические IR-метрики: Precision@K, Recall@K, MRR - для быстрой проверки retrieval без LLM-судьи

Security-тесты: document poisoning, context injection, cross-tenant leakage через Promptfoo

CI/CD pipeline: автоматический quality gate при обновлении knowledge base

От pip install ragas до GitHub Actions - всё с кодом и конфигами.

Читать далее

Подробнее

Читайте также

Доктор Джао
20.02.2026 04:06:56 | Хабр

Параллельная обработка Kafka сообщений с гарантией at-least-once в условиях медленного внешнего сервиса
20.02.2026 04:04:05 | Хабр

Лимит доверия: как ИИ решает, сколько денег вам можно дать (и почему это часто несправедливо)
20.02.2026 02:13:47 | Хабр

Строковые константы в MS SQL
19.02.2026 23:43:13 | Хабр

Концепт «Больцмановский Мозг» на квантово— волновой логике (QWL). Нейросеть. Численное моделирование
19.02.2026 23:12:34 | Хабр

Что жужжит над головой, куда исчезнут МФО и идеальный пинг Дмитрия Пескова
19.02.2026 22:45:18 | it-world

ИП и ООО за границей — налоги в РФ
19.02.2026 21:53:18 | Хабр

ИИ Google научился создавать музыку по текстовому описанию, но лишь на 30 секунд
19.02.2026 21:39:44 | ferra.ru

В Китае при поддержке правительства развивают конкурента Neuralink: компания NeuroXess провела 50 операций по имплантации нейроинтерфейсов
19.02.2026 21:38:58 | vc.ru

Пользователи рассказали, что Mail вводит плату за использование сторонних почтовых клиентов — в компании говорят, что это «эксперимент», который затронул менее 1%
19.02.2026 21:33:58 | vc.ru

Правительство отправляет дроны на замену инспекторам
19.02.2026 20:41:09 | it-world

Как скринридер «видит» сайт: DOM, accessibility tree и API простыми словами
19.02.2026 20:25:51 | Хабр

Распознавание изображений локальными LLM
19.02.2026 20:25:37 | Хабр

Kawai-Focus 2.3: логика приложения на TypeScript
19.02.2026 20:10:17 | Хабр

Научитесь слушать не жопой
19.02.2026 20:04:52 | Хабр

Без руля и педалей: Tesla собрала первый экземпляр Cybercab
19.02.2026 19:39:47 | ferra.ru

Охота за красным fps
19.02.2026 19:10:00 | Хабр

ФНС подала заявление о банкротстве майнинговой компании Bitriver
19.02.2026 19:03:34 | vc.ru

HackTheBox. Прохождение CrimeStoppers. Уровень — Сложный
19.02.2026 18:51:12 | Хабр

Очень большой аккумулятор в очень тонком смартфоне: Infinix Note Edge и его 6500 мАч
19.02.2026 18:38:04 | ferra.ru

Запуск модели gpt-oss на 20 и 120 миллиардов параметров, на процессоре Core I9 для решения непростой задачи без GPU
19.02.2026 18:36:28 | Хабр

Производитель Volga начнёт выпускать машины во втором квартале 2026 года, продавать — в третьем
19.02.2026 18:28:00 | vc.ru

[Перевод] Дрейф данных в машинном обучении
19.02.2026 17:49:24 | Хабр

Невышедший складной смартфон Honor Magic V6 заметили у олимпийской чемпионки
19.02.2026 17:39:45 | ferra.ru

Гайд-лонгрид: Как правильно читать User-Agent
19.02.2026 17:36:04 | Хабр

Объем тендеров на продукты с искусственным интеллектом достиг рекордных значений
19.02.2026 17:29:30 | it-world

Python mmap: Улучшенный I/O файлов с помощью отображения файлов в память
19.02.2026 17:22:15 | Хабр

Треть россиян хочет, чтобы оператор сам блокировал спам-звонки
19.02.2026 17:15:04 | ferra.ru

[Перевод] Автоматическая модернизация кода на Go при помощи go fix
19.02.2026 17:11:40 | Хабр

Ученые создали самый маленький QR-код в мире. Он меньше бактерии
19.02.2026 17:00:37 | ferra.ru

Феноменальные свойства воды. Как их объясняет физика?
19.02.2026 16:48:24 | Хабр

[Перевод] Соцсеть, где людям запрещено писать: зачем 150 000 ИИ создали свой реддит – Moltbook (и при чём здесь Китай)
19.02.2026 16:35:55 | Хабр

Unity позволит создавать видеоигры просто описав идею текстом
19.02.2026 16:35:48 | ferra.ru

Программист микроконтроллеров: что спрашивают на собеседованиях
19.02.2026 16:27:54 | Хабр

Суд в США допросил Марка Цукерберга по делу о «зависимости от соцсетей» — глава Meta* заявил, что компания не ставит своей целью повышение вовлечённости пользователей
19.02.2026 16:18:28 | vc.ru

Смотреть все

НОВОСТИ

В Кремле заявили, что при Каллас дипломатия ЕС далека от «золотого века»
20.02.2026 09:28:55 | Life.ru

График работы соцучреждений Москвы изменят в преддверии 23 февраля
20.02.2026 09:26:48 | ТАСС

Flightradar: неизвестный самолет США залетел в российское воздушное пространство
20.02.2026 09:25:08 | ТАСС

Володин заявил о полнейшей деградации европейского руководства
20.02.2026 09:25:00 | Российская Газета

В Москве подвели итоги сильнейшего за зиму снегопада
20.02.2026 09:23:37 | Lenta.ru

В Брянской области повреждены дома после массированной атаки 57 беспилотников
20.02.2026 09:22:37 | Life.ru

В Москве цена поездки на такси выросла до трех раз из-за снега
20.02.2026 09:21:50 | ТАСС

Стало известно о перестановках в Минобороны
20.02.2026 09:20:22 | Lenta.ru

Новая Зеландия расширила санкции против России
20.02.2026 09:20:20 | Lenta.ru

Молоко в России резко подорожало вопреки переизбытку
20.02.2026 09:20:16 | Lenta.ru

FT: ИИ-инструменты Amazon минимум дважды вызывали сбои в работе сервисов
20.02.2026 09:19:15 | ТАСС

AP объявило о начале контрнаступления Залужного на Зеленского
20.02.2026 09:18:00 | Life.ru

Семью россиян выпустили после 4 месяцев содержания в центре для мигрантов в США
20.02.2026 09:17:00 | Российская Газета

Москвичам пообещали потепление в праздничные выходные
20.02.2026 09:15:28 | Lenta.ru

The Telegraph: Зеленский опасался жесткой позиции Мединского в Женеве
20.02.2026 09:14:58 | РЕН ТВ

В Новосибирске задержали тренера по фигурному катанию Константина Медовикова
20.02.2026 09:11:31 | Коммерсантъ

В Саратовской области откроют профильные классы Роспотребнадзора
20.02.2026 09:11:06 | ТАСС

"Кион" запустил гид "Один день из жизни детектива" по Москве и Петербургу
20.02.2026 09:10:14 | ТАСС

РЕН ТВ покажет телеверсию концерта «Волна простоты» группы «Чайф»
20.02.2026 09:10:03 | РЕН ТВ

РЕН ТВ покажет телеверсию концерта "Волна простоты" группы "Чайф"
20.02.2026 09:10:03 | РЕН ТВ

С 1 марта вступают в силу новые правила обучения медиков: что изменится
20.02.2026 09:09:51 | Life.ru

Почти 30% россиян считают удобство дороги важным при планировании поездок по РФ
20.02.2026 09:09:09 | ТАСС

Стало известно о крушении пропавшего в российском регионе вертолета
20.02.2026 09:09:00 | Lenta.ru

Ведущая вышла в эфир пьяной и прославилась
20.02.2026 09:08:05 | Lenta.ru

В Туапсинском районе Кубани отменили беспилотную опасность
20.02.2026 09:07:57 | ТАСС

ВСУ отступили в ДНР
20.02.2026 09:07:28 | Lenta.ru

Самозанятым разрешат оформлять больничные — Минздрав готовит поправки
20.02.2026 09:07:22 | Life.ru

Власти Кракова хотят кормить голубей контрацептивами для контроля их численности
20.02.2026 09:06:00 | Российская Газета

Звезда «Ералаша» раскрыла секреты стройности на фото в купальнике
20.02.2026 09:05:19 | Lenta.ru

В Минске анонсированы сроки проведения испытаний и зачисления в вузы
20.02.2026 09:05:00 | Российская Газета

Воронцевич рассказал об изменениях в игре "Зенита" после смены тренера
20.02.2026 09:04:43 | ТАСС

Лисовец назвал приталенные силуэты с акцентом на плечи главным трендом весны
20.02.2026 09:04:41 | ТАСС

«Для галочки» не пройти: Водителей ждут сюрпризы при медосмотре в 2026 году
20.02.2026 09:04:01 | Life.ru

FT: военная операция США против Ирана может продлиться несколько недель
20.02.2026 09:03:40 | ТАСС

Они не роботы. Зачем Петросян так рисковала на Олимпиаде?
20.02.2026 09:02:56 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro