Почему нам пришлось превратить нормативные документы в граф, а не просто загрузить их в векторную базу

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Почему нам пришлось превратить нормативные документы в граф, а не просто загрузить их в векторную базу

23.03.2026 14:15:28 | Хабр

Хабы: Машинное обучение, Искусственный интеллект, Поисковая оптимизация, Базы данных

Когда говорят про RAG, обычно имеют в виду довольно прямую схему: взять документы, нарезать их на фрагменты, посчитать эмбеддинги, сложить всё в векторную базу и поверх этого подключить LLM. На демо это часто работает. Иногда работает и на корпоративных данных. Но на нормативных документах такой подход очень быстро начинает сыпаться.

Мы увидели это на практике, когда строили систему для работы с нормативкой. Сначала задача выглядела стандартно: есть документы, есть вопросы пользователей, есть поиск по смыслу. Значит, нужен обычный RAG. Но довольно быстро стало ясно, что главная проблема здесь не генерация. Главная проблема в том, как представить документ так, чтобы retrieval не разрушал его структуру и смысл.

В итоге мы ушли от плоской индексации к иерархическим узлам, группам соседних пунктов, отдельному слою терминов и графу обязательных связей между фрагментами.

Читать далее

Подробнее

Читайте также

Как выбрать SCADA систему для АСУ ТП: рекомендации для инженеров, основанные на реальном опыте
23.03.2026 14:08:46 | Хабр

О цифровой доступности: как постигать интернет без визуальных интерфейсов
23.03.2026 13:56:28 | Хабр

Модульная система Sass: руководство по @use
23.03.2026 13:46:22 | Хабр

Основы системного администрирования Linux: от командной строки до веб-сервера
23.03.2026 13:45:32 | Хабр

Подразделение ЦБ рассказало о пилотном эксперименте с запуском «белых» банкоматов — у них не будет бренда, а с операций не возьмут комиссию
23.03.2026 13:44:18 | vc.ru

Я закрыл магазины, поставил всё на Вайлдберриз и заработал долг 50 млн
23.03.2026 13:29:37 | Хабр

ocservice — bash инструмент для управления ocserv VPN сервером
23.03.2026 13:16:19 | Хабр

Как минимум 12 крупных автопроизводителей пересмотрели планы по переходу на электромобили, сократив инвестиции и отказавшись от выпуска новых моделей — FT
23.03.2026 13:05:26 | vc.ru

[Перевод] Три причины раздувания JavaScript
23.03.2026 13:03:40 | Хабр

[Перевод] Ключ от всех дверей: как я взломал все электросамокаты одного производителя
23.03.2026 13:01:13 | Хабр

Новая Windows с локальным ИИ: как и почему меняются требования к железу
23.03.2026 13:00:10 | Хабр

Как я пытался трудоустроиться в Яндекс в 2026
23.03.2026 12:41:22 | Хабр

Когда API недостаточно: асинхронные уведомления в SPA
23.03.2026 12:25:21 | Хабр

Как считать стоимость CPU, RAM и Storage во внутренней инфраструктуре (часть 2 из 5)
23.03.2026 12:25:01 | Хабр

Capacitor: от веба к мобильным приложениям. Часть 3. OTA обновления в обход сторов
23.03.2026 12:23:47 | Хабр

Работа в Золотом Яблоке: каково это — работать в ночном мониторинге крупнейшего бьюти-ритейла страны
23.03.2026 12:16:04 | Хабр

Не благие намерения: как власти планируют закрутить гайки на УСН, АУСН и патенте
23.03.2026 12:15:03 | Хабр

Съели — и забыли: квест для маркетолога «Подари сыр подруге». Лишние эмоции в контенте
23.03.2026 12:14:45 | Хабр

Практика FinOps и ITFM: как считать, распределять и планировать ИТ-расходы (часть 1 из 5)
23.03.2026 12:14:39 | Хабр

Мужчины совершают абсолютное большинство покупок в мобильных играх
23.03.2026 12:02:26 | ferra.ru

Как мы пришили LLM «спинной мозг»: архитектура рефлексов для ИИ-агентов в 60 FPS
23.03.2026 12:00:16 | Хабр

Мультиагентность в OpenClaw: отдельные агенты, субагенты и ACP (вайбкодим через тг)
23.03.2026 12:00:01 | Хабр

Банки вряд ли понизят комиссию за эквайринг
23.03.2026 11:57:00 | it-world

«Опора России» попросила изменить законопроект о поддержке «Почты России» — он обяжет операторов доставки платить сборы в спецфонд
23.03.2026 11:49:08 | vc.ru

Как экспортировать плейлист из Яндекс Музыки за 10 секунд
23.03.2026 11:47:12 | Хабр

Идемпотентность в backend: как перестать дублировать операции
23.03.2026 11:45:57 | Хабр

Делаем с ИИ интернет-радиоприемник на базе ESP32-S3 за один вечер
23.03.2026 11:27:10 | Хабр

Зачем айтишникам английский и где учить язык
23.03.2026 11:20:35 | Хабр

[Перевод] Flutter Widget Previewer: разработка UI без запуска приложения
23.03.2026 11:16:57 | Хабр

Экологический след ИИ: сколько энергии и воды потребляют крупные модели и как сделать их более устойчивыми
23.03.2026 11:13:24 | Хабр

Как я превратил Android-смартфоны в распределенную сеть мониторинга (и спас свои нервы)
23.03.2026 11:12:34 | Хабр

Geometry > Scale 2.0.: Манифест LILA: Как замерзшие пальцы и 10 строк кода обнуляют 7 триллионов Сэма Альтмана
23.03.2026 11:10:47 | Хабр

FT: OpenAI запланировала увеличить штат почти вдвое к концу 2026 года — с 4500 до 8000 сотрудников
23.03.2026 11:06:13 | vc.ru

Поиск с возвратом
23.03.2026 10:56:13 | Хабр

Основатель стартапа Genervis Евгений Рычков делится опытом по привлечению лиц и компаний для коммерческих предложений
23.03.2026 10:46:23 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Африка становится новым центром бункеровки из-за конфликта на Ближнем Востоке
23.03.2026 19:23:00 | Российская Газета

КСИР: Иран нанес новую серию ударов по военной инфраструктуре США и Израиля
23.03.2026 19:22:13 | ТАСС

Трамп рассказал о переговорах с «главным человеком» в Иране
23.03.2026 19:22:03 | Life.ru

Участница «Мисс Вселенной» провела в больнице четыре месяца после падения со сцены
23.03.2026 19:18:58 | Lenta.ru

Россиянка с заведующей акушерского отделения пойдут под суд за новые документы для ребенка
23.03.2026 19:18:41 | Lenta.ru

Бабкину довели до слез на собственном дне рождения
23.03.2026 19:18:00 | Lenta.ru

В Москве двум причастным к разбойному нападению избрали меру пресечения
23.03.2026 19:17:26 | ТАСС

В ВСУ заявили о резком ухудшении ситуации в ДНР
23.03.2026 19:17:00 | Lenta.ru

Депутат Бундестага: угрозы Мерца к Венгрии говорят о дипломатической несостоятельности
23.03.2026 19:16:28 | ТАСС

МИД Ирана: Контактов с США нет, но Вашингтон через посредников выходил на Иран
23.03.2026 19:16:00 | Российская Газета

В Херсонской области индустриальный парк "Таврия" начнут строить в 2026 году
23.03.2026 19:15:43 | ТАСС

Caracol: самолет ВВС Колумбии с более чем 100 военными потерпел крушение
23.03.2026 19:14:47 | ТАСС

Путин подписал закон о праве на инвестиционный доход с пенсионных взносов
23.03.2026 19:14:45 | Life.ru

Цены на нефть резко упали после заявлений Трампа о переговорах с Ираном
23.03.2026 19:14:00 | Российская Газета

Силуанов объявил курс на снижение зависимости бюджета от колебаний цен на нефть
23.03.2026 19:13:17 | Life.ru

Электронные схемы движения потоков отходов не утвердили 30 регионов
23.03.2026 19:13:15 | ТАСС

Военным ВСУ закроют доступ к азартным играм в рамках борьбы с лудоманией
23.03.2026 19:13:00 | Российская Газета

ТАСС: на Украине снова подняли вопрос о мобилизации женщин в ВСУ
23.03.2026 19:12:34 | ТАСС

ТАСС: родственники якобы пропавших солдат угрожают кровной местью комбату ВСУ
23.03.2026 19:12:16 | ТАСС

Живущий в США российский блогер раскрыл «хитрые» схемы мошенничества
23.03.2026 19:12:09 | Lenta.ru

В РПЦ отреагировали на призыв Папы Римского запретить удары авиации в ходе боевых действий
23.03.2026 19:12:00 | Lenta.ru

ТАСС: румынские СМИ начали кампанию по "демонизации" российской угрозы
23.03.2026 19:11:29 | ТАСС

ТАСС: прибалтийское СМИ признало участие литовских военных в конфликте на Украине
23.03.2026 19:11:24 | ТАСС

На Ямале появится программа подготовки специалистов для работы с детьми с ОВЗ
23.03.2026 19:11:23 | ТАСС

Моди: Конфликт вокруг Ирана создал "беспрецедентные" вызовы для Индии
23.03.2026 19:11:00 | Российская Газета

Иран прокомментировал сообщения о якобы ведущихся переговорах с США
23.03.2026 19:10:47 | Lenta.ru

Звезда «Аквамена» покинул дом из-за разрушительного наводнения и призвал молиться
23.03.2026 19:10:21 | Lenta.ru

Молдавия как новый рубеж раскола — церковного и мирового
23.03.2026 19:10:00 | ТАСС

На Ямале завели дело после травмирования четырех детей в музее
23.03.2026 19:09:48 | ТАСС

"Новые люди" призвали официально опубликовать белый список сайтов
23.03.2026 19:08:36 | ТАСС

США поразили морально устаревший советский ЗРК в Иране
23.03.2026 19:08:11 | Lenta.ru

В Крыму до 1,2 млн повысили выплаты заключившим контракт с Минобороны
23.03.2026 19:07:46 | ТАСС

Бриллианты из шерсти питомцев стали делать в России
23.03.2026 19:07:24 | Lenta.ru

В МВД России назвали основные признаки вербовки подростков
23.03.2026 19:07:19 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro