Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Где заканчивается вызов LLM и начинается backend система: локальный RAG на FastAPI и Ollama

23.06.2026 06:33:29 | Хабр

Хабы: Python, Искусственный интеллект, Машинное обучение, Open source, Проектирование API

Хотел разобраться где заканчивается простой вызов локальной LLM и начинается backend система.

Сначала всё выглядело просто: frontend отправляет вопрос, FastAPI принимает POST /ask, backend вызывает локальную модель через Ollama и возвращает ответ. Но стало понятно: для помощника по документации этого мало. Модель отвечает, но непонятно на какие документы она опирается, какие фрагменты попали в prompt, сколько времени занял каждый этап и что делать, если индекс устарел.

В статье показываю не "как вообще устроен RAG", а путь от простого вызова локальной LLM к небольшому backend/RAG-проекту с API контрактом, request_id, логированием, sources, timings, rebuild index, negative tests и честными ограничениями.

От LLM вызова к RAG системе

Подробнее

Читайте также

Спутниковая связь в симуляторе NS-3. Часть 7
23.06.2026 06:31:30 | Хабр

Архитектура высокоэффективных нейросетевых вычислений на C++ для прогнозирования динамики ВВП
23.06.2026 06:21:59 | Хабр

Покой как фича: анти-шагомер на Expo, который ругает за активность
23.06.2026 06:00:33 | Хабр

Как вырасти до мидла: на что на самом деле смотрят тимлиды при оценке DevOps-инженеров
23.06.2026 05:58:15 | Хабр

Браузер как платформа — офисные инструменты и IT-утилиты без сервера, без установки, без регистрации
23.06.2026 05:50:10 | Хабр

Как мы внедряли SLO в платформу, которая отвечает за наблюдаемость в банке
23.06.2026 05:46:35 | Хабр

Дрон-курьер, оценка технических навыков ИТ-специалистов – и ещё 8 российских стартапов
23.06.2026 05:46:12 | Хабр

Почему некоторые сообщения не выходят из головы
23.06.2026 05:25:08 | Хабр

Evals: что должен знать каждый AI-инженер в 2026
23.06.2026 05:10:05 | Хабр

Зоопарк каналов в Rust: какой выбрать и как не споткнуться
23.06.2026 05:01:01 | Хабр

Игра по новым правилам. ГОСТ Р 72160-2025: что это — очередной навязанный стандарт или рабочая система
23.06.2026 04:39:58 | Хабр

Как я сделал генератор палитр на Node.js + DeepSeek за два вечера — и что из этого вышло
23.06.2026 02:44:37 | Хабр

Все тесты зелёные, платежи зависли: 5 граблей интеграции без песочницы
23.06.2026 02:05:41 | Хабр

Когда контекстное окно кончается, а проект — нет
23.06.2026 00:23:01 | Хабр

Руководство по созданию идеальных картинок с помощью иИ
22.06.2026 23:42:21 | Хабр

Nvidia рассказала, что охлаждает свои суперкомпьютеры горячей водой
22.06.2026 23:35:45 | ferra.ru

Делаем дизайн интерьера нейросетью — Тестируем ТОП-11 ИИ для редизайна, рендеров и планеров квартир
22.06.2026 22:57:27 | Хабр

OS Personium. Часть 3: Свободы воли нет. Как эволюция держит нас на гормональном поводке
22.06.2026 22:04:06 | Хабр

Форма пишет «принято», а заявок нет: баги, которые проходят и автотест, и ручную проверку
22.06.2026 21:55:52 | Хабр

Форма пишет „принято", а заявок нет: баги, которые проходят и автотест, и ручную проверку
22.06.2026 21:55:52 | Хабр

Путеводитель по чужим STL
22.06.2026 21:47:20 | Хабр

Alibaba обновила свою нейросеть для генерации видео
22.06.2026 21:35:43 | ferra.ru

Nvidia стремится сделать человекоподобных роботов с ИИ более безопасными для работы вблизи людей
22.06.2026 21:26:06 | it-world

Лямбды в C++: пять задач на захваты и время жизни, в которых ошибается даже опытный разработчик
22.06.2026 21:17:04 | Хабр

Теперь и старая память дорожает: дефицит добрался до DDR2
22.06.2026 19:35:42 | ferra.ru

Стабильность пептидов. Мифы и реальность
22.06.2026 19:33:04 | Хабр

[Перевод] Подробно об ABI для работы с C++
22.06.2026 19:25:00 | Хабр

AI предлагает, мержу я: почему я не даю агенту последний ход
22.06.2026 19:09:03 | Хабр

Google инвестирует $75 млн в киностудию A24 и вместе с ней займётся отраслевыми исследованиями — WSJ
22.06.2026 18:57:47 | vc.ru

Как я собрал базу визовых требований, где каждая ячейка ссылается на официальный источник
22.06.2026 18:02:59 | Хабр

Nvidia поможет корейским судостроителям обучать роботов варить корабли
22.06.2026 17:35:41 | ferra.ru

Как мы измеряли удовлетворенность пользователей дизайн‑системой
22.06.2026 17:24:19 | Хабр

Как желание написать простой CRUD привело к созданию целой видеоплатформы
22.06.2026 16:38:59 | Хабр

3 модели закупки трафика для SaaS с длинной сделкой: что мы поняли на кампаниях
22.06.2026 16:17:52 | Хабр

Как я собрал новостной агрегатор HypeNet на Cloudflare Workers + Supabase и что пошло не так
22.06.2026 16:17:24 | Хабр

Смотреть все

НОВОСТИ

Стало известно, на каких машинах сконцентрируется марка Volga
24.06.2026 17:40:00 | За рулем

Ночь с 22 на 23 июня стала самой жаркой, когда-либо зафиксированной во Франции
23.06.2026 14:34:00 | Российская Газета

«Мать Армения» получила в глаз: Старейшины мэрии Еревана поколотили друг друга в прямом эфире
23.06.2026 14:31:18 | Life.ru

Адвокат оценил шансы Диброва и Бузовой получить компенсации за травмы
23.06.2026 14:30:25 | Life.ru

Космонавт «Роскосмоса» рассказал о планах внекорабельной деятельности
23.06.2026 14:30:00 | Lenta.ru

Швырнувший православную икону на пол машины юный россиянин пойдет под суд
23.06.2026 14:29:38 | Lenta.ru

ПВО ликвидировала почти полсотни вражеских «птичек» за считанные часы
23.06.2026 14:29:35 | Life.ru

Путин напомнил о восьмилетних попытках договориться перед началом СВО
23.06.2026 14:29:00 | Lenta.ru

Путин: "открытое письмо" Зеленского сводится к тому, чтобы создать конфликтный потенциал
23.06.2026 14:27:00 | ТАСС

Fars: ВС Ирана открыли Ормузский пролив
23.06.2026 14:26:26 | ТАСС

Российские миллениалы и зумеры раскрыли траты на шопинг в отпуске
23.06.2026 14:26:19 | Lenta.ru

Трамп: США сняли морскую блокаду Ирана
23.06.2026 14:26:17 | ТАСС

Путин: ВС России поджимают противника на всех участках
23.06.2026 14:26:05 | ТАСС

Трамп: Иран безоговорочно согласился на инспекции ядерных объектов на годы вперед
23.06.2026 14:26:00 | ТАСС

Путин: Россия восемь лет терпела и пыталась договориться
23.06.2026 14:25:36 | ТАСС

Путин: СССР перед Второй мировой делал все, чтобы предотвратить конфликт
23.06.2026 14:25:29 | ТАСС

Защитник "Зенита" Нино пришел на тренировку со словарем русских глаголов
23.06.2026 14:25:18 | ТАСС

Путин: РФ будет продолжать повышать авторитет офицерского корпуса
23.06.2026 14:25:14 | ТАСС

Белоусов поздравил выпускников военных вузов с окончанием учебы
23.06.2026 14:25:08 | ТАСС

В Раде назвали ошибкой отказ Зеленского ехать в Гданьск
23.06.2026 14:25:06 | ТАСС

Пять дронов ВСУ атаковали школу в Запорожской области
23.06.2026 14:24:39 | Life.ru

Аршавин оценил уровень организации на чемпионате мира
23.06.2026 14:24:19 | ТАСС

Путин: Россию во все времена провоцировали
23.06.2026 14:24:02 | ТАСС

Лавров: Россия не отказывалась и не отказывается от диалога с Киевом
23.06.2026 14:23:54 | Life.ru

На Алтае обследовали 19 км в поисках упавшего со скалы подростка
23.06.2026 14:23:33 | ТАСС

В Крыму до сентября приостановили спортивные мероприятия
23.06.2026 14:23:20 | Life.ru

Путин: с территорий стран Европы пока не запускают БПЛА по России
23.06.2026 14:23:19 | ТАСС

Раскрыты подробности расправы над первым уральским олигархом
23.06.2026 14:22:46 | Lenta.ru

Путин: рейтинги западных политиков, выступающих за конфронтацию с РФ, снижаются
23.06.2026 14:22:20 | ТАСС

Путин: западные страны пока не дошли до того, чтобы бить по РФ со своей территории
23.06.2026 14:22:15 | ТАСС

Рекомендация об эвакуации дипломатов из Киева остаётся в силе, заявил Лавров
23.06.2026 14:22:01 | Life.ru

Борис Титов предложил Добро.РФ оценивать соцпрограммы бизнеса
23.06.2026 14:22:00 | ТАСС

В Белграде возле кладбища нашли тело 20-летнего россиянина с перерезанным горлом
23.06.2026 14:22:00 | Российская Газета

Путин: страны, помогающие запускать БПЛА по России, не отдают себе отчет о последствиях
23.06.2026 14:21:53 | ТАСС

Анализы на Эболу у двух пациентов с симптомами в Израиле оказались отрицательными
23.06.2026 14:21:48 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro