Семантический обновляемый кэш на AlloyDB Omni

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Семантический обновляемый кэш на AlloyDB Omni

12.02.2026 13:38:14 | Хабр

Хабы: SQL, Искусственный интеллект, Big Data, Python

Предположим, вы построили RAG-сервис на SQL, и он отлично работает. Довольно быстро, очень точно, и очень дорого, ведь каждый запрос к сервису требует обращения к LLM для генерации ответа по чанкам, извлеченным из базы знаний. И чем больше мы извлекли таких фрагментов, тем больше входных токенов тратится на составной промпт, даже если ответ будет состоять из одного предложения.

Можно, конечно, заранее срезать количество извлекаемых чанков, но это отразится на качестве ответов.

Можно настроить кэш, который экономит на обращениях к сервису, когда приходят одинаковые вопросы. Но когда пользователь спрашивает "How to get developer support?”, и тут же другой пользователь спрашивает "How to ask development-related questions?", ваш сервис каждый раз будет генерировать ответ заново, сжигая ваши токены и заставляя пользователя ждать. Обычный кэш тут бессилен: для него эти две фразы — абсолютно разные ключи.

В этой статье я расскажу, как развернуть мощный семантический кэш на базе AlloyDB Omni (PostgreSQL от Google), используя векторный поиск ScaNN, автоматическое партиционирование и планировщик задач. Мы пройдём путь от настройки Docker-контейнера до продакшн-архитектуры.

Читать далее

Подробнее

Читайте также

«Это происходит вопреки нашей воле»: Reuters рассказал о «тысячах» иностранных машин, которые собирают в Китае, а потом экспортируют в Россию
12.02.2026 13:30:25 | vc.ru

Культурно-когнитивный код промпта ИЛИ почему все мужики — козлы
12.02.2026 13:29:09 | Хабр

ИИ в образовании: как развивается ИИ-сервис для рефератов и письменных работ в условиях постоянных изменений
12.02.2026 13:24:58 | Хабр

[Перевод] Программирование, ориентированное на данные, для Java: за пределами record-классов
12.02.2026 13:21:19 | Хабр

Работа убивает или… лечит? Как карьера влияет на то, сколько (и как) вы проживете
12.02.2026 13:18:08 | Хабр

Как оценки задач, спринты, планирования и ретроспективы помогают команде, а не убивают ее
12.02.2026 13:17:20 | Хабр

NPU в каждом утюге: обзор процессоров 2026 года с поддержкой локального ИИ
12.02.2026 13:17:13 | Хабр

От простого бота к самообучающемуся интеллекту: эволюция ИИ-агентов для бизнеса
12.02.2026 13:11:02 | Хабр

«А что будем делать, когда всё-таки взломают?»: как подготовиться к инциденту заранее на примере видеоигр
12.02.2026 13:10:36 | Хабр

Декомпозиция микросервисов: 5 паттернов против распределённого монолита
12.02.2026 13:03:59 | Хабр

Как мы приручили тысячу Telegram-чатов и вывели клиентский SLA на 98%
12.02.2026 12:59:26 | Хабр

Observability на максимум: как обеспечить наблюдаемость в микросервисной архитектуре
12.02.2026 12:53:48 | Хабр

Я собрал Telegram-бота и AI-платформу, где 100% нефтехимия и 0% санкций — силами Gemini и Cursor
12.02.2026 12:48:30 | Хабр

Google упростила удаление интимных фото из поисковой выдачи
12.02.2026 12:48:11 | ferra.ru

Тонкая настройка 2FA: как закрыть доступ к бэкапам, но не замучить админов
12.02.2026 12:45:36 | Хабр

Как отлаживать ARM-чипы, если J-Link и ST-Link бессильны
12.02.2026 12:41:40 | Хабр

От токенизации до генерации: как я с нуля написал GPT для Python-кода
12.02.2026 12:33:29 | Хабр

Театр абсурда: как проваливаются продуктовые трансформации
12.02.2026 12:31:55 | Хабр

ТОП 6 лучших ИИ для генерации текста – Рейтинг нейронок для SEO копирайта 2026 года
12.02.2026 12:30:37 | Хабр

Как использовать Emby на iOS без подписки Emby Premier
12.02.2026 12:16:28 | Хабр

Грейд по коду, а не по трудовой: гибридный анализ репозиториев с помощью GraphCodeBERT и метрик
12.02.2026 12:12:32 | Хабр

«Иммиграционные службы следят за тем, куда вы ездите»: глава Salesforce на выступлении перед сотрудниками пошутил про слежку за ними — те покинули мероприятие
12.02.2026 12:04:53 | vc.ru

Повысили производительность облака и добавили новые GPU: дайджест обновлений продуктов Selectel в январе
12.02.2026 12:00:21 | Хабр

Мобильный оператор T-Mobile запустит в США функцию перевода звонков в режиме реального времени
12.02.2026 11:58:59 | vc.ru

СМБ становится главным драйвером рынка VPN
12.02.2026 11:50:03 | it-world

Китай провёл испытания многоразовой ракеты Long March-10A — первая ступень успешно приводнилась в море
12.02.2026 11:49:04 | vc.ru

Лидерство финтеха в ИТ: как «наместник результата» удерживает баланс скорости, безопасности и смысла
12.02.2026 11:48:29 | Хабр

В России вырос интерес к старым iPhone — особенно среди подростков
12.02.2026 11:40:32 | ferra.ru

Эссе-рассуждение об этике ИИ
12.02.2026 11:30:17 | Хабр

Что у вас здесь происходит: почему сервис деск не взлетит без аудита процессов
12.02.2026 11:26:27 | Хабр

Создание физического движка при помощи BVH
12.02.2026 11:17:43 | Хабр

Как добиться резервного копирования на скорости 3,6 ГБ/c: настраиваем СРК «Береста» c TATLIN.BACKUP
12.02.2026 11:00:43 | Хабр

Как добиться резервного копирования с одного клиента на скорости 3,6 ГБ/c: настраиваем СРК «Береста» c TATLIN.BACKUP
12.02.2026 11:00:43 | Хабр

Для смартфонов Nothing вышел ИИ-сервис создания виджетов по текстовому запросу
12.02.2026 10:48:06 | ferra.ru

ТОП-10 интернет-магазинов товаров для строительства и ремонта (DIY): 60 удачных UX-решений
12.02.2026 10:36:20 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Российская спортсменка выиграла бронзу Паралимпиады
07.03.2026 12:33:00 | Lenta.ru

ВС РФ отразили четыре атаки ВСУ в Днепропетровской области
07.03.2026 12:32:08 | ТАСС

Армия России нанесла высокоточный удар возмездия по целям на Украине
07.03.2026 12:31:39 | Life.ru

в Волгограде троих пострадавших при атаке БПЛА выписали из больницы
07.03.2026 12:31:37 | ТАСС

В Ленобласти привлекли к ответственности 52 мигрантов после рейда на стройке
07.03.2026 12:31:36 | ТАСС

Ворончихина испытывает гордость от выступления под флагом РФ на Паралимпиаде
07.03.2026 12:28:37 | ТАСС

Армия Израиля сообщила об очередном обстреле из Ирана
07.03.2026 12:27:29 | ТАСС

Бойцы ВС РФ уничтожили вертолёт и объекты инфраструктуры ВСУ в течение суток
07.03.2026 12:26:42 | Life.ru

Число волков в Подмосковье выросло в 4,5 раза за зиму, хищники всё чаще выходят к людям
07.03.2026 12:26:41 | Life.ru

Российских туристов на Шри-Ланке грозят выселить из отелей
07.03.2026 12:26:04 | Life.ru

ВС РФ за сутки поразили объекты транспортной инфраструктуры ВСУ
07.03.2026 12:25:23 | ТАСС

На Запорожье ВСУ ударили по гражданскому автомобилю
07.03.2026 12:25:21 | ТАСС

Объекты двух агрохолдингов повреждены при ударе ВСУ по Брянской области
07.03.2026 12:24:04 | Life.ru

Захарова назвала идею фикс Киева
07.03.2026 12:21:36 | Lenta.ru

Мема: Размещение ядерного оружия в Финляндии приведёт к конфликту с Россией
07.03.2026 12:21:33 | Life.ru

Минтранс: аэропорт Дубая обслуживает рейсы авиакомпаний РФ с учетом ограничений
07.03.2026 12:21:06 | ТАСС

Доктор Мясников дал россиянам совет
07.03.2026 12:18:03 | Lenta.ru

Хотите белоснежную улыбку? Стоматолог объяснил, почему это может быть плохой идеей
07.03.2026 12:16:56 | Life.ru

Жителей Ельца предупредили о ликвидации упавшего фрагмента БПЛА
07.03.2026 12:16:45 | ТАСС

Есть первая медаль! Горнолыжница Ворончихина завоевала бронзу на Паралимпиаде
07.03.2026 12:15:20 | Life.ru

ВС РФ за сутки уничтожили две радиолокационные станции RADA RPS-42 в зоне СВО
07.03.2026 12:14:17 | ТАСС

В Стамбуле туристка насмерть разбилась, упав с 51-метровой Галатской башни
07.03.2026 12:14:12 | Life.ru

Подразделения ВСУ потеряли за сутки в зоне СВО около 1 015 военнослужащих
07.03.2026 12:13:42 | ТАСС

ВСУ за сутки потеряли в зоне СВО около 1 375 военных
07.03.2026 12:13:42 | ТАСС

Российские средства ПВО сбили за сутки 200 беспилотников ВСУ самолетного типа
07.03.2026 12:13:24 | ТАСС

Российские силы ПВО сбили за сутки 200 беспилотников ВСУ
07.03.2026 12:13:24 | ТАСС

Слуцкий предложил убрать перегородки на свиданиях матерей с детьми в СИЗО
07.03.2026 12:13:22 | ТАСС

ВС РФ нанесли массированный удар по используемым ВСУ объектам энергетики
07.03.2026 12:13:06 | ТАСС

В РПЦ посоветовали бороться с весенним обострением с помощью добрых дел и молитвы
07.03.2026 12:12:52 | Life.ru

Politico: представители США обсуждали с Украиной помощь в борьбе с БПЛА Ирана
07.03.2026 12:10:41 | ТАСС

Politico: США обсуждали с Украиной помощь в борьбе с беспилотниками Ирана
07.03.2026 12:10:41 | ТАСС

В Чегемском районе КБР заработал адаптивный центр для участников СВО
07.03.2026 12:10:09 | ТАСС

В Москве увеличился парк оборудования для лучевой диагностики
07.03.2026 12:10:01 | ТАСС

Daily Express рассказала о серьезном предупреждении России в адрес Финляндии
07.03.2026 12:10:00 | Российская Газета

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro