Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Некорпоративный Хабр: семантический поиск и фильтрация по структурированным полям в браузере (wllama и duckdb wasm)

19.05.2026 03:11:42 | Хабр

Хабы: Искусственный интеллект, Поисковые технологии, Базы данных

Классический RAG индексирует исходный текст документа, предварительно разбивая на фрагменты. Потом рассчитывает векторное представление фрагментов и сохраняет их векторные представления в базу данных для поиска. Это дает возможность искать по сходству фрагментов текста и поискового запроса пользователя, но не дает возможность искать по более высокоуровневым резюме и смыслам, темам поднятым в тексте и прочему. Также не помогает с аналитикой по содержимому.

Бесплатный проект text-metadata-generator позволяет выполнять запросы к LLM по каждому документу из коллекции документов, результаты вывода LLM проверяются по JSON схеме.

Зачем может пригодиться эта программа и подход со структурированием текстовой информации:

Если нужна своя библиотека с каталогом - поиск по локальным документам с использованием комбинации SQL предикатов и семантического поиска

Аналитика по документам, возможность находить новое в текстах: комбинируя структурированные поля созданные LLM из исходного текста, и находя закономерности с уже существующими в документе метаданными. Например, связывая с рейтингом признак NSFW, тон повествования, полноту содержания итп.

Разгрести “авгиевы конюшни” личных заметок в Obsidian или git репозитарии с Markdown файлами

Рассмотрим как работает данный подход на 13275 статьях с Хабра, а также текстах трех песнен…

Читать далее

Подробнее

Читайте также

GymStats — писал для себя, открыт для всех, кто ходит в спортзал
19.05.2026 02:17:40 | Хабр

200 Мп, аккумулятор на 8000 мА·ч — инсайдер о грядущем субфлагмане Redmi K100
18.05.2026 22:42:41 | ferra.ru

Бесплатных опционов не бывает
18.05.2026 22:26:57 | Хабр

Почему BitLocker по умолчанию не защищает от физического доступа
18.05.2026 21:55:15 | Хабр

В iOS 27 Genmoji будут создаваться на основе набранного текста и ваших фото
18.05.2026 21:42:40 | ferra.ru

Трое в лодке, нищета и собаки (с)
18.05.2026 21:33:09 | Хабр

Автоматический калибровочный модуль LibreCal
18.05.2026 20:56:30 | Хабр

Vivo S60 похвастается батареей на 7200 мА·ч и быстрой зарядкой 90 Вт
18.05.2026 19:42:37 | ferra.ru

Синхронизируй то. Акт III: PTPv2 G.8275.1
18.05.2026 19:40:33 | Хабр

Euroclear: решение суда в Москве по иску ЦБ на €200 млрд не повлияет на активы регулятора — они останутся замороженными
18.05.2026 19:14:39 | vc.ru

Как Александр Чачава купил пол-Рунета и как он может повлиять на публичные компании?
18.05.2026 19:07:46 | Хабр

3 ошибки при работе с dataclasses в Python
18.05.2026 19:06:50 | Хабр

В X ввели ограничения для аккаунтов без Premium-подписки — не больше 50 постов и 500 личных сообщений в сутки
18.05.2026 18:55:57 | vc.ru

Геометрия превосходства: Почему DeepSeek-V4 и Moonshot AI убили AdamW, и как оптимизатор Muon меняет физику обучения
18.05.2026 18:53:11 | Хабр

Сбой у «Делимобиля»: пользователи не могут войти в аккаунт и завершить аренду
18.05.2026 18:46:21 | vc.ru

Код Telegram iOS — лучший в индустрии. Почему же он так лагает на флагманах?
18.05.2026 18:40:21 | Хабр

AI-помощник для технической поддержки: новый этап в TG Support Bot 7.1.0
18.05.2026 18:10:11 | Хабр

«2ГИС» запустил в приложении оплату проезда в метро — пилот проводят в Нижнем Новгороде
18.05.2026 18:06:39 | vc.ru

Сможет ли Иран получить деньги за работу интернет-кабелей в Ормузе?
18.05.2026 17:48:15 | it-world

Складывающийся втрое Huawei Mate XT 2 получит «серьёзные изменения в дизайне»
18.05.2026 17:42:38 | ferra.ru

Vercel выкатил язык программирования для агентов. Я пытаюсь понять, нужен ли он мне
18.05.2026 17:26:47 | Хабр

Bloomberg: xAI в начале 2026-го предлагала сотрудникам предоставить свои налоговые декларации для обучения Grok за вознаграждение в $420 — деньги до сих пор не выплатили
18.05.2026 17:12:24 | vc.ru

Почему ваши логи бесполезны и как это починить за полчаса
18.05.2026 16:50:24 | Хабр

Попавший в организм до рождения свинец ухудшает здоровье даже через 60 лет
18.05.2026 16:10:50 | ferra.ru

Самый настоящий FP64 для ядерных расчетов? Анонс AMD Instinct MI430X
18.05.2026 15:57:27 | Хабр

В Cеть слили характеристики OnePlus Ace 7: до 240 Гц, 9000 мА·ч
18.05.2026 15:53:51 | ferra.ru

[Перевод] Каждая AI-подписка — это бомба замедленного действия для корпоративного сектора
18.05.2026 15:52:48 | Хабр

Security Week 2621: три уязвимости нулевого дня в Windows
18.05.2026 15:51:44 | Хабр

Роботизация заводов приносит миллиарды производителям комплектующих
18.05.2026 15:50:10 | it-world

Генерация дипломной работы нейросетью: какие ИИ помогают студентам в 2026 году
18.05.2026 15:22:21 | Хабр

Mimo V2 Pro от Xiaomi — что умеет нейросеть от производителя смартфонов? 4 интересных теста
18.05.2026 15:17:00 | Хабр

Дайджест: топ-5 инструментов Сбер2В для роста продаж на маркетплейсах и в интернет-магазине
18.05.2026 15:14:11 | Хабр

Рейтинг технологий для мобильной разработки для банков в 2026 году
18.05.2026 15:06:33 | Хабр

Собрал MCP-сервер для Windows-администрирования: 42 инструмента, от Event Viewer до диагностики служб
18.05.2026 14:52:11 | Хабр

Тестирование случайности самодельного ГПСЧ и сравнение с эталонами
18.05.2026 14:40:23 | Хабр

Смотреть все

НОВОСТИ

Новогодние каникулы в 2027 году сократятся до 11 дней
02.08.2026 10:12:10 | Life.ru

Депутат Григорьев призвал заморозить цены на авиабилеты
02.08.2026 10:11:46 | ТАСС

В Самарской области пропал ребенок
02.08.2026 10:11:33 | ТАСС

Белгород и Белгородский округ 2 августа подверглись ракетной атаке ВСУ
02.08.2026 10:08:39 | Life.ru

Над Брянской областью за сутки уничтожили 175 БПЛА
02.08.2026 10:06:06 | ТАСС

«Дрожу уже сейчас»: Эдита Пьеха вернётся на сцену в честь 90-летия
02.08.2026 10:05:46 | Life.ru

ВСУ больше ста раз за сутки атаковали российский регион
02.08.2026 10:03:13 | Lenta.ru

ТАСС: закачка газа в хранилища Европы в июле стала минимальной за шесть лет
02.08.2026 10:01:49 | ТАСС

Поехавшая в гости к бабушке школьница пропала в российском регионе
02.08.2026 10:01:45 | Lenta.ru

Политолог Мартынов считает, что Армения не выйдет из ЕАЭС
02.08.2026 10:01:21 | ТАСС

Семьи смогут получить ипотечные каникулы до 1,5 лет при рождении ребенка
02.08.2026 10:00:35 | РБК

Российский город попал под ракетный обстрел ВСУ
02.08.2026 10:00:19 | Lenta.ru

Сенат США одобрит законопроект Грэма о санкциях против России
02.08.2026 10:00:19 | РБК

Конструктор "потаенных судов": к столетию академика Спасского
02.08.2026 10:00:01 | ТАСС

Полный привод за полмиллиона: что реально ездит и не ломается
02.08.2026 10:00:00 | За рулем

В Энгельсском районе Саратовской области организовали оперативный штаб
02.08.2026 09:56:41 | ТАСС

Правительство Армении во главе с Пашиняном ушло в отставку
02.08.2026 09:55:46 | Life.ru

Кудрявцева считает, что гимнастки РФ не останутся без медали на ЧМ
02.08.2026 09:53:32 | ТАСС

Япония объявит о первой за 15 лет интервенции на рынке совместно с США
02.08.2026 09:53:11 | РБК

Еще один российский аэропорт сообщил о временном закрытии
02.08.2026 09:52:06 | Lenta.ru

На Амуре катер врезался в лодку с отдыхающими, один человек погиб
02.08.2026 09:50:02 | РБК

Видеокарты с 16 ГБ впервые обошли ускорители с 8 ГБ, а 8-ядерные процессоры обошли 6-ядерные: в статистике Steam произошли исторические изменения
02.08.2026 09:50:00 | iXBT.com

Российские беспилотники отправили на дно очередной военный конвой ВСУ
02.08.2026 09:48:15 | Life.ru

Премьер Армении Никол Пашинян подал в отставку
02.08.2026 09:48:00 | Российская Газета

Volkswagen отзывает десятки тысяч кроссоверов из–за риска ДТП
02.08.2026 09:45:00 | За рулем

Беглов рассказал о своем "месте силы" в Санкт-Петербурге
02.08.2026 09:44:11 | ТАСС

Главу Wildberries Татьяну Ким внесли в базу "Миротворца"
02.08.2026 09:44:00 | Российская Газета

«Планка может упасть»: Экс-капеллан ВСУ предупредил Киев о риске нового майдана
02.08.2026 09:43:30 | Life.ru

Экс-конгрессвумен Грин обвинила Трампа в предательстве
02.08.2026 09:42:31 | РБК

Правительство Армении ушло в отставку
02.08.2026 09:42:29 | ТАСС

С собаками пустят, с вонючими вещами — нет: В России изменятся правила перевозки багажа в такси
02.08.2026 09:42:24 | Life.ru

Российский аэропорт прекратил принимать и отправлять самолеты
02.08.2026 09:41:36 | Lenta.ru

Татьяну Ким внесли в базу "Миротворца"
02.08.2026 09:41:21 | ТАСС

Белгород и Белгородский округ подверглись ракетным обстрелам
02.08.2026 09:40:50 | ТАСС

Разработчики Escape Simulator 2 запустили конкурс по созданию комнат для грядущего сюжетного DLC
02.08.2026 09:40:07 | PlayGround.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro