Сравниваем быстродействие новой функциональности ClickHouse по поиску ближайших векторов с другими решениями

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Сравниваем быстродействие новой функциональности ClickHouse по поиску ближайших векторов с другими решениями

05.05.2025 12:10:36 | Хабр

Хабы: Блог компании InfoWatch, Администрирование баз данных, Хранилища данных, Data Engineering, Big Data

Всем привет! Меня зовут Диана Бутько, я студентка 3 курса, изучаю информационные системы и программирование. В InfoWatch я пришла на практику, и одной из моих задач стал сравнительный анализ различных методов поиска похожих векторов. Это один из ключевых аспектов машинного обучения и анализа данных, используемых в рекомендательных системах, кластеризации, семантическом поиске и других областях. Но чем больше объем данных, тем важнее становится выбор инструментов: полный перебор векторов требует больших вычислительных ресурсов, а в других алгоритмах порой необходимо балансировать между точностью и скоростью поиска.

В этой статье я сравниваю пять методов поиска похожих векторов:
— полный перебор по евклидову расстоянию с реализацией в Python;
— FAISS с индексами IndexFlatL2 (полный перебор, евклидово расстояние) и IndexIVFFlat (сегментирование по ячейкам, евклидово расстояние);
— векторный поиск в ClickHouse с индексом HNSW и метриками расстояния L2Distance (евклидово расстояние) и cosineDistance (косинусное сходство).

Читать далее

Подробнее

Читайте также

Карты(maps) в Go
05.05.2025 12:05:43 | Хабр

Трамп захотел сократить бюджет NASA ради планов Маска на Марс
05.05.2025 12:00:43 | ferra.ru

Изоляция с помощью глобальных акторов в Swift Concurrency: варианты на примере @MainActor
05.05.2025 12:00:24 | Хабр

У МТС, «Билайна», «Мегафона», T2 произошёл сбой — пользователи жалуются на отсутствие сети
05.05.2025 12:00:13 | vc.ru

Команда игнорировала линтеры и я написал свой нотификатор
05.05.2025 11:45:22 | Хабр

Успешный проект
05.05.2025 11:40:18 | Хабр

Новые подробности полумифической Half-Life 3 раскрыл инсайдер МакВикер
05.05.2025 11:15:42 | ferra.ru

Современные уязвимости современных LLM-агентов
05.05.2025 11:15:14 | Хабр

[Перевод] Загадка простых чисел — ключ к стратегии Magic: The Gathering
05.05.2025 11:13:55 | Хабр

ФАС оштрафовала «Билайн» на 600 тысяч рублей за рекламную SMS-рассылку без согласия абонента
05.05.2025 11:09:08 | vc.ru

[Перевод] Что покажет бенчмарк? Оценка мультиагентных систем в действии
05.05.2025 11:00:07 | Хабр

Кикшеринги хотят ограничить доступ к аренде
05.05.2025 10:37:43 | it-world

Apple изменит график выпуска iPhone ради складного смартфона в 2026 году
05.05.2025 10:30:39 | ferra.ru

[Перевод] Конвертер звука: незаменимый девайс для набора AV-устройств
05.05.2025 10:30:01 | Хабр

Как мы создали систему управления знаниями
05.05.2025 10:28:53 | Хабр

Как я собрал свою операционную систему: AUFS, слои и деконструкция себя
05.05.2025 10:27:17 | Хабр

«Обучали по-старому — теряли миллионы»: зачем внедрять VR в промышленности
05.05.2025 10:22:51 | Хабр

Минцифры: «повсеместное внедрение» верификации пользователей кикшерингов через Госуслуги «не планируется»
05.05.2025 10:20:41 | vc.ru

Edge-to-edge в Android: опыт внедрения и рекомендации по тестированию
05.05.2025 10:13:57 | Хабр

Слепые зоны инфраструктуры = мишень для хакера: итоги опроса об управлении активами
05.05.2025 10:08:48 | Хабр

40 открытых уроков мая: куда движется IT в 2025 году
05.05.2025 10:07:53 | Хабр

Как я обучал LoRA на стиле South Park для Flux: сбор кадров через MPV, особенности FluxGym и эксперименты с рангами
05.05.2025 10:05:47 | Хабр

Java Digest #24
05.05.2025 09:59:41 | Хабр

Винтик и Шпунтик, часть 1: формула включений-исключений
05.05.2025 09:49:51 | Хабр

Окончательная цена и характеристики нового середняка Honor 400 попали в Сеть
05.05.2025 09:45:37 | ferra.ru

Процент лжи
05.05.2025 09:44:14 | Хабр

Эти хакерские штучки
05.05.2025 09:38:31 | Хабр

OpenAI рассказала, когда и в каких ситуациях использовать разные версии ChatGPT
05.05.2025 09:35:16 | ferra.ru

Как я стал UI/UX-дизайнером после «весёлого» вечера
05.05.2025 09:30:40 | Хабр

Новый язык от 1С: Зачем? Кому? Стоит ли лезть?
05.05.2025 09:29:20 | Хабр

[Перевод] Мастер-класс по обходу WAF: Использование SQLMap с Proxychains и Tamper-скриптами против Cloudflare и…
05.05.2025 09:28:04 | Хабр

GPT с миллионным контекстом, провальная Llama 4 и открытие исходного кода AlexNet: главные события апреля в области ИИ
05.05.2025 09:28:03 | Хабр

В сеть слили цену глобальной версии смартфона HONOR 400
05.05.2025 09:25:16 | ferra.ru

Экзопланеты: изучение других миров
05.05.2025 09:18:29 | Хабр

Nintendo начала судиться с Genki — компанией, раскрывшей дизайн Switch 2 задолго до анонса
05.05.2025 09:17:15 | ferra.ru

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

ФБР предложило награду за информацию о взломавших почту его главы хакерах
28.03.2026 02:03:00 | Lenta.ru

Марочко: армия РФ берет в охват ВСУ в Новодмитровке под Константиновкой
28.03.2026 02:02:36 | ТАСС

Иран уведомил МАГАТЭ о третьем ударе у АЭС «Бушер»
28.03.2026 02:01:10 | Life.ru

Трамп назвал Байдена человеком с очень низким IQ из-за помощи Киеву
28.03.2026 01:57:45 | Lenta.ru

Часть иранской ракеты упала на комплекс, в котором находится бюро ТАСС в Израиле
28.03.2026 01:57:19 | ТАСС

Трамп допустил, что США не стоит оказывать поддержку НАТО
28.03.2026 01:54:45 | ТАСС

Трамп допустил прекращение поддержки НАТО из-за действий альянса
28.03.2026 01:54:14 | Lenta.ru

Камчатский вулкан Шивелуч выбросил пепел на 11 км
28.03.2026 01:54:00 | Life.ru

Al Arabiya: Израиль и США нанесли авиаудары по военным казармам в Тегеране
28.03.2026 01:53:18 | ТАСС

Трамп подверг НАТО критике за отсутствие поддержки
28.03.2026 01:52:52 | РБК

Ушедший из России технический гигант захотел зарегистрировать новый товарный знак
28.03.2026 01:52:32 | Lenta.ru

Трамп заявил, что на месте Байдена не стал бы помогать Киеву в конфликте
28.03.2026 01:51:27 | ТАСС

В ГД внесут проект об увеличении суточного довольствия в командировках
28.03.2026 01:42:39 | ТАСС

Трамп назвал число целей США в Иране
28.03.2026 01:42:27 | Lenta.ru

Трамп: США продадут Саудовской Аравии истребители F-35
28.03.2026 01:41:30 | ТАСС

Трамп сравнил демократов с Ираном
28.03.2026 01:40:19 | Lenta.ru

Слух: новая 3D-игра про Марио может выйти в 2027 году, а Star Fox вернётся уже этим летом
28.03.2026 01:37:40 | PlayGround.ru

Мерц высмеял возможности Парижа по военно-морской миссии в Ормузском проливе
28.03.2026 01:37:00 | Российская Газета

Никонов назвал визит российских депутатов в США историческим
28.03.2026 01:35:00 | Life.ru

Экипажи самолетов призвали быть начеку из-за выброса пепла вулканом Шивелуч
28.03.2026 01:33:43 | ТАСС

Трамп рассказал о своих ожиданиях от переговоров с Ираном
28.03.2026 01:33:31 | Lenta.ru

Тимур Иванов заключил сделку со следствием по делу о коррупции
28.03.2026 01:32:34 | РБК

Замглавы МИД Руденко: Россия и Индия могут отменить визы для туристических групп
28.03.2026 01:30:40 | ТАСС

Японка Сакамото стала четырёхкратной чемпионкой мира по фигурному катанию
28.03.2026 01:28:52 | Life.ru

Никонов усомнился в отмене санкций против России во время президентства Трампа
28.03.2026 01:27:38 | Lenta.ru

Трамп заявил, что Куба станет следующей целью США
28.03.2026 01:25:17 | ТАСС

В Британии рассказали о своем национальном позоре
28.03.2026 01:23:29 | Lenta.ru

Климатолог Терешонок: летом в Москве возможна аномальная жара
28.03.2026 01:22:10 | ТАСС

Климатолог Терешонок: в Москве летом возможна аномальная жара
28.03.2026 01:22:10 | ТАСС

Иран в третий раз сообщил об атаке на АЭС «Бушер»
28.03.2026 01:22:09 | РБК

Трамп предсказал судьбу Кубы
28.03.2026 01:21:52 | Lenta.ru

В Раде заявили о высокой смертности от болезней в одном из полков ВСУ
28.03.2026 01:20:00 | Lenta.ru

Трамп в шутку назвал заблокированный Ираном Ормузский пролив своим именем
28.03.2026 01:18:17 | Lenta.ru

УЕФА наказал «Црвену Звезду» за изображение святого на матче ЛЕ
28.03.2026 01:18:00 | Life.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro