[Перевод] Простой механизм поиска с нуля

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

[Перевод] Простой механизм поиска с нуля

22.06.2025 09:01:10 | Хабр

Хабы: Блог компании RUVDS.com, Машинное обучение, Поисковая оптимизация, Поисковые технологии, Браузеры

Мы с Крисом недавно «с нуля» буквально за пару часов создали механизм поиска для моего блога. Основную часть проделал именно Крис, так как до этого с word2vec я был знаком лишь отдалённо.

Разработанный нами поисковик основывается на векторных представлениях (эмбеддингах) слов. Принцип здесь следующий. Функция получает слово и отображает его в N-мерное пространство (в данном случае N=300), где каждое измерение отражает определённый оттенок смысла. Вот хорошая статья (англ.) о том, как обучить собственную модель word2vec, и её внутреннем устройстве.

Суть работы созданного нами поиска заключается в преобразовании моих статей, а точнее составляющих их слов, в эмбеддинги, сохраняемые в общем пространстве. Затем при выполнении конкретного поиска текст его запроса преобразуется аналогичным образом и сопоставляется с векторами статей. В результате этого сопоставления, используя метрику косинусного сходства, мы ранжируем статьи по их релевантности запросу.

Уравнение ниже может показаться пугающим, но в нём говорится, что косинусное сходство, представляющее косинус угла между двух векторов cos(theta), определяется в виде скалярного произведения, поделённого на произведение величин каждого вектора. Разберём всё это подробнее.

Читать далее

Подробнее

Читайте также

7,3 Тбит/с за 45 секунд: Cloudflare отразила рекордную DDoS-атаку
22.06.2025 09:00:29 | ferra.ru

Мета-акторы, готовый скелет микросервиса
22.06.2025 08:42:33 | Хабр

Прокачаться в работе с Ansible — подборка ресурсов
22.06.2025 08:16:34 | Хабр

У активных пользователей ИИ ChatGPT стал хуже работать мозг
22.06.2025 08:15:27 | ferra.ru

Clair Obscure: Expedition 33 вернула мне веру в игровую индустрию
22.06.2025 08:10:00 | Хабр

AAEON de next-RAP8: одноплатный ПК с производительностью десктопа на Intel Core 13 поколения
22.06.2025 08:01:08 | Хабр

Пять островов, три недели и дюжина пересадок: как я открыл для себя Филиппины и что из этого получилось
22.06.2025 08:00:58 | Хабр

[Перевод] Влияли ли на климат Земли пролетавшие мимо звёзды?
22.06.2025 07:51:54 | Хабр

Новости кибербезопасности за неделю с 16 по 22 июня 2025
22.06.2025 07:42:06 | Хабр

Huawei открыла бета-тест HarmonyOS 6.0, но для ограниченного числа устройств
22.06.2025 07:30:26 | ferra.ru

Huawei представила свою обновлённую ИИ-модель Pangu 5.5
22.06.2025 06:45:21 | ferra.ru

YOLO на Rust: производительность, удобство и открытость
22.06.2025 06:03:38 | Хабр

Звонки в Android получили новый дизайн в стиле Material 3
22.06.2025 06:00:17 | ferra.ru

Установка Stable Diffusion + ComfyUI
22.06.2025 05:42:37 | Хабр

ASRock показала компактную видеокарту на 32 ГБ Radeon AI PRO R9700 Creator
22.06.2025 05:15:12 | ferra.ru

Самолёт Superjet впервые провёл длительный перелёт на отечественных двигателях
22.06.2025 04:30:00 | ferra.ru

Президент Путин призвал к массовому использованию цифрового рубля
22.06.2025 03:45:00 | ferra.ru

МВД опровергло утечку 16 млрд паролей в обнаруженном архиве
22.06.2025 03:00:00 | ferra.ru

Xiaomi начала раздавать прошивку HyperOS 2.2 на европейские устройства
22.06.2025 02:15:00 | ferra.ru

Что такое прогрессивная перегрузка на самом деле?
22.06.2025 02:11:54 | Хабр

Роскосмос запустит интернет-спутники «Рассвет» с Плесецка
22.06.2025 01:30:00 | ferra.ru

Windows 11 перестанет предлагать устаревшие драйверы при наличии новых
22.06.2025 00:45:00 | ferra.ru

В Windows 11 появится возможность изменять положение регуляторов звука и яркости
22.06.2025 00:00:00 | ferra.ru

Сбер и РАНХиГС запустят курс по ИИ для госуправления
21.06.2025 23:40:45 | ferra.ru

Врач объяснила вред фруктов с плесенью, даже если всё очистить
21.06.2025 23:29:25 | ferra.ru

В Ижевске появится «Школа 21» по обучению молодёжи IT-специальностям
21.06.2025 23:15:00 | ferra.ru

Meta* хотела купить ИИ-поисковик Perplexity, но вложила $14,3 млрд в Scale AI
21.06.2025 22:49:56 | ferra.ru

Не оправдал ожиданий: Galaxy S25 Edge продаётся плохо
21.06.2025 22:30:00 | ferra.ru

В Мордовии наладили выпуск лекарств от редких болезней
21.06.2025 22:23:23 | ferra.ru

«Алроса» первой в мире добилась отрицательного углеродного следа у алмазов
21.06.2025 22:04:21 | ferra.ru

Промышленный шпион компании Deel пожаловался на слежку
21.06.2025 21:49:55 | ferra.ru

Samsung выпустила улучшенную Android-функцию обнаружения землетрясений
21.06.2025 21:45:00 | ferra.ru

Достижение ли это: в Gemini только сейчас появилась функция распознавания музыки
21.06.2025 21:00:00 | ferra.ru

В MacOS 26 пропала поддержка первого iPod и некоторых внешних жёстких дисков
21.06.2025 20:49:53 | ferra.ru

В РФ предложили ввести ответственность за преступления с использованием ИИ
21.06.2025 20:49:19 | ferra.ru

Смотреть все

НОВОСТИ

Мединский рассказал о "героизме" датских солдат во Второй мировой войне
22.01.2026 11:07:38 | ТАСС

Премьер Бельгии назвал главную причину, почему ЕС не может изъять активы РФ
22.01.2026 11:07:00 | Российская Газета

МТС-банк закрыл сделку по приобретению "ЭКСИ-Банка"
22.01.2026 11:06:39 | ТАСС

Прошедшая магнитная буря стала одним из крупнейших событий XXI века
22.01.2026 11:06:28 | ТАСС

Ребрендинг "OBI Россия" проведут в 2026 году поэтапно
22.01.2026 11:06:22 | ТАСС

Экспорт рыбы из Китая в РФ стал максимальным с 2015 года
22.01.2026 11:06:00 | Российская Газета

Порт Final Fantasy VII Remake для Switch 2 получает очень высокие оценки
22.01.2026 11:05:36 | PlayGround.ru

В Кемерово пациентка скорой помощи умерла в ДТП
22.01.2026 11:05:30 | ТАСС

Politico: Израиль отказал десяткам гуманитарных организаций в лицензиях
22.01.2026 11:05:19 | ТАСС

Женщина пристрастилась к сырому мясу и стала есть около килограмма в день
22.01.2026 11:02:55 | Lenta.ru

Генконсульство подтвердило гибель пропавшего в Босфоре российского пловца
22.01.2026 11:01:46 | Lenta.ru

Россияне купили свыше 1,5 млн смартфонов в подарок на Новый год
22.01.2026 11:01:38 | PlayGround.ru

Приложение «VK Видео» преодолело отметку в 100 млн установок
22.01.2026 11:01:00 | iXBT.com

Экс-глава совета директоров "Локомотива" Липатов признал вину по заказным убийствам
22.01.2026 11:00:05 | ТАСС

Как приготовить харчо
22.01.2026 11:00:00 | ТАСС

Нож, маску и перчатки изъяли у напавшего на уборщицу лицеиста в Нижнекамске
22.01.2026 10:59:51 | РЕН ТВ

СК возбудил дело о покушении на убийство после нападения подростка на лицей в Нижнекамске
22.01.2026 10:59:29 | Life.ru

Невероятно интересные истории — Непальские праздники (22.01.2026)
22.01.2026 10:58:53 | РЕН ТВ

Убийство девочки в Коми. Что известно о подозреваемом
22.01.2026 10:58:47 | ТАСС

Напавший на школу в Татарстане хотел отомстить за смерть своей подруги
22.01.2026 10:58:35 | Life.ru

Фельдшер СВО рассказала об удивившем ее своим желанием жить бойце
22.01.2026 10:57:43 | Lenta.ru

Снегопады привели к 20-кратному росту спроса на одну услугу в России
22.01.2026 10:57:28 | Lenta.ru

Почти 40% российских компаний используют ИИ для автоматизации бизнеса
22.01.2026 10:57:15 | ТАСС

Задания в ущерб безопасности РФ. Детали задержания агента молдавских спецслужб
22.01.2026 10:56:42 | ТАСС

На Hulu стартовал сериал Райана Мёрфи "Красота"
22.01.2026 10:56:07 | PlayGround.ru

В Дагестане маневровый локомотив столкнулся с автомобилем скорой помощи
22.01.2026 10:55:55 | ТАСС

Уиткофф: глава BlackRock входит в команду США по урегулированию на Украине
22.01.2026 10:55:08 | ТАСС

Политолог объяснил, почему Старый Свет задумался о новом альянсе без США
22.01.2026 10:54:49 | Life.ru

Появилось видео обстановки у школы в Нижнекамске, где ученик ранил уборщицу
22.01.2026 10:54:37 | Life.ru

Назвавшему Трампа тираннозавром главе Калифорнии не дали выступить в Давосе
22.01.2026 10:54:35 | Life.ru

Kyiv Post: Зеленский спешит в Давос на встречу с Трампом
22.01.2026 10:54:00 | Российская Газета

Камчатку решили откопать всем миром
22.01.2026 10:53:58 | Lenta.ru

В России высказались о перспективах ключевой ставки
22.01.2026 10:53:56 | Lenta.ru

Нож, маска и перчатки. Подробности нападения школьника на уборщицу в Нижнекамске
22.01.2026 10:53:05 | ТАСС

Софи Тёрнер рассказала о своем подходе к образу Лары Крофт: акценты будут не на внешней привлекательности героини
22.01.2026 10:52:54 | PlayGround.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro