Хабы: Блог компании SM Lab, Java, Поисковые технологии, Программирование
Из этой статьи вы узнаете:
1) Что такое Document и Query Processing.
2) Как обрабатывается текст Vespa. Что такое токенизация и стемминг.
3) Какой из обработчиков текста лучше подходит для русского языка.
4) Как выполнить текстовый поиск.
5) Как происходит ранжирование результата.
Читать далее