Как с помощью deep learning мы построили Геокодер, масштабируемый для разных стран

info@vsetut.pro

Стать автором

Вернуться

28.01.2025 08:00:08 | Хабр

Хабы: Блог компании Яндекс, Геоинформационные сервисы, Машинное обучение, Алгоритмы, Поисковые технологии

Давным‑давно, когда мир ML состоял из бустингов, линейных моделей и статистических подходов, перед нашей командой API Яндекс Карт стояла задача сделать качественный Геокодер. Это алгоритм, который конвертирует текстовые запросы пользователей в поисковой строке карт в координаты и обратно. Он нужен, когда люди вводят адреса с ошибками, опечатками или народными наименованиями, например «Мяснитская 8». Геокодер должен понять, что имелось в виду «улица Мясницкая, дом 8/2», и вернуть на карте отметку с точной локацией и координатами.

Разработанный для России Геокодер отлично справлялся, но мы хотели найти способ быстро адаптировать это решение к адресным системам других стран. Технологические ограничения не позволяли быстро адаптировать решение, поскольку для каждой страны требовалась разработка собственных правил геокодирования, которые бы учитывали различия и языковые особенности. Однако появление и развитие алгоритмов deep learning открыло новые горизонты: методы active learning, аугментации данных и contrastive learning позволяют значительно улучшить итоговое качество геокодирования и учитывать нюансы различных адресных систем.

В этой статье мы рассмотрим основные этапы и методы построения нового Геокодера, который быстро масштабируется на адресные системы разных стран. Расскажем, что у него под капотом, как именно использовались механизмы deep learning при его создании, с какими проблемами мы столкнулись и как научили его понимать адреса с ошибками и опечатками.

Подробнее

Читайте также

Лучшие IT-работодатели России 2024: ежегодный рейтинг Хабр Карьеры
28.01.2025 08:00:07 | Хабр

Рост дохода от ПК игр за 10 лет обогнал консольный
28.01.2025 07:59:26 | ferra.ru

День 1070: брокеры, Мосбиржа и ЦБ обсуждают возможность запуска биржевых торгов в выходные дни
28.01.2025 07:53:27 | vc.ru

[Перевод] DeepSeek против ChatGPT: Какой искусственный интеллект определит будущее?
28.01.2025 07:46:55 | Хабр

Как стать системным аналитиком с нуля? Бесплатная программа обучения
28.01.2025 07:45:50 | Хабр

NVIDIA перестанет обновлять драйверы легендарных видеокарт GTX 9XX и GTX 10XX
28.01.2025 07:45:23 | ferra.ru

Galaxy S25 сохранил поддержку Bluetooth-стилуса — просто покупать его надо отдельно
28.01.2025 07:39:21 | ferra.ru

Как правильно делать тестовые задания на Python (flask, fastapi)
28.01.2025 07:38:45 | Хабр

Кого и что будет проверять Роскомнадзор в 2025 году
28.01.2025 07:37:47 | Хабр

Steam Deck разобрали и сделали из его комплектующих мини-ПК
28.01.2025 07:32:20 | ferra.ru

Рак, деменция и другие последствия для здоровья употребления ультраобработанных продуктов
28.01.2025 07:30:00 | ferra.ru

Новые видеокарты AMD будут слабее уже анонсированной RTX 5090
28.01.2025 07:23:10 | ferra.ru

Как создать модуль для Flipper Zero или как прийти к этому
28.01.2025 07:15:33 | Хабр

Глава Xbox поздравил Nintendo с анонсом Switch 2 и похвалил увеличенный экран портативки
28.01.2025 07:15:21 | ferra.ru

DRAGON 32
28.01.2025 07:14:30 | Хабр

Xiaomi увеличит цену на новые флагманы бренда Redmi
28.01.2025 07:08:53 | ferra.ru

Анонс китайского «убийцы» ChatGPT o1 обрушил цену акций американских IT-гигантов
28.01.2025 07:01:42 | ferra.ru

Как мы усовершенствовали CDP благодаря агрегатным атрибутам
28.01.2025 07:01:29 | Хабр

МРТ для DataScience. Часть 3
28.01.2025 07:00:27 | Хабр

Внимание правильный ответ
28.01.2025 07:00:24 | Хабр

Бизнес-процессы Битрикс: практические советы
28.01.2025 07:00:22 | Хабр

Первый шаг к кибернетическому тимлиду: автоматическое ревью кода на основе LLM
28.01.2025 07:00:22 | Хабр

Русский Маскарад — применение NER для защиты персональных данных
28.01.2025 06:58:09 | Хабр

Доказано: у кошек и жидкостей много общего
28.01.2025 06:45:00 | ferra.ru

Что такое дизайн-система, зачем она нужна и какими отечественными решениями вдохновиться
28.01.2025 06:28:11 | Хабр

Осторожно! Домовые чаты в Telegram могут быть мошеннической схемой
28.01.2025 06:15:05 | Хабр

Как строить и развивать отдел системного анализа: от маленькой команды до большого департамента
28.01.2025 06:05:00 | Хабр

Как написать худшую статью на Хабре
28.01.2025 06:01:57 | Хабр

Что такое модель OSI? Компьютерные сети для начинающих
28.01.2025 06:00:55 | Хабр

Врач предупредил об опасности пропуска разминки и других фитнес-ошибках после 50 лет
28.01.2025 06:00:00 | ferra.ru

Памятка по XSD
28.01.2025 05:30:46 | Хабр

Блокбастеры в нескольких килобайтах: панорамная история демосцены
28.01.2025 05:12:41 | Хабр

Мой путь к идеальному терминалу с iTerm2
28.01.2025 05:05:26 | Хабр

Тренажер печати для программистов, Симулятор для обучения инвестированию, Зооняня с ИИ – и еще 7 российских стартапов
28.01.2025 04:30:19 | Хабр

Fujifilm удвоит инвестиции в материалы для чипов, чтобы опередить конкурентов
28.01.2025 04:30:00 | ferra.ru

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Госдолг США установил новый рекорд, речь идет о 39 трлн долларов
19.03.2026 05:49:00 | Российская Газета

Число фигурантов дела о хищении при поставках концерну "Калашников" выросло до 5 человек
19.03.2026 05:47:41 | ТАСС

Мурадов: дипломатическое достижение мира возможно при прекращении агрессии Украины
19.03.2026 05:46:46 | ТАСС

На Камчатке школьник спас ребенка из-под снежного завала
19.03.2026 05:46:15 | ТАСС

План «Ковёр» отменён в аэропортах Краснодара, Геленджика, Пензы и Саратова
19.03.2026 05:44:59 | Life.ru

Qatar Energy заявила о еще одном ракетном ударе по своей инфраструктуре
19.03.2026 05:43:10 | ТАСС

В Иркутской области в ДТП погиб ребенок
19.03.2026 05:42:03 | ТАСС

Лариса Долина хочет посетить места, где прежде жила
19.03.2026 05:41:38 | Life.ru

Экс-глава МИД Австрии высказалась о возможном участии ЕС в кампании на Ближнем Востоке
19.03.2026 05:40:00 | Lenta.ru

В Москве ветврачи спасли французского мастифа, съевшего пять предметов одежды
19.03.2026 05:38:15 | ТАСС

Трамп пригрозил мощным ударом по одной стране
19.03.2026 05:38:05 | Lenta.ru

Британская прокуратура обвинила двух жителей Лондона в шпионаже на Иран
19.03.2026 05:37:51 | Life.ru

Главы МИД 12 арабских и исламских стран назвали удары Ирана "неоправданными"
19.03.2026 05:37:23 | ТАСС

RED Security: хакеры активно нацелились на сферу гостеприимства
19.03.2026 05:36:27 | ТАСС

Эксперт Моисеев: контролеры не вправе применять силу к безбилетникам
19.03.2026 05:34:10 | ТАСС

Задержанный в Москве экс-зампред правительства Бурятии обвиняется в мошенничестве
19.03.2026 05:33:11 | ТАСС

Россиянин описал иммигрантов в США словами «морально полностью опустошены»
19.03.2026 05:30:31 | Lenta.ru

В России утвердили ГОСТ на системы ИИ в сфере здравоохранения
19.03.2026 05:30:13 | Life.ru

Во Владивостоке отметили 120-летие подводного флота России
19.03.2026 05:28:44 | ТАСС

Организаторов концерта BTS заподозрили в политической агитации
19.03.2026 05:27:30 | ТАСС

Александр Овечкин забросил 999-ю шайбу в НХЛ с учётом плей-офф
19.03.2026 05:25:31 | Life.ru

Меркурис заявил, что Зеленский начал осознавать критичность положения ВСУ
19.03.2026 05:24:00 | Российская Газета

В ДВФУ назвали самые популярные направления для карьеры у иностранных студентов
19.03.2026 05:20:37 | ТАСС

КСИР нанёс удары по американским базам в ОАЭ, Кувейте и Бахрейне
19.03.2026 05:19:18 | Life.ru

Трамп пригрозил ударами по месторождению Южный Парс, если Иран атакует энергетику Катара
19.03.2026 05:17:54 | ТАСС

Трамп пригрозил уничтожить объекты месторождения Южный Парс в Иране
19.03.2026 05:17:54 | ТАСС

В России раскритиковали идею передышек в конфликте с Украиной
19.03.2026 05:17:35 | Lenta.ru

Осужденному пожизненно экс-сенатору Арашукову отказали в работе в колонии
19.03.2026 05:15:49 | ТАСС

Названы проблемы большого кроссовера Chery
19.03.2026 05:15:38 | Lenta.ru

Трамп: Израиль не будет бить по объектам иранского газового месторождения Южный Парс
19.03.2026 05:13:28 | ТАСС

Трамп: Израиль не будет бить по объектам месторождения Южный Парс в Иране
19.03.2026 05:13:28 | ТАСС

Альбанезе: запасов автомобильного топлива в Австралии хватит на 37 дней
19.03.2026 05:12:32 | ТАСС

Командир Глоднев: подводники из экипажа РПКСН "Карелия" выполняют задачи на СВО
19.03.2026 05:11:56 | ТАСС

Бойцы "Востока" поразили укрепления и сбили логистику ВСУ в Запорожской области
19.03.2026 05:10:47 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro