VK опубликовала нейросеть для обработки разговорного русского языка

24.07.2025 11:13:00 | iXBT.com

Компания VK (бывшая Mail.ru Group) выложила в открытый доступ модель RuModernBERT для обработки естественного русского языка. Как отмечают разработчики, она понимает длинные тексты целиком, без разбиения на фрагменты и работает локально, без внешних API, что снижает нагрузку на инфраструктуру.

Сгенерировано нейросетью Midjourney

В VK рассказали:

Инженеры могут использовать ее для задач в области обработки текста, в том числе для извлечения информации, анализа тональности, поиска и ранжирования в приложениях и сервисах. Модель может понять сложный или длинный запрос пользователя, например, в поисковой строке и найдет наиболее релевантную информацию, видео, товары или документы.

RuModernBERT была обучена на 2 триллионах токенов данных на русском, английском языках и коде с максимальной длиной контекста до 8,192 токенов. Для всех этапов обучения были использованы разные источники данных, в том числе книги, статьи, посты и комментарии в социальных сетях, что позволяет адаптировать ее для работы с современным текстом и учитывать разговорную речь.

RuModernBERT доступна в нескольких версиях: на 150 миллионов параметров и облегченная модель на 35 миллионов параметров. Также обновлены две дополнительные версии модели: USER и USER2. Они помогают инженерам лучше группировать и находить похожую информацию. В версии USER2 есть специальная технология, которая позволяет сократить объем данных почти без потери точности. Найти все версии модели можно на Hugging Face.

Подробнее

Читайте также

«Killer Note, который сокрушает все границы». Redmi рассекретила Redmi Note 14 SE 5G
24.07.2025 11:11:00 | iXBT.com

Более 70 моделей смартфонов Xiaomi и 12 моделей планшетов получат HyperOS 3
24.07.2025 11:06:00 | iXBT.com

В «Яндекс Заправках» появилась оплата проезда по безбарьерным трассам
24.07.2025 10:49:00 | iXBT.com

Вот такой клон Land Rover Defender от Chery приедет в Россию: опубликованы живые фото первого внедорожника iCAUR
24.07.2025 10:45:00 | iXBT.com

Новейшие «Урал NEXT» отзывают с рынка: их нужно дооснастить
24.07.2025 10:39:00 | iXBT.com

Оператор «СберМобайл» запустил «Близкий круг» с бесплатными звонками
24.07.2025 10:38:00 | iXBT.com

Башенную ГЭС на территории Чеченской Республики запустили в работу
24.07.2025 10:15:56 | TechCult.ru

Продажи белорусских кроссоверов Belgee X50 и Belgee X70 в России идут на новый рекорд: за три недели июля продано больше машин, чем за весь июнь
24.07.2025 10:15:00 | iXBT.com

216 аварий, 36 машин: У Zeekr всё плохо с системами ADAS, а Tesla на голову опережает всех даже без лидаров, как показало масштабное тестирование
24.07.2025 10:14:00 | iXBT.com

Новые подробности о Samsung Galaxy S26 Ultra: корпус тоньше, экран больше, 60-ваттная зарядка и Snapdragon 8 Elite 2 for Galaxy
24.07.2025 09:56:00 | iXBT.com

Xiaomi меняет стратегию: компания отказалась от выпуска смартфона Civi 15 и возвращается в бюджетный сегмент в Индии
24.07.2025 09:52:00 | iXBT.com

В России выявлено 56 человек, на которых оформлено 1,2 млн активных SIM-карт
24.07.2025 09:51:00 | iXBT.com

Android 16 станет последним крупным обновлением для этих устройств Motorola: опубликован список
24.07.2025 09:39:00 | iXBT.com

Илон Маск: Tesla Optimus станет величайшим продуктом в истории. Новейшая версия Optimus V3 будет готова уже в 2025 году
24.07.2025 09:25:00 | iXBT.com

В России продают уникальный ВАЗ-2101 с АКПП General Motors за 10 млн рублей
24.07.2025 09:07:00 | iXBT.com

Большой «Москвич 8» поступил к дилерам. В «Рольфе» заявили, что новинке будет «крайне тяжело»
24.07.2025 08:57:00 | iXBT.com

Экспериментальный ИИ OpenAI завоевал золото на Международной математической олимпиаде
24.07.2025 08:54:52 | TechCult.ru

«Наша цель — максимально приблизиться к абсолютной правде», — Илон Маск заявил, что Colossus 2 станет первым гигаваатным суперкластером для обучения ИИ
24.07.2025 08:47:00 | iXBT.com

Полёт в любую точку планеты за полчаса со скоростью до 25 Махов. Илон Маск рассказал об использовании Starship на Земле
24.07.2025 08:37:00 | iXBT.com

Илону Маску нужно ещё $12 млрд для улучшения работы Grok
24.07.2025 08:27:00 | iXBT.com

«Аккумуляторы будут играть огромную роль. Мало кто осознаёт, насколько огромен этот спрос», — Илон Маск заявил, что батареи изменят энергетику
24.07.2025 08:12:00 | iXBT.com

«Чем доступнее мы сделаем машину, тем лучше». Илон Маск рассекретил таинственную дешёвую Tesla
24.07.2025 07:59:00 | iXBT.com

Рыжий кот стал звездой рекламы Lada Iskra
24.07.2025 07:45:00 | iXBT.com

Lada, включи свет и открой багажник. Автомобили АвтоВАЗа получат дистанционный запуск двигателя и голосовое управление различными функциями
24.07.2025 07:33:00 | iXBT.com

И ни одной Tesla: в рейтинге самых продаваемых машин Европы оказались Dacia Sandero, Duster, Volkswagen Golf и другие модели с ДВС
24.07.2025 07:29:00 | iXBT.com

Microsoft назвала самую надёжную версию Windows
24.07.2025 07:23:00 | iXBT.com

Их не должно быть на рынке: отозванный аккумулятор загорелся прямо в поезде, есть пострадавшие
24.07.2025 07:11:00 | iXBT.com

Starlink Илона Маска запустила новейший спутниковый сервис T-Satellite
24.07.2025 07:05:00 | iXBT.com

Втрое дольше: ГАЗ значительно увеличил гарантию на некоторые детали «Газели Next»
24.07.2025 06:57:00 | iXBT.com

Lada Iskra получила логотипы Renault на деталях из-за экономии
24.07.2025 06:49:00 | iXBT.com

Россия и Белоруссия создадут спутник ДЗЗ сверхвысокого разрешения
24.07.2025 06:41:00 | iXBT.com

Иранский спутник Nahid-2 и «Ионосферы-М» отправятся в космос 25 июля
24.07.2025 06:37:00 | iXBT.com

«Бион-М» № 2 готовится к запуску с Байконура, собран «пакет» ракеты-носителя «Союз-2.1б»
24.07.2025 06:33:00 | iXBT.com

Новую топовую Lada Granta Sport показали внутри
24.07.2025 06:24:00 | iXBT.com

Минцифры заплатит VK 24,5 рубля за обслуживание каждого рабочего места
24.07.2025 00:21:34 | Ведомости

Все новости

ЛЕНТА

На Камчатке появится корпус корякского языка с помощью ИИ
20.03.2026 14:59:39 | ferra.ru

ЦБ выбрал осторожность. Ключевая ставка опустилась лишь до 15%
20.03.2026 14:34:48 | it-world

OnePlus показала аккумуляторы и вентиляторы на магнитах для смартфона 15T
20.03.2026 14:10:03 | ferra.ru

ЦБ понизил ключевую ставку с 15,5% до 15% годовых
20.03.2026 13:30:28 | vc.ru

Tinder добавит ИИ-инструмент, анализирующий галерею на устройствах пользователей для помощи с выбором фотографий и составлением анкеты
20.03.2026 13:09:25 | vc.ru

Роботы-гуманоиды вышли на работу в китайский McDonald’s
20.03.2026 12:10:02 | ferra.ru

Китай помогает Кубе перейти на солнечную энергию
20.03.2026 11:57:38 | it-world

[Перевод] Signal Forms в Angular
20.03.2026 11:50:10 | Хабр

[Перевод] Netflix: практическое применение Vector API, которое спасло CPU
20.03.2026 11:45:45 | Хабр

Память для ИИ и роботов
20.03.2026 11:38:35 | Хабр

Обработка результатов лазерного сканирования в nanoCAD на примерах трубопроводов и тепловой камеры. Опыт «СибИАЦ»
20.03.2026 11:32:27 | Хабр

«АвтоВАЗ» запустил сборку коммерческих автомобилей под брендом SKM
20.03.2026 11:31:44 | vc.ru

Как одна частная компания предложила упаковать астероид в гигантский мешок и притащить его ближе к Земле
20.03.2026 11:30:11 | Хабр

Могла ли беременность спровоцировать рак у Лерчек — честный ответ онколога
20.03.2026 11:28:39 | Woman.ru

[Перевод] Бум искусственного интеллекта поверг небольшой городок в Пенсильвании в хаос
20.03.2026 11:27:09 | Хабр

От текста к знанию
20.03.2026 11:24:59 | Хабр

Как посмотреть! От аналоговой сетки к цифровому пикселю и обратно… к кубику Рубика
20.03.2026 11:23:57 | Хабр

Зумеры полюбили торги: почему молодёжь уходит с маркетплейсов на аукционы
20.03.2026 11:23:38 | ferra.ru

Когда LLM перестаёт понимать
20.03.2026 11:15:28 | Хабр

Записки ездового кота, Артёмка-электроник
20.03.2026 11:08:21 | Хабр

Озвучка текста: как озвучивать текст нейросетью — результат вас удивит
20.03.2026 11:01:19 | Хабр

Семь видов стресса
20.03.2026 10:58:35 | Хабр

Не гадайте на кофейной гуще: как понять, что редизайн действительно работает — кейс сайта «Халвы»
20.03.2026 10:55:48 | Хабр

Google рассказала, как устанавливать сторонние приложения от разработчиков без верификации
20.03.2026 10:52:07 | vc.ru

Соцсеть Bluesky, созданная при поддержке Twitter, привлекла $100 млн
20.03.2026 10:47:35 | vc.ru

Первый хак Кремниевой долины: история о взломе цифровой технологии кремния для производства интегральных ОУ
20.03.2026 10:47:16 | Хабр

Вайбкодинг в 1С: как AI увеличивает скорость разработки в 4–6 раз
20.03.2026 10:41:06 | Хабр

Умерла жена Олега Басилашвили телеведущая Галина Мшанская
20.03.2026 10:36:06 | Woman.ru

Почему джуны на сложных проектах — это нормально
20.03.2026 10:31:37 | Хабр

[Перевод] MariaDB 12.3: binlog внутри InnoDB
20.03.2026 10:31:01 | Хабр

Названы 8 неочевидных способов улучшить питание — эти привычки продлят жизнь на годы — читать на Gastronom.ru
20.03.2026 10:30:00 | ГАСТРОНОМЪ

Все модницы сейчас носят эти шарфы — он нужен и вам
20.03.2026 10:20:31 | Woman.ru

Как я собрал русскоязычного ИИ-рентгенолога: скрещиваем ViT и ruGPT-3 в условиях Kaggle
20.03.2026 10:15:58 | Хабр

Xiaomi представила нейросеть с триллионом параметров
20.03.2026 10:10:00 | ferra.ru

Как не стоит писать функциональные требования для Технического Задания
20.03.2026 10:07:01 | Хабр

Смотреть все

ВСЯ ЛЕНТА

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro