В МТУСИ применили методы многомерного статистического анализа и NLP для классификации научных публикаций

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

В МТУСИ применили методы многомерного статистического анализа и NLP для классификации научных публикаций

11.11.2024 13:31:01 | Хабр

Хабы: Блог компании МТУСИ

Обработка естественного языка, или NLP, — ключевой раздел науки о данных, популярный в промышленности и академических кругах. С развитием NLP растет количество докладов на конференциях и статей в научных журналах, что усложняет поиск нужной информации.

Классификация и выявление тематик в научных публикациях важны для нормализации цитирований и построения журнальных метрик, таких как квартили. В стандартных наукометрических инструментах, таких как Web of Science и Scopus, классификации присваиваются редакторами баз журналам, а публикации в этих источниках приписываются к этим же тематикам. Полноценная классификация на уровне отдельных статей существует только для мультидисциплинарных журналов, а наборы тематик устарели и почти не меняются.

Современные методы выявления тематик основываются на анализе ключевых слов и фраз, извлекаемых из названий, аннотаций и текстов статей, а также на анализе цитирований. Эти методы автоматизированы и способны обрабатывать большие объемы данных, но есть проблема с объективностью результатов, так как ключевые слова выделяет автор. Часто можно встретить набор ключевых слов, не отражающий содержание работы, к примеру: «artificial intelligence, intelligent systems, machine learning» и т.д..

В связи с этим возникла необходимость в применении универсальной методики с использованием современных алгоритмов кластеризации, которая может значительно улучшить понимание и интерпретацию научной литературы.

узнать больше

Подробнее

Читайте также

Apple Vision Pro 2 выйдет не раньше осени 2025 года, но и не позже весны 2026
11.11.2024 13:30:55 | ferra.ru

Зачем и как нейросети учат быть человечными
11.11.2024 13:15:51 | Хабр

Семантический веб: краткий обзор технологий и инструментов
11.11.2024 13:15:31 | Хабр

[Перевод] Как мы обнаружили потенциальные атаки при помощи штрих-кодов
11.11.2024 13:01:55 | Хабр

ИИ-поисковик ChatGPT сравнили с Google Поиском: кому-то стоит поднажать
11.11.2024 12:45:54 | ferra.ru

Когда слепой увидит зрячего?
11.11.2024 12:15:35 | Хабр

Деменция LLM: как языковые модели забывают, зачем учились, и что из этого следует
11.11.2024 12:11:46 | Хабр

Huawei создаст свой аккумулятор на основе сульфидов для электромобилей
11.11.2024 12:00:52 | ferra.ru

Глубокая оптимизация сверточных нейронных сетей: Анализ методов улучшения модели на примере CIFAR-10
11.11.2024 12:00:45 | Хабр

Телефоны с дисплеями E-Ink: для тех, кому нужна связь и не хочется отвлекаться
11.11.2024 12:00:25 | Хабр

Применение статических анализаторов архитектуры на примере гексагональной архитектуры
11.11.2024 11:43:19 | Хабр

США запретили Тайваню поставки чипов в КНР
11.11.2024 11:41:46 | it-world

Запуск необанка на core-bankning platform АБС RStyle: вызовы в финансовом секторе
11.11.2024 11:38:43 | Хабр

Как меняется кибермошенничество
11.11.2024 11:30:54 | Хабр

Секреты успешной миграции: как перенести базу данных с выделенного сервера в облако
11.11.2024 11:17:22 | Хабр

Несвоевременная реакция на ИИ-бум стоила Samsung 126 миллиардов долларов
11.11.2024 11:15:51 | ferra.ru

Как я настраивал меню выхода в Qtile
11.11.2024 11:15:19 | Хабр

Как мы работу блочного pNFS исправляли: продолжение остросюжетного детектива с Linux в главной роли
11.11.2024 11:07:10 | Хабр

Паттерн Наблюдатель в Golang на котиках
11.11.2024 11:05:12 | Хабр

Unity .NET и Mono — галопом по компонентам
11.11.2024 11:00:08 | Хабр

Где предел роста биткойна?
11.11.2024 10:59:00 | it-world

Huawei открыла первую в Бангладеш «Солнечную лабораторию»
11.11.2024 10:30:50 | ferra.ru

[Перевод] Оптимизируем использование памяти для поиска IP-адресов
11.11.2024 10:23:52 | Хабр

Rust custom Triplet
11.11.2024 10:20:22 | Хабр

Обзор и архитектура протокола LayerZero v2
11.11.2024 10:15:54 | Хабр

Ускорение LUP-разложения матрицы с помощью OpenCL
11.11.2024 10:15:01 | Хабр

[Перевод] Обманчивая статистическая значимость
11.11.2024 10:10:36 | Хабр

Минцифры предложило ввести единые тарифы за поиск уязвимостей в государственных ИТ-системах
11.11.2024 10:06:54 | vc.ru

Охват ChatGPT обошел топовые браузеры: более 3 млрд посещений в месяц
11.11.2024 09:45:48 | ferra.ru

MTA-STS на вашем почтовом сервере
11.11.2024 09:43:37 | Хабр

Как связаны скоростные шоссе и естественный отбор?
11.11.2024 09:27:06 | Хабр

Производитель микроэлектроники «Элемент» начнёт поставлять ОАК компоненты для SSJ 100 и МС-21
11.11.2024 09:26:41 | vc.ru

Опционы и формула Блэка-Шоулза (часть 2)
11.11.2024 09:23:48 | Хабр

Как силами мобильных разработчиков автоматизировать процесс разработки
11.11.2024 09:21:25 | Хабр

Краткий обзор форума GIS DAYS 2024: студенческий день, тренды в инфобезе и киберсоревнования
11.11.2024 09:19:32 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Sohu: Военные из КНР испытали шок при виде разобранного пулемета Калашникова
27.03.2026 18:14:00 | Российская Газета

В Швеции озаботились конфликтом в Иране: Помогает России достигать целей СВО
27.03.2026 18:12:16 | Life.ru

Дмитриев: Война в Иране изменит облик ЕС
27.03.2026 18:12:00 | Российская Газета

«Доктора Менгеле режима Зеленского»: главные факты из доклада о пытках пленных
27.03.2026 18:10:41 | Life.ru

Спасатели пришли на помощь раненой сове и утке в Москве
27.03.2026 18:10:31 | Life.ru

В Совфеде постыдились комментировать слова главы евродипломатии о России и Украине
27.03.2026 18:08:53 | Lenta.ru

Умные колонки Apple HomePod массово выходят из строя после обновления
27.03.2026 18:08:38 | Life.ru

В соцсетях появилось видео с горящим американским танкером Safesea Vishnu
27.03.2026 18:07:36 | Life.ru

ТАСС: Индия и РФ продолжат переговоры по поставкам СПГ и СУГ с привлечением компаний
27.03.2026 18:07:13 | ТАСС

Медвежат-сирот спасли в Подмосковье и теперь учат житейским «навыкам»
27.03.2026 18:06:21 | Life.ru

Испуганные пассажиры сняли на видео искрящийся при посадке в Афганистане лайнер
27.03.2026 18:06:21 | Lenta.ru

ФНС обязала майнеров отчитаться о доходах до 30 апреля
27.03.2026 18:06:16 | Life.ru

МИД Белоруссии: Минск не раз заявлял о готовности обсуждать с Литвой проблемные вопросы
27.03.2026 18:06:11 | ТАСС

Российский подросток изнасиловал мальчика на камеру
27.03.2026 18:05:57 | Lenta.ru

Володин зарегистрирован участником праймериз "Единой России" в Саратовской области
27.03.2026 18:05:39 | ТАСС

В Херсонской области почти 30 детей-сирот обеспечат жильем
27.03.2026 18:05:22 | ТАСС

В Северной Осетии пройдет форум креативных индустрий "Кавказский акцент"
27.03.2026 18:04:16 | ТАСС

Министры энергетики стран ЕС 31 марта проведут экстренную видеоконференцию
27.03.2026 18:04:12 | ТАСС

«Красиво жил!»: Конюхов рассказал, как делил Антарктиду с пингвинами и тюленями
27.03.2026 18:04:07 | Life.ru

В Ливане заявили о росте числа жертв израильских атак до 1 142
27.03.2026 18:03:51 | ТАСС

Reuters: электронную почту главы ФБР взломали хакеры
27.03.2026 18:02:39 | ТАСС

В Москве мужчина вскрыл сейф с деньгами в квартире, куда его пустил ребенок
27.03.2026 18:02:11 | ТАСС

Волгоградского журналиста Кошелева арестовали до 23 мая по делу о вымогательстве
27.03.2026 18:02:07 | Life.ru

Создатели s&box опубликовали дорожную карту и анонсировали лицензию для выпуска самостоятельных игр
27.03.2026 18:02:07 | PlayGround.ru

Медведев напомнил Каллас о принадлежности Донбасса и Эстонии России
27.03.2026 18:01:45 | Lenta.ru

В Энергодаре дрон ВСУ атаковал здание санэпидемстанции и вышку связи
27.03.2026 18:01:44 | ТАСС

В Брянской области расходы бюджета увеличились почти на 11 млрд рублей
27.03.2026 18:01:42 | ТАСС

По слухам, ремейк Zelda Ocarina of Time выйдет в этом году на Nintendo Switch 2
27.03.2026 18:00:29 | PlayGround.ru

Матвей Сафонов станет капитаном сборной России в первом матче года
27.03.2026 18:00:24 | Life.ru

Житель Селидово рассказал о массовых расстрелах при отступлении ВСУ из города
27.03.2026 18:00:22 | Lenta.ru

В Якутии проведут 32 мероприятия по программе инициативного бюджетирования
27.03.2026 18:00:08 | ТАСС

Демоверсия Harem vs Zombies уже в Steam!
27.03.2026 18:00:07 | PlayGround.ru

7 ошибок воспитания, которые совершали все родители в СССР, а дети расплачиваются до сих пор
27.03.2026 18:00:00 | Life.ru

Петров: "Весельчак У" поднимет планку фантастических фильмов в российском кино
27.03.2026 17:59:46 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro