Как я разрабатываю агентские ИИ системы для извлечения признаков (feature-extraction) из мультимодальных данных

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Как я разрабатываю агентские ИИ системы для извлечения признаков (feature-extraction) из мультимодальных данных

30.06.2025 09:30:33 | Хабр

Хабы: Машинное обучение, Искусственный интеллект

Извлечение признаков (feature extraction) из текстов — ключевой шаг при анализе документов: он является основной практической частью таких задач по обработке данных, как классификация, тематическое моделирование, NER, QA. Если раньше почти что для каждой из таких задач, и в особенности для разных модальностей данных использовались специализированные архитектуры нейронных сетей, то сейчас подобные системы обычно строятся вокруг LLM/VLM. Однако и современные модели на практике настраиваются под конкретные задачи через fine‑tuning или distillation, в связке с retrieval (RAG) и агентскими архитектурами.

В этой статье я рассматриваю свой опыт проектирования и разработки агентов для выполнения feature-extraction. При наличии мультимодальных данных с разнородной структурой - тексты, PDF, изображения - мне приходится извлекать нужные пользователю фрагменты информации. Для этого я перебрал различные подходы - в зависимости от сложности задачи - и теперь пора сравнить их эффективность и отметить сложности реализации.

Читать далее

Подробнее

Читайте также

Почему сайты производителей не продают и как это исправить: 18 лет опыта в одной статье
30.06.2025 09:28:45 | Хабр

Как нейросетям перестать бояться и полюбить «синтетику»
30.06.2025 09:22:25 | Хабр

Математика как язык Вселенной: почему она так эффективна?
30.06.2025 09:21:07 | Хабр

Реляционные базы данных в книге «Двенадцать стульев»: как устроен архив Коробейникова
30.06.2025 09:14:15 | Хабр

«Тупой ИИ» с нами надолго. Почему в новых моделях больше галлюцинаций
30.06.2025 09:01:33 | Хабр

Статья 1: Введение в MV шаблоны
30.06.2025 09:00:31 | Хабр

Личный опыт: как ChatGPT помог выбрать смартфон
30.06.2025 09:00:30 | Хабр

Диетолог перечислил лучшие продукты с противовоспалительными жирами
30.06.2025 09:00:04 | ferra.ru

Электронный курвиметр
30.06.2025 08:55:21 | Хабр

[Перевод] Как я убедил виртуальную машину, что у неё есть кулер
30.06.2025 08:48:00 | Хабр

Samsung ускорила разработку фирменных 2-нм чипов второго поколения
30.06.2025 08:44:59 | ferra.ru

HPC 2025: Революция вычислений от кластеров к платформам — как суперкомпьютеры становятся сервисом
30.06.2025 08:40:35 | Хабр

Эксперты VideoCardz объяснили, почему масляные пятна на видеокарте — это нормально
30.06.2025 08:37:59 | ferra.ru

Подход к оценке “живой” инфраструктуры и построению disaster recovery
30.06.2025 08:30:09 | Хабр

«Меньше памяти — больше кадров»: NVIDIA научила DLSS экономить видеопамять
30.06.2025 08:22:58 | ferra.ru

Процессор AMD Ryzen 5 9600X впервые упал ниже $160 — дешевле, чем 7600X
30.06.2025 08:15:58 | ferra.ru

Ежевика и не только: в каких продуктах антиоксидантов больше, чем в зелёном чае
30.06.2025 08:15:38 | ferra.ru

Подводные камни у материнских плат из Поднебесной
30.06.2025 08:15:32 | Хабр

[Перевод] Мне нужен хороший параллельный компьютер
30.06.2025 08:15:25 | Хабр

Обзор интеграционной платформы «ЭНЕРБАС»
30.06.2025 08:15:03 | Хабр

Робот Dubbot начнет патрулировать город Дублин в США уже летом 2025 года
30.06.2025 08:07:57 | ferra.ru

М.Видео отчиталась об успешных продажах собственного бренда Carrera
30.06.2025 08:00:53 | ferra.ru

В Китае парализованный человек научился управлять рукой силой мысли при помощи нового импланта
30.06.2025 07:59:57 | ferra.ru

Совместная работа за 500: как объединить сотни сотрудников и выстроить эффективные процессы
30.06.2025 07:58:53 | Хабр

Топ-25 полезных ботов в Телеграм, от планеров до поисковиков
30.06.2025 07:55:03 | Хабр

Docker Demo IDM Midpoint EPPL c трудоустройствами, назначениями, проектами и LDAP
30.06.2025 07:53:59 | Хабр

В китайском KFC вышел ROG-бургер с кейкапом Asus в подарок
30.06.2025 07:51:56 | ferra.ru

Android Authority раньше времени раскрыла Nothing Headphones (1): до 80 часов работы и 40-мм драйверы
30.06.2025 07:44:56 | ferra.ru

[Перевод] Как я использую терминал
30.06.2025 07:43:35 | Хабр

День 1223: сенат США может рассмотреть новые санкции против России на неделе после 7 июля 2025 года
30.06.2025 07:37:56 | vc.ru

NVIDIA RTX 5070 SUPER получит 18 ГБ видеопамяти — на 50% больше, чем у оригинала
30.06.2025 07:36:55 | ferra.ru

Продакты в Китае: как мы искали вдохновение для 2ГИС в стране, где навигация — это искусство
30.06.2025 07:35:47 | Хабр

Пропуск разминки и другие вредные фитнес-привычки в 40+ лет
30.06.2025 07:30:22 | ferra.ru

Телефон с кошачьим ушком и экраном 3,5 дюйма — Xiaomi представила Duoqin K25 за $110
30.06.2025 07:29:55 | ferra.ru

Владельцы PS5 столкнулись с массовым перегревом консоли при игре в Death Stranding 2
30.06.2025 07:22:55 | ferra.ru

Смотреть все

НОВОСТИ

Упаковщикам киндер-сюрпризов в Москве предлагают до 160 тысяч рублей
31.03.2026 08:13:34 | Life.ru

В ЛНР три танка ВСУ стреляли по своим при отступлении в 2022 году
31.03.2026 08:11:17 | Life.ru

Франция решила подготовиться к войне с Россией
31.03.2026 08:11:06 | Lenta.ru

В научные институты Камчатки трудоустроили студентов-иностранцев магистратуры
31.03.2026 08:08:36 | ТАСС

За ночь расчёты ПВО сбили 92 украинских беспилотника над регионами России
31.03.2026 08:06:00 | Life.ru

Анонсирован продвинутый симулятор автомеханика Car Mechanic Simulator 2026 с кооперативом и другими улучшениями
31.03.2026 08:05:53 | PlayGround.ru

Роснедра: санкции принципиально не поменяли геологоразведку России
31.03.2026 08:05:19 | ТАСС

На Камчатке в 2025 году преступность снизилась почти на 8%
31.03.2026 08:05:18 | ТАСС

Минск: Чукотка готова закупить белорусской техники на 3 миллиарда рублей
31.03.2026 08:04:00 | Российская Газета

Заммэра Ликсутов: москвичей призвали "переобуть" свои автомобили
31.03.2026 08:02:22 | ТАСС

Глава МИД Пакистана 31 марта прибывает в КНР для обсуждения конфликтов в мире
31.03.2026 08:00:42 | ТАСС

Модель OnlyFans раскрыла самые дикие запросы мужчин
31.03.2026 08:00:36 | Lenta.ru

Роснедра: в РФ готовят к разработке новые месторождения дефицитных видов сырья
31.03.2026 08:00:35 | ТАСС

PTI: поврежденный в Иране самолет должен был забрать в Индии медикаменты
31.03.2026 08:00:29 | ТАСС

Глава Роснедр Казанов: открытие месторождений — это творческий процесс
31.03.2026 08:00:01 | ТАСС

Минобороны выпустило заявление после атаки ВСУ на крупнейший нефтеналивной порт Балтики
31.03.2026 07:58:05 | Lenta.ru

Силы ПВО за ночь сбили над Россией 92 БПЛА
31.03.2026 07:57:35 | Коммерсантъ

Проектор с диагональю до 150 дюймов и поворотными динамиками с поддержкой Dolby Audio. В Европе выходит Anker Nebula P1i
31.03.2026 07:57:00 | iXBT.com

Девушку обвинили в истязании 11-летней российской школьницы
31.03.2026 07:56:04 | Lenta.ru

Судья постановил заморозить ключевую реформу либертарианца Милея
31.03.2026 07:56:00 | Российская Газета

Федерация конного спорта согласовала нейтральный статус всаднице Севальневой
31.03.2026 07:55:42 | ТАСС

Бригада ВСУ «Карма» наносит удары по Курской области
31.03.2026 07:53:01 | Life.ru

Проектор D1 Air за 130 долларов работает без приставок, настраивается сам и питается даже от внешнего аккумулятора
31.03.2026 07:52:00 | iXBT.com

Стало известно о новой тактике ВСУ в ДНР
31.03.2026 07:51:00 | Lenta.ru

В Приморье женщине удалили опухоль, которая заместила почку
31.03.2026 07:50:34 | ТАСС

Российский игрок НХЛ назвал недостающие вещи в Канаде
31.03.2026 07:50:17 | Lenta.ru

Над регионами РФ сбили за ночь 92 украинских БПЛА
31.03.2026 07:49:55 | ТАСС

Анохин: в Смоленской области активно развивается настольный теннис
31.03.2026 07:49:35 | ТАСС

Глава МИД Финляндии рассказала, как "охота" за дронами ВСУ испортила ей выходной
31.03.2026 07:49:00 | Российская Газета

На западе Москвы выполнили более половины работ по строительству газопровода
31.03.2026 07:47:29 | ТАСС

Госдолг России резко вырос
31.03.2026 07:46:26 | Lenta.ru

В Крыму 15 км трассы "Новороссия" расширят до четырех полос
31.03.2026 07:46:22 | ТАСС

Побывавший в Африке россиянин назвал правила для возвращения оттуда живым и с паспортом
31.03.2026 07:46:19 | Lenta.ru

Кричащего «мне терять нечего» мужчину с ножами уложили приемом самбо в российском городе
31.03.2026 07:45:29 | Lenta.ru

В результате атаки беспилотников в Ленобласти повреждён порт Усть-Луга
31.03.2026 07:45:22 | Life.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro