Исследование набора данных для обучения LVLM — SeeClick (Web Data)

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Исследование набора данных для обучения LVLM — SeeClick (Web Data)

02.03.2025 18:53:49 | Хабр

Хабы: Python, Визуализация данных

В данной статье будет рассмотрен набор данных для обучения LVLM (Large Visual Language Model), который использовался авторами статьи "SeeClick: Harnessing GUI Grounding for Advanced Visual GUI Agents" при обучении модели SeeClick, которая показывает достаточно неплохие результаты, по сравнению с аналогичными решениями. Рассмотрен будет только набор данных, который использовался при обучении SeeClick для определения элементов на веб-страницах, полученный авторами этой модели с помощью Common Crawl (открытый репозиторий набора данных о веб-страницах).

Данная статья может быть полезна специалистам, которые начинают разрабатывать свою LVLM работающую со скриншотами пользовательского экрана (image-ориентированные), а не с содержимым HTML веб-приложения (text-ориентированные). В статье будет рассмотрена базовая работа с частью предоставляемого SeeClick набора данных (10000 размеченных изображений общим объёмом в 4.8 Гб).

Читать далее

Подробнее

Читайте также

Трамп заявил, что в криптовалютный резерв США войдут токены XRP, SOL и ADA — крипторынок отреагировал ростом
02.03.2025 18:51:20 | vc.ru

Трамп заявил, что в криптовалютный резерв США войдут BTC, ETH, XRP, SOL и ADA — крипторынок отреагировал ростом
02.03.2025 18:51:20 | vc.ru

Microsoft признала «жёсткое» замедление Проводника после очередного обновления
02.03.2025 18:45:00 | ferra.ru

История ERP
02.03.2025 18:44:34 | Хабр

Я рисовала еду руками 15 лет, но потом пришла нейросеть и изменила всё
02.03.2025 18:36:37 | Хабр

Обзор IT-Weekly: OpenAI выпустила ChatGPT-4.5, а DeepSeek торопится выпустить новую модель R2
02.03.2025 18:30:50 | it-world

Системы work management: выбор решения для команды
02.03.2025 18:07:46 | Хабр

В Telegram появится функция передачи изображения со смартфона на телевизор
02.03.2025 18:00:00 | ferra.ru

[Перевод] Исследуем монады в Rust через тестирование на основе свойств
02.03.2025 17:54:37 | Хабр

BadgerDB как бэкенд для LDAP-каталога
02.03.2025 17:15:39 | Хабр

Взрывное развитие китайского ИИ заставило OpenAI выпускать модели без улучшений
02.03.2025 17:15:00 | ferra.ru

Self-healing тесты и локальная LLM
02.03.2025 17:13:05 | Хабр

Руководство по Use Cases
02.03.2025 17:08:31 | Хабр

Есть ли open source в университетах — рассказывает Михаил Гущин, лидер сообщества «Открытый код ФКН ВШЭ»
02.03.2025 17:06:13 | Хабр

Как я пере-изобрел клавиатуру, а ребята из ВК ее заимствовали не сказав «спасибо»
02.03.2025 16:37:03 | Хабр

В Китае нашли пограничное укрепление старше Великой Китайской стены
02.03.2025 16:30:00 | ferra.ru

Что есть ERP
02.03.2025 16:08:10 | Хабр

Бэкапы без боли за 40 евро
02.03.2025 15:55:23 | Хабр

«Разум Титана» — финансовый ИИ-ассистент
02.03.2025 15:52:38 | Хабр

Web 3 как замена Web 2 в стандартных задачах и есть ли в этом смысл
02.03.2025 15:46:26 | Хабр

Учёные: в 2032 к Земле приблизится астероид, опаснее Челябинского метеорита
02.03.2025 15:45:00 | ferra.ru

Модифицируем алгоритм Брезенхэма для рейкаста в стиле Wolf3D
02.03.2025 15:35:40 | Хабр

Болевые точки платформы TOGAF
02.03.2025 15:32:03 | Хабр

Symfony + React: Основные проблемы и методы их решения
02.03.2025 15:04:13 | Хабр

Ученые собрали устройство, позволяющее пробовать видеоигры на вкус
02.03.2025 15:00:44 | ferra.ru

RE: «Закат удалёнки: почему сотрудников возвращают в офис»
02.03.2025 14:58:29 | Хабр

Рейтинг хостингов для сайта: Глубокий технический разбор хостинг провайдеров
02.03.2025 14:52:57 | Хабр

Google Таблицы получили ИИ для ускорения анализа данных и создания эффектов
02.03.2025 14:15:15 | ferra.ru

[Перевод] 3200% нагрузки на процессор
02.03.2025 13:32:30 | Хабр

Использование dax.do для произвольной схемы данных на основе перевода DAX в Contoso через Telegram бот
02.03.2025 13:30:18 | Хабр

Планшет Oppo Pad 4 Pro с мощным Snapdragon 8 Elite выйдет на рынок в апреле
02.03.2025 13:30:14 | ferra.ru

Мобильная разработка за неделю #577 (24 февраля — 2 марта)
02.03.2025 13:24:03 | Хабр

Путешествия помогают быстрее адаптироваться в эволюции
02.03.2025 13:05:08 | Хабр

Реализация постквантовых алгоритмов на Java и Go
02.03.2025 13:00:53 | Хабр

Цифровой архив с полнотекстовым поиском, в том числе по PDF и картинкам
02.03.2025 12:57:26 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Врач назвала отвращение к одному продукту признаком рака желудка
20.03.2026 20:33:24 | Lenta.ru

В Москве стартовал фестиваль культуры Ирана
20.03.2026 20:32:15 | ТАСС

Лыжница Непряева получила колоссальный опыт на международных стартах
20.03.2026 20:32:14 | ТАСС

В Минске одобрены проекты международных договоров с РФ
20.03.2026 20:30:00 | Российская Газета

Футболист Соболев рассказал о людях-паразитах в «Спартаке»
20.03.2026 20:30:00 | Lenta.ru

Бывший ведущий Первого канала назвал преимущество жизни в Израиле
20.03.2026 20:30:00 | Lenta.ru

Дмитриев назвал фейком информацию о предложении России по разведданным
20.03.2026 20:29:50 | ТАСС

Глава дипмиссии Белоруссии прокомментировал отключение в ЕС карт Visa трех банков страны
20.03.2026 20:29:14 | ТАСС

Мексика отправляет на Кубу четвертое судно с гуманитарной помощью
20.03.2026 20:29:07 | ТАСС

Поджог завода израильской компании Elbit в Чехии могут расценить как теракт
20.03.2026 20:29:00 | Российская Газета

Трамп высказался о заявленной Зеленским помощи Киева США на Ближнем Востоке
20.03.2026 20:25:00 | Российская Газета

Коростелев назвал успешным свой дебютный международный сезон
20.03.2026 20:24:53 | ТАСС

Зеленский испугался усиления России на фронте
20.03.2026 20:24:00 | Lenta.ru

Нидерландские военные покинули Ирак после перевода миссии НАТО в Европу
20.03.2026 20:22:33 | ТАСС

МИД России прокомментировал ДТП с участием скрывшегося сотрудника консульства Германии
20.03.2026 20:21:55 | Lenta.ru

Захарова ответила на заявление фон дер Ляйен словами Цветаевой
20.03.2026 20:19:04 | Lenta.ru

Россиянин возмутился качеством услуг на курорте богачей и захотел миллионную компенсацию
20.03.2026 20:18:03 | Lenta.ru

Гений или злодей? Как влияет эмоциональность Талалаева на "Балтику"
20.03.2026 20:16:31 | ТАСС

У названного в Госдуме похотливым самцом «Отца-героя» появился 33-й ребенок
20.03.2026 20:16:11 | Lenta.ru

РФ может к апрелю подписать соглашения с Сербией в сфере энергетики, космоса и медицины
20.03.2026 20:15:10 | ТАСС

В Европе назвали незаконной войну США против Ирана
20.03.2026 20:14:00 | Lenta.ru

Сбившему в Петербурге трех человек запретили покидать город и Ленобласть
20.03.2026 20:13:19 | ТАСС

Популярная ИИ-модель раскрыла детали о торговле данными пользователей
20.03.2026 20:11:27 | Lenta.ru

Милонов призвал запретить россиянам продажу зарубежных туров
20.03.2026 20:10:46 | Life.ru

Энэс повторил рекорд Гусева по набранным очкам за один регулярный сезон КХЛ
20.03.2026 20:10:35 | ТАСС

Охотники на вражеских "птиц": как добровольцы из приграничья уничтожают беспилотники ВСУ
20.03.2026 20:10:01 | ТАСС

Кабмин вводит запрет на майнинг в отдельных районах Забайкальского края и Бурятии
20.03.2026 20:09:56 | ТАСС

Кабмин запретил майнинг в Бурятии и Забайкалье до 2031 года
20.03.2026 20:09:56 | ТАСС

В КДК объяснили дисквалификацию Талалаева на четыре матча
20.03.2026 20:08:40 | ТАСС

Прокурор запросил 400 часов обязательных работ для рэпера-иноагента Оксимирона
20.03.2026 20:07:56 | ТАСС

Для рэпера Оксимирона запросили 400 часов обязательных работ
20.03.2026 20:07:56 | ТАСС

"Нафтогаз" сообщил о разрушении объектов инфраструктуры в Полтавской области
20.03.2026 20:07:37 | ТАСС

40-летняя звезда сериала «Деффчонки» похвасталась результатом похудения на препаратах
20.03.2026 20:07:13 | Lenta.ru

Кабмин учредил правила работы по увековечению памяти жертв нацистского геноцида
20.03.2026 20:06:17 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro