
Google выпустила новую модель искусственного интеллекта Gemini 2.5 Computer Use. Эта модель позволяет ИИ-агентам взаимодействовать с веб-сайтами и пользовательскими интерфейсами так же, как это делает человек, по утверждению Google. Она уже доступна в публичном ознакомительном режиме через API Gemini в Google AI Studio и Vertex AI.
Модель основана на возможностях визуального восприятия и рассуждения Gemini 2.5 Pro. Она может выполнять широкий спектр действий в браузере, таких как нажатие клавиш, ввод текста, прокрутка, наведение курсора, открытие раскрывающихся списков и навигация по URL-адресам. Google заявляет, что модель превосходит конкурирующие инструменты в нескольких бенчмарках, включая Online-Mind2Web, WebVoyager и AndroidWorld, сохраняя при этом меньшую задержку.

В отличие от традиционных моделей ИИ, использующих API, Gemini 2.5 Computer Use обрабатывает скриншоты веб-интерфейсов и генерирует в ответ конкретные действия. Агент получает запрос на выполнение задачи, скриншот и историю недавних действий. Затем он анализирует интерфейс и выдает действие, например, нажатие кнопки или ввод данных в поле. Действие выполняется на стороне клиента, а новый скриншот отправляется обратно модели для продолжения выполнения задачи в цикле.
Google продемонстрировала эффективность модели на примерах, где агент сортирует стикеры на цифровой доске и переносит информацию о домашних животных с одного сайта в CRM-систему.
В настоящее время модель поддерживает 13 действий и лучше всего работает в веб-браузерах. Google заявила, что модель пока не оптимизирована для задач на уровне настольных ОС, хотя и продемонстрировала потенциал в мобильных бенчмарках.
-
09.10.2025 08:23:00 | iXBT.com
09.10.2025 08:17:00 | iXBT.com
09.10.2025 08:07:00 | iXBT.com
09.10.2025 07:58:00 | iXBT.com
09.10.2025 07:52:00 | iXBT.com
09.10.2025 07:41:00 | iXBT.com
09.10.2025 07:19:00 | iXBT.com
09.10.2025 07:07:00 | iXBT.com
09.10.2025 06:25:00 | iXBT.com
09.10.2025 04:14:00 | iXBT.com
09.10.2025 03:46:00 | iXBT.com
09.10.2025 03:15:00 | iXBT.com
09.10.2025 02:54:00 | iXBT.com
09.10.2025 02:25:00 | iXBT.com
09.10.2025 02:08:00 | iXBT.com
09.10.2025 01:11:23 | Ведомости
09.10.2025 01:05:33 | Ведомости
08.10.2025 22:18:00 | iXBT.com
08.10.2025 20:33:00 | iXBT.com
08.10.2025 20:28:00 | iXBT.com
08.10.2025 20:13:00 | iXBT.com
08.10.2025 20:10:00 | iXBT.com
08.10.2025 20:01:00 | iXBT.com
08.10.2025 19:50:00 | iXBT.com
08.10.2025 19:43:00 | iXBT.com
08.10.2025 19:03:00 | iXBT.com
08.10.2025 18:03:00 | iXBT.com
08.10.2025 17:34:00 | iXBT.com
08.10.2025 17:24:00 | iXBT.com
08.10.2025 17:21:00 | iXBT.com
08.10.2025 17:02:00 | iXBT.com
08.10.2025 16:09:00 | iXBT.com
08.10.2025 16:06:00 | iXBT.com
-
09.10.2025 10:48:03 | vc.ru
09.10.2025 10:00:32 | ferra.ru
09.10.2025 09:54:18 | vc.ru
09.10.2025 09:45:15 | ferra.ru
09.10.2025 08:35:49 | vc.ru
09.10.2025 08:18:34 | ferra.ru
09.10.2025 08:15:55 | ferra.ru
09.10.2025 08:04:33 | ferra.ru
09.10.2025 07:57:33 | ferra.ru
09.10.2025 07:35:22 | Хабр
09.10.2025 07:32:40 | Хабр
09.10.2025 07:29:31 | ferra.ru
09.10.2025 07:22:31 | ferra.ru
09.10.2025 07:15:30 | ferra.ru
09.10.2025 07:08:30 | ferra.ru
09.10.2025 07:01:29 | ferra.ru
09.10.2025 07:00:00 | ГАСТРОНОМЪ
09.10.2025 06:55:10 | Хабр
Техническая поддержка проекта ВсеТут