Мультимодальные модели – грубый и дорогой инструмент

info@vsetut.pro

Стать автором

Вернуться

15.04.2026 16:10:08 | Хабр

Хабы: Искусственный интеллект, Интерфейсы, Веб-разработка, Машинное обучение, Веб-дизайн

Пока все в погоне за всё более универсальными ИИ-агентами пытаясь создать тот самый AGI по нашему подобию, мне кажется полезным спуститься на уровень ниже и посмотреть на более приземлённую инженерную проблему.

Мы неплохо научили модели работать с текстом, кодом, изображениями и инструментами. Мы научили их вызывать функции, научили эти ИИ писать собственные инструменты каждый раз для задач которые повторяются миллионы раз, видеть как мы(фото), думать как мы(рассуждения). Мы научились – дообучать их под новые сценарии через fine-tuning.

Но если убрать хайп, остаётся неприятный факт: во многих практических задачах модели по-прежнему работают грубо и дорого. Особенно хорошо это видно на фронтенде.

Сегодня у модели есть два типовых способа "увидеть" сайт. Первый – читать код: HTML, CSS, JS, и серверную логику (если вы предоставили модели доступ). Второй – смотреть на скриншоты, а в более дорогом варианте – на видео (хоть и таких решений я не видел, и скорее не видео, а слайд-шоу, но считаю логичным внедрением для некоторых сценариев).

И эти оба подхода неудобны. А обучать модель внутреннему представлению через имеющиеся виды зрения – как правильно, – как распознать кнопку итд – дорого, требует ещё больших данных, больше вычислений. А банально небольшое отклонение стиля уже ломает верстку. Да с бэкендом мы можем строить среду в которой благодаря RL обучению модель научится решать задачу.

Но как быть с интерфейсом? Фото дает слишком много шума в виде пикселей, а код дает много лишнего шума в виде разметки, скриптов. Когда обычному пользователю: не нужно смотреть на каждый серый пиксель фона кнопки, или изучать все стили, js и html разметку сайта, он видит овал на котором написано "войти" – и понимает что это – кнопка, особенно, если при наведении или нажатии цвет фона кнопки меняется.

Подробнее

Читайте также

Разработчик оборудования для фильтрации трафика «Градиент» в 2025 году получил заём на 11,35 млрд рублей от «Ростелекома» и неназванных кредиторов — CNews
15.04.2026 16:04:02 | vc.ru

Разговоры ничего не стоят. Код тоже
15.04.2026 15:55:09 | Хабр

Российские ученые вырастят паращитовидную железу на МКС
15.04.2026 15:52:40 | ferra.ru

Проверки физических лиц: с кого начнет ФНС
15.04.2026 15:35:12 | Хабр

Специалисты МЭИ разработали устройство для испытаний высоковольтных муфт
15.04.2026 15:09:47 | ferra.ru

Топ-10 бесплатных нейросетей для создания видео в 2026 году
15.04.2026 15:02:45 | Хабр

Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия
15.04.2026 14:57:35 | Хабр

Российский препарат от рака крови прошел клинические испытания
15.04.2026 14:48:47 | ferra.ru

Разработка нового статического анализатора: PVS-Studio JavaScript
15.04.2026 14:47:18 | Хабр

Поиск уязвимостей ПО: базовый минимум или роскошный максимум
15.04.2026 14:42:52 | Хабр

Почему оценка персонала не работает как инструмент управления
15.04.2026 14:42:38 | Хабр

Власти ЕС представили единое приложение для проверки возраста на фоне инициатив по запрету соцсетей для подростков в некоторых европейских странах
15.04.2026 14:23:38 | vc.ru

Игровой смартфон OnePlus Ace 6 Ultra показали, но вряд ли он покинет Китай
15.04.2026 14:23:22 | ferra.ru

“Гифка” со сценой из “Друзей” «съела» 377 гигабайт и сломала резервное копирование сайта
15.04.2026 14:18:33 | ferra.ru

Пермские ученые научили ИИ лечить деревья по фото
15.04.2026 14:14:49 | ferra.ru

Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50%
15.04.2026 14:13:35 | Хабр

В России создали цифровую модель для ремонта мостов
15.04.2026 13:51:58 | ferra.ru

Я ушёл из найма, пожарил мешок зерна и построил производство на 14 млн в месяц
15.04.2026 13:24:09 | Хабр

Я ушёл из найма, жарю зерно и продаю на маркетплейсах на 14 млн в месяц
15.04.2026 13:24:09 | Хабр

Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет
15.04.2026 13:21:41 | Хабр

«Обидно, что уже нет шанса узнать, как бы Мах развивался без принуждения и блокировок. Я бы хотел честной борьбы за пользователя»
15.04.2026 13:18:22 | vc.ru

Как я сделал Claude мультимодальным, подключив к нему Qwen Omni
15.04.2026 13:16:30 | Хабр

Подпольных майнеров предлагают карать миллионными штрафами
15.04.2026 13:14:46 | it-world

[Перевод] Как приглашение на вакансию мечты превращается в атаку
15.04.2026 13:01:28 | Хабр

Infrastructure as Code: философия и лучшие практики IaC
15.04.2026 13:00:59 | Хабр

Почему соло-разработчик на ИИ в 2026 году быстрее трёх человек в 2024-м (и как это попробовать за 700 ₽ в РФ)
15.04.2026 12:55:11 | Хабр

Google добавила в Chrome функцию «навыков» для сохранения и быстрого использования промптов в боковом чате с Gemini
15.04.2026 12:47:31 | vc.ru

Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты
15.04.2026 12:42:32 | Хабр

nxs-universal-chart v3.0: новое поколение универсального Helm-чарта
15.04.2026 12:42:24 | Хабр

Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут
15.04.2026 12:39:52 | Хабр

«Все идеи на стол»: митап как способ вывести проект из тупика
15.04.2026 12:28:02 | Хабр

[Перевод] Сегодня я узнал нечто новое о GPU благодаря багу в своей игре
15.04.2026 12:23:57 | Хабр

«Яндекс» начал предупреждать, что «из-за действующих ограничений» запрещает доступ к своим сервисам с включённым VPN
15.04.2026 12:23:06 | vc.ru

Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать
15.04.2026 12:22:41 | Хабр

Игровой ноутбук Honor WIN H9 получил шесть вентиляторов и RTX 5060
15.04.2026 12:18:34 | ferra.ru

Смотреть все

НОВОСТИ

В России раскрыли план Трампа против НАТО за отказ бомбить Иран
15.04.2026 21:39:00 | Lenta.ru

В России назвали способ стремительно продвинуться в зоне СВО
15.04.2026 21:38:05 | Lenta.ru

Нарышкин предупредил о «политическом цунами» в Европе
15.04.2026 21:37:36 | Life.ru

Болельщиков оштрафовали за броски бутылок на поле на матче "Зенит" - "Спартак"
15.04.2026 21:35:37 | ТАСС

Нарышкин: Твёрдость Ирана доказала конец эпохи диктата в мире
15.04.2026 21:33:52 | Life.ru

Лавров и глава МИД Саудовской Аравии провели телефонный разговор
15.04.2026 21:30:00 | ТАСС

Нововведения не снизили интереса иностранных студентов к БФУ им. И. Канта
15.04.2026 21:29:31 | ТАСС

Судьи отменили два гола минского "Динамо" в матче плей-офф с "Ак Барсом" подряд
15.04.2026 21:29:08 | ТАСС

Росавиация разрешила полёты в Израиль
15.04.2026 21:29:04 | Life.ru

Космонавт Роскосмоса выступил на сессии ООН
15.04.2026 21:28:01 | ТАСС

Суд избрал меру пресечения девушке за кальян на куличе
15.04.2026 21:26:04 | Life.ru

Авиакомпаниям России разрешили полеты в Израиль с 16 апреля по 15 мая
15.04.2026 21:26:00 | Российская Газета

WSJ: Иран теряет свыше 400 млн долларов в день из-за морской блокады
15.04.2026 21:26:00 | Российская Газета

Трампа предупредили о проблеме из-за Ирана
15.04.2026 21:25:43 | Lenta.ru

В России назвали условие для справедливого мира на Украине
15.04.2026 21:25:11 | Lenta.ru

В Москве прошла первая автомобильная премия «Выбор Коммерсанта»
15.04.2026 21:24:08 | Life.ru

В ДНР из-за атак ВСУ пострадали четыре человека
15.04.2026 21:23:47 | ТАСС

Зеленский: Норвегия выделит более $500 млн для обеспечения дронами ВСУ
15.04.2026 21:23:47 | ТАСС

Главу «Карводоканала» отправили под домашний арест после отравлений в Дагестане
15.04.2026 21:19:59 | Life.ru

Певица Жасмин помогла семье из Дагестана, лишившейся жилья из-за потопа
15.04.2026 21:18:22 | Life.ru

Анохин рассказал о 56 мерах поддержки участников СВО в Смоленской области
15.04.2026 21:17:58 | ТАСС

В США высказались о повторном снятии санкций с российской нефти
15.04.2026 21:17:30 | Lenta.ru

Белый дом высказался о продлении перемирия в Иране
15.04.2026 21:16:00 | Lenta.ru

Матвиенко назвала гостеприимной обстановку на 152-й ассамблее МПС
15.04.2026 21:14:33 | ТАСС

В Краснодарском крае около 400 памятных мест приведут в порядок
15.04.2026 21:12:17 | ТАСС

Tasnim: Иран рассматривает только Исламабад как место продолжения диалога с США
15.04.2026 21:11:14 | ТАСС

Tasnim: Иран готов рассматривать только Исламабад как место продолжения диалога с США
15.04.2026 21:11:14 | ТАСС

Эксперт Долгушина рассказала, что россиянки стали чаще посещать гинекологов
15.04.2026 21:10:03 | ТАСС

Зеленский пожаловался на связанный с Россией факт о Трампе
15.04.2026 21:10:00 | Lenta.ru

Зеленский рассказал о нарушенном Трампом обещании
15.04.2026 21:10:00 | Lenta.ru

Нарышкин: При урегулировании на Украине в Европе поймут про обман о поражении РФ
15.04.2026 21:09:46 | Life.ru

В Северной Осетии приняли детей и педагогов из Дагестана
15.04.2026 21:09:14 | ТАСС

Росавиация разрешила полеты в Израиль с 16 апреля по 15 мая
15.04.2026 21:05:39 | ТАСС

В США два пилота мяукали и лаяли во время радиоэфира
15.04.2026 21:05:00 | Российская Газета

Украину предупредили о последствиях победы Мадьяра
15.04.2026 21:05:00 | Lenta.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro