
Системы искусственного интеллекта испытывают трудности с пониманием динамических социальных взаимодействий, значительно отставая от человеческих возможностей из-за ограничений в том, как эти модели обрабатывают сложные сценарии реального мира.
Недавнее исследование, проведенное учеными из Университета Джонса Хопкинса, показало, что люди превосходят текущие модели ИИ в точном описании и интерпретации социальных взаимодействий в динамических сценах. Эта способность имеет решающее значение для таких технологий, как автономные транспортные средства и вспомогательные роботы, которые в значительной степени полагаются на ИИ для безопасной навигации в реальных условиях.
Исследование подчеркивает, что существующие системы ИИ испытывают трудности с пониманием нюансов социальной динамики и контекстуальных сигналов, необходимых для эффективного взаимодействия с людьми. Кроме того, результаты показывают, что это ограничение может быть обусловлено фундаментальной архитектурой и инфраструктурой текущих моделей ИИ.

Тесты показали, что модели ИИ, независимо от размера или данных, на которых они были обучены, оказались хуже людей. Видеомодели не смогли точно описать, что делали люди в показанных видеороликах. Даже модели изображений, которым давали серию неподвижных кадров для анализа, не могли надежно определить, общались ли люди. Языковые модели лучше предсказывали поведение человека, в то время как видеомодели лучше предсказывали нейронную активность в мозге. По словам исследователей, результаты резко контрастируют с успехами ИИ в анализе неподвижных изображений.
«Недостаточно просто увидеть изображение и распознать объекты и лица. Это был первый шаг, который продвинул нас далеко вперед в ИИ. Но реальная жизнь не статична. Нам нужен ИИ, чтобы понимать историю, которая разворачивается на сцене. Понимание отношений, контекста и динамики социальных взаимодействий — это следующий шаг, и это исследование предполагает, что в разработке модели ИИ может быть слепое пятно», — сказала аспирантка Кэти Гарсия.
Исследователи полагают, что это связано с тем, что нейронные сети искусственного интеллекта были созданы на основе инфраструктуры той части мозга, которая обрабатывает статические изображения, а эта часть мозга отличается от той, которая обрабатывает динамические социальные сцены.
Есть много нюансов, но главный вывод заключается в том, что ни одна из моделей ИИ не может соответствовать реакциям человеческого мозга и поведения на сцены по всем направлениям, как это происходит со статическими сценами. Я думаю, что есть что-то фундаментальное в том, как люди обрабатывают сцены, чего не хватает этим моделям.
-
05.05.2025 12:09:00 | iXBT.com
05.05.2025 12:02:00 | iXBT.com
05.05.2025 11:45:00 | iXBT.com
05.05.2025 11:40:00 | iXBT.com
05.05.2025 11:39:00 | iXBT.com
05.05.2025 11:29:00 | iXBT.com
05.05.2025 11:27:00 | iXBT.com
05.05.2025 11:22:00 | iXBT.com
05.05.2025 11:20:00 | iXBT.com
05.05.2025 11:11:00 | iXBT.com
05.05.2025 11:11:00 | iXBT.com
05.05.2025 11:05:08 | TechCult.ru
05.05.2025 11:01:00 | iXBT.com
05.05.2025 10:57:00 | iXBT.com
05.05.2025 10:53:00 | iXBT.com
05.05.2025 10:53:00 | iXBT.com
05.05.2025 10:44:00 | iXBT.com
05.05.2025 10:35:00 | iXBT.com
05.05.2025 10:14:00 | iXBT.com
05.05.2025 10:12:00 | iXBT.com
05.05.2025 10:05:00 | iXBT.com
05.05.2025 10:01:00 | iXBT.com
05.05.2025 09:55:00 | iXBT.com
05.05.2025 09:53:00 | iXBT.com
05.05.2025 09:49:00 | iXBT.com
05.05.2025 09:46:00 | iXBT.com
05.05.2025 09:41:00 | iXBT.com
05.05.2025 09:34:00 | iXBT.com
05.05.2025 09:23:00 | iXBT.com
05.05.2025 09:16:00 | iXBT.com
05.05.2025 09:10:00 | iXBT.com
05.05.2025 09:09:00 | iXBT.com
05.05.2025 08:53:00 | iXBT.com
05.05.2025 08:46:00 | iXBT.com
-
05.05.2025 19:30:35 | ferra.ru
05.05.2025 19:14:29 | vc.ru
05.05.2025 18:45:58 | ferra.ru
05.05.2025 16:42:32 | vc.ru
05.05.2025 16:05:33 | Хабр
05.05.2025 15:45:33 | ferra.ru
05.05.2025 15:00:34 | ferra.ru
05.05.2025 14:44:02 | vc.ru
05.05.2025 14:44:02 | vc.ru
05.05.2025 14:22:46 | Хабр
05.05.2025 14:15:49 | ferra.ru
Техническая поддержка проекта ВсеТут