
Компания OpenAI подтвердила, что её новая языковая модель GPT-4.5 генерирует недостоверные ответы в 37% случаев, согласно внутреннему инструменту оценки фактологичности SimpleQA. Эти данные, озвученные в официальном релизе, вызвали дискуссию о надёжности современных алгоритмов ИИ.
Несмотря на заявления о прогрессе — предыдущие версии GPT-4o и o3-mini демонстрировали 61,8% и 80,3% галлюцинаций соответственно, — даже «лучшие модели» всё ещё остаются неточными.

«Сейчас даже самые продвинутые системы способны генерировать текст без вымысла лишь в 35% случаев», — заявила Вентинг Чжао, соавтор исследования о галлюцинациях ИИ из Корнеллского университета. Её комментарий подтверждает системную проблему отрасли: дорогостоящие модели, позиционируемые как инструменты с «человекообразным интеллектом», часто ошибаются в базовых фактах.
OpenAI, оцениваемая в сотни миллиардов долларов, пытается смягчить реакцию, акцентируя внимание на снижении ошибок по сравнению с прошлыми версиями. Однако критики отмечают, что подобные сравнения лишь маскируют стагнацию в развитии технологий. После впечатляющего старта ChatGPT компания столкнулась с замедлением прогресса, и GPT-4.5, судя по данным, не стал прорывом.
Эксперты сходятся во мнении: для преодоления кризиса доверия индустрии необходимы фундаментальные улучшения, а не косметические апдейты. Пока же пользователи вынуждены мириться с тем, что нейросети регулярно «придумывают» факты — будь то ответ на простой вопрос или анализ сложных данных.
-
02.03.2025 22:13:00 | iXBT.com
02.03.2025 21:16:00 | iXBT.com
02.03.2025 21:15:00 | iXBT.com
02.03.2025 21:01:00 | iXBT.com
02.03.2025 20:50:00 | iXBT.com
02.03.2025 20:33:00 | iXBT.com
02.03.2025 20:14:00 | iXBT.com
02.03.2025 19:44:00 | iXBT.com
02.03.2025 19:29:00 | iXBT.com
02.03.2025 18:58:00 | iXBT.com
02.03.2025 18:41:00 | iXBT.com
02.03.2025 18:15:00 | iXBT.com
02.03.2025 17:52:00 | iXBT.com
02.03.2025 17:23:00 | iXBT.com
02.03.2025 16:50:00 | iXBT.com
02.03.2025 16:28:00 | iXBT.com
02.03.2025 16:06:00 | iXBT.com
02.03.2025 16:04:00 | iXBT.com
02.03.2025 15:58:00 | iXBT.com
02.03.2025 15:55:57 | TechCult.ru
02.03.2025 15:17:00 | iXBT.com
02.03.2025 14:26:00 | iXBT.com
02.03.2025 14:16:00 | iXBT.com
02.03.2025 14:03:00 | iXBT.com
02.03.2025 14:02:00 | iXBT.com
02.03.2025 13:49:00 | iXBT.com
02.03.2025 12:09:00 | iXBT.com
02.03.2025 12:04:00 | iXBT.com
02.03.2025 11:51:38 | TechCult.ru
02.03.2025 11:24:00 | iXBT.com
02.03.2025 11:24:00 | iXBT.com
02.03.2025 11:08:00 | iXBT.com
02.03.2025 10:14:00 | iXBT.com
02.03.2025 09:55:00 | iXBT.com
-
03.03.2025 11:18:32 | vc.ru
03.03.2025 11:15:23 | ferra.ru
03.03.2025 10:07:19 | it-world
03.03.2025 10:00:36 | ferra.ru
03.03.2025 09:00:29 | Хабр
03.03.2025 09:00:19 | ferra.ru
03.03.2025 08:50:24 | Хабр
03.03.2025 08:45:56 | ferra.ru
03.03.2025 08:34:56 | ferra.ru
03.03.2025 08:24:45 | ferra.ru
03.03.2025 08:16:14 | Хабр
03.03.2025 08:10:41 | ferra.ru
03.03.2025 07:54:06 | Хабр
03.03.2025 07:46:38 | ferra.ru
03.03.2025 07:39:15 | ferra.ru
03.03.2025 07:31:57 | Хабр
03.03.2025 07:30:16 | ferra.ru
03.03.2025 07:22:18 | Хабр
Техническая поддержка проекта ВсеТут