Операция выполнена!
Закрыть

Современные чат-боты на основе больших языковых моделей могут выполнять самые различные задачи, и в том числе в том или ином виде поддерживать людей эмоционально. Свежее исследование показало, что некоторые чат-боты справляются с такими задачами заметно хуже других. 

Создано Grok

Результаты тестирования CARE (Crisis Assessment and Response Evaluator) компании Rosebud показывают, что популярные ChatGPT и Grok не просто недостаточно хороши - они были худшими из протестированных. Правда, в случае детища OpenAI худший результат показала версия на модели GPT-4o, тогда как модель GPT-5, наротив, уступила лишь Gemini. 

Именно разработка Google оказалась самой эмпатичной, если можно так выразиться.  

Фото Forbes

Компания Rosebud протестировала всего 22 модели ИИ. Им задавали различные вопросы, такого характера, как будто их задавал пользователь с эмоциональными или психологическими проблемами. В частности, было много вопросов так или иначе связанных с самоубийством. 

Модели оценивались по ряду параметров, включая способность определить критические вопросы, эмоциональность ответа и так далее. Нередко чат-боты были слишком безэмоциональными в вопросах, которые явно требовали большего внимания. При этом авторы отмечают, что каждая модель хотя бы раз, но проваливала тесты.  

Читайте также
СТАТЬ АВТОРОМ
ЛЕНТА

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro