Действительно ли большие языковые модели галлюцинируют? Эксперимент

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Действительно ли большие языковые модели галлюцинируют? Эксперимент

28.08.2024 11:09:45 | Хабр

Хабы: Блог компании YADRO, Машинное обучение, Исследования и прогнозы в IT, Искусственный интеллект, Natural Language Processing

Существует мнение, что основная проблема больших языковых моделей — в склонности к галлюцинациям. Когда нейросеть генерирует текст с информацией, не связанной с запросом.

Меня зовут Полина, я инженер по разработке ПО искусственного интеллекта в YADRO. Вместе с коллегами я разрабатываю системы на базе генеративных моделей, в том числе вопросно-ответных ассистентов. В рамках одного из проектов мы вместе с экспертом команды Андреем Соколовым задались вопросом: действительно ли проблема галлюцинаций так актуальна для современных предобученных LLM в вопросно-ответном сценарии.

Для этого мы провели эксперимент на собранном датасете. Попутно рассказали про модели-трансформеры и дали строгое определение понятию «галлюцинации LLM». Все подробности — под катом.

Читать далее

Подробнее

Читайте также

Минэкономразвития предложило внести в список оснований для проверок бизнеса работу самозанятых как штатных сотрудников — РБК
28.08.2024 11:07:42 | vc.ru

Бизнес обяжут участвовать в подготовке специалистов
28.08.2024 11:03:45 | it-world

[Перевод] Workspaces в IntelliJ IDEA
28.08.2024 11:00:33 | Хабр

Российский Минздрав разработает семь новых медизделий для кардиологии
28.08.2024 10:49:56 | ferra.ru

ML Meetup Wildberries 11/09
28.08.2024 10:43:32 | Хабр

Из лета в зиму: как хакеры сменили сезон для виртуального склада на Standoff
28.08.2024 10:35:22 | Хабр

Самарский университет создал новый гибкий фотодетектор для медицины и космоса
28.08.2024 10:30:26 | ferra.ru

Япония завершила лунную миссию SLIM: модуль замолчал навсегда
28.08.2024 10:30:00 | ferra.ru

От десятков до сотен тысяч RPS: как мы создали API, который развивается 10 лет без дропа обратной совместимости
28.08.2024 10:24:09 | Хабр

Натурфилософия стакана
28.08.2024 10:15:23 | Хабр

Как развернуть сайт на VDS
28.08.2024 10:13:36 | Хабр

[Перевод] Гладкое бритье: Razor Pages для разработчиков веб-форм
28.08.2024 10:07:17 | Хабр

Генеральный директор «Пластик Лоджик» арестован
28.08.2024 10:05:51 | it-world

Банки ОАЭ начали блокировать российские платежи за китайскую электронику — «Ъ»
28.08.2024 09:56:32 | vc.ru

Контроллеры преткновения и другие рассказы о буднях сервисной поддержки в новых реалиях
28.08.2024 09:50:20 | Хабр

Как выстроить цикл разработки в Kaiten: опыт IT-стартапа от «АвтоВАЗа»
28.08.2024 09:47:36 | Хабр

Ученые разработали устройство для быстрой диагностики рака мозга
28.08.2024 09:45:00 | ferra.ru

[Перевод] Совершили ли швейцарские учёные прорыв в области шоколада?
28.08.2024 09:44:13 | Хабр

Как получать SMS при колебаниях курса биткоина с ByBit API и SMS API
28.08.2024 09:37:28 | Хабр

Будущее ИТ-образования: диплом или практика? Кто победит в новой реальности индустрии?
28.08.2024 09:35:45 | it-world

Как мы применили Скрамбан и остались довольны: Кейс Инферит Клаудмастер
28.08.2024 09:35:04 | Хабр

Нейрогенез. Что это, и можно ли его прокачать?
28.08.2024 09:32:46 | Хабр

Развод на Договорных матчах. Как меня пытались обмануть
28.08.2024 09:25:49 | Хабр

Что на DotNext 2024 расскажут о практиках .NET-разработки, архитектуре, «кишочках» .NET и не только
28.08.2024 09:15:12 | Хабр

Как понять, что самолет управляем
28.08.2024 09:15:04 | Хабр

В ОАЭ начали блокировать платежи российских компаний
28.08.2024 09:13:35 | it-world

Как научить компьютер различать цвета?
28.08.2024 09:01:56 | Хабр

GPU для дата-центров
28.08.2024 09:00:57 | Хабр

Новый метод стимуляции мозга улучшил симптомы депрессии за пять дней
28.08.2024 09:00:00 | ferra.ru

Российские операторы начали устанавливать решения, которые «преодолевают замедление YouTube» — «Ъ»
28.08.2024 08:53:57 | vc.ru

Полулегальный радиоконструктор с Aliexpress
28.08.2024 08:45:50 | Хабр

Акционеры Qiwi утвердили смену названия на NanduQ
28.08.2024 08:36:27 | vc.ru

Samsung будет обновлять ПО телевизоров 7 лет. Но старых моделей это не касается
28.08.2024 08:31:20 | ferra.ru

[Перевод] После гравитационного манёвра, проведённого за счёт Земли и Луны, JUICE направляется к Венере и дальше
28.08.2024 08:25:46 | Хабр

Актуальные данные: зачем нужен цифровой дашборд для перевозок по железной дороге
28.08.2024 08:25:33 | Хабр

Смотреть все

СТАТЬ АВТОРОМ

НОВОСТИ

Генпрокурор РФ Краснов указал на использование ИИ в борьбе с преступностью
16.09.2025 22:29:28 | РЕН ТВ

Трамп указал на очень серьезные проблемы на Украине
16.09.2025 22:25:38 | Lenta.ru

Женщина погибла при детонации взрывоопасного предмета в Донецке
16.09.2025 22:23:55 | РЕН ТВ

Двухлетняя девочка внесена в базу "Миротворца"
16.09.2025 22:22:51 | ТАСС

Зеленского и его окружение обвинили в потере связи с реальностью
16.09.2025 22:21:10 | Lenta.ru

Власти США не нашли соучастников у убийцы Кирка
16.09.2025 22:20:41 | РЕН ТВ

"Спартак" обыграл ЦСКА в матче Континентальной хоккейной лиги
16.09.2025 22:20:24 | ТАСС

Трамп оценил телефонный разговор с Моди
16.09.2025 22:19:00 | Lenta.ru

Обвиняемый в мошенничестве экс-главред российского Playboy Ляпоров ушел на СВО
16.09.2025 22:17:31 | ТАСС

The Times: Британия не хочет вводить вторичные санкции против Индии
16.09.2025 22:17:06 | ТАСС

В зоне СВО ликвидировали подполковника и двух офицеров ВСУ
16.09.2025 22:16:27 | Lenta.ru

У бывшего главы Верховного суда Адыгеи изъяли активы на 13 миллиардов рублей
16.09.2025 22:15:00 | Lenta.ru

Нетаньяху признался, что никогда не считал Катар нейтральной страной
16.09.2025 22:12:07 | РЕН ТВ

Нетаньяху заявил, что никогда не считал Катар нейтральным игроком
16.09.2025 22:12:07 | РЕН ТВ

«Самая сексуальная в мире судья» показала грудь в леопардовом бюстгальтере
16.09.2025 22:11:52 | Lenta.ru

Навроцкий не подтвердил готовность сбивать БПЛА над Украиной у границы с Польшей
16.09.2025 22:09:59 | Life.ru

Псковские власти помогут выдворенной Латвией семейной паре пенсионеров
16.09.2025 22:07:44 | ТАСС

Псковские власти помогут семейной паре пенсионеров, выдворенных Латвией
16.09.2025 22:07:44 | ТАСС

Foreign Policy: Зеленский теряет связь с реальностью
16.09.2025 22:07:30 | ТАСС

"Страна.ua": Экс-вратаря сборной Украины поймали при попытке бегства за границу
16.09.2025 22:07:00 | Российская Газета

«Нужно гордиться»: Телеведущая Шахова запустила проект о несправедливо забытых российских гениях
16.09.2025 22:05:10 | Life.ru

Пушилин: в ДНР из-за киевской агрессии погибла женщина
16.09.2025 22:03:02 | ТАСС

Трамп заявил, что у Украины большие проблемы
16.09.2025 22:02:29 | РЕН ТВ

ВС Ирана и России отработали ведение штурмовых действий на учениях "Запад-2025"
16.09.2025 22:01:59 | ТАСС

Ми-28НМ на учениях "Запад-2025" ударили по "противнику" на дистанции до 22 км
16.09.2025 21:59:16 | ТАСС

Международными ведущими Интервидения стали индийская актриса и китайский шоумен
16.09.2025 21:58:02 | Life.ru

Индия поддержала усилия США по урегулированию конфликта на Украине
16.09.2025 21:57:57 | Lenta.ru

Американский сенатор призвал признать Россию спонсором терроризма
16.09.2025 21:54:30 | Lenta.ru

На Украине понадеялись на скорое завершение конфликта
16.09.2025 21:54:17 | Lenta.ru

«У вас проблемы»: Трамп жёстко отреагировал на дерзкий вопрос украинского журналиста
16.09.2025 21:53:31 | Life.ru

Раскрыты подробности о воровавшей деньги для ВСУ
16.09.2025 21:51:21 | Lenta.ru

В Москве пройдет выставка к годовщине победы над милитаристской Японией
16.09.2025 21:50:18 | ТАСС

Появились новые подробности о пропавшем во время заплыва в Босфоре россиянине
16.09.2025 21:50:00 | Lenta.ru

В США не располагают данными о причастности иных лиц к убийству Кирка
16.09.2025 21:49:18 | ТАСС

Бельгийский «Юнион» выиграл свой первый в истории матч в общем этапе ЛЧ
16.09.2025 21:49:06 | РБК

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2025 - vsetut.pro