ИИ научился запоминать: Mem0 представила решение для бесконечных диалогов

12.05.2025 12:31:00 | iXBT.com

Исследователи из компании Mem0 разработали две архитектуры памяти — Mem0 и Mem0g, — которые повышают способность больших языковых моделей (LLM) запоминать и использовать информацию в длительных диалогах. Это решение устраняет ключевое ограничение современных LLM: неспособность эффективно работать с данными за пределами их контекстного окна, даже если оно расширено до миллионов токенов.

По словам Таранджит Сингха, генерального директора Mem0, существующие системы страдают от «забывания» важных данных — например, игнорирования аллергий пациента медицинским ассистентом или потери деталей поездки в разговоре с планировщиком.

Изображение: VentureBeat / Ideogram

Mem0 решает проблему через динамическое извлечение и обновление информации. На первом этапе система анализирует недавние сообщения и сводку всего диалога, выделяя ключевые факты. На втором — оценивает, нужно ли добавить новые данные, обновить существующие или удалить противоречивые. В результате память агента остаётся актуальной без перегрузки контекста. Mem0g дополняет этот подход графовыми структурами, где сущности (люди, события, объекты) связаны как узлы, а их отношения — как рёбра. Это позволяет ИИ строить сложные ассоциации, например, соединять даты поездки с городами и мероприятиями.

Тестирование на базе набора данных LOCOMO показало, что Mem0 сокращает задержку на 91% и экономит более 90% токенов по сравнению с методами, загружающими полный контекст. При этом качество ответов не ухудшается. Mem0g демонстрирует аналогичную эффективность, но лучше справляется с задачами, требующими временных или логических связей. Обе архитектуры превзошли шесть категорий систем, включая решения с открытым исходным кодом и ChatGPT.

Для корпоративных приложений это означает более надёжных ИИ-агентов в службах поддержки, медицинских сервисах или планировании. Mem0 подойдёт для простых сценариев, а Mem0g — для комплексных задач вроде анализа многомесячных диалогов. Разработчики подчёркивают, что их подход не требует увеличения вычислительных ресурсов, что делает его экономически выгодным для бизнеса.

Подробнее