
Meta* анонсировала LlamaFirewall — открытый фреймворк, призванный защитить приложения на базе больших языковых моделей (LLM) от современных киберрисков. Решение, опубликованное в репозитории GitHub, сочетает три уровня безопасности: PromptGuard 2, Agent Alignment Checks и CodeShield, позволяя разработчикам создавать многоуровневую защиту для чат-ботов и автономных агентов.
Ядро фреймворка, PromptGuard 2, анализирует пользовательские запросы в реальном времени, выявляя прямые атаки через инъекции промптов и попытки «джейлбрейка» — обхода ограничений модели. Второй компонент, Agent Alignment Checks, отслеживает логику работы автономных агентов, предотвращая перехват целей и косвенные инъекции. Третий элемент, CodeShield, представляет собой статический анализатор кода, блокирующий генерацию небезопасных или вредоносных скриптов.

«Архитектура LlamaFirewall модульная, что даёт возможность комбинировать слои защиты от этапа обработки входных данных до финальных действий системы», — пояснили в Meta.
Параллельно компания представила обновлённые инструменты LlamaGuard и CyberSecEval. Последний, CyberSecEval 4, теперь включает бенчмарк AutoPatchBench для оценки способности ИИ-агентов автоматически исправлять уязвимости в коде на C/C++, обнаруженные через фаззинг. «AutoPatchBench стандартизирует тестирование ИИ-инструментов, что поможет понять их эффективность в устранении багов», — отметили разработчики.
Для поддержки сообщества Meta запустила программу Llama for Defenders, предоставляя партнёрам ранний доступ к экспериментальным и закрытым ИИ-решениям. В фокусе — борьба с мошенничеством: обнаружение фишинговых атак, фейкового контента и сценариев, где злоумышленники используют генеративный ИИ.
Отдельное внимание привлекла новая технология WhatsApp — Private Processing. Она позволяет обрабатывать пользовательские запросы через ИИ в изолированной среде, не передавая данные на сторонние серверы.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
-
02.05.2025 07:44:00 | iXBT.com
02.05.2025 07:36:00 | iXBT.com
02.05.2025 07:34:00 | iXBT.com
02.05.2025 07:20:00 | iXBT.com
02.05.2025 06:58:00 | iXBT.com
02.05.2025 06:40:00 | iXBT.com
02.05.2025 06:23:00 | iXBT.com
02.05.2025 06:10:00 | iXBT.com
02.05.2025 06:00:00 | iXBT.com
02.05.2025 05:51:00 | iXBT.com
01.05.2025 22:34:00 | iXBT.com
01.05.2025 22:16:00 | iXBT.com
01.05.2025 21:41:00 | iXBT.com
01.05.2025 21:28:00 | iXBT.com
01.05.2025 18:59:00 | iXBT.com
01.05.2025 18:34:00 | iXBT.com
01.05.2025 17:13:00 | iXBT.com
01.05.2025 16:56:00 | iXBT.com
01.05.2025 16:31:00 | iXBT.com
01.05.2025 15:11:00 | iXBT.com
01.05.2025 14:48:00 | iXBT.com
01.05.2025 14:42:00 | iXBT.com
01.05.2025 14:38:00 | iXBT.com
01.05.2025 14:27:00 | iXBT.com
01.05.2025 14:23:00 | iXBT.com
01.05.2025 14:16:00 | iXBT.com
01.05.2025 14:10:00 | iXBT.com
01.05.2025 14:07:00 | iXBT.com
01.05.2025 13:57:00 | iXBT.com
01.05.2025 13:43:00 | iXBT.com
01.05.2025 12:45:00 | iXBT.com
-
02.05.2025 19:30:25 | vc.ru
02.05.2025 18:14:43 | vc.ru
02.05.2025 18:02:56 | it-world
02.05.2025 16:22:01 | vc.ru
02.05.2025 16:01:29 | ferra.ru
02.05.2025 15:58:38 | ferra.ru
02.05.2025 15:56:27 | ferra.ru
02.05.2025 15:30:13 | vc.ru
02.05.2025 15:22:34 | Хабр
02.05.2025 15:18:31 | Хабр
02.05.2025 15:05:43 | Хабр
02.05.2025 14:00:27 | Хабр
02.05.2025 13:56:48 | Хабр
02.05.2025 13:27:37 | vc.ru
02.05.2025 13:19:30 | Хабр
Техническая поддержка проекта ВсеТут