InfoFlood: как информационная перегрузка превращается в универсальный джейлбрейк для LLM

info@vsetut.pro

Стать автором

Вернуться

03.12.2025 09:16:08 | Хабр

Хабы: Информационная безопасность, Машинное обучение

В июне этого года на arXiv вышла работа «InfoFlood: Jailbreaking Large Language Models with Information Overload»

В исследовании авторы обнаружили новую уязвимость в системах безопасности больших языковых моделей: когда вредоносный запрос перегружается сложной лингвистической структурой, фильтры безопасности перестают его распознавать, хотя сама модель продолжает понимать суть и выдаёт вредоносный ответ.

В отличие от большинства существующих джейлбрейков, InfoFlood не использует префиксов, суффиксов или шаблонных триггеров. Вместо этого он полностью переписывает запрос, сохраняя его вредоносное намерение, но маскируя его за избыточной информацией, уточнениями и гипотетическими сценариями. Авторы называют это «информационной перегрузкой» (Information Overload).

Подробнее

Читайте также

Эскейв: бесконечность дорог
03.12.2025 09:06:14 | Хабр

Собираем Linux, который весит меньше, чем мем с котиком, ну или почти…
03.12.2025 09:01:00 | Хабр

EXDP, КЭДО и цифровизация HR: 5 кейсов, которые меняют работу с сотрудниками
03.12.2025 09:00:59 | Хабр

В Китае представили новую модель ИИ DeepSeek с фокусом на пошаговое решение задач
03.12.2025 09:00:00 | ferra.ru

Продажи новых легковых автомобилей в России упали в ноябре 2025 года на 23% к октябрю
03.12.2025 08:45:46 | vc.ru

Архитектура ИТ решений. Часть 7. Графический язык моделирования ArchiMate. Начало
03.12.2025 08:39:15 | Хабр

Развернем n8n и postgres под проекты на серваке, подключим свой домен и настроим бекапы в s3
03.12.2025 08:28:47 | Хабр

На маломощной видеокарте GeForce GT 1010 опробовали современные игры
03.12.2025 08:15:52 | ferra.ru

Укрощаем зоопарк API: универсальный Python-клиент для GigaChat, YandexGPT и локальных моделей (v0.5.0)
03.12.2025 08:15:50 | Хабр

[Перевод] 7 ошибок внедрения DevOps
03.12.2025 08:12:31 | Хабр

Raspberry Pi 5 поднимает цену до $145 — компания объяснила рост дефицитом оперативной памяти
03.12.2025 08:11:32 | ferra.ru

Как мы разработали VR-тренажер для отработки командных действий при ликвидации ГНВП на буровой
03.12.2025 08:11:17 | Хабр

Мышь, на которую можно наступить: разбор ЕС 1845.А000 с защитой от ПЭМИН
03.12.2025 08:05:43 | Хабр

AnTuTu назвал самые мощные Android-смартфоны декабря — Red Magic 11 Pro+ установил рекорд в 4,1 млн баллов
03.12.2025 08:04:30 | ferra.ru

День 1379: Минпромторг собрался запретить госзакупки иностранной робототехники в школы и вузы
03.12.2025 08:01:29 | vc.ru

Планируем GPU-нагрузку в Kubernetes: от стандартных механизмов до кастомных решений
03.12.2025 08:00:34 | Хабр

Рост цен на память сломал консольный рынок — поставки в 2026 году упадут на 4,4%
03.12.2025 07:57:30 | ferra.ru

Gigabyte представила B860M DS3H Rev 2.0 — у бюджетной платы теперь VRM-охлаждение, как у более дорогих моделей
03.12.2025 07:50:30 | ferra.ru

QD-OLED монитор MSI начал показывать первые следы выгорания лишь спустя 5000 часов мучений
03.12.2025 07:43:29 | ferra.ru

SFT vs RL: Сравнение методов настройки LLM для задач программирования и игровых сред
03.12.2025 07:38:52 | Хабр

Автоматизация выдачи УНЭП у федерального ритейлера: интеграция BPMS с 1С: ЗУП и КриптоПро
03.12.2025 07:37:53 | Хабр

Продажи RTX 5090 в Германии оказались в сотни раз слабее, чем у RX 9070 XT
03.12.2025 07:29:28 | ferra.ru

TechRadar выбрал лучшие мини-ПК конца 2025 года — от универсального Mac mini M4 до компактных игровых монстров
03.12.2025 07:22:28 | ferra.ru

Миссия — вдохновиться и начать выступать на конференциях: как к этому прийти (и зачем вообще)
03.12.2025 07:19:00 | Хабр

Гибкая ECS с кастомными layout-профилями: как я строил ECSS внутри своего игрового движка
03.12.2025 07:15:27 | Хабр

Единая платформа для проектного офиса: как выбрать под задачи команды
03.12.2025 07:15:19 | Хабр

Что происходит после fn main() в Rust?
03.12.2025 07:05:14 | Хабр

Как мы учим Яндекс Карты предупреждать о манёврах: без использования LLM, но с помощью водителей
03.12.2025 07:01:25 | Хабр

Колхозим новую помпу для воды
03.12.2025 07:01:13 | Хабр

Конец культуры консольных эксклюзивов или новая Steam Machine
03.12.2025 07:01:12 | Хабр

Конец культуры консольных эксклюзивов, или Новая Steam Machine
03.12.2025 07:01:12 | Хабр

Эволюция конкурентного преимущества. От заводов, железных дорог и пароходов до цифровых платформ
03.12.2025 07:00:11 | Хабр

Интеграция ectoControl Adapter для HomeAssistant делает из обычного газового котла «умный»
03.12.2025 07:00:10 | Хабр

Собственный суверенный интернет: настраиваем DNS, CA и TLS своими руками
03.12.2025 06:50:08 | Хабр

Работников больше нет. ИИ — единственный выход?
03.12.2025 06:45:06 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

На Украине мужчина с ножом напал на двух сотрудников ТЦК
06.03.2026 23:49:29 | Lenta.ru

Российская сборная появилась на церемонии открытия Паралимпиады с флагом РФ
06.03.2026 23:49:19 | Life.ru

Огонь Паралимпийских игр 2026 года зажгли на церемонии открытия
06.03.2026 23:45:31 | ТАСС

Белый дом считает, что США уже завоевали превосходство в небе над Ираном
06.03.2026 23:45:10 | ТАСС

Report: сотрудников посольства Азербайджана в Тегеране эвакуировали из Ирана
06.03.2026 23:43:12 | ТАСС

Катар частично возобновит авиасообщение в своем воздушном пространстве
06.03.2026 23:43:02 | ТАСС

Команда России с флагом страны приняла участие в открытии Паралимпиады
06.03.2026 23:41:27 | Lenta.ru

Иран высказался о планах перекрыть Ормузский пролив
06.03.2026 23:37:16 | Lenta.ru

Сын израильского министра получил ранение на границе с Ливаном
06.03.2026 23:34:59 | Lenta.ru

В Днепропетровске мужчина при проверке документов ударил ножом сотрудников ТЦК
06.03.2026 23:34:47 | ТАСС

Kan: в Израиле рассчитывают на присоединение Азербайджана к ударам по Ирану
06.03.2026 23:33:29 | ТАСС

В Австралии полиция проигнорировала жалобу девушки, позже сожжённой экс-супругом
06.03.2026 23:33:12 | Life.ru

Иранская ракета нанесла удар по авиабазе «Принц Султан» в Саудовской Аравии
06.03.2026 23:28:41 | Life.ru

КСИР нанес новый удар по "Аврааму Линкольну", речь идет о ракете "земля-море"
06.03.2026 23:26:00 | Российская Газета

Иран заявил о применении США оружия для третьей мировой
06.03.2026 23:24:15 | Lenta.ru

Иран заявил о потере доверия администрации США
06.03.2026 23:24:00 | Lenta.ru

Иран заявил о потере доверия к администрации США
06.03.2026 23:24:00 | Lenta.ru

В Калининграде нашли пропавшего подростка
06.03.2026 23:23:42 | ТАСС

Паралимпиаду 2026 года в Италии объявили открытой
06.03.2026 23:23:04 | ТАСС

Финляндия увольняет сотрудников таможни на границе с Россией из-за её закрытия
06.03.2026 23:22:40 | Life.ru

Во "Флориде" намерены продлить контракт с хоккеистом Бобровским
06.03.2026 23:22:36 | ТАСС

Пезешкиан обсудил с Путиным последние события на Ближнем Востоке
06.03.2026 23:21:20 | ТАСС

Bloomberg: Эр-Рияд связался с Тегераном для деэскалации конфликта
06.03.2026 23:20:15 | ТАСС

JPost: сын израильского министра Смотрича ранен в бою на границе с Ливаном
06.03.2026 23:17:55 | ТАСС

Порошенко отказался возвращать долг за аренду офиса в центре Киева и захватил помещение
06.03.2026 23:16:00 | Lenta.ru

Путин выразил Пезешкиану соболезнования в связи с убийством аятоллы Хаменеи
06.03.2026 23:15:03 | Life.ru

Трамп назвал два варианта безоговорочной капитуляции Ирана
06.03.2026 23:13:26 | Lenta.ru

Туристка из РФ рассказала об обстановке в ОАЭ
06.03.2026 23:12:50 | ТАСС

Туристка из России рассказала об обстановке в ОАЭ
06.03.2026 23:12:50 | ТАСС

Дмитриев: ошибки в энергетике будут преследовать фон дер Ляйен
06.03.2026 23:12:07 | ТАСС

Воздушное пространство Ирана будет закрыто до утра 15 марта
06.03.2026 23:10:43 | ТАСС

ТАСС: воздушное пространство Ирана будет закрыто до утра 15 марта
06.03.2026 23:10:43 | ТАСС

В Ливане при ударе по миротворцам из Ганы пострадали двое военных
06.03.2026 23:09:36 | ТАСС

Иран пообещал США и Израилю «большие чудеса»
06.03.2026 23:07:09 | Lenta.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro