Новый универсальный метод взлома LLM от Anthropic «Best-of-N Jailbreaking»

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Новый универсальный метод взлома LLM от Anthropic «Best-of-N Jailbreaking»

14.12.2024 00:10:49 | Хабр

Хабы: Информационная безопасность, Искусственный интеллект, Машинное обучение, Программирование, Научно-популярное

Буквально несколько часов назад (на момент написания этой статьи), компания Anthropic предоставила свое новое исследование по обходу защитных механизмов LLM в открытый доступ.

Новый способ взлома «Best‑of‑N Jailbreaking» описывает универсальный метод обхода защиты передовых AI‑моделей, работающий с текстом, изображениями и аудио.

Суть BoN Jailbreaking — в добавлении искажений во входные данные модели для поиска уязвимостей защиты методом проб и ошибок. Исследователи продемонстрировали высокую эффективность метода на моделях GPT-4, Claude, Gemini и др.

Читать далее

Подробнее

Читайте также

Цири, как протагонист Ведьмак 4 — это провал?
14.12.2024 00:10:40 | Хабр

В США хакеры атаковали популярную пончиковую Krispy Kreme
14.12.2024 00:00:00 | ferra.ru

Китай создаст комитет для разработки стандартов в области ИИ
13.12.2024 23:59:13 | ferra.ru

Исследование выявило уязвимости метавселенных перед кибератаками
13.12.2024 23:58:56 | ferra.ru

Ученые создали компактный и недорогой лазер для квантовых технологий
13.12.2024 23:49:22 | ferra.ru

Вредный кадровый голод, преступный Viber, и живучий Blu-ray
13.12.2024 23:45:10 | it-world

AMD в 28,3 раза увеличила энергоэффективность новых ИИ-серверов образца 2024 года
13.12.2024 23:15:00 | ferra.ru

Инженеры создали новый способ 3D-печати для гибких и прочных материалов
13.12.2024 22:55:37 | ferra.ru

Ученые превратили воздух в удобрения
13.12.2024 22:52:15 | ferra.ru

Тест на основе ИИ поможет выявить рак молочной железы на ранней стадии
13.12.2024 22:49:07 | ferra.ru

Для тех, кто хочет «улучшенный бюджетный смартфон» и хочет улучшения не в камере или процессоре...
13.12.2024 22:34:52 | ferra.ru

Исследователь нашёл в процессоре Intel Pentium дефект, который привёл к крупной ошибке
13.12.2024 22:30:00 | ferra.ru

Спутники зафиксировали резкий рост опасного парникового газа
13.12.2024 22:29:03 | ferra.ru

Спутниковые измерения существенно улучшили карту морского дна
13.12.2024 22:27:03 | ferra.ru

Тест-кейсы: сортировка и гранулярность в репозитории
13.12.2024 21:52:03 | Хабр

Страх, боль, защита территории и охотничий инстинкт: названы причины, по которым собака может вас укусить
13.12.2024 21:45:00 | ferra.ru

Роскомнадзор заблокировал Viber
13.12.2024 21:32:53 | it-world

Метод PRoC3S поможет роботам выполнять сложные задачи с учетом ограничений
13.12.2024 21:30:31 | ferra.ru

Антимонопольный регулятор Турции оштрафовал Google на 75 млн долларов
13.12.2024 21:26:42 | ferra.ru

Apple начнет производство AirPods на юге Индии
13.12.2024 21:21:24 | ferra.ru

Роскомнадзор заблокировал мессенджер Viber в России
13.12.2024 21:12:07 | ferra.ru

Хорошо позавтракайте: диетолог рассказала, как избежать переедания
13.12.2024 21:00:00 | ferra.ru

В США правозащитники призвали полицию отказаться от использования «ИИ-писаря»
13.12.2024 20:21:15 | ferra.ru

ИИ ошибочно «научился» по рентгену колена понимать, пьет ли кто-то пиво
13.12.2024 20:15:25 | ferra.ru

Роскомнадзор сообщил о блокировке Viber в России
13.12.2024 20:04:36 | vc.ru

Проектная работа «Оно тебе надо» от Яндекс практикума
13.12.2024 19:42:22 | Хабр

TCL выпустила короткометражные фильмы, созданные ИИ
13.12.2024 19:30:24 | ferra.ru

«Т-Банк» предупредил о возможных проблемах с приёмом карт Visa и Mastercard в своих терминалах с января 2025 года
13.12.2024 19:23:05 | vc.ru

В Санкт-Петербурге представили подводный аппарат с ИИ
13.12.2024 19:05:26 | ferra.ru

Работа с клиентом по Agile: как мы уходим от бюрократии
13.12.2024 18:50:09 | Хабр

Верховный суд США расчистил путь для исков против Nvidia
13.12.2024 18:45:22 | ferra.ru

В Москве наградили лауреатов Национальной премии «Лидеры ИИ»
13.12.2024 18:42:55 | ferra.ru

5G шагает по планете: теперь и в Океании
13.12.2024 18:29:30 | it-world

CustDev аудитории почти бесплатно, сравнение онлайн и офлайн опросов
13.12.2024 18:19:02 | Хабр

Samsung оснастит модели Galaxy Z Flip 7 процессором Exynos 2500
13.12.2024 18:15:44 | it-world

Смотреть все

СТАТЬ АВТОРОМ

НОВОСТИ

Гузеева оказалась в центре международного скандала из-за вилл на Бали
10.11.2025 12:39:21 | РЕН ТВ

Туск допустил раскол Запада на две части
10.11.2025 12:38:21 | ТАСС

Посол РФ: Создание базы российского ВМФ в Порт-Судане приостановлено
10.11.2025 12:38:00 | Российская Газета

По делу о хищении сотни миллионов рублей у Ларисы Долиной появились новые подробности
10.11.2025 12:37:13 | Lenta.ru

На конференции в Душанбе обсуждают роль русского языка в Центральной Азии
10.11.2025 12:36:13 | ТАСС

Трижды оправданного по делу об убийстве охранника отпустили из зала суда
10.11.2025 12:35:42 | РЕН ТВ

В Подмосковье с начала года выдали свыше 4 тыс. наборов для новорожденных
10.11.2025 12:35:17 | ТАСС

Токаев по видеосвязи выступит на форуме межрегионального сотрудничества Казахстана и РФ
10.11.2025 12:34:58 | ТАСС

Задержан возможный соучастник рядового Кострикина, подозреваемого в убийстве и изнасиловании
10.11.2025 12:34:49 | Коммерсантъ

В Кремле оценили ситуацию на фронте
10.11.2025 12:34:42 | Lenta.ru

Невеста изменила жениху за день до свадьбы и приняла неожиданное решение
10.11.2025 12:34:13 | Lenta.ru

BFMTV: прокуратура предложила освободить Саркози под судебный контроль
10.11.2025 12:33:52 | ТАСС

Москалькова попросила ГД ввести наказание за воспрепятствование работе омбудсменов
10.11.2025 12:33:15 | ТАСС

Песков заявил об активной подготовке визита Путина в Индию
10.11.2025 12:33:00 | Российская Газета

Толкнувшая девочку в московском метро пенсионерка объяснилась
10.11.2025 12:32:36 | Lenta.ru

На ресторан в регионе России подали в суд за рекламу с хинкали вместо куполов храма
10.11.2025 12:32:12 | Lenta.ru

В России прокомментировали инициативу о новом сборе на электронику
10.11.2025 12:32:00 | Lenta.ru

Песков: ситуация на фронтах для Киева будет ухудшаться изо дня в день
10.11.2025 12:31:55 | РЕН ТВ

Лукашенко заявил, что Белоруссия должна разрабатывать и иметь собственные вооружения
10.11.2025 12:30:50 | ТАСС

В Тбилиси заявили, что ЕС говорит о дружбе с Грузией, при этом готовя революцию
10.11.2025 12:30:21 | ТАСС

Слуцкий предложил установить памятник Михаилу Задорнову
10.11.2025 12:29:43 | ТАСС

Глава МВД наградил отличившихся сотрудников в День полиции
10.11.2025 12:29:08 | РЕН ТВ

Песков назвал причину приостановки переговоров по Украине
10.11.2025 12:29:00 | Lenta.ru

Песков: для ВСУ ситуация будет ухудшаться изо дня в день
10.11.2025 12:28:38 | РЕН ТВ

В Раду внесли постановление об увольнении министра энергетики Украины
10.11.2025 12:28:29 | ТАСС

Долиной угрожали убийством
10.11.2025 12:27:53 | РЕН ТВ

Российский офицер рассказал о бое с превосходящими его отряд в десять раз силами ВСУ
10.11.2025 12:27:34 | Lenta.ru

Власти Жуковского предупредили о мошеннических чатах от имени медучреждений
10.11.2025 12:27:11 | ТАСС

В Приморье создадут систему отслеживания товаров из РФ для борьбы с подделками
10.11.2025 12:26:24 | ТАСС

В Кремле ответили на вопрос о мирной инициативе Орбана по Украине
10.11.2025 12:25:54 | Life.ru

На 27-м км СВХ в Москве восстановили движение
10.11.2025 12:25:29 | ТАСС

Песков назвал условие для завершения СВО
10.11.2025 12:25:21 | Lenta.ru

В парный теннис тоже надо уметь играть. Кудерметова это доказала
10.11.2025 12:25:05 | ТАСС

Хакера из Новосибирской области осудили за создание вирусов для хищения денег
10.11.2025 12:24:17 | ТАСС

В Китае придумали новый способ получения сырья из России
10.11.2025 12:23:33 | Lenta.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2025 - vsetut.pro