Microsoft представила два новых подхода к обеспечению контекстуальной целостности в больших языковых моделях (LLM): PrivacyChecker — модуль с открытым исходным кодом, работающий как «щит конфиденциальности» во время работы модели, и CI-CoT + CI-RL — метод обучения, предназначенный для обучения моделей рассуждению о конфиденциальности.
Контекстуальная целостность определяет конфиденциальность как уместность потоков информации в конкретных социальных контекстах, то есть раскрытие только той информации, которая строго необходима для выполнения данной задачи, например, записи на приём к врачу. По мнению исследователей Microsoft, современные LLM не обладают подобным контекстуальным осознанием и могут раскрывать конфиденциальную информацию, подрывая доверие пользователей.
Первый подход фокусируется на проверках во время работы модели. Эти проверки представляют собой «щит», оценивающий информацию на нескольких этапах жизненного цикла запроса. Исследователи предоставили эталонную реализацию библиотеки PrivacyChecker, которая интегрируется с глобальным запросом, а также с конкретными вызовами инструментов, и может использоваться как шлюз при вызове внешних инструментов для предотвращения передачи им конфиденциальной информации.
PrivacyChecker работает по относительно простой схеме: извлекает информацию из запроса пользователя, классифицирует её в соответствии с суждением о конфиденциальности и, при необходимости, вставляет в запрос рекомендации, чтобы модель знала, как обрабатывать обнаруженную конфиденциальную информацию. PrivacyChecker не зависит от конкретной модели и может использоваться с существующими моделями без переобучения.

На статическом бенчмарке PrivacyLens было показано, что PrivacyChecker снижает утечку информации с 33,06% до 8,32% на GPT4o и с 36,08% до 7,30% на DeepSeekR1, сохраняя при этом способность системы выполнять поставленную задачу.
Второй подход, разработанный исследователями Microsoft, направлен на повышение контекстуальной целостности с использованием метода «цепочки рассуждений» (chain-of-thought prompting, CI-CoT). Обычно этот метод используется для улучшения способностей модели к решению задач, но исследователи применили его с другой целью: они заставили модель оценивать нормы раскрытия контекстной информации перед ответом. Запрос направлял модель на определение того, какие атрибуты необходимы для выполнения задачи, а какие следует скрыть.
Хотя CI-CoT оказался эффективным в снижении утечки информации на бенчмарке PrivacyLens, он также имел тенденцию давать более консервативные ответы, иногда скрывая информацию, необходимую для выполнения задачи. Для решения этой проблемы исследователи Microsoft представили этап обучения с подкреплением (reinforcement learning, CI-RL): модель «вознаграждается», когда она выполняет задачу, используя только информацию, соответствующую контекстуальным нормам, и «штрафуется», когда раскрывает информацию, неуместную в данном контексте. Это обучает модель определять не только то, как отвечать, но и следует ли включать конкретную информацию.
Комбинированный подход, CI-CoT + CI-RL, оказался столь же эффективным, как и CI-CoT, в снижении утечки информации, сохраняя при этом производительность исходной модели.
Контекстуальная целостность — новая концепция, разработанная Google DeepMind и Microsoft в контексте исследований LLM. Она определяет конфиденциальность не как всеобщее право на секретность, а как «надлежащий поток информации в соответствии с контекстуальными информационными нормами».
-
Fender Audio представила свои первые беспроводные наушники с рекордным временем работы от батареи
03.01.2026 08:31:00 | iXBT.com
Skoda Superb 2025 в России подешевели до 3 млн рублей. По предзаказу машины ещё дешевле
03.01.2026 08:25:00 | iXBT.com
Анализ одной клетки: квантовые методы могут справиться с огромными и «зашумлёнными» наборами данных по отдельным клеткам, недоступными для классических методов
03.01.2026 08:18:00 | iXBT.com
Новые Rolls-Royce Cullinan в России подешевели за год на 25 млн рублей
03.01.2026 08:17:00 | iXBT.com
Дешевле аналогичных китайских кроссоверов: Nissan Magnite стал доступнее в России
03.01.2026 08:10:00 | iXBT.com
ИИ из Южной Кореи научился подбирать персональные вакцины от рака, нацеленные на предотвращение рецидивов
03.01.2026 08:05:00 | iXBT.com
Xiaomi развенчивает мифы о кольце зума в Xiaomi 17 Ultra Leica Edition: механика реальна, это не программный фейк
03.01.2026 07:55:00 | iXBT.com
Сардиния превращает углекислый газ в аккумулятор для «зелёной» энергетики: пилотная установка с резервуаром на 2000 тонн уже обеспечивает до 20 МВт мощности в течение 10 часов
03.01.2026 07:49:00 | iXBT.com
«Это не ценовая война». BMW обрушила цены на машины в Китае, снижение достигло 43 000 долларов
03.01.2026 07:48:00 | iXBT.com
Представлена HMD Boom E1: компактная Bluetooth-колонка с защитой IPX7
03.01.2026 07:43:00 | iXBT.com
QWERTY-клавиатура и магнитый внешний аккумулятор в одном устройстве. Представлен Clicks Power Keyboard
03.01.2026 07:34:00 | iXBT.com
Ракета Falcon 9 побывала в космосе 21 раз, вывела на орбиту спутник нового поколения и совершила 100-ю посадку (для серии) на сушу
03.01.2026 07:15:00 | iXBT.com
SpaceX испытала баржу для транспортировки Starship между Техасом и Флоридой
03.01.2026 07:10:00 | iXBT.com
«Искусственное солнце» Китая и термоядерный синтез сделали большой шаг вперед, преодолев барьер плотности плазмы
03.01.2026 07:05:00 | iXBT.com
Agibot Q1: карманный гуманоидный робот из Китая может стать первым «персональным андроидом»
03.01.2026 06:53:00 | iXBT.com
Астрономы восстановили «бурную молодость» нашей галактики и смоделировали, как менялся Млечный Путь от ранней Вселенной до наших дней
03.01.2026 06:46:00 | iXBT.com
Самое большое Солнце в 2026 году: Земля подошла к светилу на минимальную дистанцию
03.01.2026 06:36:00 | iXBT.com
Starlink заработал в Армении. Илон Маск передал терминалы для подключения школ
03.01.2026 06:24:00 | iXBT.com
Кембридж и Google DeepMind предложили первый научный тест «личности» для нейросетей
03.01.2026 05:03:00 | iXBT.com
Глава Instagram* предсказывает доминирование ИИ-контента и предлагает «цифровые отпечататки» для реальных фото
03.01.2026 04:56:00 | iXBT.com
Red Bull раскрыла дизайн своего первого гиперкара RB17 с атмосферным V10 и электромотором перед стартом продаж 2026 года
03.01.2026 04:37:00 | iXBT.com
OpenAI готовит новую аудио-модель в первом квартале 2026 года: компания нацелилась на собственные голосовые устройства
03.01.2026 04:24:00 | iXBT.com
IBM представила первый квантовый процессор Nighthawk и открыла ранний доступ к самому мощному Heron
03.01.2026 04:19:00 | iXBT.com
Samsung Freestyle+: портативный проектор с ИИ сам подстраивает фокус, геометрию и цвет под любую поверхность и освещение
02.01.2026 22:24:00 | iXBT.com
Минималистичный смартфон Punkt MC03 с AphyOS: ставка на приватность с разделением приложений на доверенную зону и «дикий веб»
02.01.2026 22:17:00 | iXBT.com
Новый космодром у экватора: Турция начала строительство в Сомали для доступа к выгодным орбитам
02.01.2026 21:44:00 | iXBT.com
Microsoft и ведущие биологи выявили уязвимости в проверке ИИ?сгенерированных генетических последовательностей
02.01.2026 21:33:00 | iXBT.com
Microsoft и ведущие биологи выявили уязвимости в проверке ИИ-сгенерированных генетических последовательностей
02.01.2026 21:33:00 | iXBT.com
-
Новая игра Bloober Team, Dark Souls на саксофоне, 9 минут Styx: Blades of Greed, Гейб доволен…
07.01.2026 01:22:08 | StopGame
Сбер проник в n8n и фильтрует нам лидов: как мы подключили Отечественную нейросеть к автоматизациям
06.01.2026 23:24:25 | Хабр
Талышинская нагадала дочь, а Кожевникова — хорошего мужа: рождественское чудо звезд
06.01.2026 21:05:00 | Woman.ru
Сапёр в эпоху LLM: собираем персонального архивариуса для SPRO, ABAP-кода и Telegram-чата
06.01.2026 21:03:13 | Хабр
Как перестать терять лидов: автоматическое распределение заявок в Bitrix24 через n8n. Реальный кейс
06.01.2026 20:05:01 | Хабр
День 1412: Владимир Путин поручил правительству и ЦБ восстановить темпы экономического роста в 2026 году
06.01.2026 19:37:35 | vc.ru
«Рай под ногами матерей-2. Письмо матери». Тизер с русскими субтитрами
06.01.2026 19:28:48 | КИНО-ТЕАТР.РУ
Release любой ценой: как продуктовый дизайнер создал настольную игру про хаос в IT-разработке (с PnP-версией)
06.01.2026 19:15:47 | Хабр
«Ее голос прекрасен, но она стала на 20 лет старше и 40 кг полнее»: как живет та, которую Джей Зи любил сильнее, чем Бейонсе
06.01.2026 19:15:00 | Woman.ru
Google DeepMind и Boston Dynamics интегрируют Gemini в человекоподобных роботов Atlas
06.01.2026 18:36:53 | vc.ru
ИИ-агент для анализа продающих звонков: как автоматизировать контроль качества продаж с помощью n8n
06.01.2026 18:17:32 | Хабр
Что стало с дочерью актера Дедюшко, которую судьба уберегла от смертельного ДТП
06.01.2026 17:15:00 | Woman.ru
Поговорили о: Metroid Prime 4, Hollow Knight, Blasphemous и метроидваниях в целом
06.01.2026 16:58:02 | StopGame
Реактивность без фреймворков (просто эксперимент на чистом JS + Web APIs)
06.01.2026 16:44:47 | Хабр
Настройка Tor + Privoxy на Arch Linux: HTTP и SOCKS5 proxy для домашней сети через Tor
06.01.2026 16:38:13 | Хабр
Техническая поддержка проекта ВсеТут