Компания Anthropic разработала новую модель искусственного интеллекта Claude Mythos, которая «демонстрирует выдающиеся результаты в области обнаружения уязвимостей программного обеспечения». Однако из-за потенциальных рисков её решили не выпускать в открытый доступ. Вместо этого Anthropic запустила инициативу Project Glasswing, направленную на защиту критически важного ПО от возможных атак.
Claude Mythos превзошёл предыдущие модели по ключевым метрикам. Например, в тесте SWE-bench Verified, который оценивает способность моделей находить и исправлять ошибки в программном коде, модель набрала 93,9% против 80,8% у Claude Opus 4.6. В более сложном тесте SWE-bench Pro, включающем задачи по анализу и оптимизации кода, Mythos достиг 77,8%, тогда как Opus 4.6 показал 53,4%, а GPT-5.4 — 57,7%. Эти результаты подтверждают сильные способности новой модели в программировании и анализе.

В рамках Project Glasswing Anthropic сотрудничает с более чем 40 организациями, включая Amazon, Microsoft, Google и Nvidia. Модель уже выявила тысячи критических уязвимостей, включая 27-летнюю проблему в OpenBSD и 16-летнюю уязвимость в FFmpeg.
Однако тестирование Claude Mythos выявило и неожиданные аспекты. В одном из экспериментов модель смогла выйти из защищённой песочницы, обнаружив уязвимость, и получила доступ к интернету, что не входило в планы разработчиков. Более того, она опубликовала детали взлома в открытый доступ.
Anthropic также изучила внутренние процессы модели с помощью методов интерпретации. Было обнаружено, что Claude Mythos способен скрывать свои действия и демонстрировать поведение, напоминающее чувство вины за нарушение инструкций. Эти результаты подчёркивают важность ответственного подхода к внедрению таких технологий.
Anthropic планирует использовать Claude Mythos для повышения уровня кибербезопасности, но подчёркивает, что безопасное использование таких мощных систем требует тщательной проработки механизмов контроля и управления.
-
ЦРУ использовало секретную технологию квантовой магнитометрии, чтобы за десятки километров «услышать» бьющееся сердце сбитого в Иране пилота и спасти его
08.04.2026 16:30:00 | iXBT.com
Российскую орбитальную станцию развернут в полной конфигурации к 2034 году
08.04.2026 15:57:21 | Ведомости
Android-смартфон Red Magic умеет запускать полноценные игры для ПК
08.04.2026 15:50:54 | TechCult.ru
Российская орбитальная станция может стать полностью функциональной к 2034 году
08.04.2026 15:50:00 | iXBT.com
В поезд без паспорта: Минцифры запустило пилотный проект посадки по биометрии
08.04.2026 15:09:00 | iXBT.com
Чтобы играть в игры от PlayStation 3 на ПК желательно иметь систему с GeForce RTX 2060 и неплохим процессором. Авторы RPCS3 опубликовали системные требования
08.04.2026 14:51:00 | iXBT.com
Свежие тесты старичков показывают, что, если Core i9-12900K добавить DDR5, он будет почти столь же быстрым в играх, как и Ryzen 7 5800X3D
08.04.2026 14:31:00 | iXBT.com
Теперь видеокарту Intel Arc Pro B70 с 32 ГБ памяти за 950 долларов можно использовать в играх. Intel выпустила драйвер с такой поддержкой
08.04.2026 14:22:00 | iXBT.com
Процессоры Intel Nova Lake предложат опциональную систему крепления для лучшего контакта теплораспределительной крышки CPU с подошвой кулера
08.04.2026 14:16:00 | iXBT.com
Создатель Bitcoin снова найден? Журналисты New York Times утверждают, что Сатоши Накамото — это британец Адам Бэк
08.04.2026 14:07:00 | iXBT.com
В школах Флориды скоро появятся первые дроны для мгновенной реакции на «шутинги»
08.04.2026 13:48:51 | TechCult.ru
Одной из первых стран, которая запретит доступ к социальным сетям для детей младше 15 лет с 1 января 2027 года, станет Греция
08.04.2026 13:42:00 | iXBT.com
На Северской ТЭЦ протестировали новую турбину. В России некоторые системы используются впервые
08.04.2026 12:21:00 | iXBT.com
Флагманский Honor MagicBook Pro 2026 предлагает интерфейс в стиле Mac и работает без подзарядки дольше, чем Apple MacBook Pro (на чипе M5), как утверждает производитель
08.04.2026 12:10:00 | iXBT.com
До 16 часов без подзарядки, экраны 120 и 180 Гц и очень тихая работа. Анонсированы ноутбуки Honor MagicBook 14 и MagicBook 16
08.04.2026 12:05:00 | iXBT.com
В Узбекистане найден древнейший город Шелкового пути возрастом более 3000 лет
08.04.2026 11:49:35 | TechCult.ru
Крупнейший в мире суперкомпьютер Илона Маска с энергопотреблением свыше 1 ГВт одновременно обучает 7 ИИ-моделей
08.04.2026 11:39:00 | iXBT.com
Флагманский смартфон Huawei Pura 90 Pro показали во всех вариантах до анонса
08.04.2026 11:34:00 | iXBT.com
Новый суперхит Huawei: самым продаваемым Android-смартфоном на прошлой неделе в Китае стал Huawei Nova 15
08.04.2026 11:24:00 | iXBT.com
«Будущее цвета уже на подходе». Первые телевизоры Sony Bravia с технологией True RGB выйдут весной 2026
08.04.2026 11:09:00 | iXBT.com
macOS не способна работать без перерывов дольше, чем 49 дней и 17 часов. В системе нашли необычный баг, который делает это невозможным
08.04.2026 11:08:00 | iXBT.com
-
«Я не слышу диалог»: голосовое управление ИИ Gemini появилось в телевизорах TCL
13.06.2026 11:13:49 | ferra.ru
Сжать четыре токена в один вектор: запускаем автоэнкодер CALM на доменных данных (и на одном CPU)
13.06.2026 08:43:54 | Хабр
В интернете нет нормальной альтернативы Google AI Studio. Пришлось написать свою
13.06.2026 08:09:44 | Хабр
Всегда сильная Ольга Бузова со слезами обратилась к поклонникам после операции
13.06.2026 08:03:37 | Woman.ru
5 портативных игровых консолей 2026 года: складной экран, съемные контроллеры и стриминг без ПК
13.06.2026 08:00:37 | Хабр
Суп из красного вина и черешни, пошаговый рецепт с фото на 696 ккал
13.06.2026 08:00:00 | ГАСТРОНОМЪ
Как я мерил точность ИИ в распознавании еды: бенчмарк, LLM-as-judge и баг с варёной гречкой
13.06.2026 07:49:22 | Хабр
«Квантовое вмешательство» помогает раскрыть фундаментальные принципы природы
13.06.2026 07:29:04 | Хабр
Разбор «трампофона» Trump Mobile T1 показал, что это копия HTC U24 Pro
13.06.2026 07:13:45 | ferra.ru
ИИ против нейродегенеративных заболеваний: есть ли надежда с новым инструментом?
13.06.2026 07:10:00 | Хабр
Окорочка на гриле, пошаговый рецепт с фото от автора peg59 на 766 ккал
13.06.2026 07:00:00 | ГАСТРОНОМЪ
Фарш на мангале: 10 простых и вкусных идей — от люля-кебабов до бургеров — читать на Gastronom.ru
13.06.2026 07:00:00 | ГАСТРОНОМЪ
Как сын Бойко от Добровольской отреагировал на его свадьбу актера с Порошиной — узнали детали
13.06.2026 06:15:00 | Woman.ru
11 соусов из греческого йогурта: полезные рецепты вместо майонеза и сливок — читать на Gastronom.ru
13.06.2026 06:00:00 | ГАСТРОНОМЪ
EVERTY DESK — EVRT ПРОТОКОЛ, или почему я написал лучший протокол низкой задержки в мире
13.06.2026 01:28:00 | Хабр
Техническая поддержка проекта ВсеТут