Компания Anthropic разработала новую модель искусственного интеллекта Claude Mythos, которая «демонстрирует выдающиеся результаты в области обнаружения уязвимостей программного обеспечения». Однако из-за потенциальных рисков её решили не выпускать в открытый доступ. Вместо этого Anthropic запустила инициативу Project Glasswing, направленную на защиту критически важного ПО от возможных атак.
Claude Mythos превзошёл предыдущие модели по ключевым метрикам. Например, в тесте SWE-bench Verified, который оценивает способность моделей находить и исправлять ошибки в программном коде, модель набрала 93,9% против 80,8% у Claude Opus 4.6. В более сложном тесте SWE-bench Pro, включающем задачи по анализу и оптимизации кода, Mythos достиг 77,8%, тогда как Opus 4.6 показал 53,4%, а GPT-5.4 — 57,7%. Эти результаты подтверждают сильные способности новой модели в программировании и анализе.

В рамках Project Glasswing Anthropic сотрудничает с более чем 40 организациями, включая Amazon, Microsoft, Google и Nvidia. Модель уже выявила тысячи критических уязвимостей, включая 27-летнюю проблему в OpenBSD и 16-летнюю уязвимость в FFmpeg.
Однако тестирование Claude Mythos выявило и неожиданные аспекты. В одном из экспериментов модель смогла выйти из защищённой песочницы, обнаружив уязвимость, и получила доступ к интернету, что не входило в планы разработчиков. Более того, она опубликовала детали взлома в открытый доступ.
Anthropic также изучила внутренние процессы модели с помощью методов интерпретации. Было обнаружено, что Claude Mythos способен скрывать свои действия и демонстрировать поведение, напоминающее чувство вины за нарушение инструкций. Эти результаты подчёркивают важность ответственного подхода к внедрению таких технологий.
Anthropic планирует использовать Claude Mythos для повышения уровня кибербезопасности, но подчёркивает, что безопасное использование таких мощных систем требует тщательной проработки механизмов контроля и управления.
-
ЦРУ использовало секретную технологию квантовой магнитометрии, чтобы за десятки километров «услышать» бьющееся сердце сбитого в Иране пилота и спасти его
08.04.2026 16:30:00 | iXBT.com
Российскую орбитальную станцию развернут в полной конфигурации к 2034 году
08.04.2026 15:57:21 | Ведомости
Android-смартфон Red Magic умеет запускать полноценные игры для ПК
08.04.2026 15:50:54 | TechCult.ru
Российская орбитальная станция может стать полностью функциональной к 2034 году
08.04.2026 15:50:00 | iXBT.com
В поезд без паспорта: Минцифры запустило пилотный проект посадки по биометрии
08.04.2026 15:09:00 | iXBT.com
Чтобы играть в игры от PlayStation 3 на ПК желательно иметь систему с GeForce RTX 2060 и неплохим процессором. Авторы RPCS3 опубликовали системные требования
08.04.2026 14:51:00 | iXBT.com
Свежие тесты старичков показывают, что, если Core i9-12900K добавить DDR5, он будет почти столь же быстрым в играх, как и Ryzen 7 5800X3D
08.04.2026 14:31:00 | iXBT.com
Теперь видеокарту Intel Arc Pro B70 с 32 ГБ памяти за 950 долларов можно использовать в играх. Intel выпустила драйвер с такой поддержкой
08.04.2026 14:22:00 | iXBT.com
Процессоры Intel Nova Lake предложат опциональную систему крепления для лучшего контакта теплораспределительной крышки CPU с подошвой кулера
08.04.2026 14:16:00 | iXBT.com
Создатель Bitcoin снова найден? Журналисты New York Times утверждают, что Сатоши Накамото — это британец Адам Бэк
08.04.2026 14:07:00 | iXBT.com
В школах Флориды скоро появятся первые дроны для мгновенной реакции на «шутинги»
08.04.2026 13:48:51 | TechCult.ru
Одной из первых стран, которая запретит доступ к социальным сетям для детей младше 15 лет с 1 января 2027 года, станет Греция
08.04.2026 13:42:00 | iXBT.com
На Северской ТЭЦ протестировали новую турбину. В России некоторые системы используются впервые
08.04.2026 12:21:00 | iXBT.com
Флагманский Honor MagicBook Pro 2026 предлагает интерфейс в стиле Mac и работает без подзарядки дольше, чем Apple MacBook Pro (на чипе M5), как утверждает производитель
08.04.2026 12:10:00 | iXBT.com
До 16 часов без подзарядки, экраны 120 и 180 Гц и очень тихая работа. Анонсированы ноутбуки Honor MagicBook 14 и MagicBook 16
08.04.2026 12:05:00 | iXBT.com
В Узбекистане найден древнейший город Шелкового пути возрастом более 3000 лет
08.04.2026 11:49:35 | TechCult.ru
Крупнейший в мире суперкомпьютер Илона Маска с энергопотреблением свыше 1 ГВт одновременно обучает 7 ИИ-моделей
08.04.2026 11:39:00 | iXBT.com
Флагманский смартфон Huawei Pura 90 Pro показали во всех вариантах до анонса
08.04.2026 11:34:00 | iXBT.com
Новый суперхит Huawei: самым продаваемым Android-смартфоном на прошлой неделе в Китае стал Huawei Nova 15
08.04.2026 11:24:00 | iXBT.com
«Будущее цвета уже на подходе». Первые телевизоры Sony Bravia с технологией True RGB выйдут весной 2026
08.04.2026 11:09:00 | iXBT.com
macOS не способна работать без перерывов дольше, чем 49 дней и 17 часов. В системе нашли необычный баг, который делает это невозможным
08.04.2026 11:08:00 | iXBT.com
-
На Байконур доставили ракету «Союз-2.1б» для запуска грузового корабля к МКС
02.06.2026 17:55:00 | ferra.ru
256 ГБ с двух планок, скорость 8000 МГц: Origin Code и GIGABYTE создали DDR5-память
02.06.2026 16:30:47 | ferra.ru
Песков: белые списки расширят для работы сервисов при отключениях интернета
02.06.2026 16:25:00 | ferra.ru
«Яндекс Пэй» запустил функцию подтверждения переводов выше установленного лимита через доверенное лицо
02.06.2026 15:56:26 | vc.ru
Xiaomi добавила поддержку AirDrop в функцию обмена файлами Quick Share на своих смартфонах — сначала на Xiaomi 17T Pro
02.06.2026 15:32:55 | vc.ru
Changan испытали новый автомобиль на самой старой гоночной трассе России
02.06.2026 15:02:18 | ferra.ru
Поднимаем Linux на плате Zynq RK-7020-F V1.1 c помощью Buildroot и U-Boot SPL
02.06.2026 14:55:40 | Хабр
До 50 ч. работы, двойной ЦАП, переводчик: Realme Buds Air8 Pro оценили в 8990 рублей
02.06.2026 14:33:06 | ferra.ru
Multi-WAN, 3 белых IP, IPv6, два интернет провайдера и 2 Гбит/с скорости в условиях домашнего интернета
02.06.2026 14:29:04 | Хабр
Используешь ИИ в поиске работы — и именно поэтому тебе не перезванивают. Гайд по выживанию в эпоху нейронайма
02.06.2026 14:13:47 | Хабр
Как проект на лето растянулся на полгода: Делаем свою светодиодную вывеску с управлением по Wi-Fi (ч.1)
02.06.2026 14:10:48 | Хабр
Запускаем единую оценку компетенций в ИТ для найма и перевода между ролями: наш опыт
02.06.2026 14:07:25 | Хабр
Какими выросли внучки-двойняшки Буйнова — Дарье и Софье 17 лет и они влюблены в высокое искусство
02.06.2026 14:00:00 | Woman.ru
Функции управления цифровыми активами автомобильных дорог. Часть 2 – маппинг
02.06.2026 13:45:22 | Хабр
Имитационное моделирование (DES): оптимизация бизнес-процессов по-настоящему, или почему интуиция не работает
02.06.2026 13:44:52 | Хабр
Service desk системы в 2026 году: сравниваем 10 решений для российского бизнеса
02.06.2026 13:40:56 | Хабр
Пятипальцевые балетки — странная обувь, за которую ваши ноги скажут спасибо
02.06.2026 13:30:00 | Woman.ru
Техническая поддержка проекта ВсеТут