[Перевод] Бенчмарк для оценки LLM в задачах триажа security-находок

31.05.2026 11:07:14 | Хабр

Хабы: Информационная безопасность, Иконки, Анализ и проектирование систем, Системное администрирование, DevOps

Я создал собственный бенчмарк для оценки языковых моделей, потому что стандартные публичные тесты не отвечают на мой главный вопрос: какая модель лучше справляется с триажем security-находок. Эта задача отличается от оценки общей сообразительности модели.

Подробнее

Читайте также

Академик РАН: искусственный интеллект никогда не обретет сознание
31.05.2026 10:59:56 | ferra.ru

Визуальный поиск: Новый подход к обнаружению объектов
31.05.2026 10:48:12 | Хабр

QPSK HDL приёмопередатчик
31.05.2026 10:36:43 | Хабр

Ищем разработчика в Synaps — приложение для научного нетворкинга
31.05.2026 09:58:12 | Хабр

Новая эра ПК или старая боль Windows on Arm
31.05.2026 09:53:02 | it-world

3D Stereo Home Cinema, эргономичный домашний кинотеатр с иммерсивным звуком
31.05.2026 09:45:55 | Хабр

Встречайте: muenvsubst — улучшенный envsubst
31.05.2026 09:32:10 | Хабр

Живые обои на Mac своими руками: Metal, окна на уровне рабочего стола и немного математики
31.05.2026 09:26:21 | Хабр

Россия вымирает: что говорят данные
31.05.2026 09:19:17 | Хабр

CNN подала в суд на ИИ-поисковик Perplexity за кражу контента
31.05.2026 09:09:00 | ferra.ru

Тегирование людей на изображениях и Генерация заголовков для видеороликов
31.05.2026 09:03:11 | Хабр

[Перевод] Квантовые компьютеры не угроза 128-битным симметричным ключам
31.05.2026 09:01:10 | Хабр

Navidrome: поднимаем свой стриминговый сервер за один вечер
31.05.2026 09:00:05 | Хабр

Зачем мне фото- и видеоредакторы с GUI, когда есть FFmpeg?
31.05.2026 09:00:01 | Хабр

[Перевод] Астрономы разглядели галактику, возникшую всего через 800 млн лет после Большого взрыва
31.05.2026 08:54:59 | Хабр

Как решить конфликт в Git: merge, rebase, cherry-pick conflict
31.05.2026 08:25:15 | Хабр

DNSSEC validation на Go: написал свой validator и не до конца сошёл с ума
31.05.2026 08:22:56 | Хабр

Про «случайных» людей в ИТ
31.05.2026 08:22:15 | Хабр

Пять одноплатников мая 2026 года: Intel N300, RISC-V с AI и невыпущенный Raspberry Pi 6
31.05.2026 08:01:42 | Хабр

Как я заработал 400 тысяч рублей на боте, который нарезает картинки на квадратики
31.05.2026 07:49:29 | Хабр

Telegram вернулся на часы с Wear OS
31.05.2026 07:08:58 | ferra.ru

Простая аналитическая плафторма для 1С-ов и не только
31.05.2026 07:05:42 | Хабр

(Не)безопасный eBPF: что маркетологи забыли упомянуть об уязвимостях
31.05.2026 07:00:23 | Хабр

AMD вложит 10 млрд долларов в Тайвань ради гонки ИИ с Nvidia. Что происходит?
31.05.2026 07:00:10 | Хабр

Перепрошивка системы вознаграждения. Мой друг Никотин Никотиныч
31.05.2026 01:59:33 | Хабр

Российские ученые проверили неизменность законов физики в космосе
30.05.2026 23:49:01 | ferra.ru

Острова и несколько личностей на одном устройстве: как мы делаем приватность частью архитектуры
30.05.2026 23:29:14 | Хабр

Как я научил Home Assistant передавать показания счётчиков и напоминать об оплате ЖКХ
30.05.2026 22:39:25 | Хабр

Microsoft пригрозила «уголовкой» кибербезопаснику, что раскрыл её ошибки
30.05.2026 22:08:56 | ferra.ru

Intel и 3DGS построят в индийском штате Одиша завод за $3,3 млрд
30.05.2026 22:07:43 | ferra.ru

Российские ученые расширили диапазон лазерных кристаллов
30.05.2026 21:36:37 | ferra.ru

Российские ученые впервые составили карту морских вихрей Баренцева моря
30.05.2026 20:38:22 | ferra.ru

ИИ-агент Google Gemini Spark работает даже при выключенном телефоне
30.05.2026 20:08:54 | ferra.ru

ИИ-фото нейросети для создания изображений: ТОП-14 моделей ИИ для летней фотосессии
30.05.2026 19:29:37 | Хабр

Reset — прохождение сложной машины от Tryhackme
30.05.2026 19:26:38 | Хабр

Смотреть все

НОВОСТИ

В Беларуси вырастут размеры прожиточного минимума и не только
27.07.2026 11:33:00 | Российская Газета

Более 3,8 тыс. человек в Испании умерли из-за жары в 2026 году
27.07.2026 11:32:36 | ТАСС

Столичный курс по бережливым технологиям стал доступен в других регионах РФ
27.07.2026 11:31:54 | ТАСС

В Новосибирске арестовали стрелявшего по подросткам мужчину
27.07.2026 11:31:24 | ТАСС

Госдума закрыла весеннюю сессию и завершила восьмой созыв
27.07.2026 11:31:23 | ТАСС

"Страна.ua": В Польше пару с Украины избили из-за акцента
27.07.2026 11:31:00 | Российская Газета

Экс-премьер Молдавии: Санду и ее партия провалили обещание покончить с коррупцией
27.07.2026 11:30:41 | ТАСС

В Петербурге задержали извергов, растоптавших голубя ради хайпа
27.07.2026 11:30:31 | Life.ru

В Саратовской области задержали подозреваемого в нападении на фельдшера
27.07.2026 11:30:11 | ТАСС

Предпринимателям запретили продавать маски с лицом Джигурды
27.07.2026 11:28:58 | ТАСС

В Польше избили украинцев из-за акцента
27.07.2026 11:28:12 | Lenta.ru

Депутат Рады Геращенко возмутилась, что Зеленский отчитался перед западными СМИ
27.07.2026 11:28:00 | Российская Газета

Иран отверг слова Трампа о переговорах фразой «это не в нашей природе»
27.07.2026 11:27:51 | Lenta.ru

Раскрыта необычная деталь часов российского министра
27.07.2026 11:27:41 | Lenta.ru

В аэропорту Нижнего Новгорода задерживаются 10 рейсов
27.07.2026 11:27:19 | ТАСС

ИИ выходит из-под контроля? Разработчик ChatGPT объявил о наступлении «эры сингулярности»
27.07.2026 11:26:43 | Life.ru

Замгендиректора ТАСС: СМИ ШОС должны бороться с информационным терроризмом
27.07.2026 11:25:55 | ТАСС

Бастрыкин потребовал доклад о расследовании дела о смерти детей в Дагестане
27.07.2026 11:25:21 | ТАСС

Журналистка Баязитова вышла на свободу
27.07.2026 11:24:44 | Lenta.ru

Володин заявил, что киевский режим терпит поражение на всей линии фронта
27.07.2026 11:24:40 | ТАСС

Володин: с 2021 года количество межфракционных законов выросло в 3,5 раза
27.07.2026 11:23:46 | ТАСС

Медведев поднялся в рейтинге АТР
27.07.2026 11:23:24 | Lenta.ru

Калининградские таможенники пресекли контрабанду 6,5 тыс. пачек сигарет
27.07.2026 11:23:21 | ТАСС

Туркменистан осудил атаки ВСУ в Каспийском море
27.07.2026 11:23:01 | Lenta.ru

Володин: Россия открыта для диалога, но на равных
27.07.2026 11:22:32 | ТАСС

Госдума за пять лет приняла 250 антисанкционных законов
27.07.2026 11:21:45 | ТАСС

В ТАСС расскажут о программе Международного форума "Технопром-2026" в Новосибирске
27.07.2026 11:21:43 | ТАСС

Володин: Россия развивается, несмотря на внешнее противодействие и санкции
27.07.2026 11:21:38 | ТАСС

Володин: Запад посягает на право России быть независимой и свободной
27.07.2026 11:20:39 | ТАСС

Wildberries эвакуировала свои логистические объекты в Удмуртии
27.07.2026 11:20:35 | Lenta.ru

В Астраханской области экс-полицейского осудили за взятки
27.07.2026 11:19:30 | ТАСС

Зеленский: быстро запустить производство ракет Patriot на Украине не удастся
27.07.2026 11:19:15 | ТАСС

В Петербурге задержали проникшего на территорию Эрмитажа
27.07.2026 11:19:11 | ТАСС

Алиханов: Лазерные комплексы начали защищать предприятия в РФ от беспилотников
27.07.2026 11:19:11 | Life.ru

В Молдавии фермеры столкнулись с нехваткой дизтоплива
27.07.2026 11:18:11 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro