Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

ИИ-агент сказал «сделано». Но сделал ли он на самом деле?

08.03.2026 19:15:39 | Хабр

Хабы: Информационная безопасность, Искусственный интеллект, Программирование, Машинное обучение, Проектирование и рефакторинг

На прошлой неделе Хабр опубликовал материал о том, как компании платят до 300 000 рублей в месяц за «скрытый аутсорс» задач в ChatGPT. История получила резонанс — но обсуждение ушло не туда. Говорили о доверии, об этике, о трудовом договоре.

Никто не спросил о главном: а как вы вообще проверяете, что задача была выполнена — агентом или человеком? И была ли она выполнена вообще?

В открытом демо-пайплайне dcl-eval-pipeline-demo я показала, как аудировать поведение агентов на практике. Теперь разберём, почему это критично и как построить полноценный слой верификации — вплоть до готового инструмента, который можно скачать и запустить прямо сейчас.

Это не риторический вопрос. Это архитектурная дыра, которая сейчас присутствует практически в каждой агентной системе. Называется она fabricated execution — ситуация, когда агент возвращает результат, не выполнив задачи, или выполнив что-то принципиально другое, оформив под видом запрошенного.

Что такое DCL?

Подробнее

Читайте также

В России разработают ДНК-метод ранней диагностики аллергии на пыльцу
08.03.2026 19:11:30 | ferra.ru

Mini-Shell: Часть 2 — Pipes, фоновые процессы и управление задачами
08.03.2026 19:05:44 | Хабр

Как посчитать MDE?
08.03.2026 19:04:16 | Хабр

Закурсорить мечту. Часть 4: неожиданный финал
08.03.2026 18:58:03 | Хабр

Разработка CRM для ресторана с нуля: зачем я написал бэкенд для сайта на конструкторе
08.03.2026 18:16:33 | Хабр

Claude: от истоков до нынешнего времени. Цифры, факты, инсайды
08.03.2026 18:10:28 | Хабр

Святой грааль от Рэй Далио
08.03.2026 18:02:30 | Хабр

ЗОЖ 3.0: информационная архитектура здоровья, или Почему тело — это не железо, а распределённая система
08.03.2026 17:49:54 | Хабр

Telegram-бот вместо Excel-рутины: как я автоматизировал рутину с помощью Python
08.03.2026 17:15:15 | Хабр

Руководитель отдела робототехники OpenAI ушла из компании после сделки с Пентагоном
08.03.2026 16:50:53 | ferra.ru

Biohazard! Инфекции из игр в реальной жизни
08.03.2026 16:37:46 | Хабр

В Москве разработали контейнерный хаб для зарядки электромобилей
08.03.2026 16:18:34 | ferra.ru

Asset Catalog – скрытый bottleneck сборки iOS. Разбираемся, как распараллелить компиляцию Asset’ов
08.03.2026 16:16:09 | Хабр

Расширение вариантов применения теоремы Котельникова в современных телекоммуникациях
08.03.2026 16:12:42 | Хабр

Когда выгорает руководитель разработки: 4 управленческих анти-паттерна и быстрый ремонт системы
08.03.2026 15:46:03 | Хабр

[Перевод] Дата-центры на орбите. 5 камней преткновения, почему в космосе ничего не получится
08.03.2026 15:31:42 | Хабр

3d в MonoGame, python в c# или всё таки KNI в браузере? трёхслойная постирония о том, как я игру делал
08.03.2026 15:18:10 | Хабр

Инвалидация nginx кэша
08.03.2026 15:15:56 | Хабр

CryptoBuddy или как мы с другом решили сделать переписку секьюрной
08.03.2026 14:45:48 | Хабр

Ученые оценили риск сильного землетрясения в районе Сочи
08.03.2026 14:36:58 | ferra.ru

Категории типов. Часть 5½. Сопряжения из монады
08.03.2026 14:22:26 | Хабр

Вакансия мечты? Как меня взяли QA и уволили через несколько часов
08.03.2026 14:15:45 | Хабр

[Перевод] Технологические основы сайтов Wikimedia
08.03.2026 14:13:28 | Хабр

Китай предупредил о риске нового кризиса в мировой цепочке поставок чипов
08.03.2026 14:11:36 | ferra.ru

IT-Weekly: ФАС счел рекламу в Telegram незаконной; Apple представила 10 новых устройств
08.03.2026 14:05:20 | it-world

Архитектура ИИ‑агентов
08.03.2026 13:51:04 | Хабр

Как я строю адаптивную модель управления отоплением на ESP32
08.03.2026 13:50:15 | Хабр

Почему ваш SSD тихо теряет данные пока он лежит на полке
08.03.2026 13:43:44 | Хабр

День 1474: Valentino подал заявки на товарные знаки в России
08.03.2026 13:35:25 | vc.ru

Преобразователь сопротивление-длительность, или будни самогонщика
08.03.2026 13:16:56 | Хабр

Домашний кинотеатр малыми средствами
08.03.2026 13:16:39 | Хабр

Российские ученые создадут лекарства из редких тропических растений
08.03.2026 13:16:28 | ferra.ru

Агент, который хочет жить: почему идея «ИИ, зарабатывающий себе на сервер» опаснее, чем кажется
08.03.2026 13:08:11 | Хабр

APF Imagination Machine: забытый гибрид приставки и компьютера
08.03.2026 13:01:36 | Хабр

Метеостанция своими руками: от идеи до работающего устройства
08.03.2026 12:47:04 | Хабр

Смотреть все

НОВОСТИ

Ночной концерт у капота: чем опасна «чуткая» сигнализация
02.05.2026 03:28:42 | За рулем

Reuters: НАТО откажется от проведения саммитов из-за США
27.04.2026 19:58:00 | Российская Газета

Суд не стал взыскивать почти два миллиона со второй помощницы Блиновской
27.04.2026 19:56:58 | Life.ru

Непогода в регионах привела к поваленным деревьям и повреждённым машинам
27.04.2026 19:55:07 | Life.ru

Салоны начали брать расписки с невест при покупке свадебных платьев
27.04.2026 19:53:24 | Lenta.ru

МИД Польши: пролет борта Фицо через Польшу в Россию снят с повестки
27.04.2026 19:49:59 | ТАСС

Беглов: в Петербурге впервые приняли на учебу в колледж 10 кубинских студентов
27.04.2026 19:49:29 | ТАСС

Снег засыпал цветущие в Аптекарском огороде МГУ сакуру и форзицию
27.04.2026 19:49:19 | Life.ru

МИД России ответил на очередной пакет санкций Евросоюза
27.04.2026 19:48:05 | Life.ru

В ФРГ полицейского обязали посетить мемориал в Освенциме из-за нацистского лозунга
27.04.2026 19:47:52 | ТАСС

Звезда шоу «Голос» попал в страшное ДТП
27.04.2026 19:47:36 | Lenta.ru

ВСУ снова атаковали Севастополь после мощнейшего удара по городу
27.04.2026 19:47:33 | Lenta.ru

В Севастополе в районе мыса Херсонес сбили три украинских БПЛА
27.04.2026 19:46:10 | ТАСС

«Уникальное оружие Су-57». Украинская разведка заявила о применении Россией новейших крылатых ракет. Что о них известно?
27.04.2026 19:45:59 | Lenta.ru

В Самарской области из-за урагана погибли три человека
27.04.2026 19:45:52 | Коммерсантъ

В Одессе задержали членов ОПГ на машине с поддельными дипномерами посольства США
27.04.2026 19:45:00 | Российская Газета

За два месяца от ударов Израиля в Ливане погибло более 2500 человек
27.04.2026 19:45:00 | Российская Газета

Появились подробности о боях с ВСУ около российской границы
27.04.2026 19:44:00 | Lenta.ru

Андрей Белоусов проверил объекты Минобороны России в Киргизии
27.04.2026 19:44:00 | Российская Газета

Император за столом и платье за миллионы: 6 дворянских традиций XIX века, которые сегодня не потянуть
27.04.2026 19:43:45 | Life.ru

Россияне решили провести майские праздники рядом с домом
27.04.2026 19:43:24 | Lenta.ru

В России появился эвакуатор для борьбы с техникой эко-нарушителей
27.04.2026 19:42:54 | Life.ru

Названы ускоряющие старение пищевые привычки
27.04.2026 19:42:39 | Lenta.ru

На Украине отменили концерт певицы Приходько после ее поста о "киевском русском"
27.04.2026 19:42:21 | ТАСС

В Самарской области завели дело после гибели рабочего под упавшим деревом
27.04.2026 19:41:23 | ТАСС

Певица Люся Чеботина отметила день рождения в откровенном наряде
27.04.2026 19:40:49 | Lenta.ru

Ушедший из России автоконцерн объявил крупнейший отзыв в своей истории
27.04.2026 19:40:06 | Lenta.ru

Рынок акций РФ закрылся разнонаправленным изменением биржевых индексов
27.04.2026 19:39:45 | ТАСС

Вучич сравнил позицию Запада по Крыму с позицией по Косово
27.04.2026 19:39:26 | Lenta.ru

Клуб НХЛ "Нэшвилл" подписал контракт с белорусским хоккеистом Пинчуком
27.04.2026 19:38:52 | ТАСС

В Подмосковья из-за непогоды упали почти 550 деревьев, пострадали шесть человек
27.04.2026 19:37:53 | Life.ru

Российским туристам дали советы по выбору отелей
27.04.2026 19:37:05 | Lenta.ru

Выборы президента Федерации велосипедного спорта России пройдут 27 мая
27.04.2026 19:36:52 | ТАСС

«Замечательный день»: Иностранный профессор поразился «апрельской зиме» в Москве
27.04.2026 19:36:11 | Life.ru

Проблема полета Фицо в Москву на парад Победы разрешилась
27.04.2026 19:35:19 | Lenta.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro