
Искусственный интеллект часто принимает решения на основе «ложных корреляций» — несущественных и потенциально вводящих в заблуждение связей между данными. Исследователи из Университета штата Северная Каролина обнаружили, что такие корреляции могут возникать из-за крайне малой части обучающих данных, и предложили метод, который решает проблему даже без понимания конкретных причин её возникновения.
«Эта техника уникальна тем, что её можно применять, даже если вы не знаете, какие именно ложные признаки использует модель», — заявил Чон Ын Ким, доцент компьютерных наук и соавтор исследования. Метод, описанный в работе, позволяет устранять нежелательные зависимости как в случаях, когда проблема уже выявлена, так и при отсутствии чёткого понимания её источника.
Ложные корреляции возникают из-за «предвзятости» (simplicity bias) в процессе обучения ИИ-моделей. Например, при обучении распознавать собак на фотографиях система может фиксироваться на ошейниках, если те присутствуют у большинства животных в обучающей выборке. Это упрощает задачу, но приводит к ошибкам: модель начинает классифицировать кошек в ошейниках как собак.
Традиционные методы борьбы с такой проблемой требуют от разработчиков заранее выявить ложные признаки (например, ошейники) и скорректировать набор данных, увеличив вес «чистых» примеров (собак без ошейников). Однако на практике идентифицировать такие признаки удаётся не всегда.

«Наша цель — разорвать ложные связи, даже если мы ничего не знаем о них», — пояснил Ким. Новый подход основан на удалении небольшой части данных (менее 5%) из обучающего набора.
Учёные предположили, что самые «сложные» для модели образцы — те, в которых неоднозначность заставляет ИИ опираться на ложные признаки. Такие данные определялись через анализ поведения модели во время тренировки: если образец вызывал длительные колебания в точности предсказаний, то он считался «шумным».
«Исключая даже крошечную долю проблемных данных, мы устраняем ключевой источник ложных корреляций, не снижая общую эффективность модели», — отметил Ким. Тесты показали, что метод превосходит существующие решения, включая те, где проблема была заранее известна. Например, в задачах классификации изображений точность моделей повысилась на 12% – 15% по сравнению с предыдущими подходами.
По словам команды, метод особенно полезен в сценариях, где наборы данных содержат скрытые искажения — от медицинской диагностики до автономного вождения.
Это открытие не только улучшает надёжность ИИ, но и сокращает затраты на переобучение моделей, поскольку не требует масштабной переработки данных. Следующим шагом станет интеграция подхода в промышленные системы, где проблема ложных корреляций остаётся одним из главных барьеров для внедрения ИИ.
-
11.03.2025 21:24:00 | iXBT.com
11.03.2025 21:05:00 | iXBT.com
11.03.2025 20:57:00 | iXBT.com
11.03.2025 19:32:00 | iXBT.com
11.03.2025 19:31:00 | iXBT.com
11.03.2025 18:52:00 | iXBT.com
11.03.2025 18:45:00 | iXBT.com
11.03.2025 18:30:58 | TechCult.ru
11.03.2025 18:27:00 | iXBT.com
11.03.2025 18:21:00 | iXBT.com
11.03.2025 18:00:00 | iXBT.com
11.03.2025 17:57:00 | iXBT.com
11.03.2025 17:13:00 | iXBT.com
11.03.2025 16:52:00 | iXBT.com
11.03.2025 16:29:00 | iXBT.com
11.03.2025 16:24:00 | iXBT.com
11.03.2025 16:14:00 | iXBT.com
11.03.2025 15:58:00 | iXBT.com
11.03.2025 15:49:49 | TechCult.ru
11.03.2025 15:12:00 | iXBT.com
11.03.2025 14:54:00 | iXBT.com
11.03.2025 14:27:00 | iXBT.com
11.03.2025 14:20:00 | iXBT.com
11.03.2025 14:12:00 | iXBT.com
11.03.2025 14:11:00 | iXBT.com
11.03.2025 13:50:00 | iXBT.com
11.03.2025 13:47:05 | TechCult.ru
11.03.2025 13:22:00 | iXBT.com
11.03.2025 13:17:00 | iXBT.com
11.03.2025 13:16:00 | iXBT.com
11.03.2025 13:04:00 | iXBT.com
-
12.03.2025 09:45:00 | ferra.ru
12.03.2025 09:42:55 | it-world
12.03.2025 09:00:00 | ferra.ru
12.03.2025 08:42:00 | ferra.ru
12.03.2025 08:25:59 | ferra.ru
12.03.2025 08:15:58 | ferra.ru
12.03.2025 08:15:26 | ferra.ru
12.03.2025 08:06:58 | ferra.ru
12.03.2025 08:00:25 | vc.ru
12.03.2025 07:57:58 | ferra.ru
12.03.2025 07:41:57 | ferra.ru
12.03.2025 07:32:56 | ferra.ru
12.03.2025 07:24:56 | ferra.ru
12.03.2025 07:09:55 | ferra.ru
12.03.2025 07:01:54 | ferra.ru
12.03.2025 07:00:08 | Хабр
12.03.2025 06:51:05 | Хабр
12.03.2025 06:45:48 | ferra.ru
12.03.2025 06:33:38 | Хабр
12.03.2025 06:00:23 | ferra.ru
12.03.2025 04:30:41 | ferra.ru
12.03.2025 02:15:22 | ferra.ru
12.03.2025 01:30:47 | ferra.ru
12.03.2025 00:45:54 | ferra.ru
Техническая поддержка проекта ВсеТут