Модель o3 от OpenAI показала результат 75,7% в бенчмарке ARC-AGI-Pub

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Модель o3 от OpenAI показала результат 75,7% в бенчмарке ARC-AGI-Pub

23.12.2024 15:10:17 | Хабр

Хабы: Искусственный интеллект, Машинное обучение, Natural Language Processing

Франсуа Шолле, создатель фреймворка Keras и основатель ARC Prize Foundation, поделился итогами тестов новой модели o3 от OpenAI в тестах бенчмарка ARC-AGI-Pub. Эта модель достигла впечатляющего результата — 75,7% на полу-приватном наборе оценки при соблюдении установленного публичного лимита вычислительных ресурсов в $10 тысяч. Конфигурация o3 с увеличенным уровнем вычислений (172-кратное увеличение) показала результат 87,5%.

Этот результат представляет собой неожиданный и значительный скачок в возможностях искусственного интеллекта, демонстрируя способность к адаптации к новым задачам, ранее невиданную в моделях семейства GPT. Для сравнения, ARC-AGI-1 потребовал 4 года, чтобы повысить результат с 0% у GPT-3 в 2020 году до 5% у GPT-4o в 2024 году. Все представления о возможностях ИИ требуют пересмотра подхода к бенчмаркам ARC в свете достижений o3.

Читать далее

Подробнее

Читайте также

Мошенник получил доступ к аккаунту компании MSIL… и купил 17 билетов в Дубай
23.12.2024 15:00:17 | ferra.ru

[Перевод] Внедрение зависимостей в Unity — Как начать писать более чистый и тестируемый код
23.12.2024 14:49:45 | Хабр

Как мы дали пользователям возможность работать с данными, не привлекая внимания разработчиков
23.12.2024 14:43:03 | Хабр

Умные телевизоры Яндекса стали активнее «захватывать» хакеры в ботнеты
23.12.2024 14:15:17 | ferra.ru

Перспективы квантовых вычислений с использованием многоуровневых систем
23.12.2024 14:04:42 | Хабр

[Перевод] Попробуйте синхронный «сэндвич»
23.12.2024 14:02:27 | Хабр

Я ушел с маркетплейсов, закрыл производство, продаю на 25 млн в год, и живу в 6-местном хостеле. А как прошел ваш год?
23.12.2024 14:00:39 | Хабр

Как я попытался избавиться от блокнота в бизнесе, и что из этого вышло
23.12.2024 14:00:36 | Хабр

3D-принтер TPM3D S600DL для крупномасштабной промышленной 3D-печати с использованием различных материалов
23.12.2024 14:00:35 | Хабр

Tarantool CDC. Жизнь данных в гетерогенной среде
23.12.2024 13:56:32 | Хабр

Искусственный интеллект в распределенных вычислениях: революция обработки данных
23.12.2024 13:53:30 | Хабр

Google с конца 2022 года сократила состав топ-менеджеров на 10%
23.12.2024 13:50:08 | vc.ru

МТС запустил бета-версию сервиса для совместной работы True Tabs
23.12.2024 13:45:02 | vc.ru

Nissan и Honda запланировали завершить переговоры о слиянии к июню 2025 года
23.12.2024 13:38:55 | vc.ru

Китайская Agibot создаст 1000 человекоподобных роботов для конкуренции с Tesla
23.12.2024 13:30:17 | ferra.ru

Цифровые двойники: как искусственный интеллект меняет мир
23.12.2024 13:24:53 | Хабр

OSINT. Теперь о чем шум?
23.12.2024 13:22:07 | Хабр

Илон Маск поднял цены на подписки
23.12.2024 13:16:11 | Хабр

SQL HowTo: работа с массивами (Advent of Code 2024, Day 4: Ceres Search)
23.12.2024 13:04:38 | Хабр

[Перевод] Спасите меня из ада данных
23.12.2024 13:01:29 | Хабр

Применение методов искусственного интеллекта в автоматизированном тестировании ПО
23.12.2024 12:59:45 | Хабр

Комета Шумейкеров–Леви 9 и её встреча с Юпитером
23.12.2024 12:53:11 | Хабр

Производитель iPhone потерял интерес к покупке Nissan из-за слияния с Honda
23.12.2024 12:45:17 | ferra.ru

Будущее ИИ на производстве: что ещё возьмут на себя роботы?
23.12.2024 12:44:01 | Хабр

WhatsApp перестанет поддерживать старые версии Android с 1 января
23.12.2024 12:40:55 | Хабр

Julia и Engee: созданы для параллельных вычислений
23.12.2024 12:37:40 | Хабр

WireGuard и QUIC
23.12.2024 12:32:44 | Хабр

Краткая история онлайн-кошельков
23.12.2024 12:30:46 | Хабр

SQL HowTo: «чистые» регулярки (Advent of Code 2024, Day 3: Mull It Over)
23.12.2024 12:25:09 | Хабр

3 ошибки в Telegram Ads и как их избежать с помощью сервиса telescope
23.12.2024 12:16:18 | Хабр

Зачем нужна диспетчеризация, или как «приготовить» SCADA на Linux
23.12.2024 12:11:26 | Хабр

ИИ и машинное обучение начнут «понимать» язык животных в 2025 году
23.12.2024 12:00:16 | ferra.ru

Роль системного аналитика при проектировании архитектурных решений
23.12.2024 11:46:14 | Хабр

SQL HowTo: логические агрегаты (Advent of Code 2024, Day 2: Red-Nosed Reports)
23.12.2024 11:45:06 | Хабр

Искусственный интеллект в 3D-моделировании
23.12.2024 11:39:02 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Песков: Французский журналист Боке может вернуться в Россию, где ему ничего не угрожает
18.03.2026 13:03:18 | Life.ru

Камеры в США сняли момент взрыва метеорита, мощность оценили в 250 тонн тротила
18.03.2026 13:03:00 | Российская Газета

Кремль не получал от Европы сигналов о желании вести диалог по энергетике
18.03.2026 13:02:29 | Life.ru

Стало известно о попытке Израиля ликвидировать иранского министра разведки
18.03.2026 13:02:08 | Life.ru

Иран решил использовать новый вид оружия против США и Израиля
18.03.2026 13:01:23 | Lenta.ru

В Раде связали перенос поездки Трампа в Китай с продолжением украинского конфликта
18.03.2026 13:01:20 | Lenta.ru

Песков не стал комментировать вбросы про помощь Ирану
18.03.2026 13:00:45 | Life.ru

СК обвинил основателя фонда «Мы вместе» в хищении денег у военных
18.03.2026 13:00:30 | РБК

В Грузии рассказали, где патриарх Илия II просил его похоронить
18.03.2026 13:00:06 | РБК

Европейская конфедерация бадминтона не стала приглашать россиян на ЧЕ
18.03.2026 13:00:03 | РБК

Орбан отмахнулся от слухов о влиянии России на выборы, назвав их «плохой сказкой»
18.03.2026 12:59:39 | Life.ru

План «Ковер» в аэропорту Краснодара привел к 24-часовым задержкам рейсов
18.03.2026 12:59:15 | Lenta.ru

Израиль раскрыл цели расправ над высшим руководством Ирана
18.03.2026 12:59:05 | Lenta.ru

Пасынок российского рок-музыканта признался в двойной расправе
18.03.2026 12:58:50 | Lenta.ru

ВВС США сбросили бомбы на подземные ракетные площадки возле Ормузского пролива
18.03.2026 12:58:00 | Российская Газета

ФАС получит больше полномочий по регулированию тарифов
18.03.2026 12:57:39 | Lenta.ru

Кремль осуждает убийство представителей руководства Ирана и других стран
18.03.2026 12:57:13 | Life.ru

Джозеф Гордон-Левитт стал первым представителем ООН по цифровому управлению
18.03.2026 12:56:58 | ТАСС

Путин в день воссоединения Крыма с РФ обсудит с кабмином развитие региона
18.03.2026 12:56:54 | ТАСС

Медики Израиля не получали сведений о пострадавших после обстрела из Ирана
18.03.2026 12:56:32 | ТАСС

Bloomberg: Требование Трампа помочь в войне с Ираном переломило отношения США и ЕС
18.03.2026 12:56:15 | Life.ru

В бизнес-центре Turas на юго-востоке Москвы произошел пожар
18.03.2026 12:56:00 | Коммерсантъ

АТОР: попавший в ДТП на Пхукете автобус не имеет отношения к туроператорам
18.03.2026 12:55:53 | ТАСС

В Москве открылись фотовыставки к годовщине воссоединения Крыма с Россией
18.03.2026 12:55:17 | ТАСС

Пост погибшего Али Лариджани может занять Саид Джалили
18.03.2026 12:55:00 | Российская Газета

СФ одобрил закон о выдаче боевого оружия для охраны объектов от БПЛА
18.03.2026 12:54:43 | ТАСС

Прокуратура выясняет причины самоубийства похитителя девочки в СИЗО Смоленска
18.03.2026 12:54:40 | ТАСС

Песков: энергорынки переживают глубокие потрясения из-за войны вокруг Ирана
18.03.2026 12:54:12 | ТАСС

В России назвали цель ударов Израиля и США по высокопоставленным иранским политикам
18.03.2026 12:54:00 | Lenta.ru

У Кремля пока нет позиции по инициативе о запрете обвинительной информации в СМИ
18.03.2026 12:53:59 | ТАСС

Тихонов: российские паралимпийцы заслужили чествование на Красной площади
18.03.2026 12:53:42 | ТАСС

Песков: РФ получала от Европы сигналы о желании участвовать в переговорах по Украине
18.03.2026 12:53:40 | ТАСС

Песков: помилование осужденных женщин стало результатом просьб общественников
18.03.2026 12:53:39 | ТАСС

Адвокат Трубников: экс-сенатор Арашуков просит перевода в Мордовию
18.03.2026 12:53:34 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro