Новый математический бенчмарк FrontierMath поставил ИИ в тупик

info@vsetut.pro

Стать автором

Вернуться

14.11.2024 07:30:41 | ferra.ru | Максим Многословный

Epoch AI представила новый математический бенчмарк FrontierMath, который ставит в тупик современные ИИ-модели. По данным исследовательской организации, бенчмарк включает сотни сложных математических задач, которые топовые ИИ-модели, включая GPT-4o и Claude 3.5 Sonnet, решают менее чем в 2% случаев. Эти задачи, которые обычно требуют от математиков нескольких часов или дней, охватывают широкий спектр дисциплин, от вычислительной теории чисел до абстрактной алгебраической геометрии.

Подробнее

Читайте также

История о том как мы подарили вторую жизнь своей игре
14.11.2024 07:15:44 | Хабр

Рецензия на книгу “Изучаем паттерны проектирования JavaScript, 2-е издание”
14.11.2024 07:14:41 | Хабр

Разбираем iOS-приложение: код, сборка, статические и динамические библиотеки, компиляция, запуск
14.11.2024 07:08:28 | Хабр

[Перевод] Если вы встретите в космосе инопланетянина, убейте его
14.11.2024 07:06:19 | Хабр

А по ночам я веду беседы с лампочками
14.11.2024 07:05:17 | Хабр

Готовьтесь к росту цен
14.11.2024 07:02:16 | Хабр

Руководство по heatmap для анализа игрового уровня
14.11.2024 07:00:09 | Хабр

[Перевод] Встраивание вредоносного исполняемого файла в обычный PDF или EXE
14.11.2024 06:46:06 | Хабр

Слон научился использовать шланг для утреннего душа
14.11.2024 06:45:34 | ferra.ru

30k аудиозаписей: наводим порядок
14.11.2024 06:37:46 | Хабр

«Приключение на 20 минут: взял и поменял язык». Личный опыт перехода на Kotlin
14.11.2024 06:15:51 | Хабр

[Перевод] Как работают Kubernetes Services: управление трафиком с помощью iptables
14.11.2024 06:02:07 | Хабр

nanoCAD BIM ОПС: редактирование шаблонов спецификации в соответствии с ГОСТ 21.110-2013 СПДС
14.11.2024 06:01:08 | Хабр

Нейросети, синтетические конверсии и отказ от ключевых слов – 7 главных лайфхаков контекстной рекламы в уходящем году
14.11.2024 06:00:45 | Хабр

Как поднять инфраструктуру для запуска автотестов Android в облаках
14.11.2024 06:00:43 | Хабр

В США предупредили о лазейке в законах, которую хакеры используют для кражи данных
14.11.2024 06:00:00 | ferra.ru

Настройка no-code приложения ALM (Управление активами и пассивами)
14.11.2024 05:29:01 | Хабр

Кроссплатформенные приложения на Python с Flet и FastAPI: Полное руководство по разработке
14.11.2024 05:26:33 | Хабр

Ошибки при работе с tailwindcss
14.11.2024 05:19:57 | Хабр

Подразделение NASA уволит 325 человек из-за проблем с финансированием
14.11.2024 05:15:00 | ferra.ru

Lasso, Ridge и кастомные регуляризаторы: основы
14.11.2024 05:05:35 | Хабр

UART-терминал из LCD-дисплея и компьютерной клавиатуры
14.11.2024 04:31:30 | Хабр

Перечислены самые удивительные факты о кактусах
14.11.2024 04:30:00 | ferra.ru

Простой шлюз в сеть Интернет на nftables в ОС Astra Linux Special Edition
14.11.2024 04:28:28 | Хабр

Технология возвращения зрения Blindsight вскоре получит одобрение американских регуляторов
14.11.2024 04:15:40 | it-world

Слово пацана (менеджерам и исполнителям посвящается)
14.11.2024 04:05:23 | Хабр

Названо лучшее время для завтрака при высоком холестерине
14.11.2024 03:45:00 | ferra.ru

Пути увеличения выручки в 2025 году. Как мы увеличили продажи интернет-магазина на 34%
14.11.2024 03:03:30 | Хабр

Доказано: запоры повышают риск возникновения сердечного приступа
14.11.2024 03:00:00 | ferra.ru

Раскрыто, почему кокосовая вода — лучший напиток для утоления жажды
14.11.2024 02:15:00 | ferra.ru

Перечислены простые и эффективные способы избавления от тяги к сладкому
14.11.2024 01:30:00 | ferra.ru

В Японии ждут снижение спроса на литографическое оборудование со стороны Китая
14.11.2024 00:45:00 | ferra.ru

Geekbench опубликовал результаты тестирования ИИ в глобальной версии Xiaomi 15
14.11.2024 00:00:00 | ferra.ru

Amazon закроет бесплатный аналог Netflix. Контент перенесут на Prime Video
13.11.2024 23:42:15 | ferra.ru

Как легально обналичить биткоин в России работникам IT: 3 лучших способа
13.11.2024 23:31:05 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Линию «Ферросплавная-1» снова подключили к ЗАЭС
05.03.2026 19:55:29 | Life.ru

Нацбанк Украины опустил гривну на исторический минимум
05.03.2026 19:53:45 | Life.ru

Fitch считает, что Ормузский пролив будет закрыт менее месяца
05.03.2026 19:53:11 | ТАСС

Главу района в Саратовской области подозревают в злоупотреблении полномочиями
05.03.2026 19:51:08 | ТАСС

Адвокаты высказались о грозящем бывшему первому замминистра обороны России наказании
05.03.2026 19:50:03 | Lenta.ru

В Бахрейне НПЗ Bapco Energies работает в штатном режиме после атаки Ирана
05.03.2026 19:49:30 | ТАСС

Зеленский заявил, что нефтепровод «Дружба» может заработать лишь через полтора месяца
05.03.2026 19:49:07 | Life.ru

Росфинмониторинг поддержал ужесточение ответственности для нелегальных кредиторов
05.03.2026 19:48:32 | ТАСС

Трамп считает, что должен лично участвовать в выборе лидера Ирана
05.03.2026 19:47:06 | ТАСС

В Москве к 8 Марта провели открытую встречу "Она - герой"
05.03.2026 19:45:55 | ТАСС

Мишустин объявил благодарность Трутневу
05.03.2026 19:45:12 | ТАСС

В сети оценили кастомные свадебные туфли российской художницы с фразой «пойдут на развод»
05.03.2026 19:44:39 | Lenta.ru

Голый по пояс мужчина пришел в больницу с укусившей его змеей в руках
05.03.2026 19:42:15 | Lenta.ru

В ЦСКА заявили, что обвинения "Краснодара" в расизме не имеют фактической основы
05.03.2026 19:41:49 | ТАСС

МАГАТЭ: линия электропередачи "Ферросплавная-1" снова подключена к ЗАЭС
05.03.2026 19:41:31 | ТАСС

Иран заявил о гибели более 100 моряков после атаки на фрегат IRIS Dena
05.03.2026 19:40:39 | Life.ru

Иран заявил о гибели более 100 моряков после атаки на фрегат IRIS Dena у берегов Индии
05.03.2026 19:40:39 | Life.ru

Трамп счёл неприемлемой кандидатуру сына Хаменеи на пост верховного лидера Ирана
05.03.2026 19:39:52 | Life.ru

Трамп захотел выбрать нового лидера Ирана
05.03.2026 19:39:31 | Lenta.ru

Рост цен на нефть резко усилился
05.03.2026 19:39:00 | Lenta.ru

Топ-менеджер российской компании сел после продажи иномарки за один рубль
05.03.2026 19:38:00 | Lenta.ru

Здание национального музея Карелии загорелось в Петрозаводске
05.03.2026 19:37:36 | Коммерсантъ

Число жертв с атакованного США иранского фрегата увеличилось
05.03.2026 19:36:52 | Lenta.ru

Северная железная дорога в марте добавит дополнительные вагоны к 11 поездам
05.03.2026 19:36:36 | ТАСС

Россиянка купила семь билетов ради выезда из ОАЭ
05.03.2026 19:35:14 | Lenta.ru

ТАСС: дело бывшего первого замглавы МО Цаликова связано со строительством
05.03.2026 19:35:05 | ТАСС

ТАСС: дело Цаликова связано со строительством объектов для МО РФ
05.03.2026 19:35:05 | ТАСС

Азербайджан закрыл границу для грузовиков после атаки иранского дрона
05.03.2026 19:34:37 | Life.ru

VK Fest пройдет в Казани
05.03.2026 19:34:25 | ТАСС

Путин подарил цветы участницам встречи в Кремле по случаю 8 Марта
05.03.2026 19:33:45 | ТАСС

Россиянка раскрыла отношение к соотечественникам в Дубае
05.03.2026 19:33:21 | Lenta.ru

Россиян призвали добавить в весенний рацион пять специй
05.03.2026 19:33:07 | Lenta.ru

Звезда Comedy Woman раскрыла подробности знакомства с мужем-итальянцем
05.03.2026 19:32:48 | Lenta.ru

ISNA: на востоке Тегерана произошли взрывы
05.03.2026 19:32:43 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro