Прогнал 6 апрельских LLM через battle test. Победил не самый новый и не самый дорогой

28.04.2026 10:50:22 | Хабр

Хабы: Машинное обучение, Искусственный интеллект

DeepSeek V4 Pro вышел 24 апреля. Огромная модель, топ AIME и SWE-bench, передовая reasoning-архитектура. Я ждал Tier S — 95+ из 100 в нашем battle test на русском контенте. Получил 89. Запустил его собственный Flash — 83. Pro выше на 6 пунктов, но в 13 раз дороже. Перетестировал Qwen 3.6 Plus, который вышел на 22 дня раньше V4 Pro: 92 балла. Старый Qwen обогнал новейший флагман DeepSeek и по качеству, и по цене. В статье: парадокс Pro vs Flash с экономикой production, гипотезы почему reasoning-оптимизация не вытягивает narrative, обновления методологии (max_tokens, paid re-test), формула score-per-dollar и обновлённые рекомендации.

Подробнее

Читайте также

12 ГБ видеопамяти в 2026 году: хватает или уже нет?
28.04.2026 10:48:31 | Хабр

Высоконагруженные люди: как управлять давлением и не сломать команду
28.04.2026 10:39:13 | Хабр

Как я написал антиспам-бота (TAB) для Telegram на собственной нейросети
28.04.2026 10:33:27 | Хабр

Апрельский «В тренде VM»: уязвимость в Microsoft SharePoint
28.04.2026 10:18:06 | Хабр

[Перевод] Детектор на дне моря поймал необычное нейтрино, которое может раскрыть секреты древних чёрных дыр
28.04.2026 10:17:25 | Хабр

Топ вопросов по математики для ML и Data Science собесов
28.04.2026 10:00:34 | Хабр

Цифровая тень: что скрывают под капотом популярные Android-приложения (результаты аудита)
28.04.2026 09:45:56 | Хабр

Отчёт «Яндекса» за квартал: выручка выросла на 22% год к году, до 372,7 млрд рублей, число сотрудников увеличилось на 6%
28.04.2026 09:31:52 | vc.ru

Книга: «Антипаттерны PostgreSQL и как их избежать»
28.04.2026 09:30:50 | Хабр

10 настроек Claude Code, до которых большинство разработчиков не доходит
28.04.2026 09:28:09 | Хабр

В Сети завирусились видео, где фонарик смартфона плавит пластик. И это возможно
28.04.2026 09:25:52 | ferra.ru

Story points — прошлый век?
28.04.2026 09:15:39 | Хабр

Это ты на фото? SMS-RAT. Методы обфускации
28.04.2026 09:08:30 | Хабр

Методы оценки эффективности сменного персонала на промышленных предприятиях
28.04.2026 09:07:50 | Хабр

Как понять, что мониторинг в ЦОДе шумит
28.04.2026 09:07:20 | Хабр

Геометрические фигуры в CSS-анимации
28.04.2026 09:01:01 | Хабр

Как мы написали UI-тесты для ИИ-агента внутри JetBrains IDE
28.04.2026 09:00:57 | Хабр

Онбординг сломан: мое мнение, почему разработчики теряют недели впустую
28.04.2026 09:00:08 | Хабр

Названы самые популярные бренды ноутбуков в России в начале 2026 года
28.04.2026 09:00:00 | ferra.ru

Квартира за один звонок: как работает социнженерия на рынке недвижимости
28.04.2026 08:48:51 | Хабр

Лучшие иностранные eSIM для путешествий заграницу
28.04.2026 08:47:37 | Хабр

Продакт-билдер — это не будущее. Это деградация роли
28.04.2026 08:46:54 | Хабр

Мониторинг SIP-телефонии через eBPF: полная Observability для VoIP-инфраструктуры
28.04.2026 08:46:09 | Хабр

Что проверить перед релизом микросервиса: практический чек-лист
28.04.2026 08:36:06 | Хабр

Можно ли запустить корпоративную BI+ETL-систему за 1,5 млн рублей? Часть 4: Biplane24
28.04.2026 08:34:48 | Хабр

Как проводить нагрузочное тестирование на Python
28.04.2026 08:34:31 | Хабр

День 1524: число загрузок VPN-сервисов в марте 2026-го выросло в 14 раз год к году
28.04.2026 08:24:14 | vc.ru

Протестировали самый дешёвый смартфон 2026 года
28.04.2026 08:03:00 | ferra.ru

От киосков самообслуживания до единой платформы, или Как котики ускоряют офисные процессы
28.04.2026 08:01:10 | Хабр

Технический долг в ИТ: главные причины и скрытые риски
28.04.2026 08:00:02 | Хабр

Тайны чёрных мониторов и бегущих строк. От ASCII-графики к современным языкам разметки
28.04.2026 07:54:19 | Хабр

Отображаем списки SharePoint в корпоративном портале: опыт реализации Proxy Object Storage для Инкоманд
28.04.2026 07:52:37 | Хабр

Как стратегия оптимальной конфигурации экономит до 50% ИТ бюджета
28.04.2026 07:46:20 | Хабр

«И что?»: 5 неудобных истин об HR-аналитике, которые меняют правила игры
28.04.2026 07:45:55 | Хабр

Революция на рынке ОЗУ откладывается. Праотец TurboQuant раскрыл все нюансы и написал жалобу в комитет по этике
28.04.2026 07:40:22 | Хабр

Смотреть все

НОВОСТИ

В России высказались о судьбе Visa и Mastercard
10.06.2026 14:13:06 | Lenta.ru

«Это уже крик души»: В Забайкалье директор школы умоляет починить дорогу — дети едут по шесть часов на ЕГЭ
10.06.2026 14:12:11 | Life.ru

Останки девушки с пулей в черепе идентифицировали спустя 37 лет
10.06.2026 14:10:36 | Lenta.ru

Появились кадры боев с ВСУ на северных окраинах Харькова
10.06.2026 14:09:00 | Российская Газета

Трамп: Иран затянул переговоры по мирной сделке с США
10.06.2026 14:08:53 | ТАСС

ГД включает благоустройство территорий в цели волонтерства
10.06.2026 14:08:45 | ТАСС

Будущее ведущей экономики Европы омрачилось еще сильнее
10.06.2026 14:08:08 | Lenta.ru

Сносить Банковую и жечь ТЦК: В РФ предложили перейти к «войне символов» после атаки на Панораму Севастополя
10.06.2026 14:08:07 | Life.ru

L"AntiDiplomatico: США видят угрозу в сотрудничестве Грузии с РФ и Китаем
10.06.2026 14:08:00 | Российская Газета

В Башкирии при пожаре в частном доме погибли трое детей
10.06.2026 14:07:44 | ТАСС

Минфин разместил ОФЗ 26244 на 53,497 млрд рублей
10.06.2026 14:07:32 | ТАСС

Специалисты обладают средствами для работы над почти уничтоженной панорамой в Севастополе
10.06.2026 14:07:25 | ТАСС

ISU впервые проведет чемпионат по всем дисциплинам в Пекине
10.06.2026 14:07:17 | Life.ru

В Польше назвали причину прославления УПА со стороны Зеленского
10.06.2026 14:06:52 | ТАСС

«Сталинка» с сюрпризом: Главный пародист Пугачёвой уже второй год не может продать квартиру из-за долгов
10.06.2026 14:06:42 | Life.ru

Футболист ЦСКА Круговой спрогнозировал победителя чемпионата мира
10.06.2026 14:06:41 | ТАСС

Fars: ВС Ирана сбили беспилотник над Хузестаном
10.06.2026 14:06:30 | ТАСС

В Калмыкии простились с Героем России Нараном Очир-Горяевым
10.06.2026 14:06:04 | ТАСС

Стубб: Европе пора возобновить дипломатический диалог с РФ
10.06.2026 14:05:53 | ТАСС

Россиянка сшила сумку из шнура и впечатлила пользователей сети
10.06.2026 14:05:45 | Lenta.ru

ГД намерена вернуться к вопросу повышения пошлин для мигрантов
10.06.2026 14:05:35 | ТАСС

Kyodo: Япония почти согласовала с США исключения из санкций для поставок СПГ РФ
10.06.2026 14:05:30 | ТАСС

Атака на панораму в Севастополе и адреса производств БПЛА для Киева. Заявления МИД
10.06.2026 14:05:28 | ТАСС

Apple случайно рассекретила новое устройство
10.06.2026 14:04:20 | Lenta.ru

Директор "Артека" назвал удар ВСУ по панораме в Севастополе преступлением против памяти
10.06.2026 14:03:57 | ТАСС

В Москве открыли регистрацию на первый в этом году Ночной велофестиваль
10.06.2026 14:03:51 | ТАСС

ГД разрешает установку ночных прицелов на гражданском оружии
10.06.2026 14:03:36 | ТАСС

Стал известен новый срок контракта тренера "Крыльев Советов" Булатова
10.06.2026 14:03:10 | ТАСС

"Финуслуги": ставки по вкладам до года выросли с начала мая на 0,07-0,17 п.п.
10.06.2026 14:03:01 | ТАСС

Россиянка увидела в Азии жареных собак и описала деликатес фразой «не для слабонервных»
10.06.2026 14:02:52 | Lenta.ru

В России назвали причины ударов по отдаленным от границы с Украиной регионам
10.06.2026 14:02:24 | Lenta.ru

Эрдоган: Израиль представляет угрозу для региона и всего человечества
10.06.2026 14:02:16 | ТАСС

ОДКБ рассмотрит исключение Армении из организации
10.06.2026 14:01:59 | Lenta.ru

В Башкирии задержали девять человек за аферы с sim-картами
10.06.2026 14:01:49 | ТАСС

Главу абхазской организации ветеранов внесли в базу "Миротворца"
10.06.2026 14:00:56 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro