Погоди переезжать на дешёвую модель: считаем effective cost с учётом кэша

10.03.2026 08:00:22 | Хабр

Хабы: Блог компании Битрикс24, Искусственный интеллект

В сообществе часто пишут о том что KV-cache hit rate - один из главных приоритетов при оптимизации стоимости. Manus в той-самой статье про context engineering и своего агента, TikTok в кейсе про оптимизацию AI-агента для тестирования, AiSDR в статье про перестройку шаблонов генерации писем.
Стало интересно стало: а как это считается у MaaS-провайдеров? Я знаком со скидкой за кэш токены, но никогда не садился детально разбирать экономику кэша у OpenAI, Anthropic, Gemini, DeepSeek - с цифрами, сценариями, сравнением.

Сел считать. Первый же результат удивил: два запроса к одной и той же модели с одним и тем же объёмом токенов - разница в цене в 3 раза. Зависит только от того, попали ли токены в кэш.

Про то как KV-кэш устроен внутри - уже хорошо написано на Хабре, ссылки в конце. Здесь только про деньги и токены: как считать реальную стоимость и почему прайс-лист для этого не подходит только прайс-лист.

Подробнее

Читайте также

Новогодние страдания, или как я сдавал CPTS в 2026 году
10.03.2026 08:00:21 | Хабр

Как защититься от удаления в S3 с помощью Object Lock / WORM
10.03.2026 08:00:20 | Хабр

Project Valhalla: революция в памяти Java
10.03.2026 08:00:19 | Хабр

Stitches закрыт — да здравствует StyleX
10.03.2026 07:56:56 | Хабр

[Перевод] Разработчики должны быть слегка циничными
10.03.2026 07:45:53 | Хабр

Computer Vision модель в борьбе с галлюцинациями LLM. Оправданный оверинжиниринг?
10.03.2026 07:30:15 | Хабр

Почему поддержка знает о проблемах продукта больше, чем разработка
10.03.2026 07:28:59 | Хабр

Пять человек в компании должны сказать Ок, чтобы сменить мессенджер. Вот что убедит каждого из них
10.03.2026 07:27:00 | Хабр

Выход новых устройств Apple расстянется на весь год
10.03.2026 07:01:47 | ferra.ru

LLM Inside: выжимаем максимум из Decoder Attention на GPU
10.03.2026 07:01:15 | Хабр

Blueprint VM изнутри: ~80 инструкций, которые двигают вашу игру
10.03.2026 07:00:43 | Хабр

Время в BPMN
10.03.2026 07:00:43 | Хабр

Мифы про REST API. Часть 2
10.03.2026 06:59:15 | Хабр

Поколение JSON: цена удобных абстракций и упадок культуры ресурсов
10.03.2026 06:47:41 | Хабр

Наблюдаемость LLM-агентов: Часть 2. Разработка и отладка графа
10.03.2026 06:37:27 | Хабр

Простые проблемы, которые мы решали в ИИ-стартапе
10.03.2026 06:33:37 | Хабр

Интеграция «Честного знака» или законы Мерфи в разработке
10.03.2026 06:22:34 | Хабр

[Перевод] Сэм Альтман собрал больше денег, чем ВВП 140 стран. Их хватило на два года. Что будет дальше?
10.03.2026 06:22:27 | Хабр

Почему мы ненавидим, но так любим нейросети
10.03.2026 06:18:28 | Хабр

«Принеси-подай, отвали и не мешай»: что такое агентность и почему менеджеру её не хватает
10.03.2026 06:00:22 | Хабр

AI-агент с долгосрочной памятью: строю личного аналитика с Claude Code
10.03.2026 05:59:05 | Хабр

Мониторинг частоты упоминаний бренда в ChatGPT и Яндекс Алисе, карта ПДн вашего бизнеса — и еще 8 российских стартапов
10.03.2026 05:45:20 | Хабр

Воплощение it проекта в реальном производстве. Практический кейс из металлургии
10.03.2026 05:33:53 | Хабр

Конструктор табличных значений, UNNEST(), TABLE(), STRING_SPLIT(), JSON_TABLE() — замена временным таблицам в SQL
10.03.2026 05:28:41 | Хабр

Как уместить опыт в одностраничный PDF
10.03.2026 05:16:14 | Хабр

9 событий в мире ИИ, которые завирусились в соцсетях 24 февраля — 9 марта 2026 года
10.03.2026 05:10:42 | Хабр

Unreal Engine 5.4 + C++ + MacOS Tahoe + Android build = Build Successful
10.03.2026 03:15:56 | Хабр

Концепция кастомизированных ИИ-агентов как «виртуальных аватаров» человека
10.03.2026 01:19:21 | Хабр

Контракт вместо настроек: чего я жду от OLTP-БД
10.03.2026 01:07:46 | Хабр

Тёмная сторона крипты, аномалии и управление тысячами роботов
10.03.2026 00:24:42 | Хабр

Стики с эффектом Холла для неоригинального контроллера xbox 360
09.03.2026 22:00:32 | Хабр

Как построить DWDM-сеть в России
09.03.2026 21:57:55 | Хабр

От бронзы к золоту. Методика управления ETL-процессами через сквозную нумерацию пакетов с данными
09.03.2026 21:16:53 | Хабр

Lexometrica Ground Truth: бенчмарк LLM по российскому праву
09.03.2026 21:15:27 | Хабр

Lenovo показала концепт портативной консоли со складным экраном
09.03.2026 21:01:48 | ferra.ru

Смотреть все

НОВОСТИ

Ночной концерт у капота: чем опасна «чуткая» сигнализация
02.05.2026 03:28:42 | За рулем

Путин в Санкт-Петербурге начал встречу с главой МИД Ирана Аракчи
27.04.2026 16:13:00 | Российская Газета

Убьют быстро и без камер: Покушение на Трампа было постановкой, считает политолог
27.04.2026 16:12:29 | Life.ru

В Рязанской области арестовали подозреваемого в убийстве женщины и ребенка
27.04.2026 16:10:38 | ТАСС

В Новгородской области более 3,2 тыс. человек остались без света из-за ветра
27.04.2026 16:10:18 | ТАСС

Под Самарой ветер снёс с трассы «Газель» с прицепом
27.04.2026 16:10:07 | Life.ru

Буданов описал экспорт украинской военной продукции фразой «Украина больше не нужна»
27.04.2026 16:09:19 | Lenta.ru

Стрелка из московского метро задержали
27.04.2026 16:09:06 | Lenta.ru

Стало известно о запрещенном оружии при атаке ВСУ на Севастополь
27.04.2026 16:08:46 | Lenta.ru

Сервисы S7 Airlines включили в белый список интернет-ресурсов
27.04.2026 16:08:43 | ТАСС

В Турции распространяется возможность оплаты рублями через СБП
27.04.2026 16:08:23 | ТАСС

Путин поцеловал юную гимнастку
27.04.2026 16:08:23 | Lenta.ru

Обелиск «Городу-Герою Севастополю» поврежден при атаке ВСУ
27.04.2026 16:07:06 | Коммерсантъ

Жителя Кубани осудили за диверсию на железной дороге
27.04.2026 16:06:19 | ТАСС

Экс-стюардесса предложила пускать пассажиров с детьми в самолет последними
27.04.2026 16:06:16 | Lenta.ru

Путин: РФ намерена продолжать стратегические отношения с Ираном
27.04.2026 16:05:55 | ТАСС

«В России свободы гораздо больше»: Жители Германии облюбовали село на Алтае
27.04.2026 16:05:14 | Life.ru

Россияне не оценили идею о шестидневке, показал опрос
27.04.2026 16:05:01 | Life.ru

Международный союз конькобежцев обсудит допуск российских фигуристов
27.04.2026 16:04:24 | Lenta.ru

Путин сделал заявление на встрече с главой МИД Ирана
27.04.2026 16:04:00 | Lenta.ru

В России упал спрос на бизнес-тренеров
27.04.2026 16:03:44 | Lenta.ru

Арагчи: отношения Москвы и Тегерана будут укрепляться
27.04.2026 16:02:28 | ТАСС

Звезду «Дома-2» захотели лишить родительских прав из-за проблем с алкоголем
27.04.2026 16:02:14 | Lenta.ru

Путин получил послание от верховного лидера Ирана
27.04.2026 16:02:13 | Lenta.ru

В Минтрансе допустили изменения в расписании авиарейсов из-за снегопада
27.04.2026 16:01:53 | ТАСС

Арагчи: народ Ирана своим мужеством смог сопротивляться агрессии США
27.04.2026 16:01:02 | ТАСС

Арагчи поблагодарил Путина и Россию за поддержку Ирана
27.04.2026 16:00:56 | ТАСС

Назван неожиданный фактор резкого роста риска развития деменции
27.04.2026 16:00:50 | Lenta.ru

Россия и Сербия договорились о расширении взаимодействия в сфере образования
27.04.2026 16:00:33 | ТАСС

Глава МИД Ирана: Хаменеи и Пезешкиан передали Путину наилучшие пожелания
27.04.2026 16:00:32 | ТАСС

Экс-гендиректора "Пластик лоджик" Галкина осудили на девять лет за растрату
27.04.2026 16:00:12 | ТАСС

Лавров, Костюков и Ушаков принимают участие во встрече Путина с Арагчи
27.04.2026 16:00:06 | ТАСС

Внезапный снег на грядках: что делать сразу, чтобы спасти рассаду, — пошаговая инструкция
27.04.2026 16:00:00 | Life.ru

В Армении задержали еще четверо сторонников "Сильной Армении"
27.04.2026 15:58:54 | ТАСС

Арагчи заявил, что рад встретиться с Путиным в Санкт-Петербурге
27.04.2026 15:58:34 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro