Выбираем правильный инеференс: Как мы сэкономили 70к $ на ЛЛМках

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Выбираем правильный инеференс: Как мы сэкономили 70к $ на ЛЛМках

20.04.2024 11:53:45 | Хабр

Хабы: Машинное обучение, DevOps, Data Engineering

Недавно ко мне обратились знакомые, которые активно впиливали LLM в своей продукт, однако их смущала стоимость такого решения - они платили около 8$/час за Huggingface inference Endpoint 24/7, на что уходили просто невиданные ~100 тысяч долларов в год. Мне нужно было заресерчить какие есть способы развертывания больших текстовых моделей, понять какие где есть проблемы и выбрать оптимальных из них. Результатами этого ресерча и делюсь в этой статье)

Читать далее

Подробнее

Читайте также

Эксперт посоветовал заряжать смартфон в режиме полёта для ускорения зарядки
20.04.2024 11:15:00 | ferra.ru

«Лаборатория Касперского» представила прототип магазина приложений для KasperskyOS
20.04.2024 10:30:00 | ferra.ru

Основное о конференции Token 2049 и изменениях в Telegram
20.04.2024 10:07:03 | it-world

Как пытались (пере)программировать мозги, и что из этого получилось? Часть 5: загадочный полёт Фрэнка Олсона
20.04.2024 10:00:53 | Хабр

Boeing на фоне скандала с самолетами сократил штат сотрудников ракеты SLS
20.04.2024 09:45:40 | ferra.ru

Дайджест полезных находок, инструментов, статей и видео из мира машинного обучения за неделю
20.04.2024 09:10:18 | Хабр

Netflix перестанет сообщать о количестве своих подписчиков
20.04.2024 09:00:38 | ferra.ru

[Перевод] В чем разница между движками и средами выполнения JavaScript?
20.04.2024 08:32:02 | Хабр

Никогда такого не было и вот опять: падение поставок ASML и финансовые преграды
20.04.2024 08:24:23 | Хабр

Процессор Snapdragon X попытается занять ПК-рынок уже 24 апреля
20.04.2024 08:15:36 | ferra.ru

[Перевод] Как заново реализовать тетрис
20.04.2024 08:01:43 | Хабр

Ноутбук Framework и его проблемы: с «железом» всё хорошо, но вот с ПО что-то нужно делать. Перспективы устройства
20.04.2024 08:00:41 | Хабр

Миф о бесполезности земли возле ветряков развеяли
20.04.2024 07:30:34 | ferra.ru

SaltStack: управление конфигурациями
20.04.2024 07:11:37 | Хабр

Тестирование UI в Compose Multiplatform
20.04.2024 06:58:12 | Хабр

Созданная учеными ИИ-система поможет понять сложные болезни
20.04.2024 06:45:31 | ferra.ru

Новый анализ мочи сократил количество ненужных биопсий для поиска рака простаты
20.04.2024 06:00:29 | ferra.ru

Гипотеза вселенной 3. Гравитация и свет. Волна пространства
20.04.2024 05:40:58 | Хабр

Оценка экономики применения БПЛА в доставке посылок
20.04.2024 05:33:05 | Хабр

Создаем свой диалект змеиного, или DSL на Python
20.04.2024 05:21:29 | Хабр

Братья и сестры с уникальной мутацией дали надежду на лечение диабета 1 типа
20.04.2024 05:15:27 | ferra.ru

WhatsApp*, Facebook* и Instagram* получили мощнейший ИИ
20.04.2024 04:30:24 | ferra.ru

3DStereo, как старый новый формат объёмного звука
20.04.2024 04:16:18 | Хабр

Украинские войска взломали терминалы Starlink для бесплатного доступа в Интернет
20.04.2024 03:45:22 | ferra.ru

NumPy для самых маленьких
20.04.2024 03:35:46 | Хабр

Планшет, смартфон, ПК: Razer представила универсальный геймпад
20.04.2024 03:00:20 | ferra.ru

Возможное кумовство: Reddit стал «захватывать» результаты поисковика Google
20.04.2024 02:15:18 | ferra.ru

Стала известна официальная дата презентации Sony Xperia 1 VI
20.04.2024 02:11:50 | it-world

Создан экзоскелет с ИИ Dnsys X1 для улучшения возможностей человека
20.04.2024 01:30:17 | ferra.ru

Выбор загрузочного диска домашнего компьютера из Home Assistant
20.04.2024 00:52:00 | Хабр

Вспышка обезьяньей оспы может стать пандемией: предупредил иммунолог
20.04.2024 00:45:15 | ferra.ru

В Европе на iPhone появилась первая альтернатива магазину приложений App Store
20.04.2024 00:00:00 | ferra.ru

Ученые создали новый метод прогнозирования риска почечной недостаточности
19.04.2024 23:41:30 | ferra.ru

[Перевод] 6. Nix в пилюлях: Наша первая деривация
19.04.2024 23:39:04 | Хабр

Правительство РФ утвердило стратегию цифровой трансформации здравоохранения
19.04.2024 23:37:52 | ferra.ru

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Пленные бойцы ВСУ сдали командира, устроившем террор в селе Сопычь
19.03.2026 11:09:33 | Life.ru

Три новых вида рыб расселились по Северной Двине из-за глобального потепления
19.03.2026 11:08:57 | ТАСС

Пленный из ВСУ: колумбийцев отправляют на фронт без заключения контрактов
19.03.2026 11:08:38 | ТАСС

«Победил тот, кто взял небо»: Как в Ленобласти за месяц готовят операторов дронов
19.03.2026 11:08:25 | Life.ru

Лукашенко встретится со спецпосланником президента США по Белоруссии Коулом
19.03.2026 11:07:27 | ТАСС

Додик напомнил послу Германии, как Россия поддерживала сербов
19.03.2026 11:05:36 | Life.ru

ВЦИОМ: в России индекс цифрофобии в феврале составил 21 пункт
19.03.2026 11:04:47 | ТАСС

В Херсонской области БПЛА ВСУ атаковали детский сад
19.03.2026 11:04:37 | ТАСС

МВД Молдавии опубликовало пост с неправильным гербом, созданным ИИ
19.03.2026 11:04:00 | Российская Газета

В Молдавии начался скандал из-за публикации МВД искаженного нейросетями герба
19.03.2026 11:04:00 | Российская Газета

Раскрыто состояние впавшей в кому в Таиланде российской туристки
19.03.2026 11:03:17 | Lenta.ru

ВСУ более 500 раз атаковали Алешкинский округ Херсонской области за неделю
19.03.2026 11:03:09 | ТАСС

Хоккеист Сикьюра продлил контракт с московским "Динамо"
19.03.2026 11:03:05 | ТАСС

Минфин видит резервы роста доходов бюджета по программам по обелению экономики
19.03.2026 11:02:51 | ТАСС

Мерц заявил о необходимости участия Европы в переговорах США по Украине
19.03.2026 11:02:04 | Life.ru

Двести молодых медиков и педагогов поддержат грантами в этом году в Курганской области
19.03.2026 11:01:29 | ТАСС

NetBlocks: в Иране доступ в интернет полностью отсутствует более 450 часов
19.03.2026 11:01:28 | ТАСС

В Индии фондовые индексы резко упали из-за эскалации на Ближнем Востоке
19.03.2026 11:01:07 | ТАСС

В Брянске задержали преступную группу с 6 кг наркотиков
19.03.2026 11:00:41 | ТАСС

В МИД КНР заявили, что США должны прекратить вмешательство в вопрос Тайваня
19.03.2026 11:00:40 | ТАСС

Путин наградил российских паралимпийцев
19.03.2026 11:00:26 | РЕН ТВ

В России вводятся штрафы за остекленные балконы. Правда ли это?
19.03.2026 11:00:00 | ТАСС

Гной, боль и шаг до слепоты: Забытый стоматологами предмет чуть не отправил москвичку на тот свет
19.03.2026 10:59:47 | Life.ru

DR: Дания готовилась к отражению нападения США из-за Гренландии в январе
19.03.2026 10:59:21 | ТАСС

Начались съемки детективного экшена "Черный шелк"
19.03.2026 10:59:11 | РЕН ТВ

В Петербурге резекцию желудка при ожирении начали делать бесплатно по ОМС
19.03.2026 10:58:43 | Life.ru

В России отреагировали на идею ослабления связей с Китаем ради сближения с США
19.03.2026 10:58:08 | Lenta.ru

Путин присвоил госнаграды паралимпийцам и их тренерам
19.03.2026 10:57:53 | РБК

Разработана новая методика расчета выбросов метана на полигонах ТКО
19.03.2026 10:57:50 | ТАСС

Мишустин: межбиржевое сотрудничество с БРИКС и ЕАЭС способствует ценообразованию
19.03.2026 10:57:30 | ТАСС

ФТС за 2025 год перечислила в федеральный бюджет 5,911 трлн рублей
19.03.2026 10:57:29 | ТАСС

Захарова назвала англосаксов лицемерами за критику агрессии США и Израиля
19.03.2026 10:56:34 | ТАСС

Мема поймал Европу на лицемерии в вопросе санкций на фоне ударов по Ливану
19.03.2026 10:56:00 | Российская Газета

Певица МакSим призналась, что разочаровалась в ботоксе
19.03.2026 10:55:27 | Life.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro