Выбираем правильный инеференс: Как мы сэкономили 70к $ на ЛЛМках - Все тут

Операция выполнена!

info@vsetut.pro

О проекте

Вернуться

Выбираем правильный инеференс: Как мы сэкономили 70к $ на ЛЛМках

20.04.2024 11:53:45 | Хабр

Хабы: Машинное обучение, DevOps, Data Engineering

Недавно ко мне обратились знакомые, которые активно впиливали LLM в своей продукт, однако их смущала стоимость такого решения - они платили около 8$/час за Huggingface inference Endpoint 24/7, на что уходили просто невиданные ~100 тысяч долларов в год. Мне нужно было заресерчить какие есть способы развертывания больших текстовых моделей, понять какие где есть проблемы и выбрать оптимальных из них. Результатами этого ресерча и делюсь в этой статье)

Читать далее

Подробнее

Читайте также

Эксперт посоветовал заряжать смартфон в режиме полёта для ускорения зарядки
20.04.2024 11:15:00 | ferra.ru

«Лаборатория Касперского» представила прототип магазина приложений для KasperskyOS
20.04.2024 10:30:00 | ferra.ru

Основное о конференции Token 2049 и изменениях в Telegram
20.04.2024 10:07:03 | it-world

Как пытались (пере)программировать мозги, и что из этого получилось? Часть 5: загадочный полёт Фрэнка Олсона
20.04.2024 10:00:53 | Хабр

Boeing на фоне скандала с самолетами сократил штат сотрудников ракеты SLS
20.04.2024 09:45:40 | ferra.ru

Дайджест полезных находок, инструментов, статей и видео из мира машинного обучения за неделю
20.04.2024 09:10:18 | Хабр

Netflix перестанет сообщать о количестве своих подписчиков
20.04.2024 09:00:38 | ferra.ru

[Перевод] В чем разница между движками и средами выполнения JavaScript?
20.04.2024 08:32:02 | Хабр

Никогда такого не было и вот опять: падение поставок ASML и финансовые преграды
20.04.2024 08:24:23 | Хабр

Процессор Snapdragon X попытается занять ПК-рынок уже 24 апреля
20.04.2024 08:15:36 | ferra.ru

[Перевод] Как заново реализовать тетрис
20.04.2024 08:01:43 | Хабр

Ноутбук Framework и его проблемы: с «железом» всё хорошо, но вот с ПО что-то нужно делать. Перспективы устройства
20.04.2024 08:00:41 | Хабр

Миф о бесполезности земли возле ветряков развеяли
20.04.2024 07:30:34 | ferra.ru

SaltStack: управление конфигурациями
20.04.2024 07:11:37 | Хабр

Тестирование UI в Compose Multiplatform
20.04.2024 06:58:12 | Хабр

Созданная учеными ИИ-система поможет понять сложные болезни
20.04.2024 06:45:31 | ferra.ru

Новый анализ мочи сократил количество ненужных биопсий для поиска рака простаты
20.04.2024 06:00:29 | ferra.ru

Гипотеза вселенной 3. Гравитация и свет. Волна пространства
20.04.2024 05:40:58 | Хабр

Оценка экономики применения БПЛА в доставке посылок
20.04.2024 05:33:05 | Хабр

Создаем свой диалект змеиного, или DSL на Python
20.04.2024 05:21:29 | Хабр

Братья и сестры с уникальной мутацией дали надежду на лечение диабета 1 типа
20.04.2024 05:15:27 | ferra.ru

WhatsApp*, Facebook* и Instagram* получили мощнейший ИИ
20.04.2024 04:30:24 | ferra.ru

3DStereo, как старый новый формат объёмного звука
20.04.2024 04:16:18 | Хабр

Украинские войска взломали терминалы Starlink для бесплатного доступа в Интернет
20.04.2024 03:45:22 | ferra.ru

NumPy для самых маленьких
20.04.2024 03:35:46 | Хабр

Планшет, смартфон, ПК: Razer представила универсальный геймпад
20.04.2024 03:00:20 | ferra.ru

Возможное кумовство: Reddit стал «захватывать» результаты поисковика Google
20.04.2024 02:15:18 | ferra.ru

Стала известна официальная дата презентации Sony Xperia 1 VI
20.04.2024 02:11:50 | it-world

Создан экзоскелет с ИИ Dnsys X1 для улучшения возможностей человека
20.04.2024 01:30:17 | ferra.ru

Выбор загрузочного диска домашнего компьютера из Home Assistant
20.04.2024 00:52:00 | Хабр

Вспышка обезьяньей оспы может стать пандемией: предупредил иммунолог
20.04.2024 00:45:15 | ferra.ru

В Европе на iPhone появилась первая альтернатива магазину приложений App Store
20.04.2024 00:00:00 | ferra.ru

Ученые создали новый метод прогнозирования риска почечной недостаточности
19.04.2024 23:41:30 | ferra.ru

[Перевод] 6. Nix в пилюлях: Наша первая деривация
19.04.2024 23:39:04 | Хабр

Правительство РФ утвердило стратегию цифровой трансформации здравоохранения
19.04.2024 23:37:52 | ferra.ru

Смотреть все

НОВОСТИ

Мощный снегопад принес крупные пробки на дороги Урала
04.05.2024 05:45:56 | РЕН ТВ

РИА Новости: Алжир запросил заседание СБ ООН по теме массовых захоронений в Газе
04.05.2024 05:43:00 | Российская Газета

Юрист посоветовал родителям указывать в договоре запреты для няни
04.05.2024 05:36:00 | Life.ru

23-летний Шилов – самый молодой в истории «Ванкувера» вратарь с шатаутом в плей-офф НХЛ. Он побил рекорд Демко
04.05.2024 05:34:00 | Sports.ru

Солдаты ВС РФ поздравили ветерана Василия Попова с Днем Победы
04.05.2024 05:25:14 | РЕН ТВ

У Михеева 0+0 в 6 играх плей-офф с «Нэшвиллом». Серия без очков с учетом регулярки – 7 матчей
04.05.2024 05:19:00 | Sports.ru

Невысоким людям подсказали, как выглядеть выше за счёт одежды
04.05.2024 05:18:00 | Life.ru

Стали известны самые востребованные профессии во время майских праздников
04.05.2024 05:14:53 | ТАСС

Военнослужащие Южной группировки ВС РФ поздравили ветерана ВОВ, проживающего в Горловке
04.05.2024 05:06:14 | ТАСС

Группировка "Днепр" сообщила об уничтожении за сутки 40 пунктов управления БПЛА ВСУ
04.05.2024 05:04:20 | ТАСС

Стало известно об особом интересе Киева к американским дронам MQ-9 Reaper
04.05.2024 05:03:00 | Life.ru

«Ванкувер» сыграет с «Эдмонтоном» во втором раунде плей-офф НХЛ
04.05.2024 05:03:00 | Спорт-Экспресс

Министр туризма Кубы анонсировал открытие новых рейсов из Москвы на остров в июне и зимой
04.05.2024 05:01:13 | ТАСС

«Ванкувер» вышел во 2-й раунд Кубка Стэнли впервые за 4 года и сыграет с «Эдмонтоном»
04.05.2024 05:01:00 | Sports.ru

Аналитики нашли троян в Android-приложении для управления секс-игрушками
04.05.2024 05:00:16 | РБК

Су-25 группировки "Центр" уничтожили опорник ВСУ ракетами С-8
04.05.2024 05:00:00 | РЕН ТВ

Перебои с электричеством наблюдаются в Днепропетровской области после взрывов
04.05.2024 04:49:00 | Life.ru

Гол Сутера принес «Ванкуверу» победу над «Нэшвиллом», «Кэнакс» вышли во второй раунд плей-офф
04.05.2024 04:49:00 | Спорт-Экспресс

«Дортмунду» интересен Гирасси из «Штутгарта». Отступные за 2-го бомбардира Бундеслиги – 20 млн евро
04.05.2024 04:47:00 | Sports.ru

«Орландо» сравнял счет в серии с «Кливлендом», команды ждет седьмой матч
04.05.2024 04:45:00 | Спорт-Экспресс

Разработчики Apex Legends показали актрису озвучки новой легенды - Альтер
04.05.2024 04:44:39 | PlayGround.ru

МЧС предложило увеличить штрафы за нарушения пожарной безопасности
04.05.2024 04:40:30 | РБК

Россиянам рассказали, как подготовиться к тренировкам на улице
04.05.2024 04:32:00 | Life.ru

Селюк назвал Дзюбу разочарованием сезона в РПЛ
04.05.2024 04:32:00 | Спорт-Экспресс

Литвинов не против, чтобы Слишкович остался в «Спартаке»: «Его уже все знают, он давно в клубе. Но решение принимать не игрокам, а руководству. Давайте Гвардиолу поставим»
04.05.2024 04:30:00 | Sports.ru

Посол ЕС на Украине ждет, что в 2024 году Киев получит доходы от замороженных активов РФ
04.05.2024 04:29:22 | ТАСС

Канчельскис: «Мне предлагали Дениса Глушакова в «Тобол»
04.05.2024 04:19:00 | Спорт-Экспресс

В Египте состоятся переговоры по прекращению огня в секторе Газа
04.05.2024 04:18:17 | РБК

Наумов о бане Тихонова: «Достаточно было дать один матч. В мужском футболе все‑таки должны судить арбитры‑мужчины»
04.05.2024 04:17:00 | Sports.ru

МЧС предложило ужесточить штрафы для незастрахованных АЗС после взрыва в Дагестане
04.05.2024 04:15:00 | Life.ru

Политолог Бортник: ВСУ не могут сдержать наступление армии РФ на Донбассе
04.05.2024 04:14:00 | Российская Газета

Моддеры показали обновленную Dark Messiah of Might and Magic на RTX Remix
04.05.2024 04:13:16 | PlayGround.ru

Фильцов: «Ахмат» очень опасен для «Краснодара»
04.05.2024 04:06:00 | Спорт-Экспресс

Луна не помешает наблюдению звездопада эта-Аквариды в ночь на 6 мая
04.05.2024 04:05:16 | ТАСС

В ЕС раскрыли, почему Украине будет сложнее получить военную помощь
04.05.2024 04:03:49 | РБК

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2024 - vsetut.pro