Рецепт vLLM с мистралем. Часть 1

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Рецепт vLLM с мистралем. Часть 1

03.10.2025 13:13:03 | Хабр

Хабы: Python

В первой части мы загрузим и запустим модель Mistral-7b, используя технику QLoRA, метода 4-битного квантования, который позволяет значительно уменьшить размер модели без потери её производительности.

Вместе мы разберёмся, как загрузить модель в 4-битном формате, изучим все варианты её конфигурации и запустим её для выполнения задач (инференса).

Читать далее

Подробнее

Читайте также

Пандемия «порченой крови»: виртуальная катастрофа с реальным продолжением
03.10.2025 13:07:03 | Хабр

Не флагман, но с амбициями: тестируем камеру HUAWEI nova 14 Pro в реальных условиях
03.10.2025 13:03:58 | Хабр

Видеоаналитика в реальном времени: что делать, если нет GPU
03.10.2025 13:01:02 | Хабр

Три пути к 4K: выбираем свой инструмент для нейросетевой реставрации видео
03.10.2025 13:01:01 | Хабр

Сервис для бегунов и велосипедистов Strava подал в суд на производителя «умных» часов Garmin, обвинив в нарушении патентных прав
03.10.2025 13:00:36 | vc.ru

Как написать нейросеть для бизнеса на Python
03.10.2025 12:49:36 | Хабр

Rules File Backdoor. Как атакуют GitHub Copilot и Cursor и почему «это ваша проблема»
03.10.2025 12:48:59 | Хабр

Samsung незаметно изменила расчёт качества сна на часах Galaxy Watch
03.10.2025 12:45:00 | ferra.ru

В Google Gemini нашли сразу три серьёзные уязвимости, позволявшие красть данные
03.10.2025 12:42:33 | ferra.ru

Издательство Питер. Колонка редактора, октябрь 25 г
03.10.2025 12:42:19 | Хабр

В Galaxy S26 Ultra появится защита от подглядывания за экраном
03.10.2025 12:34:34 | ferra.ru

Зоопарк фреймворков для AI-агентов: как выбрать подходящий — делаем бенчмарк и большое сравнение
03.10.2025 12:33:35 | Хабр

Электромобиль Xiaomi SU7 в Китае самостоятельно уехал от владельца
03.10.2025 12:33:21 | vc.ru

Квартальные продажи электромобилей китайской BYD на 17% превысили показатели Tesla, несмотря на «рекордные» продажи американской компании
03.10.2025 12:31:00 | vc.ru

Как я писал свою звонилку для видеозвонков
03.10.2025 12:27:16 | Хабр

Продажи электрокаров Tesla резко выросли накануне отмены налоговых льгот
03.10.2025 12:25:20 | ferra.ru

Борьба с дисбалансом классов. Стандартные методы
03.10.2025 12:19:27 | Хабр

Архитектура NGFW: опыт использования VPP и DPDK, частые ошибки разработчиков
03.10.2025 12:18:50 | Хабр

Чтение на выходные: «Всё под контролем. Моя эпичная история в геймдеве» Клиффа Блезински
03.10.2025 12:16:45 | Хабр

Минфин предложил ввести налог на заказы зарубежных товаров через маркетплейсы
03.10.2025 12:11:22 | vc.ru

[Перевод] У JavaScript не будет прекрасного будущего
03.10.2025 12:00:55 | Хабр

В Telegram прокомментировали одобрение в США удалённого взлома мессенджера
03.10.2025 12:00:00 | ferra.ru

PCIe умер, да здравствует CXL
03.10.2025 11:53:58 | Хабр

Едем в поле с железным ящиком: как тестируют телеком
03.10.2025 11:50:42 | Хабр

В App Store появилось приложение CashHunter с функциями «Газпромбанка»
03.10.2025 11:41:08 | vc.ru

Как мы решились автоматизировать поиск работы в рунете и какие препятствия были у нас на пути…
03.10.2025 11:38:04 | Хабр

[Перевод] Рекомендательные системы в современном мире
03.10.2025 11:36:51 | Хабр

Как попасть в ответы ChatGPT, Perplexity и Google AI: практическое руководство по GEO
03.10.2025 11:23:47 | Хабр

Amplicode – идеальное дополнение к IntelliJ IDEA Ultimate. Огромный гайд для Spring-разработчика
03.10.2025 11:15:48 | Хабр

EntityFrameworkCore в C#
03.10.2025 11:15:46 | Хабр

iPhone Air получил самую медленную зарядку среди других моделей серии iPhone 17
03.10.2025 11:15:00 | ferra.ru

Как с помощью ИИ быстро найти общий язык с заказчиком
03.10.2025 11:06:44 | Хабр

Видеокарты NVIDIA для enterprise: A2000, T4 и A2 — что выбрать и как арендовать за рубль
03.10.2025 11:00:43 | Хабр

[Перевод] Почему не стоит заменять пустые значения нулями в Power BI
03.10.2025 11:00:42 | Хабр

«Яндекс Go для бизнеса» добавил предзаказ трансфера — машина подъедет ко времени посадки самолёта
03.10.2025 11:00:15 | vc.ru

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Доходы фронтмена «Мумий Тролля» в России выросли до почти 40 млн рублей после отъезда
09.03.2026 09:07:46 | Life.ru

Водителей предупредили о штрафе до 15 тысяч из-за незаметной пометки в правах
09.03.2026 09:00:26 | Life.ru

BNA: на объекте близ столицы Бахрейна из-за иранского удара произошел пожар
09.03.2026 09:00:00 | ТАСС

"Благодаря ему я влюбилась в космос": молодежь из разных стран — о Юрии Гагарине
09.03.2026 09:00:00 | ТАСС

Анестезист о службе на СВО: женщина в полевом госпитале — прежде всего медик
09.03.2026 09:00:00 | ТАСС

Птичье потенье 9 марта: какие приметы помогут привлечь счастье и богатство в дом
09.03.2026 09:00:00 | Life.ru

Назван самый популярный вид вклада у россиян
09.03.2026 08:59:14 | Lenta.ru

В Японии выступили с тревожным для США прогнозом
09.03.2026 08:59:00 | Lenta.ru

Трамп прокомментировал избрание нового верховного лидера Ирана
09.03.2026 08:58:43 | РБК

Над Курской областью сбили более 20 беспилотников ВСУ за сутки
09.03.2026 08:58:39 | ТАСС

G7 экстренно обсудит возможное использование запасов нефти
09.03.2026 08:57:16 | РБК

В Минске оценили возможность организации перелетов в США
09.03.2026 08:57:00 | Российская Газета

Лыжница Ордина: Россия развивается и расцветает, а Швеция в упадке
09.03.2026 08:57:00 | Российская Газета

Армия Израиля заявила об ударах по месту производства ракетных двигателей в Иране
09.03.2026 08:56:40 | ТАСС

Российским отелям советуют не селить китайцев на «несчастный» четвёртый этаж
09.03.2026 08:54:57 | Life.ru

США приказали госслужащим покинуть Саудовскую Аравию
09.03.2026 08:54:00 | Российская Газета

Пугачеву могут лишить товарного знака в России
09.03.2026 08:53:15 | Lenta.ru

Кучерова признали третьей звездой игрового дня в НХЛ
09.03.2026 08:52:57 | ТАСС

Пусковая установка MLRS и расчёт солдат ВСУ уничтожены двумя ракетами под Харьковом
09.03.2026 08:52:48 | Life.ru

Скандала не будет. В титрах Marathon указана художница, работы которой использовали без разрешения
09.03.2026 08:52:37 | PlayGround.ru

Российские дипломаты в Мьянме помгли пассажирам рейса Azur Air Тюмень - Нячанг
09.03.2026 08:49:41 | ТАСС

В Калужской области наложили арест на имущество должностных лиц
09.03.2026 08:49:19 | ТАСС

Девять детей отправились в больницу после посещения бассейна в российском городе
09.03.2026 08:49:00 | Lenta.ru

"По сути, это ПК": по слухам, Xbox Project Helix будет только "эмулировать" работу консоли
09.03.2026 08:48:18 | PlayGround.ru

Руководитель Microsoft заверяет игроков, что компания продолжит поддерживать и развивать Xbox
09.03.2026 08:42:52 | PlayGround.ru

Новый российский дрон-перехватчик «Ёлка» неуязвим для РЭБ
09.03.2026 08:42:47 | Life.ru

FT: главы Минфинов G7 обсудят возможное совместное использование запасов нефти
09.03.2026 08:41:33 | ТАСС

FT: главы Минфинов G7 экстренно обсудят возможное использование запасов нефти
09.03.2026 08:41:33 | ТАСС

Сотрудники ТЦК остановили депутата Рады, парламентарию озвучили сумму взятки
09.03.2026 08:41:00 | Российская Газета

Претендент на звание лучшего камерофона 2026 года. Инсайдер раскрыл все характеристики камеры Vivo X300 Ultra
09.03.2026 08:41:00 | iXBT.com

«РИА Новости»: самые высокие средние зарплаты в России получают управляющие фондами
09.03.2026 08:40:54 | Коммерсантъ

В аэропортах Красноярска, Омска и Новосибирска задерживаются рейсы
09.03.2026 08:39:41 | ТАСС

Звезда "Фуриосы" и "Дюны" Аня Тейлор-Джой может сыграть главную женскую роль в новом фильме "Властелин колец"
09.03.2026 08:38:55 | PlayGround.ru

В Demon Slayer: Kimetsu no Yaiba - The Hinokami Chronicles 2 добавят Гию Томиоку из "Бесконечного замка"
09.03.2026 08:38:27 | PlayGround.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro