Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

info@vsetut.pro

Стать автором

Вернуться

08.04.2026 08:27:49 | Хабр

Хабы: Машинное обучение, Высоконагруженные системы, Программирование, Open source, Системное программирование

Год назад запуск модели на 35 миллиардов параметров подразумевал облако, очередь на GPU, и счёт от провайдера в конце месяца. Сегодня я покажу, как мы сделали это на одной потребительской видеокарте AMD за $500 — без ROCm, без CUDA, без MLX, одним бинарником на Zig.

Это пост про ZINC — inference engine, который мы строим с нуля под железо, которое люди реально покупают. Не как proof of concept, а как рабочий инструмент с OpenAI-совместимым API, потоковой генерацией и встроенным чатом.

Погрузиться

Подробнее

Читайте также

Cruzo — минималистичный UI-фреймворк без лишней сложности
08.04.2026 08:20:43 | Хабр

Делаем шасси для модели ретроавто
08.04.2026 08:05:34 | Хабр

Push-уведомления в Linux не работают: история одного багрепорта
08.04.2026 08:01:51 | Хабр

Собираем pod с учетом зависимостей в Podman
08.04.2026 08:00:31 | Хабр

Что даёт воспроизводимая среда разработки и как развернуть контейнеры на VPS
08.04.2026 08:00:28 | Хабр

Так выглядит портативная консоль GameMT с отсоединяемым экраном
08.04.2026 07:47:23 | ferra.ru

И всё-таки она вертится…
08.04.2026 07:29:17 | Хабр

Что нам стоит UX настроить? Или как мы искали способы проверки интерфейсов Smart TV без разработки
08.04.2026 07:22:07 | Хабр

Как подготовить сайт ИТ-компании к аккредитации в 2026 году: полный гайд по новым требованиям
08.04.2026 07:19:45 | Хабр

TTF-DOOM: как я запустил 3D-рейкастер внутри TrueType-шрифта
08.04.2026 07:16:09 | Хабр

Облачная виртуализация: почему мы переработали интерфейс и что из этого вышло
08.04.2026 07:14:52 | Хабр

Рецензия на книгу «Искусство визуализации в бизнесе. Как представить сложную информацию простыми способами»
08.04.2026 07:14:05 | Хабр

Как более 100 000 специалистов оказались на рынке труда всего за один месяц
08.04.2026 07:13:30 | Хабр

Стриминг ответов в Telegram-боте: новый API и 100 строк Python
08.04.2026 07:11:03 | Хабр

3 архитектурные ошибки в C#, из-за которых проект становится неуправляемым
08.04.2026 07:00:48 | Хабр

Квантовый аккумулятор
08.04.2026 07:00:19 | Хабр

Четыре тактики перехода для уровня 9+ млн/год. Тактика третья: “Растем с руководителем”
08.04.2026 06:55:27 | Хабр

Создание и тестирование пенсионных инвестиционных стратегий с помощью Okama
08.04.2026 06:50:43 | Хабр

Как мы перестроили тестирование релизов 1С и сократили цикл выпуска вдвое
08.04.2026 06:42:16 | Хабр

Как учиться? (большая статья, основанная на личном опыте)
08.04.2026 06:16:28 | Хабр

Tokenmaxxing: Новый тренд в бигтехах в 2026 году
08.04.2026 06:10:29 | Хабр

[Перевод] 60% падение трафика, коллапс моделей и однообразие: что ИИ делает с интернетом
08.04.2026 06:09:17 | Хабр

Как я сделал скилл для AI-ревью плана и кода — и зачем мне две модели
08.04.2026 06:00:24 | Хабр

Антипаттерны вайбкодинга для начинающих: 10 способов сломать себе карьерный старт
08.04.2026 06:00:23 | Хабр

Как найти работу с помощью нейросети в 2026: 7 промптов, которые реально помогают пройти собеседование
08.04.2026 05:54:25 | Хабр

Графическая утилита для очистки кэша 1С (с возможностью выбора базы) для ОС Linux
08.04.2026 05:51:19 | Хабр

Как проектировать бизнес‑логику в микросервисах: 3 правила агрегатов, которые работают
08.04.2026 05:46:15 | Хабр

Как проектируют приложения и системы, которые не падают под нагрузкой на примере бега, медитации и чая
08.04.2026 05:16:08 | Хабр

Телефонный звонок → структурированный JSON: строим STT + LLM пайплайн на Python
08.04.2026 05:16:00 | Хабр

Не все RPS одинаково полезны: уроки нагрузочного тестирования core-системы
08.04.2026 05:07:57 | Хабр

Укрощаем рыночный хаос: Пишем Liquid Neural Network (LNN) на PyTorch для алготрейдинга
08.04.2026 05:03:10 | Хабр

Краткий справочник про внимания (self-attention, cross-attention, multi-head attention)
08.04.2026 04:15:48 | Хабр

Почему чужой бизнес эффективнее моей жизни?
08.04.2026 04:05:45 | Хабр

Game Boy вместо модуляра: секвенции и синтез
08.04.2026 04:00:23 | Хабр

[Перевод] Аугментация ограничивающих боксов в детекции: форматы, `BboxParams` и типичные ошибки
08.04.2026 02:56:37 | Хабр

Смотреть все

НОВОСТИ

SNN: управление портов Ирана обновило маршруты следования судов через Ормуз
08.04.2026 22:40:28 | ТАСС

«Авангард» и «Локомотив» стартовали с побед в четвертьфинале плей-офф КХЛ
08.04.2026 22:39:53 | Life.ru

Смоленск и Минск проведут десятки совместных мероприятий в рамках Молодежных столиц
08.04.2026 22:39:33 | ТАСС

Вэнс: США не будут соблюдать часть условий прекращения огня, если Иран не откроет Ормуз
08.04.2026 22:39:18 | ТАСС

Вэнс заявил, что между США и Ираном есть "недопонимание"
08.04.2026 22:37:58 | ТАСС

Глава МЭА заявил о перебоях в авиасообщении из-за закрытия Ормузского пролива
08.04.2026 22:35:49 | ТАСС

Поддержу, но с одним «но»: Кадыров объяснил, почему чеченцы не поедут воевать за Иран
08.04.2026 22:33:49 | Life.ru

Участие Германии в военной миссии в Ормузе назвали самоубийством
08.04.2026 22:32:20 | Lenta.ru

"Охотник на Люси": в Эфиопии обнаружен новый вид крокодила
08.04.2026 22:32:00 | Российская Газета

Мирра Андреева рада начать грунтовый сезон с победы
08.04.2026 22:29:40 | ТАСС

На Украине утвердили механизм оформления отсрочки после "молодежного" контракта
08.04.2026 22:29:33 | ТАСС

Женщина откопала в земле возле дома таинственные каменные лица
08.04.2026 22:29:00 | Российская Газета

Белый дом: Иран признал реальность и передал США изменённый план урегулирования
08.04.2026 22:26:29 | Life.ru

В ООН призвали расследовать удары Израиля по Ливану после перемирия США с Ираном
08.04.2026 22:24:59 | ТАСС

Победу США в Иране назвали липовой
08.04.2026 22:23:46 | Lenta.ru

В России предрекли НАТО мрачное будущее
08.04.2026 22:17:34 | Lenta.ru

Александр Гуцан провел переговоры с прокурорами Узбекистана и Казахстана
08.04.2026 22:17:00 | Российская Газета

Двоих сотрудников СЖД осудили за гибель семи человек в ДТП с автобусом и поездом
08.04.2026 22:15:58 | ТАСС

В Европе заявили об отсутствии у Европы власти навязывать свою волю миру
08.04.2026 22:14:57 | Lenta.ru

Иран назвал атаку Израиля на Ливан нарушением соглашения с США
08.04.2026 22:14:46 | Life.ru

В Тунисе развернуты масштабные кампании по очистке городов и улиц
08.04.2026 22:14:00 | Российская Газета

В Европе заявили об отсутствии власти навязывать свою волю миру
08.04.2026 22:14:00 | Lenta.ru

С помощницы Блиновской отказались взыскать 46,6 млн рублей
08.04.2026 22:13:38 | ТАСС

ТАСС: с помощницы Блиновской отказались взыскать 46,6 млн рублей
08.04.2026 22:13:38 | ТАСС

«Динамо» и «Краснодар» сыграли вничью в финале «Пути РПЛ» Кубка России
08.04.2026 22:13:02 | Life.ru

Белый дом назвал условие для переговоров с Ираном
08.04.2026 22:13:00 | Lenta.ru

Кто проживает на дней океана: Новое существо не похоже ни на кого
08.04.2026 22:12:53 | Life.ru

Кто проживает на дне океана: Новое существо не похоже ни на кого
08.04.2026 22:12:53 | Life.ru

Кто проживает на дне океана: Новое существо, непохожее ни на кого
08.04.2026 22:12:53 | Life.ru

Медведев высказался о нарушении перемирия на Ближнем Востоке
08.04.2026 22:12:21 | Lenta.ru

«Кетаминовую королеву» приговорили к 15 годам тюрьмы по делу о смерти Мэттью Перри
08.04.2026 22:11:00 | Коммерсантъ

Норвегия так и не передала Украине обещанные в 2023 году F-16
08.04.2026 22:10:21 | Life.ru

В МИД РФ назвали конъюнктурным и деструктивным решение Молдавии о выходе из СНГ
08.04.2026 22:10:00 | Российская Газета

Стоимость фьючерсов на драгметаллы демонстрирует рост в пределах 10%
08.04.2026 22:09:50 | ТАСС

В Донецке начнут тестировать электробусы
08.04.2026 22:08:26 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro