Операция выполнена!
Закрыть
Хабы: Искусственный интеллект, Программирование

Привет, Хабр!

В конце прошлого года Сбер выложил GigaChat 3 в open source под MIT. Две модели: Ultra Preview на 702 миллиарда параметров и Lightning на 10 миллиардов. Взял Lightning, развернул на бесплатном Colab, погонял тесты. Плюс разобрался в документации.

В статье разберём архитектуру, сравним бенчмарки с Qwen и покажем, как запустить модель без затрат на железо. Спойлер: для задач на русском языке и работы с длинными контекстами Lightning — одна из лучших открытых моделей в своём классе. При этом порог входа минимальный,  base-версия запускается на бесплатном Colab с 4-bit квантизацией, а MIT-лицензия позволяет использовать модель в коммерческих проектах без ограничений. 

Читать далее
Читайте также
НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro