Irbis-7B или как мы учили ЛЛМку казахскому языку

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Irbis-7B или как мы учили ЛЛМку казахскому языку

29.06.2024 19:17:31 | Хабр

Хабы: Natural Language Processing

Языковые модели, основанные на архитектуре трансформеров, такие как Llama, Mistral и прочие, показывают впечатляющие результаты на английском языке. Однако их эффективность на других языках, включая казахский, может страдать. Дообучение на отдельный домен, даже при наличии хорошего датасета, может не давать значительного прироста в качестве. И дело не столько в том, что базовая модель при обучении видела мало текста на казахском, сколько в неэффективной токенизации. Этот недостаток приводит к тому, что модели не могут в полной мере использовать свой потенциал на языках, отличных от английского. В данной статье мы расскажем решали эту проблему при создании казахской языковой модели.

Читать далее

Подробнее

Читайте также

Японская автомобильная компания разработает ИИ-чип для независимости от Nvidia
29.06.2024 18:45:00 | ferra.ru

Трамп пообещал создать американскую версию израильского «Железного купола»
29.06.2024 18:29:13 | ferra.ru

В Японии железные дороги начнёт обслуживать человекоподобный робот
29.06.2024 18:00:00 | ferra.ru

Вместо 8 дней команда Starliner проведет на МКС из-за проблем 1,5… месяца
29.06.2024 17:29:12 | ferra.ru

Saint HighLoad++ 2024. Заметки путешественника
29.06.2024 17:20:28 | Хабр

Прощай VMware — привет Broadcom
29.06.2024 17:18:13 | Хабр

В Китае разработали первый в мире метропоезд из углеродного волокна
29.06.2024 17:15:00 | ferra.ru

Детей недостаточно учить только питону и ардуине
29.06.2024 17:08:00 | Хабр

Хакер начал продавать ПО для взлома компьютера через браузер Chrome за $1 млн
29.06.2024 16:30:00 | ferra.ru

Интерпол поймал около 4 000 человек, связанных с онлайн-мошенничеством
29.06.2024 16:29:10 | ferra.ru

Design Whiteboard Challenge — личный опыт кратко и по делу
29.06.2024 16:23:52 | Хабр

Steam начал тестировать запись фрагментов игрового процесса
29.06.2024 15:45:00 | ferra.ru

Android: form builder на старых добрых View
29.06.2024 15:35:36 | Хабр

На Microsoft подали в суд за использование данных клиентов сексшопа
29.06.2024 15:29:08 | ferra.ru

Простые истории про ускорение сборки большой кодобазы
29.06.2024 15:06:30 | Хабр

ИИ-генератор видео Google Vids стал доступен в Workspace Labs
29.06.2024 15:00:30 | ferra.ru

Швейцария: какие цены и зарплаты, как найти работу и правда ли, что там все миллионеры
29.06.2024 14:32:15 | vc.ru

TSMC потратит 4 млрд долларов на EUV-машины для 2-нм техпроцесса
29.06.2024 14:29:06 | ferra.ru

Наука о прокрастинации: ученые поняли, почему мы откладываем дела на потом
29.06.2024 14:15:28 | ferra.ru

Анализ изменения возраста и антропометрических данных игроков Национальной Хоккейной Лиги
29.06.2024 14:07:35 | Хабр

Почему 9 из 10 владельцев бизнеса не могут найти хорошего руководителя отдела продаж?
29.06.2024 14:06:53 | Хабр

KC868-M16v2: мечта ардуинщика (16 токовых каналов, 3 канала напряжения, SD, LAN, POE, дисплей, RTC и SH3x)
29.06.2024 14:05:12 | Хабр

Какой агрегатор нейросетей выбрать?
29.06.2024 14:00:09 | Хабр

Компании стали менять политику конфиденциальности ради «свободы» в обучении ИИ
29.06.2024 13:48:55 | ferra.ru

VR-шлем Apple Vision Pro впервые вышел за пределами США. И сразу в Китае
29.06.2024 13:35:48 | ferra.ru

Кража, плагиат: на Perplexity — конкурента Google — обрушился шквал критики
29.06.2024 13:30:26 | ferra.ru

Армия США закупила у Lockheed Martin ракет Patriot на 4,5 миллиарда долларов
29.06.2024 13:30:19 | ferra.ru

Решаем задачу уровня «Невозможно». Сжатие хаотического бинарного кода. Суперпозиционные системы счисления
29.06.2024 13:25:43 | Хабр

Resident Evil и Assassin's Creed вышли на iPhone, но успеха они не сыскали
29.06.2024 13:23:52 | ferra.ru

Можно ли научить нейросеть определять иронию?
29.06.2024 13:14:58 | Хабр

Без шоу мировых звёзд, но с новыми форматами и площадками: как изменился концертный бизнес в России
29.06.2024 13:10:22 | vc.ru

Земля в прошлом была суровым «снежным комом», но это помогло появиться нам
29.06.2024 12:45:24 | ferra.ru

Страницы российских музыкантов начали исчезать из Spotify
29.06.2024 12:00:22 | ferra.ru

День 857: посол России рассказал о работе над возможностью использования карт российских банков в Танзании
29.06.2024 11:22:50 | vc.ru

Связанный с Boeing механик забил тревогу по поводу безопасности 787 Dreamliner
29.06.2024 11:15:20 | ferra.ru

Смотреть все

СТАТЬ АВТОРОМ

НОВОСТИ

В Нижнем Новгороде погиб журналист Артем Кузнецов
21.11.2025 12:00:38 | РБК

В Индии 24 ребенка умерли после приема сиропа от кашля
21.11.2025 11:59:36 | РБК

Grok Илона Маска научился создавать длинные ролики: можно выбирать четыре варианта продолжительности
21.11.2025 11:58:00 | iXBT.com

Муж в момент ссоры вылил на жену кипящее жаркое в Бурятии
21.11.2025 11:57:24 | РЕН ТВ

В Севастополе завели дело о телефонном мошенничестве на 50 млн рублей
21.11.2025 11:56:47 | ТАСС

Аксаков: РФ может национализировать активы западных стран в ответ на действия ЕС
21.11.2025 11:56:38 | ТАСС

В России высказались о реакции Украины и Европы на план США
21.11.2025 11:56:28 | Lenta.ru

Как устроен мир с Тимофеем Баженовым — Каменный цветок (21.11.2025)
21.11.2025 11:55:03 | РЕН ТВ

42-летняя звезда «Универа» опубликовала фото в красном купальнике
21.11.2025 11:54:50 | Lenta.ru

Лукашенко призвал белорусских ученых работать "без амбиций и понтов"
21.11.2025 11:54:22 | ТАСС

Кустурица: русские кинематографисты всегда вдохновляли лучших режиссеров мира
21.11.2025 11:54:16 | ТАСС

Под ударом Samsung, Reebok, Zepp и Nexxbase. Oura обвиняет четвёрку в нарушении её патентов, связанных с умными кольцами
21.11.2025 11:54:00 | iXBT.com

Омбудсмен Москвы: девочка, которую избивали сверстницы, молчала из-за их угроз
21.11.2025 11:53:53 | ТАСС

Москвичей призвали отказаться от машин
21.11.2025 11:53:52 | Lenta.ru

WSJ назвала кандидата на покупку доли России в сербской NIS
21.11.2025 11:53:51 | РБК

Биткоин упал ниже $85 тыс. впервые с апреля
21.11.2025 11:53:14 | Коммерсантъ

Эксперт Бо назвал преимущество Путина в переговорах по Украине
21.11.2025 11:52:20 | ТАСС

США проведут брифинг для послов ЕС в Киеве по новому плану
21.11.2025 11:52:14 | Lenta.ru

В России заявили о засилье убыточных угольных компаний
21.11.2025 11:52:04 | Lenta.ru

Lada ждет ценовая коррекция: АВТОВАЗ объяснил предстоящий рост стоимости
21.11.2025 11:51:51 | За рулем

В городе Саки из-за аварии отключили отопление более чем на сутки
21.11.2025 11:51:49 | ТАСС

Китайский робот установил мировой рекорд, пройдя без остановки более 100 км
21.11.2025 11:51:46 | ТАСС

24 ребенка умерли от токсичного сиропа от кашля в Индии
21.11.2025 11:51:42 | РЕН ТВ

17-летний футболист «Зенита» получил тяжелую травму на тренировке
21.11.2025 11:51:18 | Lenta.ru

Около 40 тыс. жителей Новосибирской области участвуют в программе соцконтрактов
21.11.2025 11:50:16 | ТАСС

Фестиваль документального кино РФ пройдет в этнодеревне Дрвенград
21.11.2025 11:50:00 | ТАСС

Российские силы ПВО за два часа сбили 18 беспилотников
21.11.2025 11:49:11 | Коммерсантъ

Орбан призвал ЕС повернуть из тупика по Украине
21.11.2025 11:49:07 | Lenta.ru

Казахстан приостановил участие в Договоре об обычных вооруженных силах в Европе
21.11.2025 11:49:00 | Российская Газета

Масштабное наводнение во Вьетнаме привело к гибели 43 человек
21.11.2025 11:49:00 | ТАСС

Российский полицейский помогал бандитам в похищении человека
21.11.2025 11:48:52 | Lenta.ru

В России ежегодно производится около 60 тонн черной икры
21.11.2025 11:48:10 | ТАСС

Британия разработала план отправки войск на Украину после прекращения огня
21.11.2025 11:48:01 | Life.ru

Mediascope: две трети россиян смотрят телевизор ежедневно
21.11.2025 11:47:31 | ТАСС

На Кубани подросток топором убил бабушку и пытался скрыться
21.11.2025 11:47:26 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2025 - vsetut.pro