[Перевод] Опыт тюнинга Llama3 405B на AMD MI300x

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

[Перевод] Опыт тюнинга Llama3 405B на AMD MI300x

24.09.2024 16:09:52 | Хабр

Хабы: Машинное обучение, Искусственный интеллект, Компьютерное железо

Опенсорсные модели становятся всё объёмнее, поэтому потребность в надёжной инфраструктуре для выполнения крупномасштабного обучения ИИ сегодня как никогда высока. Недавно наша компания выполнила fine-tuning модели LLaMA 3.1 405B на GPU AMD, доказав их способность эффективно справляться с крупномасштабными задачами ИИ. Наш опыт был крайне положительным, и мы с радостью выложили всю свою работу на GitHub в опенсорс.

GPU AMD, и в особенности серия MI300X — это серьёзная альтернатива ИИ-оборудованию NVIDIA, обеспечивающая больше производительности на вложенный доллар. Наша система состояла из одного узла с 8 GPU AMD MI300x, а для fine-tuning мы использовали JAX. В этой статье мы расскажем всю историю fine-tuning LLaMA 405B, в том числе и подробности шардинга параметров и реализации LoRA.

Читать далее

Подробнее

Читайте также

Случайный тест, или как я не стал клиентом
24.09.2024 16:02:46 | Хабр

Ретро-шик: индийская BOULT представила две новые кожаные колонки в винтажном стиле
24.09.2024 16:00:33 | it-world

Российские ученые создадут универсальную вакцину от бетакоронавирусов
24.09.2024 16:00:23 | ferra.ru

Приточка на минималках или как сделать дёшево, быстро и качественно одновременно
24.09.2024 15:49:03 | Хабр

Перечислены основные способы взлома аккаунтов в Telegram
24.09.2024 15:45:00 | ferra.ru

Как правильно писать тесты?(Часть 1)
24.09.2024 15:38:18 | Хабр

Как убрать боль в спине и сутулость
24.09.2024 15:38:07 | Хабр

В России появится почти тысячу цифровых двойников полигонов ТКО
24.09.2024 15:29:48 | ferra.ru

Аппаратный Таймер в Качестве Микрофона
24.09.2024 15:26:43 | Хабр

Кривая дорожка или приставными шагами в DevOps
24.09.2024 15:25:33 | Хабр

В России импортозаместят судовые насосы
24.09.2024 15:14:36 | ferra.ru

Qucs-S: руководство по видам моделирования, часть 2
24.09.2024 15:12:38 | Хабр

Собственные бренды «Яндекса» становятся частью новой бизнес-структуры
24.09.2024 15:11:07 | it-world

Раскрыт лучший орех для улучшения уровня сахара в крови
24.09.2024 15:00:00 | ferra.ru

Что такое интеллект? Введение
24.09.2024 14:59:51 | Хабр

Павел Дуров сообщил о появлении в Telegram цензуры и бота для жалоб
24.09.2024 14:55:30 | it-world

Цифровой рентген: Инженерная некромантия
24.09.2024 14:55:24 | Хабр

ООП в Dart
24.09.2024 14:55:07 | Хабр

Продолжение статьи про CFG Scale | математика, плюсы и минусы метода
24.09.2024 14:52:25 | Хабр

Российские ученые упростили переработку пластика с помощью глины
24.09.2024 14:46:14 | ferra.ru

Системный аналитик с ЗП 400+. Найти за 30 дней. Часть 2 «Проверка на прочность»
24.09.2024 14:44:50 | Хабр

Moshi: GPT4-O voice mode дома (обзор)
24.09.2024 14:33:07 | Хабр

В Перми удешевили производство бумаги с помощью отходов
24.09.2024 14:32:57 | ferra.ru

США ужесточили контроль за банковскими операциями Турции с Россией — «РИА Новости»
24.09.2024 14:27:06 | vc.ru

Почему «Идеальный программист» Роберта Мартина далёк от реальности: критический взгляд
24.09.2024 14:24:25 | Хабр

Повышаем безопасность петербургского метро и качество обслуживания пассажиров с помощью ИИ
24.09.2024 14:21:46 | Хабр

Дэвид Харрис, автор «Цифровой схемотехники и архитектуры компьютера», ответил на вопросы про его следущую книгу и вообще
24.09.2024 14:20:33 | Хабр

Эксперт посоветовал устанавливать антивирусы на смартфоны с Android
24.09.2024 14:15:00 | ferra.ru

Искусственный интеллект для школьника
24.09.2024 14:14:10 | Хабр

Ученые из Томска разработали новый композит для гибких датчиков
24.09.2024 14:03:11 | ferra.ru

uBlock Orign в качестве ограничителя потока бесполезной информации
24.09.2024 13:56:15 | Хабр

Что такое MRP. Описание и практическое применение
24.09.2024 13:47:26 | Хабр

Обзор популярных сервисов локализации в 2024 году: какой выбрать?
24.09.2024 13:42:01 | Хабр

Как мы полностью обновили VK Мессенджер: переписать нельзя рефакторить
24.09.2024 13:37:14 | Хабр

Выбираем название для дата-центра
24.09.2024 13:34:13 | Хабр

Смотреть все

СТАТЬ АВТОРОМ

НОВОСТИ

Atlantic узнал, что приказы Трампа исполняют только со второго раза
28.04.2025 22:53:11 | РБК

FT: Европа и Украина опасаются выхода США из переговоров в ближайшие дни
28.04.2025 22:51:28 | ТАСС

ВСУ атаковали населенные пункты в четырех районах Брянской области
28.04.2025 22:46:20 | Коммерсантъ

Футболист "Спартака" Барко подал в суд на один из своих бывших клубов
28.04.2025 22:42:18 | ТАСС

МИД Германии возглавит «ликвидатор «Петербургского диалога»
28.04.2025 22:38:43 | РБК

Депутат Оглоблина: в Госдуме законодательно пропишут использование агродронов
28.04.2025 22:37:21 | ТАСС

Власти Испании ввели режим ЧС из-за масштабного блэкаута
28.04.2025 22:36:46 | Life.ru

Количество погибших при взрыве в иранском порту выросло до 70
28.04.2025 22:29:57 | РБК

Ирина Винер в июне представит премьеру спектакля о великих людях ХХ века
28.04.2025 22:28:42 | ТАСС

Трое мужчин изнасиловали девочку-инвалида в «Бургер Кинге» в Москве
28.04.2025 22:26:27 | Life.ru

Европе не светит // Пиренейский полуостров временно остался без электроэнергии
28.04.2025 22:23:24 | Коммерсантъ

На севере Свердловской области ограничили движение автобусов из-за снегопада
28.04.2025 22:23:16 | ТАСС

Выглядит нелепо: В ГД высмеяли Киев за предложение помочь Испании в борьбе с блэкаутом
28.04.2025 22:22:42 | Life.ru

В Камеруне назвали экс-чемпиона UFC Нганну виновником смертельного ДТП
28.04.2025 22:22:03 | РБК

Истребитель F/A-18 упал с палубы авианосца «Гарри Трумэн» в Красном море
28.04.2025 22:20:35 | РБК

Володин принял участие в мероприятии "Свет Великой Победы" на Мамаевом кургане
28.04.2025 22:16:23 | ТАСС

Макрон пообещал, что Запад "усилит давление" на Россию в ближайшую неделю
28.04.2025 22:16:00 | Российская Газета

Лерчек и ее бывшего мужа оставили под домашним арестом
28.04.2025 22:15:51 | ТАСС

Карпин одной фразой ответил на вопрос о работе с иностранной сборной
28.04.2025 22:14:43 | Life.ru

В Британии открытку пассажира с "Титаника" продали за 400 тысяч долларов
28.04.2025 22:14:00 | Российская Газета

Галущенко: Минэнерго Украины поможет Европе восстановить сети после блэкаута
28.04.2025 22:09:45 | Life.ru

Суд в Москве продлил процедуру конкурсного производства российской дочке Google
28.04.2025 22:08:13 | Ведомости

В Австралии нейросеть полгода вела эфир на радио
28.04.2025 22:08:00 | Российская Газета

В промзоне Кубани загорелась емкость с топливом
28.04.2025 22:07:56 | ТАСС

В Дагестане возбуждено дело после гибели туристки на Сулакском каньоне
28.04.2025 22:07:05 | Коммерсантъ

Щедрость вопреки нормативам // ВТБ компенсирует выплаты дивидендов дополнительной эмиссией
28.04.2025 22:06:12 | Коммерсантъ

Представлены телевизоры Xiaomi Redmi TV X 2025 Energy-Saving с экранами 4K и частотой обновления 288 Гц
28.04.2025 22:05:36 | PlayGround.ru

В Анкаре открылась выставка портретов погибших на Донбассе журналистов
28.04.2025 22:05:26 | ТАСС

В Горловке потушили возникший из-за атаки БПЛА ВСУ пожар в многоэтажке
28.04.2025 22:03:35 | ТАСС

Филиппо сообщил о панике в Елисейском дворце после "унижения" Макрона Трампом
28.04.2025 22:02:00 | Российская Газета

В двух областях Украины объявили воздушную тревогу
28.04.2025 22:00:15 | ТАСС

Задержанных в Подольске полицейских поймали на взятке в 15 млн рублей
28.04.2025 22:00:01 | Life.ru

Terminator: Survivors может задержаться ещё дольше и не выйти в этом году
28.04.2025 21:59:52 | PlayGround.ru

Внук Де Голля призвал к тесному сотрудничеству Франции с РФ
28.04.2025 21:59:35 | ТАСС

В подольской полиции взяли пятерых
28.04.2025 21:55:09 | Коммерсантъ

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2025 - vsetut.pro