Оптимизируем Shuffle в Spark

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Оптимизируем Shuffle в Spark

21.08.2024 10:24:29 | Хабр

Хабы: Блог компании X5 Tech, Big Data, Data Engineering, IT-компании

Привет, Хабр! Меня зовут Сергей Смирнов, я аналитик в продукте CVM в X5 Tech. Я занимаюсь разработкой инструмента анализа A/B экспериментов. Мы ежедневно считаем десятки метрик для сотен экспериментов на десятки миллионов клиентов –- это терабайты данных, поэтому наш инструмент разработан на Spark.

В последнее время мы заметили, что существенную часть времени работы наших Spark-приложений занимает обмен данными (Shuffle) между исполнителями. В этой статье я расскажу о том, какие оптимизации помогли нам избавиться от самых тяжёлых операций Shuffle. Речь пойдёт не только о BroadcastJoin, но и о двух других неочевидных методах – предварительное репартицирование и бакетирование.

Читать далее

Подробнее

Читайте также

«Яндекс Музыка» добавила формат lossless — без потери качества
21.08.2024 10:15:25 | vc.ru

Делегирование почтового ящика в Carbonio
21.08.2024 10:09:33 | Хабр

Нейроинтерфейсы: патентный анализ в России и в мире
21.08.2024 10:02:56 | Хабр

Обнаружена уязвимость в популярном протоколе безопасности
21.08.2024 09:45:00 | ferra.ru

Куда и как развиваться системному аналитику, если «потолок» уже близко
21.08.2024 09:39:20 | Хабр

Yandex Cloud запустила видеосервис Cloud Video для бизнеса
21.08.2024 09:37:21 | vc.ru

[Перевод] Секреты переговорщика с хакерами
21.08.2024 09:37:19 | Хабр

Как работает графика PS1
21.08.2024 09:26:34 | Хабр

Использование isolatedModules в Angular 18.2
21.08.2024 09:24:51 | Хабр

Разделение и Объединение Pdf по страницам без стороннего компонента на C# и .NET
21.08.2024 09:22:50 | Хабр

Вирусы с яйцами. Какие сюрпризы скрывают вредоносные программы
21.08.2024 09:21:00 | Хабр

Под капотом облаков. Строим облачную консоль. Часть 1. Знакомство
21.08.2024 09:16:14 | Хабр

Мы роботизировали почти всё, но один процесс заставил нас полностью переосмыслить подход к RPA
21.08.2024 09:14:32 | Хабр

С какого возраста начинать обучение детей программированию: опрос
21.08.2024 09:09:01 | Хабр

Пострадавшие от ботулизма готовят коллективный иск к «Кухне на районе»
21.08.2024 09:08:17 | vc.ru

Самодельная оптопара из светодиода и 1Т308
21.08.2024 09:00:10 | Хабр

Ученые разработали новый метод лечения атеросклероза
21.08.2024 09:00:00 | ferra.ru

Контейнеры, разминаем мозги под Kubernetes – разговоры у костра
21.08.2024 08:46:17 | Хабр

[Перевод] Теория игр может сделать ИИ более корректным и эффективным
21.08.2024 08:35:06 | Хабр

Ученые изобрели экологически чистую замену пластику
21.08.2024 08:34:15 | ferra.ru

NVIDIA представила первую игру, персонажи которой «оживит» искусственный интеллект
21.08.2024 08:25:14 | ferra.ru

Летний дископад, новые процессоры Intel и ApmereOne Aurora: дайджест серверного железа
21.08.2024 08:23:33 | Хабр

Хакеры украли и опубликовали в сети внутренние данные Toyota
21.08.2024 08:18:14 | ferra.ru

Ещё один фронтендер или как прогать три года и не суметь найти работу
21.08.2024 08:16:00 | Хабр

Новый тест предскажет риск сердечно-сосудистых заболеваний по тромбоцитам
21.08.2024 08:15:00 | ferra.ru

ИИ улучшил прогнозирование побочных эффектов лучевой терапии
21.08.2024 08:15:00 | ferra.ru

День 910: Генпрокуратура решила обратить в доход государства акции владельца складов Raven
21.08.2024 08:14:13 | vc.ru

Легендарный месснеджер Mail.Ru Агент закрыли
21.08.2024 08:07:13 | ferra.ru

Большое руководство по сетям и шифрованию трафика в Linux (часть 2)
21.08.2024 08:05:54 | Хабр

Nokia 6555 — 17 лет стильной раскладушке
21.08.2024 08:05:27 | Хабр

Как ОАЭ стали страной, на 90% состоящей из мигрантов, и как власти с этим справляются
21.08.2024 08:04:42 | Хабр

Прошлое города и будущее: взболтать, но не смешивать
21.08.2024 08:03:12 | Хабр

Google Карты заработают на умных часах без интернета
21.08.2024 07:59:13 | ferra.ru

Вы таки внедрили сканеры безопасности в пайплайны — на этом все?
21.08.2024 07:59:04 | Хабр

WAF: интеграция в SOC через SIEM или ASOC? (Часть 1)
21.08.2024 07:57:34 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

"Руспродсоюз": Турецкие и китайские фисташки могут заменить поставки из Ирана
19.03.2026 08:10:00 | Российская Газета

Биткойн и Ethereum снижаются в пределах 5%
19.03.2026 08:08:55 | ТАСС

По "Дальневосточной концессии" в 2026 году сдадут 12 объектов
19.03.2026 08:07:44 | ТАСС

InfoWatch: с 2023 года из РФ похитили более 4,5 млрд записей персональных данных
19.03.2026 08:06:14 | ТАСС

Израильская армия предупредила об очередном запуске ракет из Ирана
19.03.2026 08:05:00 | ТАСС

Пентагон запросил сотни миллиардов долларов на войну с Ираном
19.03.2026 08:04:45 | Lenta.ru

Депутат Лобач рассказала о влиянии ситуации на Ближнем Востоке на туризм в РФ
19.03.2026 08:04:09 | ТАСС

Эксперт Киселев назвал Доброполье последним крупным узлом обороны ВСУ
19.03.2026 08:03:13 | ТАСС

Марочко: ВСУ мародерствуют в Доброполье
19.03.2026 08:03:07 | ТАСС

В РФ нашли способ точнее контролировать поведение капсул-носителей лекарств
19.03.2026 08:02:28 | ТАСС

ТАСС: установлен комбат ВСУ, отдавший приказ на убийства жителей Сопычи
19.03.2026 08:01:40 | ТАСС

Россияне пересели с коктейлей на ликеры
19.03.2026 08:01:30 | Lenta.ru

Кент: Вероятно, именно Израиль предоставил США данные для удара по школе в Иране
19.03.2026 08:01:00 | Российская Газета

Порноактер пожаловался на взрывающийся пенис после супервиагры
19.03.2026 08:01:00 | Lenta.ru

ПВО за ночь уничтожила 138 украинских БПЛА над территорией России
19.03.2026 08:00:24 | РБК

Warframe празднует 13-ю годовщину
19.03.2026 08:00:23 | PlayGround.ru

«Ростех» перенес выпуск базовых станций и ликвидирует прежнего разработчика
19.03.2026 08:00:04 | Коммерсантъ

Рельефы и границы: что важно знать перед покупкой участка для строительства дома
19.03.2026 08:00:01 | ТАСС

Желтый сигнал «Светофора» // Рост оборота жестких дискаунтеров в 2026 году будет минимальным за 8 лет
19.03.2026 08:00:00 | Коммерсантъ

Россия и Китай развивают двустороннее транспортное сообщение
19.03.2026 08:00:00 | Российская Газета

Международный день счастья 20 марта: учёные раскрыли 7 понятных способов стать счастливее
19.03.2026 08:00:00 | Life.ru

На Камчатке вулкан Шивелуч выбросил пепел на высоту 12 км над уровнем моря
19.03.2026 07:59:53 | ТАСС

Пол Кинг снимет анимационный фильм о Лабубу
19.03.2026 07:59:07 | ТАСС

"Делимобиль": самым непопулярным днем зимы для каршеринга стало 1 января
19.03.2026 07:58:58 | ТАСС

За ночь над Россией сбили 138 беспилотников
19.03.2026 07:58:29 | Коммерсантъ

"Автостат": продажи подержанных легковушек в РФ в феврале выросли на 3,7%
19.03.2026 07:58:00 | ТАСС

За ночь расчёты ПВО уничтожили 138 украинских дронов над регионами России
19.03.2026 07:57:46 | Life.ru

WP узнала о неизвестных дронах над базой, где живут Рубио и Хегсет
19.03.2026 07:57:04 | РБК

Мичков отдал голевую передачу в овертайме матча с "Анахаймом"
19.03.2026 07:57:03 | ТАСС

Ростех заявил о "хирургическойточности" "Торнадо-С" даже при работе РЭБ
19.03.2026 07:56:50 | ТАСС

9000 мАч, 80 Вт, AMOLED-экран с частотой 165 Гц. Новый смартфон OnePlus показал возможности до выхода
19.03.2026 07:56:00 | iXBT.com

Появились подробности отражения ночной атаки ВСУ на Россию
19.03.2026 07:55:54 | Lenta.ru

Новосибирский губернатор прокомментировал массовый убой скота в регионе
19.03.2026 07:55:29 | Lenta.ru

Женщина получила травмы при падении обломков БПЛА в Ставропольском крае
19.03.2026 07:54:49 | Коммерсантъ

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro