Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Только Сигма выбирают Delta Lake

03.06.2026 10:33:46 | Хабр

Хабы: Блог компании Magnit Tech

Привет, Хабр! Меня зовут Дмитрий Кравчук, я занимаюсь всем, что связано с данными в блоке AI&ML MAGNIT TECH. Расскажу про фундамент прибыльных проектов, которыми мы занимаемся в департаменте. Эта начало цикла статей о наших достижениях за 5 лет и планах на будущее.

В 2020 году мы выбирали формат для больших ML-хранилищ: Delta Lake, Iceberg или Hudi. В итоге остановились на Delta Lake. За 5 лет вокруг него у нас выросла полноценная платформа данных для ML-нагрузок: Spark, Kubernetes, S3, YDB, Airflow, Flink, OpenMetadata, Trino, StarRocks и собственные фреймворки.

Я не буду пересказывать документацию Delta Lake, а расскажу, как это работает у нас в промышленном контуре: доставка данных, слои хранения, оркестрация, хранилище метаданных, lineage, data quality, observability и governance, а также доступ к данным.

Отдельно расскажу, в чём Delta Lake оказался силён, а где пришлось достраивать инфраструктуру: объектное хранилище вместо блочного, координировать коммиты для приближения к ACID, обеспечивать потоковую загрузку, оптимизировать хранение и эксплуатировать большие таблицы.

Материал будет полезен инженерам данных, ML-инженерам, Data scientist’ам, системным аналитикам, MLOps/DataOps/DevOps и всем, кто создаёт промышленную платформу данных под реальные нагрузки.

Читать далее

Подробнее

Читайте также

Opus 4.8 вышел и сразу проиграл GPT-5.5, $500M без лимитов и 21-летний баг MySQL
03.06.2026 10:28:04 | Хабр

Почему WER недостаточно: Семантическая декомпозиция ошибок ASR
03.06.2026 10:27:10 | Хабр

Готов ли бизнес оплачивать цифровых сотрудников
03.06.2026 10:19:49 | it-world

Процессоры для автономных агентов
03.06.2026 10:17:22 | it-world

Создание собственной темы для GNU Emacs
03.06.2026 10:02:27 | Хабр

В Перми оценили влияние магнитных бурь на навигацию
03.06.2026 09:59:40 | ferra.ru

Эксперимент с локальной Qwen на Go-сервисе
03.06.2026 09:58:15 | Хабр

Как поменять дизайн ИИ чата, чтобы лучше находить его ошибки. Обзор исследований
03.06.2026 09:54:53 | Хабр

Я сошёл с ума и сдаю свой браузер ИИ-агентам
03.06.2026 09:51:58 | Хабр

Пять ошибок в работе с ожиданиями в UI‑автотестах, из‑за которых тесты падают через раз
03.06.2026 09:40:59 | Хабр

Model Predictive Control для Kubernetes autoscaling: что получилось, где HPA оказался сильнее
03.06.2026 09:38:27 | Хабр

Qualcomm показала Dragonwing IQ10 — платформу-«мозг» человекоподобных роботов
03.06.2026 09:30:58 | ferra.ru

Книга: «100 ошибок C++ и как их избежать»
03.06.2026 09:24:51 | Хабр

В Новосибирске создали алгоритм для ускорения нефтедобычи
03.06.2026 09:21:28 | ferra.ru

«Яндекс» запустил продажу страховок по подписке
03.06.2026 09:21:18 | vc.ru

«Аэрофлот» предложил части пассажиров компенсации за отменённые в 2023 году билеты на Пхукет — но те не согласны на условия
03.06.2026 09:16:54 | vc.ru

Даже бесплатное внедрение обречено на провал, если бизнес не готов к переменам
03.06.2026 09:09:35 | Хабр

Личный CI/CD за один вечер: настраиваем GitLab Runner на собственном VPS
03.06.2026 09:07:55 | Хабр

«Склеить параметры»: параметризация для экспертизы ЦИМ и не только
03.06.2026 09:06:10 | Хабр

Пока все смотрят на LLM: почему классический ML годами зарабатывает сотни миллионов?
03.06.2026 09:01:48 | Хабр

ИИ вместо отдела продаж? На что он действительно способен?
03.06.2026 08:49:33 | Хабр

DQ-шаблон через MCP: что получилось и где агенту нельзя верить
03.06.2026 08:45:15 | Хабр

ИИ-агент в компании: что реально автоматизируется, а что остается на людях
03.06.2026 08:42:59 | Хабр

В России разработали ИИ для векторизации спутниковых снимков
03.06.2026 08:41:19 | ferra.ru

ИИ-компаньоны и подростки: что показывают исследования и о чём стоит знать родителям
03.06.2026 08:39:23 | Хабр

DREM для линейной регрессии: как развязать веса перцептрона и ускорить обучение
03.06.2026 08:38:29 | Хабр

День 1561: Volga вложит в локализацию китайских машин 60 млрд рублей за десять лет
03.06.2026 08:29:52 | vc.ru

Я написал визуализатор сборщика мусора для Go — теперь GC не чёрный ящик
03.06.2026 08:26:26 | Хабр

Как процессоры обмениваются данными в многопроцессорных системах
03.06.2026 08:24:59 | Хабр

В России испытали датчик контроля состояния масляного фильтра
03.06.2026 08:16:54 | ferra.ru

Распространение CD-R и кризис музыкальной индустрии
03.06.2026 08:15:28 | Хабр

NVIDIA выбрала Unitree: разбор H2 Plus и платформы Isaac GR00T
03.06.2026 08:12:39 | Хабр

Обзор Podlodka Product Crew: AI в управлении продуктами (Часть 1)
03.06.2026 08:10:23 | Хабр

Что не так с React.js? Мой личный баттхёрт
03.06.2026 08:01:18 | Хабр

OTel Collector в кастомизации Битрикс24: подключаем Observability
03.06.2026 08:00:19 | Хабр

Смотреть все

НОВОСТИ

Она пьёт, он поёт: Милохин и Зеленская берут $50 тысяч за выступления на частных корпоративах
28.07.2026 08:25:57 | Life.ru

В июле нейтральный статус получили два российских гребца
28.07.2026 08:25:52 | ТАСС

У берегов Камчатки произошло землетрясение магнитудой 5,2
28.07.2026 08:24:35 | ТАСС

В России создали уникальный скоростной дрон-перехватчик «Виверна-Коготь»
28.07.2026 08:24:22 | Lenta.ru

Рожков рассказал о проблемах пауэрлифтеров при отборе на Паралимпиаду
28.07.2026 08:22:07 | ТАСС

США ушли с заседания ООН по Украине после критики Францией
28.07.2026 08:21:41 | Lenta.ru

Дмитриев удивился реакции нефти на удары хуситов по объектам в Саудовской Аравии
28.07.2026 08:21:08 | ТАСС

Командир Велес: ВС РФ за сутки уничтожили 12 пикапов ВСУ в Сумской области
28.07.2026 08:19:00 | ТАСС

Средства ПВО сбили за ночь над Россией 356 беспилотников ВСУ
28.07.2026 08:18:44 | Коммерсантъ

Рекордный рой разбился о стальной купол России: ПВО смела 356 беспилотников ВСУ за ночь
28.07.2026 08:18:15 | Life.ru

ТАСС: под Ореховом практически уничтожен один из гарнизонов ВСУ
28.07.2026 08:18:04 | ТАСС

СК начал проверку после смерти главного тренера баскетбольного "Динамо" Сандлера
28.07.2026 08:17:46 | ТАСС

Минобороны раскрыло число сбитых над Россией за ночь украинских БПЛА
28.07.2026 08:16:42 | Lenta.ru

В Wildberries рассказали о работе склада в Коледино после атаки БПЛА
28.07.2026 08:15:18 | Коммерсантъ

ТАСС: один из полков ВСУ потерял боеспособность под Ореховом
28.07.2026 08:15:04 | ТАСС

"Островок" рассказал, где туристы чаще останавливаются в путешествиях по России
28.07.2026 08:13:35 | ТАСС

В России начали отменять скидки на электромобили
28.07.2026 08:11:33 | Lenta.ru

Ли Чжэ Мён признал, что его попытки наладить отношения с КНДР пока безуспешны
28.07.2026 08:11:00 | Российская Газета

Маркос заявил о планах вернуть атомную энергетику на Филиппины
28.07.2026 08:11:00 | Российская Газета

Минобрнауки назвало сроки завершения приема по программам аспирантуры
28.07.2026 08:10:56 | ТАСС

Над регионами России сбили 356 украинских БПЛА
28.07.2026 08:10:32 | ТАСС

9-летний мальчик сел за руль и врезался в припаркованную машину в Приамурье
28.07.2026 08:10:32 | Life.ru

В Никарагуа начались консультации по проведению конституционной реформы
28.07.2026 08:10:00 | Российская Газета

КНДР ответила отказом на призыв АСЕАН к денуклеаризации
28.07.2026 08:10:00 | Российская Газета

Ученые связали сильную потерю жира с развитием диабета
28.07.2026 08:09:00 | Lenta.ru

Украина вышла на первый план для Трампа
28.07.2026 08:08:48 | Lenta.ru

Логистический центр Wildberries в Коледине работает без изменений
28.07.2026 08:08:10 | Life.ru

ТПП предложила сдвинуть эксперимент по обелению рынка персонала на 1 ноября
28.07.2026 08:07:32 | ТАСС

У берегов Хорватии нашли корабль Византии с рекордным грузом золота
28.07.2026 08:07:20 | Life.ru

В Подмосковье в среду может выпасть до 20 мм осадков
28.07.2026 08:04:36 | ТАСС

"Газпром" развеял миф о надежности отгрузок СПГ по сравнению с поставками по трубе
28.07.2026 08:04:07 | ТАСС

"Газпром" развенчал миф о надежности отгрузок СПГ по сравнению с поставками по трубе
28.07.2026 08:04:07 | ТАСС

В России открылся предзаказ на новые флагманские смартфоны от Huawei
28.07.2026 08:03:01 | ТАСС

Sankei узнала о планах ЛДП создать в Японии аналог MI6
28.07.2026 08:02:46 | ТАСС

Sankei узнала о планах ЛДП предложить создать в Японии внешнюю разведку
28.07.2026 08:02:46 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro