Платформа данных на минималках. Часть 1: проблемы Data Lake и роль Iceberg

14.04.2026 08:00:27 | Хабр

Хабы: Блог компании Selectel, IT-инфраструктура, Apache, IT-компании, Хранение данных

Представим ситуацию: у нас есть сервисы, которые пишут логи событий и сообщения из очередей (Kafka, RabbitMQ) в формате Avro для гарантии схемы и потоковой доставки. В это же время отдел машинного обучения работает с датасетами в Parquet — ребята ценят столбцовое хранение и производительность на скалярных чтениях. Соседняя команда фиксирует фактовые таблицы в ORC, поскольку этот формат подходит для тяжелых аналитических агрегаций.

Пока объемы данных измерялись гигабайтами, такой «зоопарк форматов» был терпим: каждый отдел использовал свой инструмент, а данные копировались между ними через ETL-конвейеры. Но с ростом до терабайтов и выше эта архитектура начинает ломаться: запросы становятся медленными, стоимость хранения и вычислений стремительно растет, а главное — теряется единый источник истины. Теперь одна и та же бизнес-сущность существует в трех разных форматах, схемах и состояниях.

В этот момент возникает потребность не в очередном хранилище, а в табличной абстракции поверх существующих форматов. Такой слой должен обеспечивать ACID-транзакционность, централизованное управление схемой и единый каталог для всех потребителей — от потоковой инженерии до машинного обучения и BI. Именно так и приходят к Apache Iceberg и к идее построения собственной платформы данных.

Подробнее

Читайте также

Как мы извлекали модель подразделения из живой конфигурации и находили расхождения с регламентом
14.04.2026 07:51:43 | Хабр

Шахтёры и белые воротнички в мире ИТ
14.04.2026 07:40:48 | Хабр

ARG внутри интерфейса: как я добавил метаигру в SPA и зачем это вообще нужно
14.04.2026 07:40:21 | Хабр

Великий фильтр уже здесь. Мы просто не хотим это признать
14.04.2026 07:40:00 | Хабр

[Перевод] Маск появляется в Tesla один день в неделю, и управляет Tesla вслепую
14.04.2026 07:39:39 | Хабр

Database-клиент для GigaIDE
14.04.2026 07:39:05 | Хабр

Как не выгорать и к чему я пришел
14.04.2026 07:38:08 | Хабр

Как 164 команды получили 164 разных ответа на один вопрос
14.04.2026 07:01:02 | Хабр

Linux отказывается от процессоров Intel 486 спустя почти 40 лет. Почему?
14.04.2026 07:01:02 | Хабр

Учет НМА: кому принадлежит ваш код? Как ИТ-стартапу оформить права на софт и капитализировать разработку
14.04.2026 07:01:01 | Хабр

Фотография при длинной выдержке с изменением зума
14.04.2026 07:01:00 | Хабр

Как найти причину латенси в пайплайне обработки HTTP запроса за 5 минут: разбираем шаг за шагом
14.04.2026 07:00:59 | Хабр

Лонгрид на тему перспектив онлайн-кредитования МФО в 2026-2027
14.04.2026 07:00:58 | Хабр

Добавим приставку нейро: взгляд на интеграцию LLM в продукт со стороны фронтенда
14.04.2026 07:00:04 | Хабр

Blameless post‑mortem: как разбирать инциденты так, чтобы они не повторялись
14.04.2026 06:50:55 | Хабр

Милла Йовович — скамер??
14.04.2026 06:46:17 | Хабр

Кейс: как производитель цемента автоматизировал планирование оптовых продаж в условиях нестабильного рынка
14.04.2026 06:44:57 | Хабр

[Перевод] Вышел Playwright 1.59: как тестировщикам с пользой применить каждую новую фичу
14.04.2026 06:00:42 | Хабр

Как я сократил рабочий день до 4 часов и вырос в должности
14.04.2026 06:00:41 | Хабр

Двойной удар: почему хакеры полюбили заводы и торговые сети
14.04.2026 06:00:39 | Хабр

Российский 3D-движок, автоматический UX-аудит – и ещё 8 российских стартапов
14.04.2026 05:45:33 | Хабр

Десктопная версия MAX или МАХ — что исправить, чтобы не было так плохо?
14.04.2026 05:36:26 | Хабр

Удобные и неудобные дети, или Послушание — это отложенная катастрофа
14.04.2026 05:30:26 | Хабр

Компилятор в голове: как я учил HTML без компьютера и интернета, вооружившись листком в клетку
14.04.2026 05:30:24 | Хабр

Обзор доклада PGBootCamp 2026 о технологии разделения Compute и Storage
14.04.2026 05:26:08 | Хабр

Вайб-код для настоящих инженеров: старые практики в новых реалиях
14.04.2026 05:01:21 | Хабр

От хаоса к системе: история трансформации IT-отдела за 7 месяцев
14.04.2026 04:26:12 | Хабр

Теория организации с антропологическим ядром
14.04.2026 04:16:08 | Хабр

Статический анализ кода STM32. Конкретный пример
14.04.2026 04:14:20 | Хабр

Голосовой ввод в Claude на русском — бесплатно и офлайн за один вечер
14.04.2026 03:38:25 | Хабр

Умные камеры и ИИ защитят леса Подмосковья от огня
14.04.2026 01:53:03 | ferra.ru

В КФУ предложили новый способ воздействия на опухоли без агентов
13.04.2026 23:58:39 | ferra.ru

Чат GPT (ГПТ) бесплатно в России: ChatGPT без регистрации и ограничений
13.04.2026 23:27:57 | Хабр

МГУ запустит три спутника в 2027 году для поиска солнечных вспышек
13.04.2026 23:12:58 | ferra.ru

МГУ создаст комплекс TAIGA-100 для изучения космических лучей
13.04.2026 23:05:55 | ferra.ru

Смотреть все

НОВОСТИ

В России назвали причины ударов по отдаленным от границы с Украиной регионам
10.06.2026 14:02:24 | Lenta.ru

Эрдоган: Израиль представляет угрозу для региона и всего человечества
10.06.2026 14:02:16 | ТАСС

ОДКБ рассмотрит исключение Армении из организации
10.06.2026 14:01:59 | Lenta.ru

В Башкирии задержали девять человек за аферы с sim-картами
10.06.2026 14:01:49 | ТАСС

Главу абхазской организации ветеранов внесли в базу "Миротворца"
10.06.2026 14:00:56 | ТАСС

Ивлев: возвращение Шварца показывает изменение отношения и большее понимание позиции РФ
10.06.2026 14:00:32 | ТАСС

Telegraph: Британия намерена помочь Украине с разработкой альтернативы ЗРК Patriot
10.06.2026 14:00:25 | ТАСС

Путин поприветствовал участников VI Международного форума «Путешествуй!»
10.06.2026 14:00:16 | Life.ru

Проект "Россия - Моя история" готов помочь создать вариант "Обороны Севастополя"
10.06.2026 13:59:49 | ТАСС

Росгвардия за сутки уничтожила на южном направлении 34 беспилотника ВСУ
10.06.2026 13:59:42 | ТАСС

ГД поддержала законопроекты о порядке регистрации детей, рожденных после смерти отца
10.06.2026 13:58:42 | ТАСС

Reuters: В ЕС хотят ограничить право голоса будущих членов блока
10.06.2026 13:58:00 | Российская Газета

Во Франции предупредили о риске войны с Россией из-за Украины в ЕС
10.06.2026 13:57:49 | Life.ru

Лавров: РФ должна убедиться, что предложения по диалогу с Европой серьезны
10.06.2026 13:57:41 | ТАСС

Лавров: чудеса бывают, но с позицией Европы по Украине оно вряд ли произойдет
10.06.2026 13:57:13 | ТАСС

Число сбитых на подлете к Москве дронов превысило 20
10.06.2026 13:57:10 | РБК

Россиянин пролил кровь четырех человек за металл и спрятался на 18 лет
10.06.2026 13:57:00 | Lenta.ru

Лавров призвал оперативно разобраться с членством Армении в ЕАЭС
10.06.2026 13:57:00 | Lenta.ru

Раскрыт механизм, мешающий ультрафиолету разрушать пластик в природных средах
10.06.2026 13:56:55 | ТАСС

В Кузбассе осудили женщину, отобравшую квартиру у 101-летней участницы войны
10.06.2026 13:56:49 | ТАСС

Госдума приняла закон о реформе института бизнес-омбудсмена
10.06.2026 13:56:33 | РБК

Стармер пообещал применить всю силу закона к участникам антимигрантских погромов
10.06.2026 13:56:23 | ТАСС

Змея поселилась в машине в российском городе и не захотела ее покидать
10.06.2026 13:56:17 | Lenta.ru

Гострудинспекция проверяет информацию о долгах по зарплатам в БК "Пари НН"
10.06.2026 13:56:12 | ТАСС

Совет директоров СПБ Биржи рекомендовал не выплачивать дивиденды за 2025 год
10.06.2026 13:55:40 | Коммерсантъ

Военный раскрыл подробности применения ВСУ ракет «Фламинго»
10.06.2026 13:55:16 | Lenta.ru

В Челябинске осудили женщину, прятавшую труп дочери в диване
10.06.2026 13:55:08 | ТАСС

Telegraph: Британия поможет Украине создать европейскую альтернативу Patriot
10.06.2026 13:55:00 | Российская Газета

Украинский дрон атаковал пассажирский автобус в Запорожской области
10.06.2026 13:54:50 | РБК

«Нетривиальная задача»: IT-эксперт объяснил, как понять, что роутер пора выбросить
10.06.2026 13:54:47 | Life.ru

«ЛизаАлерт» зафиксировала следы медведей в районе поисков семьи Усольцевых
10.06.2026 13:54:05 | Life.ru

В Японии умер бывший глава МИД и экс-спикер парламента Ёхэй Коно
10.06.2026 13:53:25 | ТАСС

Девять БПЛА сбиты в ходе новой атаки на Москву
10.06.2026 13:52:42 | Life.ru

"Мощь и масштаб": производитель самолетов-рекордсменов отмечает 50 лет
10.06.2026 13:52:33 | ТАСС

Глава МИД Турции посетит Москву с рабочим визитом
10.06.2026 13:52:12 | РБК

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro