ORC in Hive/Spark — “анатомия” файла, индексация и фильтр Блума

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

ORC in Hive/Spark — “анатомия” файла, индексация и фильтр Блума

01.04.2026 14:00:07 | Хабр

Хабы: Блог компании АО «ГНИВЦ», Hadoop, Big Data, Data Engineering

ORC in Hive/Spark - “анатомия” файла, индексация и фильтр Блума

ORC — это колоночный формат, то есть данные хранятся не по строкам (как в CSV), а по столбцам. Именно это даёт ему способность эффективно сжимать и читать только нужные колонки. Есть ещё встроенная индексация и фильтр Блума, которые позволяют не перелопачивать лишние данные.

Давайте заглянем под капот и посмотрим, как устроен ORC-файл, зачем там индексы и как фильтр Блума ускоряет поиск.

I. Анатомия файла

Читать далее

Подробнее

Читайте также

Как бизнесу стать технологичнее без перестройки подразделений
01.04.2026 13:50:02 | Хабр

Подарочные карты для российского App Store пропадают с маркетплейсов и из сервисов-посредников, а оставшиеся продаются с наценкой до 80% от номинала
01.04.2026 13:47:35 | vc.ru

СМИ: складной Huawei Pura X2 получит новый дизайн камеры «в стиле iPhone Air»
01.04.2026 13:43:59 | ferra.ru

Насмотренность — ловушка. Что на самом деле развивает продуктового дизайнера
01.04.2026 13:40:49 | Хабр

Ростех создал очки для поддержания биоритмов в условиях полярной ночи
01.04.2026 13:30:45 | ferra.ru

6 способов выбесить кандидата в вакансии и как их избежать
01.04.2026 13:25:09 | Хабр

Ну‑ка, посмотрим, что там у Claude Code…
01.04.2026 13:23:32 | Хабр

YOLOv11 и RF-DETR для object detection в видео. Добавление временных характеристик с помощью суперкадра
01.04.2026 13:16:01 | Хабр

BI-аналитика или Excel: где вести аналитику компаниям?
01.04.2026 13:13:54 | Хабр

В России нашли способ сделать раковые клетки беззащитными перед терапией
01.04.2026 13:12:48 | ferra.ru

Оптимизация производительности во Flutter
01.04.2026 13:09:39 | Хабр

[Перевод] Как выбирают свой путь призраки в Pac-Man
01.04.2026 13:01:49 | Хабр

Ведьма, чума, компьютер и ИИ: как человечество приручало неизвестное
01.04.2026 12:54:46 | Хабр

7 странных трендов привычек из TikTok
01.04.2026 12:49:46 | Хабр

Как автор книг по Kotlin проверял мой проект: разбор ошибок в Coroutines и архитектуре
01.04.2026 12:46:02 | Хабр

Игровые серверы на Cozystack: первоапрельская нешутка
01.04.2026 12:38:51 | Хабр

добавил(-а) Вас в канал в МАХ
01.04.2026 12:33:04 | Хабр

Студенты разработали дрон для доставки лекарств в труднодоступные районы
01.04.2026 12:31:25 | ferra.ru

К Perplexity подали коллективный иск — компанию обвинили в передаче Google и Meta* персональной информации пользователей
01.04.2026 12:26:29 | vc.ru

Почему один HR не спасёт бизнес
01.04.2026 12:23:04 | Хабр

Google выпустит фитнес-браслет без экрана
01.04.2026 12:20:33 | ferra.ru

Apple Developer enrollment и Unknown Error: как «неизвестная» ошибка оказалась региональным ограничением
01.04.2026 12:15:56 | Хабр

Делаем принт-сервер из старого ADSL модема
01.04.2026 11:50:59 | Хабр

5 неочевидных возможностей системы защиты от протечки воды и как настроить ее под свои привычки и быт
01.04.2026 11:45:50 | Хабр

ИИ Apple неожиданно появился в Китае и… пропал
01.04.2026 11:44:00 | ferra.ru

Антенны для мобильной связи запустили в небо
01.04.2026 11:26:04 | it-world

«Ъ»: власти планируют лишать ИТ-аккредитации компании, которые не ограничат доступ к своим сервисам через VPN
01.04.2026 11:04:23 | vc.ru

Oracle сократит «тысячи» сотрудников на фоне роста капитальных расходов на финансирование ИИ-инфраструктуры — СМИ
01.04.2026 11:01:20 | vc.ru

Скорочтение — скрытый гем. Спасение в эпоху LLM
01.04.2026 10:59:53 | Хабр

Место Питона, Си и Паскаля в образовательном процессе
01.04.2026 10:57:27 | Хабр

Случайность — другое имя Бога
01.04.2026 10:57:18 | Хабр

Что написать в резюме, что бы точно пригласили на работу?
01.04.2026 10:49:40 | Хабр

No-code в крупных компаниях: Свобода или новая ИТ-ловушка?
01.04.2026 10:44:56 | Хабр

Задача внешней баллистики. Первая часть. Аналитическое решение
01.04.2026 10:30:37 | Хабр

Когда надо вносить изменения в управление в компании
01.04.2026 10:18:57 | Хабр

Смотреть все

НОВОСТИ

Google подала 24 заявки на регистрацию товарных знаков в России, включая YouTube
01.04.2026 18:08:45 | Life.ru

Пассажирский самолет ушел на второй круг во время посадки из-за ошибки пилотов
01.04.2026 18:08:37 | Lenta.ru

Мосгорсуд вынес решение по статусу иноагента у рэпера Влади
01.04.2026 18:08:25 | Lenta.ru

«Всё было по понятному сценарию»: Самойлова объяснила развод с Джиганом
01.04.2026 18:06:39 | Life.ru

Путин надеется, что ЕАЭС и ЕС смогут взаимодействовать в будущем
01.04.2026 18:05:41 | Life.ru

МИД Ирана назвал заявление Трампа о перемирии ложным и необоснованным
01.04.2026 18:05:00 | Российская Газета

DM: Гиды на Эвересте нарочно травили альпинистов ради денег за эвакуацию
01.04.2026 18:03:00 | Российская Газета

Бугаев рассказал, как санкции МПК повлияли на уровень горнолыжников
01.04.2026 18:02:56 | ТАСС

СБ РФ: предвосхищать результаты диалога по Украине рано
01.04.2026 18:02:56 | ТАСС

СБ РФ: Запад в попытке сохранить доминирование стал прибегать к терроризму
01.04.2026 18:02:54 | ТАСС

«Париж, я готова»: путь Селин Дион и ее возвращение на сцену
01.04.2026 18:02:46 | Ведомости

Россиянин развращал несовершеннолетних и изготавливал порнографические изображения
01.04.2026 18:02:28 | Lenta.ru

СБ РФ: Израиль военными действиями против Ирана поставил под угрозу свой народ
01.04.2026 18:02:24 | ТАСС

СБ РФ: говорящие о допустимости ядерных ударов политики на Западе безумны
01.04.2026 18:02:15 | ТАСС

СБ РФ: Запад, утратив веру в поражение РФ, взял курс на террор
01.04.2026 18:02:09 | ТАСС

Замсекретаря СБ РФ: Запад приблизил мир к опасной черте
01.04.2026 18:02:07 | ТАСС

Путин рассказал, сколько армян проживает в России
01.04.2026 18:01:59 | Life.ru

В Microsoft попросили не ругать обновления Windows
01.04.2026 18:01:48 | Lenta.ru

СБ РФ: чем ближе конец киевского режима, тем выше угроза глобальных провокаций
01.04.2026 18:01:37 | ТАСС

СБ РФ: нет гарантий, что новые власти Сирии смогут обуздать террористов
01.04.2026 18:01:19 | ТАСС

Священник раскрыл, можно ли носить крестик на одной цепочке с другими подвесками
01.04.2026 18:00:38 | Life.ru

Признаки паразитов в организме: какие бывают, к какому врачу идти и какие анализы сдавать
01.04.2026 18:00:00 | Life.ru

Юрий Коков: Россия исторически является одной из главных желанных целей Запада
01.04.2026 18:00:00 | Российская Газета

Появилось видео забитой оружием секретной подземной базы Ирана
01.04.2026 17:59:57 | Lenta.ru

Бизнес попросил определить ИИ // Иначе контролировать будут и голосовых помощников
01.04.2026 17:59:11 | Коммерсантъ

Посол Ирана: Тегеран приветствовал бы выбор России на роль посредника
01.04.2026 17:59:00 | Российская Газета

В Каире при пожаре на швейной фабрике погибли девять человек
01.04.2026 17:58:33 | ТАСС

Путин сравнил объёмы торговли России с Арменией и Азербайджаном
01.04.2026 17:58:09 | Life.ru

ЕК передаст Украине очередной транш в 1,4 млрд евро от доходов с активов РФ
01.04.2026 17:58:03 | Life.ru

Nvidia отказалась от чудовищно огромного GPU Rubin Ultra? Сообщается, что компания сделала выбор в пользу компоновки двух обычных Rubin на одной плате
01.04.2026 17:58:00 | iXBT.com

"Аэрофлот" не ждет резкого роста цен на авиабилеты
01.04.2026 17:57:43 | ТАСС

В Литве рассмотрение дела о поджоге оборудования для Украины отложили
01.04.2026 17:56:56 | ТАСС

Переехавшая на Мадейру россиянка назвала неожиданные плюсы островной жизни
01.04.2026 17:56:35 | Lenta.ru

Группы ПВО "Рубикона" сбили тараном дрон-разведчик ВСУ Shark
01.04.2026 17:55:57 | ТАСС

МИД РФ: ЕС в условиях энергокризиса вместо диалога с Москвой выбирает "чумазую" стратегию
01.04.2026 17:55:50 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro