Поможем выбрать подходящее решение
Пишите нам:
Проконсультируем
Data Sapience: только полезное и ничего лишнего
Раз в две недели — только ценная аналитика.
Самые важные и интересные новости в одном письме.
Пользуясь сайтом datasapience.ru, вы соглашаетесь с использованием файлов cookie в соответствии с политикой использования cookie. Узнать подробнее
Принять

Оптимизации функционала Apache Iceberg в задачах real-time загрузки и обработки данных

16.12.2025
В блоге Data Sapience на Habr вышла новая статья.
Технические лидеры направления разработки Apache Spark в составе платформы Data Ocean Андрей Первушин и Дмитрий Паршин рассказывают, с какими проблемами можно столкнуться при реализации Upsert Streaming в Iceberg, что такое equality delete, почему они создают нагрузку при чтении таблиц в Apache Iceberg и как мы оптимизировали Apache Spark, чтобы снизить потребление памяти и ускорить чтение данных.

Вам может быть интересно

Новости