Apache Hudi入门指南详解Hudi PMC从零到一

Hudi作为数据湖解决方案之一，与Iceberg和Delta并称三大数据湖技术。主要内容包括：1. Hudi的数据存储格式和表结构。2. 读取操作流程及查询类型。3. 写入操作流程，包括UPSERT和INSERT等操作。4. 索引的详细介绍及其类型。5. 表服务的概念和具体实现，包括压缩、清理和索引。6. 聚类技术和空间填充曲线的应用。7. 并发控制机制，同时运行写入操作和表服务。8. 增量处理的实现，包括增量查询和变更数据捕获（CDC）。