Hudi作为数据湖解决方案之一,与Iceberg和Delta并称三大数据湖技术。主要内容包括:1. Hudi的数据存储格式和表结构。2. 读取操作流程及查询类型。3. 写入操作流程,包括UPSERT和INSERT等操作。4. 索引的详细介绍及其类型。5. 表服务的概念和具体实现,包括压缩、清理和索引。6. 聚类技术和空间填充曲线的应用。7. 并发控制机制,同时运行写入操作和表服务。8. 增量处理的实现,包括增量查询和变更数据捕获(CDC)。