Spark存储机制

spark 21

793.43KB 2024-05-16

#大数据处理 #Spark #存储机制 #内存存储 #磁盘存储

内存存储（RDD）: 快速高效，但容量有限。
磁盘存储（HDFS）：容量大，但访问速度较慢。
外围存储（Cache）：介于内存和磁盘存储之间，提供平衡的性能和容量。
流水线执行: 优化数据处理流程，减少磁盘I/O。