针对Hadoop分布式文件系统 (Hadoop Distributed File System, HDFS)在小文件存储时NameNode内存占用率高的问题,通过分析HDFS基础架构,提出了基于元数据存储集群的SQL-DFS文件系统。通过在NameNode中加入小文件处理模块,实现了小文件元数据从NameNode内存向元数据存储集群的迁移,并借助关系数据库集群,实现了小文件元数据的快速读写。SQL-DFS优化了小文件的读取过程,减少了文件客户端对NameNode的请求次数。通过将部分DataNode文件块的校验工作转移到元数据存储集群中,进一步降低了NameNode的负载压力。最终,通过搭建HDFS和SQL-DFS实验平台,对比测试了两种架构在小文件读写中的表现。实验结果表明:SQL-DFS在文件平均耗时 (File Average Cost, FAC)和内存占用率方面均显著优于原HDFS架构,具备更优的小文件存储能力,适用于海量小文件存储需求。