在机器学习与数据挖掘实验中,我们探索了k-means聚类算法的应用,使用Matlab实现了相关代码。实验涵盖了多源数据集成、清洗和统计,以及数据的数值量化处理。我们通过C/C++/Java程序实现了两个数据源的合并,并解决了数据的一致性问题。实验结果包括了学生家乡在北京的课程平均成绩计算,以及对广州和上海女生体能测试成绩的比较。此外,我们还分析了学习成绩与体能测试成绩之间的相关性。