数据挖掘项目要求从不同数据源整合学生信息,使用C/C++/Java编程语言实现数据一致性合并及学生样本量化。分析包括计算家乡为北京学生的课程平均成绩,统计广州家乡男生中特定成绩条件下的数量,比较广州与上海女生的体能测试成绩,探讨学习成绩与体能测试成绩的相关性。项目详细目录包含原始数据、清洗后数据及数据库插入代码示例。