案例包括R语言程序调试开发文本数据处理与挖掘的函数、各种可视化图集(具体可参考博客中展示的一部分),k近邻与加权k近邻,以及最终的模型预测。数据量为140多万记录,针对不同的预测变量进行了汇总。自己编写了针对k近邻与加权k近邻的十折交叉验证程序,并进行了可视化展示。整个项目过程全程没有使用R语言中现有的包,所有代码都是独立编写的。对于想要提升R编程能力的同学,这个项目将是一个绝佳的选择。谢谢大家支持!