作为初级数据科学家的最终项目,我创建了一个电影推荐系统工具。该工具根据具有相似特征的电影推荐电影列表。我清理了电影原始数据集,并使用Python、Excel和PowerBI进行数据分析。通过使用不同的度量标准如曼哈顿距离、欧氏距离和余弦相似度,优化了K最近邻(KNN)模型,以实现最佳的数据挖掘解决方案。我还使用了K均值算法作为描述性数据挖掘工具。最终,我使用Spider构建了用户界面,展示了电影推荐系统的功能和预测能力。数据集包括movie.csv和rating.csv,这些数据集基于MovieLens的用户评级。