这是我们CSE 597A课程项目的存储库,其中包含了一个新的数据集:book_data_1225.csv,收录了1225本独特的书籍。数据集添加了多项功能,但保持了使用便捷的特点。在使用这个数据集进行机器学习算法时,建议使用以下两组特征:第一组特征包括3、4、5、6、7、8、10、11;第二组特征则在第一组的基础上增加12到134。总共涵盖了134个特征。评级是我们的主要目标。我们计划在未来的测试中添加基于标题的词袋转换。此外,我们还记录了价格信息,以及每本书是否有Nook(电子书)版本和音频版本。