驾驭海量数据：Ullman教授的数据挖掘精要

数据挖掘 19

2.31MB 2024-05-19

#数据挖掘 # Hadoop # LSH # 流数据 # 图数据 # 聚类 # 机器学习 # 统计陷阱

斯坦福大学Jeffrey Ullman教授及其团队在数据挖掘领域取得了新的进展。这本著作深入探讨了如何利用Hadoop和LSH等技术进行数据挖掘，并涵盖了对流数据和图数据的挖掘，以及传统的聚类方法。作者清晰地区分了数据挖掘和机器学习方法，并在书中阐述了在数据挖掘过程中需要避免的统计陷阱。