斯坦福大学Jeffrey Ullman教授及其团队在数据挖掘领域取得了新的进展。这本著作深入探讨了如何利用Hadoop和LSH等技术进行数据挖掘,并涵盖了对流数据和图数据的挖掘,以及传统的聚类方法。作者清晰地区分了数据挖掘和机器学习方法,并在书中阐述了在数据挖掘过程中需要避免的统计陷阱。