斯坦福大学 CS246 课程官方教材,探索海量数据集的挖掘技术。
海量数据挖掘
相关推荐
海量数据集挖掘
一本阐述大数据经典理论和实践方法的专业书籍。
数据挖掘
3
2024-05-20
海量数据集挖掘
海量数据集挖掘
作者: Anand Rajaraman,Jeffrey D. Ullman
这本数据挖掘经典著作以清晰易懂的方式阐述了相关概念和技术。
数据挖掘
2
2024-05-25
云计算赋能海量数据挖掘
云计算赋能海量数据挖掘
云计算的出现为海量数据挖掘提供了新的可能性。其强大的计算和存储能力能够有效解决传统数据挖掘方法面临的挑战,例如:
数据规模庞大: 云计算平台可以弹性扩展,满足海量数据的存储和处理需求。
计算资源受限: 云计算提供按需付费的计算资源,无需前期投入大量资金购买硬件设备。
算法复杂度高: 云计算平台支持分布式计算框架,可以高效执行复杂的挖掘算法。
通过将海量数据存储在云端,并利用云计算平台提供的计算资源和挖掘工具,可以更加高效地发现数据背后的价值。
数据挖掘
2
2024-05-25
驾驭海量数据:Ullman教授的数据挖掘精要
斯坦福大学Jeffrey Ullman教授及其团队在数据挖掘领域取得了新的进展。这本著作深入探讨了如何利用Hadoop和LSH等技术进行数据挖掘,并涵盖了对流数据和图数据的挖掘,以及传统的聚类方法。作者清晰地区分了数据挖掘和机器学习方法,并在书中阐述了在数据挖掘过程中需要避免的统计陷阱。
数据挖掘
6
2024-05-19
七月学习-数据挖掘海量分布式处理
海量数据的分布式处理ppt
数据挖掘
4
2024-05-01
海量数据挖掘(英文第二版,PDF&EPUB)
《海量数据挖掘》由数据库和网络技术领域的权威人士 Jure Leskovec、Anand Rajaraman 和 Jeffrey David Ullman 执笔,适合学生和从业者阅读。
网络和电子商务的普及产生了大量可供数据挖掘信息的海量数据集。本书侧重于解决数据挖掘关键问题的实用算法,这些算法即使应用于最大的数据集也能取得成功。
本书首先讨论了 map-reduce 框架,这是一种自动并行化算法的重要工具。作者解释了局部敏感哈希和流处理算法的技巧,用于挖掘到达速度过快而无法进行详尽处理的数据。其他章节涵盖了 PageRank 的理念和组织网络的相关技巧、查找频繁项集和聚类的问题。
第二版新增和扩展了社交方面的内容。
算法与数据结构
3
2024-05-23
海量翼型数据宝库
包含约两千多个翼型数据,以点坐标形式精准描述,是目前较为全面的翼型数据资源库。
Access
2
2024-05-28
海量数据处理流程
通过数据采集、数据清洗、数据存储、数据分析、数据可视化等步骤,有序处理海量数据,助力企业深入挖掘数据价值,提升决策效率。
DB2
2
2024-05-15
海量成语数据库
包含 13000 条成语,为成语查询应用提供支持。
Access
4
2024-05-21