数据挖掘原理

书籍概述

数据挖掘原理》是由 David HandHeikki MannilaPadhraic Smyth 合著的一本经典数据挖掘教材,由 MIT 出版社于 2001 年出版。这本书全面介绍了从大型数据库中提取信息的数学与科学原理,非常适合初学者和专业人士阅读。

作者简介

  • David Hand:英国著名统计学家,专注于数据挖掘和机器学习。
  • Heikki Mannila:芬兰计算机科学家,研究方向涵盖数据挖掘和生物信息学。
  • Padhraic Smyth:爱尔兰计算机科学家,专注于信息检索和机器学习。

内容概览

本书共分为 14 章,涵盖数据挖掘的各个方面。以下是每章的简要介绍:

  1. 第1章:引言
  2. 数据挖掘的基本概念;
  3. 发展历程及应用领域。
  4. 第2章:测量与数据
  5. 测量理论与实践;
  6. 数据类型及特点。
  7. 第3章:可视化与探索性数据分析
  8. 数据可视化方法;
  9. 探索性分析的技术与工具。
  10. 第4章:数据分析与不确定性
  11. 不确定性数据处理;
  12. 概率在数据分析中的应用。
  13. 第5章:数据挖掘算法的系统综述
  14. 常见算法概述;
  15. 算法选择与评估标准。
  16. 第6章:模型与模式
  17. 数据模型构建与解释;
  18. 模式识别与分析。
  19. 第7章:算法评分函数
  20. 评分函数的设计;
  21. 各算法的评分实现。
  22. 第8章:搜索与优化方法
  23. 搜索技术应用;
  24. 优化算法选择与实现。
  25. 第9章:描述性建模
  26. 描述性模型定义;
  27. 应用场景分析。
  28. 第10章:预测性建模(分类)
  29. 分类模型构建;
  30. 常用分类算法比较。
  31. 第11章:预测性建模(回归)
  32. 回归模型原理;
  33. 回归分析实际案例。
  34. 第12章:数据组织与数据库
  35. 数据库管理系统功能;
  36. 大规模数据存储策略。
  37. 第13章:模式与规则发现
  38. 规则发现与模式提取技术。