数据挖掘原理
书籍概述
《数据挖掘原理》是由 David Hand、Heikki Mannila 和 Padhraic Smyth 合著的一本经典数据挖掘教材,由 MIT 出版社于 2001 年出版。这本书全面介绍了从大型数据库中提取信息的数学与科学原理,非常适合初学者和专业人士阅读。
作者简介
- David Hand:英国著名统计学家,专注于数据挖掘和机器学习。
- Heikki Mannila:芬兰计算机科学家,研究方向涵盖数据挖掘和生物信息学。
- Padhraic Smyth:爱尔兰计算机科学家,专注于信息检索和机器学习。
内容概览
本书共分为 14 章,涵盖数据挖掘的各个方面。以下是每章的简要介绍:
- 第1章:引言
- 数据挖掘的基本概念;
- 发展历程及应用领域。
- 第2章:测量与数据
- 测量理论与实践;
- 数据类型及特点。
- 第3章:可视化与探索性数据分析
- 数据可视化方法;
- 探索性分析的技术与工具。
- 第4章:数据分析与不确定性
- 不确定性数据处理;
- 概率在数据分析中的应用。
- 第5章:数据挖掘算法的系统综述
- 常见算法概述;
- 算法选择与评估标准。
- 第6章:模型与模式
- 数据模型构建与解释;
- 模式识别与分析。
- 第7章:算法评分函数
- 评分函数的设计;
- 各算法的评分实现。
- 第8章:搜索与优化方法
- 搜索技术应用;
- 优化算法选择与实现。
- 第9章:描述性建模
- 描述性模型定义;
- 应用场景分析。
- 第10章:预测性建模(分类)
- 分类模型构建;
- 常用分类算法比较。
- 第11章:预测性建模(回归)
- 回归模型原理;
- 回归分析实际案例。
- 第12章:数据组织与数据库
- 数据库管理系统功能;
- 大规模数据存储策略。
- 第13章:模式与规则发现
- 规则发现与模式提取技术。