数据挖掘是一门交叉学科,涵盖统计学、数据库管理和人工智能,从海量数据中提取模式、关联、趋势、异常和结构,以预测和解释数据行为。技术进步推动了数据挖掘在信息化社会中的关键作用,尽管自动化程度有限,但已成为各行业决策支持的重要工具。预测、描述、关联分析、序列模式挖掘、分类、聚类和异常检测是其主要技术方法。数据挖掘领域自1989年的IJCAI会议追溯,经过KDD会议和专业学会的推动,软件如WEKA、RapidMiner、SPSS Modeler及大数据平台如Hadoop、Spark也促进了其广泛应用。