分类与聚类

分类是将数据划分到预先定义好的类别中。例如,将邮件识别为垃圾邮件或非垃圾邮件。

聚类则是将数据分组到不同的类别,这些类别事先并不确定。例如,根据用户的购买行为将用户划分到不同的消费群体。

分类与预测

分类预测都是数据分析的重要形式,用于解决预测问题。

分类侧重于预测数据的类别标签,例如将客户分类为高价值客户或低价值客户。

预测则侧重于预测连续值,例如预测未来一周的销售额。

预测与回归

预测是指利用历史数据识别数据变化规律,构建模型,并利用该模型预测未来的数据类型、特征等。

回归分析是预测的一种典型方法,用于建立自变量和因变量之间的关系模型,并利用该模型进行预测。