分类与聚类
分类是将数据划分到预先定义好的类别中。例如,将邮件识别为垃圾邮件或非垃圾邮件。
聚类则是将数据分组到不同的类别,这些类别事先并不确定。例如,根据用户的购买行为将用户划分到不同的消费群体。
分类与预测
分类和预测都是数据分析的重要形式,用于解决预测问题。
分类侧重于预测数据的类别标签,例如将客户分类为高价值客户或低价值客户。
预测则侧重于预测连续值,例如预测未来一周的销售额。
预测与回归
预测是指利用历史数据识别数据变化规律,构建模型,并利用该模型预测未来的数据类型、特征等。
回归分析是预测的一种典型方法,用于建立自变量和因变量之间的关系模型,并利用该模型进行预测。