数据挖掘工具应用详解-使用Weka教程

数据挖掘中的结果分析包括两种模式：非监督模式和监督模式。在非监督模式下，使用SimpleKMeans进行运算，得到迭代次数、SSE和簇中心等结果，同时检验对象的分组信息。监督模式下同样使用SimpleKMeans，得到类/簇混淆矩阵和错误分组的对象比例。此外，对于数值属性，簇中心为均值，分类属性为众数。另一种方法是使用DBScan，同样分为非监督和监督模式，结果包括迭代次数和训练对象的分组信息。图形分析中，勾选“store clusters for visualization”可生成2D散布图，便于可视化类/簇混淆矩阵。