使用Matlab对随机生成的数据进行聚类分析,分别采用K均值聚类和模糊C均值聚类方法。

K均值聚类:

* 距离计算方法:默认采用欧式距离(sqeuclidean),可选用曼哈顿距离(cityblock)、余弦距离(cosine)、相关系数距离(correlation)以及汉明距离(hamming,仅适用于二分类变量)。

* 可选参数:'Streams'和'UseSubstreams',用于设置数据流,需重新设置数据。

* 输出结果:

* 各变量的簇心位置;

* 簇内点到质心距离之和;

* 各点在不同距离计算方法下到质心的距离;

* 基于不同距离计算方法的聚类结果;

* silhouette系数用于评估聚类合理性。

模糊C均值聚类:

* 输出结果:

* 聚类结果;

* 各变量的簇心位置。

结果可视化:

* 聚类图

* 识别图

* 三维分布图

* 树状图

* 平铺图