使用Matlab对随机生成的数据进行聚类分析,分别采用K均值聚类和模糊C均值聚类方法。
K均值聚类:
* 距离计算方法:默认采用欧式距离(sqeuclidean),可选用曼哈顿距离(cityblock)、余弦距离(cosine)、相关系数距离(correlation)以及汉明距离(hamming,仅适用于二分类变量)。
* 可选参数:'Streams'和'UseSubstreams',用于设置数据流,需重新设置数据。
* 输出结果:
* 各变量的簇心位置;
* 簇内点到质心距离之和;
* 各点在不同距离计算方法下到质心的距离;
* 基于不同距离计算方法的聚类结果;
* silhouette系数用于评估聚类合理性。
模糊C均值聚类:
* 输出结果:
* 聚类结果;
* 各变量的簇心位置。
结果可视化:
* 聚类图
* 识别图
* 三维分布图
* 树状图
* 平铺图