在聚类分析中,确定最佳类别数量是一个挑战,目前还没有完美的解决方案。一个常用的方法是阈值法

  1. 观察聚类图,设置一个合理的距离阈值T。
  2. 在聚类过程中,当类别间距离超过阈值T时,停止聚类。

例如,设定T=0.35,如果聚类过程中类别间距离超过0.35,则认为达到了最佳类别数量,停止聚类。