类直径的定义与计算方法

对于包含 j-i+1 个样本的类别 G,其均值向量表示为:

假设有序样本为 x(1), x(2), ..., x(n),这些样本可以按大小排序,也可以按时间顺序排列。

用 D(i,j) 表示该类的直径,常用的直径计算方法包括:

  • 欧氏距离:

D(i,j) = max ||x(k) - x(l)|| , i ≤ k, l ≤ j

其中,||x(k) - x(l)|| 表示样本 x(k) 和 x(l) 之间的欧氏距离。

  • 单变量情况下的直径:

当样本是单变量时,可以使用以下公式定义直径:

D(i,j) = x(j) - x(i)

其中,x(j) 和 x(i) 分别表示类别 G 中最大和最小的样本值。

  • 离差平方和:

D(i,j) = Σ(x(k) - x̄)^2 , i ≤ k ≤ j

其中,x̄ 表示类别 G 的均值。

  • Fisher 最优求解法:

Fisher 最优求解法是一种用于寻找最佳分割点的方法,它可以用于定义类的直径。