类直径的定义与计算方法
对于包含 j-i+1 个样本的类别 G,其均值向量表示为:
假设有序样本为 x(1), x(2), ..., x(n),这些样本可以按大小排序,也可以按时间顺序排列。
用 D(i,j) 表示该类的直径,常用的直径计算方法包括:
- 欧氏距离:
D(i,j) = max ||x(k) - x(l)|| , i ≤ k, l ≤ j
其中,||x(k) - x(l)|| 表示样本 x(k) 和 x(l) 之间的欧氏距离。
- 单变量情况下的直径:
当样本是单变量时,可以使用以下公式定义直径:
D(i,j) = x(j) - x(i)
其中,x(j) 和 x(i) 分别表示类别 G 中最大和最小的样本值。
- 离差平方和:
D(i,j) = Σ(x(k) - x̄)^2 , i ≤ k ≤ j
其中,x̄ 表示类别 G 的均值。
- Fisher 最优求解法:
Fisher 最优求解法是一种用于寻找最佳分割点的方法,它可以用于定义类的直径。