假设我们有 k 个总体,分别记为 $G_1, G_2,..., G_k$,每个总体都有其对应的概率密度函数 $f_1(x), f_2(x), ..., f_k(x)$,以及先验概率 $p_1, p_2, ..., p_k$。
对于一个新样本 x,我们想要判断它属于哪个总体。根据贝叶斯定理,我们可以计算后验概率:
$$P(G_i|x) = frac{p_i f_i(x)}{sum_{j=1}^{k} p_j f_j(x)}, i = 1,2,...,k$$
其中:
- $P(G_i|x)$ 表示给定样本 x 的情况下,样本属于总体 $G_i$ 的概率。
- $f_i(x)$ 表示样本 x 在总体 $G_i$ 中出现的概率密度。
- $p_i$ 表示总体 $G_i$ 的先验概率。
贝叶斯判别规则指出,为了最小化误判概率,我们应该将样本 x 判给后验概率最大的那个总体。