异常(Outlier)指的是数据集中与大部分数据显著偏离的数据点,其偏离程度超出随机因素的范围,可能源于完全不同的生成机制。根据Hawkins的定义,异常是数据中那些使人怀疑其生成方式不同于其他数据的点。根据Weisberg的看法,异常是不符合数据集其他部分统计模型的数据。Samuels认为,异常是与数据集中其余部分显著不同的数据点。Porkess指出,异常是远离数据集中其他数据点的极端值。