数据对称性与偏度
概念解析
- 对称数据: 数据集围绕中心值对称分布,均值、中位数和众数基本重合。
- 右偏数据(正偏): 数据集右侧存在长尾,呈现出拉伸趋势,均值大于中位数。
- 左偏数据(负偏): 数据集左侧存在长尾,呈现出压缩趋势,均值小于中位数。
R语言函数
skewness()
: 计算偏度系数,用于判断数据偏斜方向和程度。kurtosis()
: 计算峰度系数,用于描述数据分布的平坦或尖锐程度。
数据特征比较
| 数据类型 | 均值 | 中位数 | 众数 | 偏度 |
|---|---|---|---|---|
| 对称数据 | 相等 | 相等 | 相等 | 接近0 |
| 右偏数据 | 最大 | 中间值 | 最小 | 大于0 |
| 左偏数据 | 最小 | 中间值 | 最大 | 小于0 |