均值 (代数度量) (样本 vs. 总体)(mean):

Note: n 样本大小, N 总体大小.

- 加权算术均值:

- 截断均值: 去掉高低极端值

数据挖掘顺序分析的理解(数据描述性统计之集中趋势-均值)(1)

中位数(median):

- 奇数则为有序集的中间值, 否则为中间两个数的平均

数据挖掘顺序分析的理解(数据描述性统计之集中趋势-均值)(2)

§ 众数Mode

- 出现频率最高的值(不唯一/每个值出现一次则没有)

- 1/2/3个众数-〉单峰的, 双峰的, 三峰的

- 经验公式(Empirical formula):mean-mode=3*(mean-median)

,