描述统计是数据分析中常用的方法,它是指通过数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计通常包括集中趋势分析、离散趋势分析和相关分析三大部分。
在Excel中,可以使用"分析工具库"中的相关工具对数据直接进行描述分析。除此以外,使用公式同样也可以实现这样的分析需求。
例如图显示了两组不同型号的灯泡的使用寿命实测值,可以使用公式来对这两组灯泡的寿命数据进行描述。
以B列数据为例,
● 平均值:
=AVERAGE(B2:B56)
● 标准误差(Standard Error,标准差/观测值个数的平方根):
=STDEV(B2:B56)/SQRT(COUNT(B2:B56))
其中SQRT函数用于求取平方根。
● 中位数(排序后处于中间的值):
=MEDIAN(B2:B55)
● 众数(出现次数最多的值):
=MODE(B2:B55)
● 标准差(标准偏差,Standard Deviation):
=STDEV(B2:B55)
● 方差(Variance):
=VAR(B2:B55)
● 峰度(衡量数据分布起伏变化的指标):
=KURT(B2:B55)
● 偏度(衡量数据峰值偏移的指标):
=SKEW(B2:B55)
● 区域(极差,最大值与最小值的差值):
=MAX(B2:B55)-MIN(B2:B55)
● 平均值置信度(95%):
=TINV(0.05,COUNT(B2:B55)-1)*STDEV(B2:B55)/SQRT(COUNT(B2:B55))
其中TINV函数用于返回T分布的T值。
CONFIDENCE函数也可以计算置信度,但是CONFIDENCE函数采用Z分布进行运算,适用于计算总体样本平均值的置信空间。
从这两组数据的集中度和离散度分析对比可以看出,型号 A 的灯泡相对来说质量更优,品质 相对更稳定
,