特别要注意,进入到某些专业领域后(比如统计),对待EXCEL的帮助内容要慎之又慎。
以下的内容来自于百度百科,“standardize是一个英语单词,动词,作动词时意思是“使标准化;用标准检验””。数据的标准化就是通过一定的数学变换方式,对原始数据进行一定的转换,使原始数据转换为无量纲化指标测评值,即各指标值都处于同一个数量级别上,这样可以进行综合分析和比较。特别要注意,标准化不等于正态化。
033 standardize
助记:英文的“standardize”
类别:统计
语法:
standardize(x,mean,standard_dev)
参数:3个参数
- x 要进行标准化的数值
- mean 分布的算术平均值。
- standard_dev 分布的标准偏差。
说明:
- 保证standard_dev>0,否则返回错误值#NUM!。
- 标准化数值的计算公式如下
用法:返回标准化后的数据。
1)新建一个工作表,在A列随机产生一组500个身高数据。A1单元格输入“身高(cm)”,A2单元格输入公式“=randbetween(140,200)”并向下填充到A501。
2)B2输入公式“=average(”,然后点击A列的标签,然后回车。B4输入公式“=stdev(”,然后点击A列的标签,然后回车。
3)C2输入公式“=standardize(”,鼠标左键点击A2,输入“,”,点击B2,按F4变成绝对引用,输入“,”,点击B4,按F4变成绝对引用,然后回车。
4)鼠标左键点击C2,向下滚动,按住shift键的同时再次鼠标点击C501,点击“开始”菜单,“编辑”区域的“填充”,选择“向下”,将公式填充到C501。
5)选择B1:B4区域,点击“复制”,点击D1单元格,点击“粘贴”。
6)此种处理方式会压缩数据,并让数据呈现出一种特殊特征,即数据的算术平均值一定为0,标准差一定是1。按照上期的内容我们按照正态分布构建一个-3~ 3的区间,计算一下频数,作出直方图。
7)所有的数据减去平均值后叫离均差,其总和在正负抵消后刚好为0。减去算术平均值的数据处理方法也叫“中心化”,则所有数据的算术平均值为0。
8)标准差的计算公式如下:
要使标准差等于1,只要将两边同时除以标准差即可。
9)而且,经过处理的数据没有量纲,数据被压缩在一定范围内,但保留了原来数据的相对特性,方便进行比较。我们把A列的随机数换成单位m、mm的数据,标准化后基本差不多。不使用随机数,我们在A列从1开始填充一个等差数列,其步距不会影响标准化后的数据。如图数据,和A列填入1~500结果是一样的,数据分布完全等同。
10)还有我们以前讲过的“归一化”也是一种处理方式,公式如下:
这种方法将数据强行压缩到0~1的范围内。例如,将绝对误差(有量纲)除以量程转化成相对误差(无量纲)就可以比较了。
11)有个故事是这样的,同样捐100元钱是不公平的,应该按照个人收入的多少来算。对于一个乞丐,可能倾其所有,而对于一个富豪只是九牛一毛。所以,捐款名单上不要比较具体的数额,而要除以这个人全部财产的总数,看看他相对来说卷出来多少。
(待续)
,