数据分析师经常需要做实验来对比不同的数据,当数据出来之后,领导会问:小刘啊,这个数据怎么样,我们的页面改动对留存时长有效果吗?这时候我们就可以按照下面的步骤,给领导一个信服的答案。
1、如何判断实验数据是否符合预期?
通过计算 P值来评估实验数据,一般当P值<0.05时(5%),认为数据变化符合预期。
2、如何判断P值?假如,我们本次做的实验是,改变页面排版,用户的留存时长是否有提升本次
我们的数据如下:
对照组数据:
实验组数据:
计算对照组平均留存时长:
a = (10 10 10 15 15 15 15 20 20 20)/ 10 = 15s
计算实验组平均留存时长:
b = (20 20 20 25 25 25 25 30 30 30)/ 10 = 25s
计算实验组样本标准差:
计算样本标准差的公式
公式如上:最终得到的结果是
S = 4.08
根据样本标准差,计算总体标准差
计算对照组数据和实验组数据之间存在几个标准差
最终算出来,我们得到的实验组数据,与对照组数据相差7.75个标准差。
然后查找正态分布表,查出来这个概率已经超过99.9%,几乎完全可以判定样本的实验结果可以说明问题。
怎样查正态分布表
正态分布表
上一步计算出来了实验组数据与对照组数据相差多少个标准差,假如相差了2.58个标准差,那么就可以按照上面的方式查表,纵坐标找2.8,横坐标找0.08,对应的0.9951就是目标数据了。
,