数据分析师经常需要做实验来对比不同的数据,当数据出来之后,领导会问:小刘啊,这个数据怎么样,我们的页面改动对留存时长有效果吗?这时候我们就可以按照下面的步骤,给领导一个信服的答案。

数据量化判断技巧(test数据是否符合预期)(1)

1、如何判断实验数据是否符合预期?

通过计算 P值来评估实验数据,一般当P值<0.05时(5%),认为数据变化符合预期。

2、如何判断P值?

假如,我们本次做的实验是,改变页面排版,用户的留存时长是否有提升本次

我们的数据如下:

对照组数据:

数据量化判断技巧(test数据是否符合预期)(2)

实验组数据:

数据量化判断技巧(test数据是否符合预期)(3)

计算对照组平均留存时长:

a = (10 10 10 15 15 15 15 20 20 20)/ 10 = 15s

计算实验组平均留存时长:

b = (20 20 20 25 25 25 25 30 30 30)/ 10 = 25s

计算实验组样本标准差:

数据量化判断技巧(test数据是否符合预期)(4)

计算样本标准差的公式

公式如上:最终得到的结果是

S = 4.08

根据样本标准差,计算总体标准差

数据量化判断技巧(test数据是否符合预期)(5)

计算对照组数据和实验组数据之间存在几个标准差

数据量化判断技巧(test数据是否符合预期)(6)

最终算出来,我们得到的实验组数据,与对照组数据相差7.75个标准差。

然后查找正态分布表,查出来这个概率已经超过99.9%,几乎完全可以判定样本的实验结果可以说明问题。

数据量化判断技巧(test数据是否符合预期)(7)

怎样查正态分布表

数据量化判断技巧(test数据是否符合预期)(8)

正态分布表

上一步计算出来了实验组数据与对照组数据相差多少个标准差,假如相差了2.58个标准差,那么就可以按照上面的方式查表,纵坐标找2.8,横坐标找0.08,对应的0.9951就是目标数据了。

,