在纯文科生的眼中,量化统计就是高大上的研究方法,可惜数理脑子不够,一直望洋兴叹。

文科统计学与理科统计学的区别(戏说统计文科生的统计学精华)(1)

偶然见到这本书《戏说统计》,副标题便是“文科生的量化方法”。作为纯文科生,对于所有的看起来很科学的高大上方式都心驰神往。结果假期拜读了一个星期,发现还是如干啃馒头一般难以下咽……

费了十来天的劲儿,合上书发现,读这本书带来了两个收获。

那些我们对量化的刻板印象

第一个收获是,这本书打破了我对量化的一些刻板印象,比如:

1、有数据、有百分比就是我们需要的量化。

有数据的论文非常常见,但这只是最最简单的,没怎么用上量化真正的威力。

2、量化的就是科学的,是可以确定地告诉我们结论的。

量化其实只能给出概率,哪怕结果是显著的,也只是代表概率高。而决定放弃任何一个概率时,也没有一条绝对值来判断低于多少的就可以舍弃,特别是在它所代表的选项被放弃后可能会带来严重后果时。

3、定量分析比定性分析高级、准确。

第一,定性分析才是基础,如果没有定性分析找出的方向,定量分析将寸步难行;

第二,定量分析没有那么准确,很多时候数字上的相关不一定代表实质上的相关,而这样的数据可以拿来蛊惑人心。我们需要定性分析帮助判断,找出真正的影响因素。

第二个收获是,提炼出了几个比较有用的概念,跟纯文科生们分享一下,也许下次看到的时候就会知道在说些什么。

一、效度与信度

目前学校越来越多地采用网络阅卷和成绩分析成绩分析中,时常会见到一个项目是分析某一题目的效度与信度分别是多少。那它们是什么意思呢?

其实这两个概念我还在大学里的时候便接触过,但是一直混淆,看了这本书才发现,也不全怪我,翻译实在是有点问题。

效度(validity)可以理解为切实,测量的就是自己想知道的。想要测一个人的身高,却搬来了一个体重秤,这个称测出来的值效度就很低,因为你测出来的不是自己想要得到的数据。拿到测试里就是,比如你想考学生的语言表达,结果题目里要求学生背诵原文,那肯定不切实际,考不出来。也就是效度低。

信度(reliability)可以理解成可靠,即数据是真实可信的.比如一个体重秤,可信就是指测得准,比如你第1次第2次第3次站上去都是50公斤,那它就是可信的(可是我不信!),如果隔一会儿上去,数值就大幅摆动,那它就是不可信的。考试中如果很多人作弊,这场考试的信度就很低。

测试中高信度的题目是指,同一个人多次做这个题,得分率应该差不多。比如不要出现模糊的概念,让学生猜,或是超过了学生的理解力,学生做时不得不每一次都是蒙。

效度、信度这两个词不好记,很大程度上是因为字面意思和所指的实际意思不太一致,改成切实、可靠会好记不少。

小测试:

《红楼梦》的作者是?

A. TFboys B. 蔡徐坤 C.语文老师 D.曹雪芹

请问这个题的效度和信度怎么样?

A 效度高,信度低

B 信度高,效度低

C 都高

D 都低

二、正态分布

正态分布(normal distribution)就是这样的一个图。

文科统计学与理科统计学的区别(戏说统计文科生的统计学精华)(2)

数字不重要,每个图里各不相同,形状比较重要,有点像正弦函数的一部分。峰顶是这一属性平均值的位置。

正态分布英文是normal distribution,可以理解成为正常分布,顾名思义,指的是,自然情况下,正态分布是万物分布的常态。无论哪个属性,都是多数人聚在平均值的周围,远远高于平均值的很少,远远低于平均值的也很少。

生活中的很多数据都呈正态分布。比如成年人中身高很高或很矮的人很少,大部分人处在中间。智商也是如此,天才和傻子都不多,我们都是普通人。

这个图可以引发特别多的哲学思考,作者拿了足足一整章来说这件事情。我从其中摘取几句:

1、万有不齐天地事,大道之行是中庸。

可以看出世间万物变化众多,天地不齐。但是大部分事物都聚集在平均值周围,主流平平。这是对世界的基本认识。

2、安于平平,追求不平。

我们每个人必然在很多方面平平,要能坦然接受这一点。

但也有可能在少数方面不平,比如你若发现自己在某一方面幸运高配,那根据正态分布的图像,你超过了平均值,就已经超过了很多人,这种时候要多多发扬对自己有利的属性,不要暴殄天物。

三、回归分析

回归分析是一个困扰了我极久的概念。这一次拿着书研究了半天,终于发现,简单来说,回归就是分析一个事物出现,是由哪些因素怎么带来的。影响因素叫做自变项,结果叫作因变项。

回归分析就是研究自变项和因变项之间的关系。回归分析后,我们会得出这二者之间的回归系数,就是根据一个变项的值去求另一个变项的值时要乘的那个数。

比如假设我们要研究某一学科的成绩(单位为分)跟他每周在这一学科上花的时间(单位为小时)之间的关系,那花的时间就是自变项,学科成绩就是因变项。

对它们进行回归分析后,假设我们得到的回归系数是4,意思就是,每周多花一个小时在这一学科上,这个学科就能提高4分。

但是,并非所有的回归系数都是可靠的。要表示这个回归系数可不可靠,常用的术语是“显著”。

显著意味着自变项影响因变项的可能性大,我们有可能根据自变项的变化,去推测因变项的变化。

再回到上面的例子,假如说经过对回归系数的显著度检验之后,这个4被认为显著度很高,那就意味着各科老师要督促学生每周多花点时间在自己的学科上。如果被认为显著度不高,那就有可能关系不大,我们需要找别的影响成绩的原因

整体说来,这不算一本特别合理的科普书。总是默认读者知道一些专有名词,徒增阅读难度。

文科统计学与理科统计学的区别(戏说统计文科生的统计学精华)(3)

居然还用了几十页来说怎么学英语。

但是如果哪位同志最近有做量化研究的需求或想法,或是正在学习统计和量化,或是憋在家里时间很多,想感受一下概率视角下的世界,这本书是个不错的辅助~

,