内审干货——抽样法中,应抽取多少样本量?干货湿讲!

ID:内审师修行与实战(shenjizhishi)

抽样法中,最难的部分是:确定样本量!

样本少了没有代表性,样本多了费时费力。

一、全靠经验,说服力不强

作为内审人员,大多情况下,我们都是通过经验判断来抽取样本,总量少的情况下就全部审计,总量多的话就根据审计时间和效率来确定样本量。

很少会用到精准的数理公式来推导应提取的样本量!

由审计师们来主观判断样本量,我们不能说错,但是却不科学,其结果的“理想性”太过依靠审计师的个人能力。

一旦有人质疑:“你的样本量合理吗?科学吗?有代表性吗?”,我们就难以应付。

今天,就分享一个科学抽取样本量的方法,因为过于抽象,略微枯燥,我尽量讲得通俗易懂,但深度可能不够,聊胜于无!

抽样方法及样本量(内审干货抽样法中)(1)

二、简述

当你抽样对象的总量很大时,样本量和总数就没有什么关系了,直接套用公式就行;

当你抽样对象的总量较小时,样本量就和总数就有关系了,总数越小,样本也越少,但样本对总数的占比就多;总数越大时,样本也越多,但样本占比就越小。

无论总数是多少,样本量的计算方法在本质上用的都是一个公式,先算出总数很大的样本量;

再根据已经计算出的总数大的样本量和总数,修订一下样本量数量就得出新的样本量了。

三、为便于理解,举例来说

西虹市的新首富,朴布成先生,坐拥千亿资产,准备举办一次美女拳击比赛。

为冠亚军们准备的金牌、银牌,有烧饼一样大小,谁得了冠军就可以直接坐拥千万资产,所以,各路女中豪杰闻讯而来。

原则上,是女人就可以参赛,但朴先生得到消息“有不少人妖来参加比赛,比赛会有失公平”。

于是朴先生就委托其高薪聘请的“美女审计官”来评估“人妖”的情况。

报名参赛人很多,时间又紧张,不可能将报名的选手都一一脱光了去检查,就只能用抽样法。

抽样方法及样本量(内审干货抽样法中)(2)

四、上干货,样本量计算公式

豪华会议室,朴布成先生与美女审计官在研究应该抽取多少样本量,宽大的投屏上出现一个计算公式。

抽样方法及样本量(内审干货抽样法中)(3)

1.参数n代表要计算的样本量;

2.参数Z表示置信水平下的Z统计量;

3.参数S代表总体的标准差;

4.参数d代表抽样调查时,你所允许产生的误差。

朴先生一看这公式,就有点蒙圈,虽然他是美国麻绳理工大学毕业生,但上学时只学了如何系麻绳,没学会看公式。

需要美女审计官给他一一讲解。

五、细讲参数:允许的误差d=3%

高冷的美女审计官,讲解毫不委婉,直接用朴先生最容易理解的话来讲:“n代表着样本量,也就是我们需要抽取的女人,这些人需要剥光衣服,来查看她们是不是人妖。”

“这个好!我可以当检验师!”朴先生食指大动。

“不行,检验师必须女人来做,不然会影响您的形象!”冷艳审计官的话并没有打消朴先生的玩耍之心。

只见他说道:“那d是啥玩意?是不是男人的小dd?上面一些东西压着,会不会压坏?”

“流氓!当然不是!”美女审计官白了他一眼,薄怒微现。

“嘿嘿!”

美女审计官正色道:“d代表误差率,包括抽样误差和非抽样误差,抽样误差代表抽样本身就有误差,比如:我们抽取100个女人来验明正身,但这100个人并不能完全代表所有来参赛的女人!可能存在一定误差。”

“非抽样误差呢?”

“非抽样误差是调查过程中产生的其他错误,比如:检验师喜欢上人妖,故意不抽他或让他通过了!或者有些人妖就算剥光了也分辨不出男女!”

“哦,明白了!”朴布成先生看了看美女审计员的下身,略带深意地说!

“臭流氓!”美女的娇斥让朴先生很受用,她紧接着说:“我准备用3%的误差率作参数计算样本量。”

“允许的误差率为啥用3%?而不是50%?我对雯雯你的工作要求一向没那么严格?”朴老板翘起了二郞腿倚在沙发上,斜眼眯着面前凸凹有致的女人。

“一般的调查研究,抽样误差控制在3%-7%之间,但我的要求比较严格,必须用3%”,美女没理会他的好意,反而略有生气。

“嘿嘿,你决定就好!我知道雯雯你很专业,对自己要求又严格,要不然怎么能做我的高级审计官?”

其实朴老板想的是“专业不专业没关系,关键是颜值。”

抽样方法及样本量(内审干货抽样法中)(4)

六、细讲参数:方差S=0.2412

“说说分子上面的两个参数都是什么玩意?”见美女想发火,朴老板立刻停下了意淫。

“我们先说S吧,然后再说Z,因为Z不好理解,放到最后说!”美女用手点着大屏继续讲。

“S是不是代表着一群傻子或傻X?”朴先生打岔的本事不一般。

“都不是!S就是标准差,代表离散程度,也可以说是变异程度!这个数越大,证明结果的一致性越差!”美女瞪了一眼说道。

“变异?难道还有变种人?有没有像变形蜥蜴女那样的,变成什么女人都成?”朴先生的胡扯并没有打断美女审计官的讲解。

“标准差就是,个体和平均值差异大小的一个统计参数,是你上大学时都学过的!”朴先生虽然扯,但也是正经的名校毕业,自然明白这代表什么?

“这个S的参数该怎么计算?”朴先生一问,让美女审计官也犯了愁,如果是评估女人们的身高,还有均值和方差,这次审计目标是查人妖,这值该怎么取呢?

冷艳美女皱了皱自己的柳叶眉,说道:“正常情况下,我们根据历史经验来确定这一参数,如果没有历史数据,我们只有再抽样确定或者估测一个数”

“嗯,那就按10%的人妖,90%的正常女人来取方差数吧!”朴先生虽然好色,但看到美女犯愁就英雄感爆棚,帮她做了决定。

“嗯....”美女审计官沉吟思考了一会儿,仍旧犯愁,拳击比赛中,10%的人妖比例是不是太高了?但因为没有经验和历史数据,只好听老板的。

美女在电脑上打开一个表格,用90%的女人和10%的人妖值,算出方差和标准差:“好吧,这样算的话,标准差是0.2412”

“好,这不就成啦!接着来,不过先让我看看你有没有变异?”朴先生见美女还是在严肃思考,就伸手摸向美女细腰下的高翘之处,想调节下气氛。

抽样方法及样本量(内审干货抽样法中)(5)

七、细讲参数:Z=1.96

美女审计官反应过来后,快速躲开大手揉捏,严肃地用手指点着大屏上的字母:“Z代表随机变量经过列维-林德伯格中心极限定理的变形后,服从标准正态分布Φ(0,1),而Z为该标准正态分布下的新变量。”

“不懂!”朴老板收回手后,不过这次他是真的不懂。

“知道正态分布不?”

“知道一点儿,好像是一种概率分布,是世界上最常见的分布状态!”朴先生终于说了一句有专业素养的话。

“Z值就是通过查询《正态分布表》,查出来的值!”

“那它到底是一个什么东西?”朴老板也终于问了一个有深度的问题,这问题让美女审计官也犯难,毕竟没有认真学过概率统计的人,理解起来很费劲。

“说太深了你也不懂,也不需要太懂,你只需要知道它是通过置信区间和正态分布表查出来的数值就好了!”

“还是不懂!”

“嗯...它只是在正态分布中的一个临界值,是标准化的结果,本身没有意义,有意义的在于在标准正态分布模型中它代表的概率值,通过查表便可以知道。”

“那就是没用的玩意儿呗?是不是有些数学家闲得蛋疼弄出来的东西?回头我也弄一个没意义的T值,累死那帮数学家的孙子们,话说回来,T字还有其他用途,比如:炒股可以做T,男女之事可以用TT,一会儿我们可以研究研究TT的用法?”

“概率统计上确实有一个T分布!”美女审计官缺少幽默感的一句话噎得朴老板干瞪眼。

“好吧?那要怎么查Z值?”

“首先得明白‘置信度’的概念,也就是置信水平的一个值!”美女看到朴先生无趣的模样,嘴角扬起,朴老板怔怔地盯着她漂亮的眼睛。

“就是你对抽样结果是否有把握,如果你的置信区间是95%,那就证明你有95%的把握,来保证你的抽样结果是正确的!”

“哦,那就按95%的把握来测吧,反正也不会100%!”

“查询《正态分布表》,置信水平为95%所对应的概率值是2.5%(正态分布图内的左右各2.5%),通过2.5%的概率值就能查到Z值,Z值为1.96”。

“几个参数我都明白了,是不是可以直奔主题,进入高潮了?”朴老板盯着美女,对这些枯燥的数据有点儿不耐烦。

抽样方法及样本量(内审干货抽样法中)(6)

八、总数很大的情况下,计算样本量:n=248

抽样方法及样本量(内审干货抽样法中)(7)

“当然!”美女审计官像是没理解他的言外之意一样,继续讲道:“有了抽样误差、有了方差和Z值,就可以通过公式,得出抽取的样本量是多少?结果应该是248人”

“那不是正好是二百五吗?”朴老板嘴角邪笑。

“你就二百五!”美女审计官又白了他一眼,嗔道。

“咱们是老同学了,你还不知道我的长处?二百五....厘米”朴老板的男人本色外露。

“滚!说正事!”

九、总数量较小的情况下,计算样本量

美女走近朴老板,有点儿担心地问“你说这次有多少会报名参加拳击比赛?”

虽然朴老板豪的奖励很丰厚,但是毕竟专业女拳击手较少,业余的未必会来。

“放心吧,哪有人不好财的?再说,只要报了名都有奖金,报名的人肯定不会少!”朴老板为举办比赛,真是花了大价钱了。

“如果来的人数少的话,我们抽取的样本量也可以相应减少!”美女继续说道“还有一个公式,是总数量较小情况下的样本量,引入总数参数N”

美女审计官在大屏上划出了一个新公式:

n=n1/(1 n1/N)

参数n表示:总数较小时需要计算的新的样本量,也就是修正后的样本量;

参数n1表示:总数很大时计算的样本量,也就是n1=248;

参数N表示:总数,也就是准备报名参赛的所有美女。

计算:n=248/(1 248/1000)=198(人)

“意思就是,如果报名1000人,在95%的可信度下,允许3%的抽样误差下,我们可以抽取198位美女,来验明正身!”

“好好好!”朴老板站起来,走到美女身边,想伸手抱住她,却被她打开手掌,他不介意地笑了笑“无论来多少女人,都比不上我的雯雯漂亮!”

“不要叫我小名,我只是给你打工,不是卖身给你!”美女怒道。

“还在生我气啊?留学回来后,分手也不能全怨我,当年我父亲去世破产,负债数千万,我当时还没有继承二大爷的遗产,哪能让你跟我一起爱苦!”朴老板变和温柔。

“滚,你这话跟多少女人讲过?”美女退后几步,怒气冲冲地盯着他。

“从没有对任何女人说过!只有对你,你知道我为什么举办女子拳击比赛?”朴老板轻轻走上前,盯着美女的眼睛说道。

“还不是满足你变态的恶趣味!恶心!”

“错了!我是准备给雯雯你配几个女保镖!你看我坐拥数千亿资产,身边全是男保镖,但是如果主母身边也是男保镖,我可不放心!”男子终于抱住的女人,却没有感觉到反抗。

抽样方法及样本量(内审干货抽样法中)(8)

十、几个小点儿

男女主角结束了样本量的研究,灯灭人走。

但有几个相关性,还是要简单交待下,便于我们直观理解。

1.样本量和置信水平正相关:想对结论的准确性更有把握,就需要提升样本量。

2.样本量和方差正相关:抽样对象的差异越大,证明越不稳定,想要更准确,只能多抽样本。

3.样本量和误差率反相关:抽样过程中,你允许出现的误差多,那样本自然就可以少了。

不管怎么说,抽取的样本量越多,就越能代表整体。

哎!这种文章有点儿烧脑子!

请君多多点赞关注!

#职场##职场达人炼成记##内审##抽样##内部审计并不是摆设#

,