内审干货——抽样法中,应抽取多少样本量?干货湿讲!
ID:内审师修行与实战(shenjizhishi)
抽样法中,最难的部分是:确定样本量!
样本少了没有代表性,样本多了费时费力。
一、全靠经验,说服力不强
作为内审人员,大多情况下,我们都是通过经验判断来抽取样本,总量少的情况下就全部审计,总量多的话就根据审计时间和效率来确定样本量。
很少会用到精准的数理公式来推导应提取的样本量!
由审计师们来主观判断样本量,我们不能说错,但是却不科学,其结果的“理想性”太过依靠审计师的个人能力。
一旦有人质疑:“你的样本量合理吗?科学吗?有代表性吗?”,我们就难以应付。
今天,就分享一个科学抽取样本量的方法,因为过于抽象,略微枯燥,我尽量讲得通俗易懂,但深度可能不够,聊胜于无!
二、简述
当你抽样对象的总量很大时,样本量和总数就没有什么关系了,直接套用公式就行;
当你抽样对象的总量较小时,样本量就和总数就有关系了,总数越小,样本也越少,但样本对总数的占比就多;总数越大时,样本也越多,但样本占比就越小。
无论总数是多少,样本量的计算方法在本质上用的都是一个公式,先算出总数很大的样本量;
再根据已经计算出的总数大的样本量和总数,修订一下样本量数量就得出新的样本量了。
三、为便于理解,举例来说
西虹市的新首富,朴布成先生,坐拥千亿资产,准备举办一次美女拳击比赛。
为冠亚军们准备的金牌、银牌,有烧饼一样大小,谁得了冠军就可以直接坐拥千万资产,所以,各路女中豪杰闻讯而来。
原则上,是女人就可以参赛,但朴先生得到消息“有不少人妖来参加比赛,比赛会有失公平”。
于是朴先生就委托其高薪聘请的“美女审计官”来评估“人妖”的情况。
报名参赛人很多,时间又紧张,不可能将报名的选手都一一脱光了去检查,就只能用抽样法。
四、上干货,样本量计算公式
豪华会议室,朴布成先生与美女审计官在研究应该抽取多少样本量,宽大的投屏上出现一个计算公式。
1.参数n代表要计算的样本量;
2.参数Z表示置信水平下的Z统计量;
3.参数S代表总体的标准差;
4.参数d代表抽样调查时,你所允许产生的误差。
朴先生一看这公式,就有点蒙圈,虽然他是美国麻绳理工大学毕业生,但上学时只学了如何系麻绳,没学会看公式。
需要美女审计官给他一一讲解。
五、细讲参数:允许的误差d=3%
高冷的美女审计官,讲解毫不委婉,直接用朴先生最容易理解的话来讲:“n代表着样本量,也就是我们需要抽取的女人,这些人需要剥光衣服,来查看她们是不是人妖。”
“这个好!我可以当检验师!”朴先生食指大动。
“不行,检验师必须女人来做,不然会影响您的形象!”冷艳审计官的话并没有打消朴先生的玩耍之心。
只见他说道:“那d是啥玩意?是不是男人的小dd?上面一些东西压着,会不会压坏?”
“流氓!当然不是!”美女审计官白了他一眼,薄怒微现。
“嘿嘿!”
美女审计官正色道:“d代表误差率,包括抽样误差和非抽样误差,抽样误差代表抽样本身就有误差,比如:我们抽取100个女人来验明正身,但这100个人并不能完全代表所有来参赛的女人!可能存在一定误差。”
“非抽样误差呢?”
“非抽样误差是调查过程中产生的其他错误,比如:检验师喜欢上人妖,故意不抽他或让他通过了!或者有些人妖就算剥光了也分辨不出男女!”
“哦,明白了!”朴布成先生看了看美女审计员的下身,略带深意地说!
“臭流氓!”美女的娇斥让朴先生很受用,她紧接着说:“我准备用3%的误差率作参数计算样本量。”
“允许的误差率为啥用3%?而不是50%?我对雯雯你的工作要求一向没那么严格?”朴老板翘起了二郞腿倚在沙发上,斜眼眯着面前凸凹有致的女人。
“一般的调查研究,抽样误差控制在3%-7%之间,但我的要求比较严格,必须用3%”,美女没理会他的好意,反而略有生气。
“嘿嘿,你决定就好!我知道雯雯你很专业,对自己要求又严格,要不然怎么能做我的高级审计官?”
其实朴老板想的是“专业不专业没关系,关键是颜值。”
六、细讲参数:方差S=0.2412
“说说分子上面的两个参数都是什么玩意?”见美女想发火,朴老板立刻停下了意淫。
“我们先说S吧,然后再说Z,因为Z不好理解,放到最后说!”美女用手点着大屏继续讲。
“S是不是代表着一群傻子或傻X?”朴先生打岔的本事不一般。
“都不是!S就是标准差,代表离散程度,也可以说是变异程度!这个数越大,证明结果的一致性越差!”美女瞪了一眼说道。
“变异?难道还有变种人?有没有像变形蜥蜴女那样的,变成什么女人都成?”朴先生的胡扯并没有打断美女审计官的讲解。
“标准差就是,个体和平均值差异大小的一个统计参数,是你上大学时都学过的!”朴先生虽然扯,但也是正经的名校毕业,自然明白这代表什么?
“这个S的参数该怎么计算?”朴先生一问,让美女审计官也犯了愁,如果是评估女人们的身高,还有均值和方差,这次审计目标是查人妖,这值该怎么取呢?
冷艳美女皱了皱自己的柳叶眉,说道:“正常情况下,我们根据历史经验来确定这一参数,如果没有历史数据,我们只有再抽样确定或者估测一个数”
“嗯,那就按10%的人妖,90%的正常女人来取方差数吧!”朴先生虽然好色,但看到美女犯愁就英雄感爆棚,帮她做了决定。
“嗯....”美女审计官沉吟思考了一会儿,仍旧犯愁,拳击比赛中,10%的人妖比例是不是太高了?但因为没有经验和历史数据,只好听老板的。
美女在电脑上打开一个表格,用90%的女人和10%的人妖值,算出方差和标准差:“好吧,这样算的话,标准差是0.2412”
“好,这不就成啦!接着来,不过先让我看看你有没有变异?”朴先生见美女还是在严肃思考,就伸手摸向美女细腰下的高翘之处,想调节下气氛。
七、细讲参数:Z=1.96
美女审计官反应过来后,快速躲开大手揉捏,严肃地用手指点着大屏上的字母:“Z代表随机变量经过列维-林德伯格中心极限定理的变形后,服从标准正态分布Φ(0,1),而Z为该标准正态分布下的新变量。”
“不懂!”朴老板收回手后,不过这次他是真的不懂。
“知道正态分布不?”
“知道一点儿,好像是一种概率分布,是世界上最常见的分布状态!”朴先生终于说了一句有专业素养的话。
“Z值就是通过查询《正态分布表》,查出来的值!”
“那它到底是一个什么东西?”朴老板也终于问了一个有深度的问题,这问题让美女审计官也犯难,毕竟没有认真学过概率统计的人,理解起来很费劲。
“说太深了你也不懂,也不需要太懂,你只需要知道它是通过置信区间和正态分布表查出来的数值就好了!”
“还是不懂!”
“嗯...它只是在正态分布中的一个临界值,是标准化的结果,本身没有意义,有意义的在于在标准正态分布模型中它代表的概率值,通过查表便可以知道。”
“那就是没用的玩意儿呗?是不是有些数学家闲得蛋疼弄出来的东西?回头我也弄一个没意义的T值,累死那帮数学家的孙子们,话说回来,T字还有其他用途,比如:炒股可以做T,男女之事可以用TT,一会儿我们可以研究研究TT的用法?”
“概率统计上确实有一个T分布!”美女审计官缺少幽默感的一句话噎得朴老板干瞪眼。
“好吧?那要怎么查Z值?”
“首先得明白‘置信度’的概念,也就是置信水平的一个值!”美女看到朴先生无趣的模样,嘴角扬起,朴老板怔怔地盯着她漂亮的眼睛。
“就是你对抽样结果是否有把握,如果你的置信区间是95%,那就证明你有95%的把握,来保证你的抽样结果是正确的!”
“哦,那就按95%的把握来测吧,反正也不会100%!”
“查询《正态分布表》,置信水平为95%所对应的概率值是2.5%(正态分布图内的左右各2.5%),通过2.5%的概率值就能查到Z值,Z值为1.96”。
“几个参数我都明白了,是不是可以直奔主题,进入高潮了?”朴老板盯着美女,对这些枯燥的数据有点儿不耐烦。
八、总数很大的情况下,计算样本量:n=248
“当然!”美女审计官像是没理解他的言外之意一样,继续讲道:“有了抽样误差、有了方差和Z值,就可以通过公式,得出抽取的样本量是多少?结果应该是248人”
“那不是正好是二百五吗?”朴老板嘴角邪笑。
“你就二百五!”美女审计官又白了他一眼,嗔道。
“咱们是老同学了,你还不知道我的长处?二百五....厘米”朴老板的男人本色外露。
“滚!说正事!”
九、总数量较小的情况下,计算样本量
美女走近朴老板,有点儿担心地问“你说这次有多少会报名参加拳击比赛?”
虽然朴老板豪的奖励很丰厚,但是毕竟专业女拳击手较少,业余的未必会来。
“放心吧,哪有人不好财的?再说,只要报了名都有奖金,报名的人肯定不会少!”朴老板为举办比赛,真是花了大价钱了。
“如果来的人数少的话,我们抽取的样本量也可以相应减少!”美女继续说道“还有一个公式,是总数量较小情况下的样本量,引入总数参数N”
美女审计官在大屏上划出了一个新公式:
n=n1/(1 n1/N)
参数n表示:总数较小时需要计算的新的样本量,也就是修正后的样本量;
参数n1表示:总数很大时计算的样本量,也就是n1=248;
参数N表示:总数,也就是准备报名参赛的所有美女。
计算:n=248/(1 248/1000)=198(人)
“意思就是,如果报名1000人,在95%的可信度下,允许3%的抽样误差下,我们可以抽取198位美女,来验明正身!”
“好好好!”朴老板站起来,走到美女身边,想伸手抱住她,却被她打开手掌,他不介意地笑了笑“无论来多少女人,都比不上我的雯雯漂亮!”
“不要叫我小名,我只是给你打工,不是卖身给你!”美女怒道。
“还在生我气啊?留学回来后,分手也不能全怨我,当年我父亲去世破产,负债数千万,我当时还没有继承二大爷的遗产,哪能让你跟我一起爱苦!”朴老板变和温柔。
“滚,你这话跟多少女人讲过?”美女退后几步,怒气冲冲地盯着他。
“从没有对任何女人说过!只有对你,你知道我为什么举办女子拳击比赛?”朴老板轻轻走上前,盯着美女的眼睛说道。
“还不是满足你变态的恶趣味!恶心!”
“错了!我是准备给雯雯你配几个女保镖!你看我坐拥数千亿资产,身边全是男保镖,但是如果主母身边也是男保镖,我可不放心!”男子终于抱住的女人,却没有感觉到反抗。
十、几个小点儿
男女主角结束了样本量的研究,灯灭人走。
但有几个相关性,还是要简单交待下,便于我们直观理解。
1.样本量和置信水平正相关:想对结论的准确性更有把握,就需要提升样本量。
2.样本量和方差正相关:抽样对象的差异越大,证明越不稳定,想要更准确,只能多抽样本。
3.样本量和误差率反相关:抽样过程中,你允许出现的误差多,那样本自然就可以少了。
不管怎么说,抽取的样本量越多,就越能代表整体。
哎!这种文章有点儿烧脑子!
请君多多点赞关注!
#职场##职场达人炼成记##内审##抽样##内部审计并不是摆设#
,