企业的客户关系管理数据库里存有大量会员数据,对会员进行分析,就必须要抽取样本,而会员因为消费、年龄等不同,又会有不同的分类,如果要想获取准确的分析结果,不能采取单一的随机抽样方法获取样本,而必须采用分层的方法,对会员分层,然后再抽取样本。在实施最优分配方案时,可能会遇到意想不到的麻烦,我们知道每层的会员样本量n与每层的会员数,每层的方差成正比,而与抽取每层会员单位成本的二次方根成反比。假如某些层的标准差S特别大,而每层的会员数N相对于总样本量n又小得多,同时这些层的平均单位抽样费用C较低,那么此时按照最优分配n计算得出的层的样本可能会超过每层的会员数,这时对这些层至少要实施100%的抽样,即对这些层进行普查,然后再将剩下的样本量按最优分配方式在其余各层进行分配。

假设某公司会员总体按消费额度分为四层,Nh和Sh的值列于下表中,假如样本量n=100,应如何进行内曼最优分配?

实现指数级客户增长的案例(企业会员分层数据分析的大于100)(1)

解:第一步:根据上表中的数据计算内曼最优分配下各层的样本量n1=100*(3000/36000)=8,而N1=6,可见n1>N1,因此令n1=N1=6。

第二步:将n-n1=94个待分配的样本量再按照内曼最优分配的原则分配到第2层到第4层,则n2=94*(12000/33000)=34.而N2=20,可见n2>N2,因此,再令n1=N1=6,n2=N2=20。

第三步:将n-n1-n2=74个待分配的样本量再按照内曼最优分配的原则分配到第3层和第4层,则n3=74*(6000/21000)=21.而N3=300,可见n3<N3,且n4=74*(15000/21000)=53。而N4=500,也满足n4<N4。

第四步:确定各层最终所分配的样本量。n1=6,n2=20,n3=21,n4=53。

(作者系国际数控管理专家李颖)

实现指数级客户增长的案例(企业会员分层数据分析的大于100)(2)

实现指数级客户增长的案例(企业会员分层数据分析的大于100)(3)

,