spss箱线图怎么分析结论(SPSS统计分析案例箱图)(1)

箱图在SPSS统计图形中算是很有特色的一个了,用分位数可视化的形式展示了变量的分布信息,往往能达到开门见山的读图效果。

spss箱线图怎么分析结论(SPSS统计分析案例箱图)(2)

↑有 700 位已经在银行取得贷款的客户,记录了他们的主要信息,包括年龄、受教育程度、受雇年限、固定居所居住年限、收入、信用卡债务、是否违约等。现在我们希望了解一下这些贷款客户的信用卡债务情况。

spss箱线图怎么分析结论(SPSS统计分析案例箱图)(3)

↑打开SPSS图表构建器窗口↓

spss箱线图怎么分析结论(SPSS统计分析案例箱图)(4)

↑下半部分用于选择图表类型。SPSS箱图主要分为三种,其一是简单箱图(可分组),其二是集群箱图(多系列)、其三是单一变量箱图。我们先选择制作一个单一变量的箱图。

spss箱线图怎么分析结论(SPSS统计分析案例箱图)(5)

↑将截图中所示的1-D箱图(单一变量箱图)用鼠标拖入商方面的绘图面板中,然后选择信用卡债务变量并移入右侧的画板X轴位置,参数设置完毕,最后点击底部确定按钮即可。

spss箱线图怎么分析结论(SPSS统计分析案例箱图)(6)

↑这就是单一变量的箱图了,只需要设置一个轴即可获得。

怎么解读呢?箱图从下往上给出变量最主要的5个值,第一条横线是最小值,再往上则是一个方框,方框的底线是25%分位数、顶线是75%分位数,也就是说整个方框包含了变量50%的信息,方框内还有一条粗黑线,不是平均值,它是中位数,继续往上走的一条黑线是最大值。

除最小值、1/4分位数、中位数、3/4分位数、最大值这5个基本信息之外,在上下两端还标出了异常值。

标出异常值才是箱图之所以闻名的主要原因。

异常值包括两种,其一是离群值,用圆圈“o”表示,其二是极值,用“*”表示,旁边附个案的行号,用于在原始数据中快速找到该异常值,便于深入辨识。

spss箱线图怎么分析结论(SPSS统计分析案例箱图)(7)

↑如果我们希望了解违约与未违约客户之间信用卡债务有何不同,则可绘制可分组的箱图。

spss箱线图怎么分析结论(SPSS统计分析案例箱图)(8)

哦哦~,效果怎么样。

有拖欠的客户信用卡债务要比没违约的客户差不少,债务总体偏高是一方面,最令人担心的是有部分客户的信用卡债务严重,极值偏高需重点关注。

本案例数据下载↓

(全文完)

左下角「阅读原文」埋了一枚文彤老师和小蚊子老师的云课堂教程,感兴趣的可以参与一下。

spss箱线图怎么分析结论(SPSS统计分析案例箱图)(9)

spss箱线图怎么分析结论(SPSS统计分析案例箱图)(10)

「SPSS统计训练营」是一个自学平台,以详实统计案例教程为基础,配套练习使用的原始数据,方便读者自己实践,致力于让数据科学学习简单有趣高效。发起人数据小兵,资深数据分析师,SPSS套件爱好者,愿与科研工作者、行业数据分析者学习交流,欢迎订阅。

觉得不错,就分享转发吧

,