各位伙伴,大家好,我是归一!

本节内容我将为大家介绍一个用于观察顺序的图形——箱形图(又叫箱线图)。#制作表格#

excel箱线图绘制(数据大佬手把手教你如何提升办公效率)(1)

箱形图的适用场景

箱形图适用于展示顺序数据,通过它我们可以观察出顺序数据的集中趋势和离散程度。

箱形图是由5个统计量组合而成的图形,它们分别是:“最大值”、“最小值”、中位数、上四分位数和下四分位数。下面,我们用箱形图来展示如下各学生的学生成绩数据:

excel箱线图绘制(数据大佬手把手教你如何提升办公效率)(2)

箱形图如下图所示:

excel箱线图绘制(数据大佬手把手教你如何提升办公效率)(3)

可以看出该箱形图中一共显示了6个数据,5条线段。下面,我们依次来解释它们所代表的含义。

“最大值和最小值”:在Excel当中,箱形图中的最大值其实是指去除异常值后的最大值和最小值,然后将它们作为整体图形的上下两条边界线。

还有一种箱形图则是将图形的上下两条边界线用区分异常值的边界线来表示。此时,上下边界线又称之为异常值截断点,该点的计算方式如下:

上异常值截断点 = 上四分位数 1.5*IQR(IQR即四分位差)

下异常值截断点 = 下四分位数-1.5*IQR(IQR即四分位差)

因此,在异常值截断点之外的点就是异常值,如图中点30。

excel箱线图绘制(数据大佬手把手教你如何提升办公效率)(4)

中位数:代表数据集中趋势位置的数,它表示这组数据大部分是集中在哪个数的附近,在这组数据中即表示了大多数的学生成绩是在75.5分左右。

四分位差(IQR):IQR = Q3(上四分位数)-Q1(下四分位数)。

四分位差表示了一组数据中间50%的数据的离散程度,通过它我们可以来衡量中位数的代表性。如果IQR较大,则说明中间50%的数据相对分散,中位数的代表性则不好;如果IQR较小,则说明中间50%的数据相对集中,中位数的代表性则较好。

此外,我们还可以通过图形的整体长度,即极差来观察数据的整体分散程度。

那么,如何来绘制箱形图呢?

Excel 绘制箱形图

下面,我们一起来看下如何在Excel当中绘制箱形图:

excel箱线图绘制(数据大佬手把手教你如何提升办公效率)(5)

Excel箱形图默认还将这组数据的平均数标记出来了,因此,还可以通过平均数和中位数的相对位置判断数据分布的状况。若平均数在中位数上方则表示数据右偏;若平均数在中位数下方,则表示数据左偏。

在该组数据中,由于小钱同学的成绩只有30,是这组数据的一个异常值,导致数据左偏,也就是“ 将平均成绩拉低了!”

想要获取数据了解其中每个操作的作用的伙伴,可以关注账号后发送关键字:箱线图。打开Excel自己尝试一下吧~

,