饼图是一种使用非常广泛的统计图,也是丑图的重灾区。经常看画的饼图,有下面这种效果。

excel怎么利用数据做饼图(一分钟教你学会做靓丽)(1)

饼图跟柱状图一样,都是针对离散型数据的统计图。柱状图多用于展示频数,饼图多用于展示频率(也就是比例)。老规矩,先展示一个规规矩矩的饼图。数据来自炉石传说盒子(lushi.163.com)。饼图展示的是,最近一周9个职业使用热度(就是某一职业使用次数占总次数的比例)。法师这个职业使用次数最多,永远是暴雪的亲儿子。最受嫌弃的职业是战士,占比只有不到5%。

excel怎么利用数据做饼图(一分钟教你学会做靓丽)(2)

图示 最近一周炉石各职业使用热度分布

下面先看三组丑图,最后再做总结。咱们重点从饼的块数和标签的标注来进行点评,配色。

第一组:一拍两散,貌合神离

当一个离散变量只有两个取值的时候,无论在报告里,还是在屁屁踢里,我都不建议画饼图,因为很容易画成下面的丑样。

excel怎么利用数据做饼图(一分钟教你学会做靓丽)(3)

图示 当变量只有两个取值时候的各种饼图

这些饼图之所以不好看,主要是因为这里只有两个比例,信息量太少。那怎么办?如果是在报告里,建议直接写一句话。比如右上角的饼图,可以写成“样本数据中,成功的比例为51.6%”。如果非要画图做屁屁踢展示,除非你能画成这样(对你没看错,是魔兽世界里的部落和联盟),不然就别画!

excel怎么利用数据做饼图(一分钟教你学会做靓丽)(4)

这里额外强调一点,简单的统计图,非常不推荐立体的(纯属个人偏好,主要是因为立体几何学的太差)。所以我很少选择画立体的饼图。

第二组:群雄割据,丑绝人寰

与第一组饼图形成鲜明对比的,是变量取值特别多的一类饼图。除非这几个类别分布比较均匀(如左上角的饼图,是的这次你也没看错,是魔兽玩家星座分布),否则效果就是剩下的几个饼图。

excel怎么利用数据做饼图(一分钟教你学会做靓丽)(5)

图示 当变量取值较多时候的各种饼图

就着这几块饼,我讲这么几件事情。

第一、饼的块数过多的时候,有两种改进办法:

比例不到5%的,我都建议归成一类,叫做其他。可以在饼的下方写个注释或者在行文中提及,“其他”都包括什么。

画条形图。这里说一句,条形图是柱状图的兄弟,是把柱状图顺时针旋转90度。由于咱们平时写报告的纸张,纵向较长,所以条形图比柱状图更适合展示类别数较多的离散型变量。

第二、饼的标签单独打在旁边的时候,读者对应起来很费劲,比如右下角的饼图。小编还发现,这个饼分了9块,右侧的标签只有8个。另外一个34.53%的饼对应的标签呢?夜里画的饼图,太饿了当宵夜吃了么?

第三、饼的标签,一般只标注百分比,很少标注频数或者两者都标注。左下角的饼图,就同时标注了频数和百分比,异常混乱。

针对右下角的饼图,手动输入了一下数据,给出了一个改良后的版本。

图示 2014年北京市医疗卫生机构分布饼图

注:“其他”包括二级医院(1.25%)、一级医院(3.86%)、三级医院(0.86%)、专业公共卫生机构(1.18%)和其他机构(1.13%)

第三组:不多不少,丑的正好

你可能要说,前两组饼图丑,怪我喽,谁让那个离散型变量取值要么太少,要么太多呢!有本事给我一个类别不多不少的变量,画出来的饼图一定美美哒!我只能说,少年,你还是图样图森破,请看下面这组充满想象力的饼图。

excel怎么利用数据做饼图(一分钟教你学会做靓丽)(6)

图示 充满想象力的难看饼图

我亲爱的同学们,画完饼图,请你们看一看再交作业,不要把珍贵的“第一次”献给我!

左上的饼图,你是秤砣转世么,厚重感满满。比例不标注,标签也很难对应上。右上的饼图,小数位数保留2位即可,又不是比赛背诵圆周率,不用标注那么多。左下的饼图,标签是“1,2,3,4,5”,跟比例完美的融合在一起不分彼此,颁给你们一个不离不弃奖。

我知道有很多小伙伴不服气了,数据就长成这样啊,画出来的饼图就是这么丑。为了回答这个问题,我引用一句R help里面的Note:Pie charts are a very bad way of displaying information. The eye is good at judging linear measures and bad at judging relative areas. A bar chart or dot chart is a preferable way of displaying this type of data. 翻译过来的意思就是:没事儿别画饼图!

你说那不行,你放弃治疗了,我可不能跟着你一块。为了显示小编的诚意,这里隆重推出一款整容神器:复合饼图!中心思想是把占比特别小的区块用另外一个饼图放大出来。右上角的饼图整容之后就长成下面的样子(没错这是用excel画的,也是小编excel画图的巅峰之作了)。

excel怎么利用数据做饼图(一分钟教你学会做靓丽)(7)

图示 借款记录的交易状态分布复合饼图

最后,我们做一点总结。

第一、饼的块数。这是我上课常问学生的问题,一块饼到底多少个人吃才合适。块数少了,每个人都容易吃撑;块数多了,大家都吃不饱。结论又是那句不多不少的废话。

第二、饼的标签。一个规规矩矩的做法,是在饼的旁边对应着标注类别 比例。还有一种常见的做法是只在饼上标注比例,在旁边额外标注相应的类别。然而第二种做法读者不是那么容易对应上,所以我还是推荐第一种标注方法。

第三、饼的配色。精挑细选的难看配色比比皆是,我就不再吐槽了。R里面有四个常用的配色:heat.colors,terrain.colors,cm.colors以及rainbow。大家可以尝试一下,然后量力而行。注意量力而行,用力过猛的后果很严重!注意面积大的区块用浅色,面积小的区块用深色。

,