01 为什么数据图很重要?
数据图是一篇论文的门面,这是因为很多人习惯从扫读论文的主要图片开始。制作精美的数据图从一开始就能抓住读者以及审稿人的“心”。虽然一篇论文的核心是其表述的思想以及观点,而且有很多论文甚至都没有数据图,但我们不能否认精美的数据图能极大的提升论文的接受率。
02 主要的数据图有哪些种类?
直/曲线图。这是我们最常见的一种图,属于二维图形,实例如下。一般横、竖坐标分别表示一个参数,这样可以表示两个参数之前的关系。同时这个图形可以允许多个竖坐标存在,这样表示多个参数与横坐标参数之间的关系。
散点图。散点图除了表示横、竖坐标之间参数的关系以外,还能从散点的大小来表示额外的参数。所以下面的散点图其实表示的是一个三维数据。
柱状图。如下图所示,柱状图可以表示各个参数下另外一个参数的大小。一般来讲跟曲线表现形式类似,但对于曲线更加直观。
箱型图。箱型图也是一种通用的图形,一般常见于重复性实验组的数据处理。箱型图一般包括一个箱体(长方形),以及箱体上向上、向下的延长线,另外有些箱体内部还有一条横线(通指代常位中位数)。所以一个箱型图可以表示五个数据,从高到低分别表示最大值(延长线上边缘)、上四分位数(箱体上边缘)、中位数(箱体内部横线)、下四分位数(箱体下边缘)、以及最小值(延长线下边缘)。具体如下图所示。
饼图。饼图通常表示各个部分占总体的百分比,可以很直观的表示部分在整体中所占的比重。饼图也可以做的很复杂,比如可以用不同的半径表示另外一组参数,如下图所示。
极坐标图。极坐标图可以下分很多种图形。下图可以看成是周一到周日每天A、B、C任务所用时间的展示图,如果长条形(离零度位置的垂直线)越长,表示所用时间越长。
地理坐标图。下图表示全国主要城市空气质量图,每个点的位置表示城市所在的位置,而点的颜色深浅表示空气质量的高低。
热力图。热力图表示某个参数在空间上分布的规律,颜色越深一般代表该处参数的数值越高,从而表明此处为热点。比如地图上显示交通拥堵情况的图也是一种热力图。
K线图。这个图形与箱体图类似。其中的每个图形可以表示四个数据,包括箱体以及延长线两端。K线图为大众所熟悉是因为这是股市以及期货的常见图形,其中箱体上下侧为当日开收盘价格、延长线高地处分别表示当日最高以及最低值。在国内,红色箱体表示当日收盘价高于开盘价,箱体上下两端分别表示收盘和开盘价。
3D图。其中有多种图形,比如3D曲面图、3D散点图、其他3D形状图等等。3D图与二维图不一样的是,其可以增加一个参数,可以很直观的表示三个参数之间的关系。比如下面图中表示了X、Y以及Z轴(垂直轴)三个参数之间的关系,其中Z轴除了用图形的高低表示数值大小以外,还用了一个颜色表示其坡度大小(导数或者是梯度),这样整个图更加生动。
主题河流图。这个图形和曲线图类似,可以看成曲线堆积面积的一种变形,主要表示不同类别的数据随时间的变化情况。比如下面的图就表示六个参数随时间的变化情况。
03 主要画图软件有哪些?
Excel. 这是微软Microsoft Excel软件自带的功能。所以Excel除了能很方便的列出数据以外,还能画出建议图形来表示各个参数之间的关系。其优点可以很简单利用其自带功能来进行统计分析,比如曲线拟合、方差计算等等。但其缺点也比较明显,其画图一般比较简单,而且画的图以二维为主,比如曲/直线图、柱状图、饼图等等。
Origin. 这个应该是科研人员使用最广泛的一款软件,一般可以满足所有主要的二维以及三维图形,而且其可以个性化定制自己的习惯,从而缩短同类型图的时间。其操作界面简单易懂,对于初学者很容易入手。另外其中也自带直线、曲线拟合功能,可以很容易得到相关的统计分析数据。
Python.Python自带的画图功能一般比“鸡肋”,因为需要通过编程来实现各种功能,需要对Python语言有比较充分地了解。但Python有很多公司或者网友制作的模块(或者可以说成插件,比如pyecharts、Seaborn),可以简单实现各种“炫酷”以及“无所不能”的定制图形,如下图所示。另外其还可以使用一个其他软件很少的功能,也就是动态图。但其缺点也很明显,其人机界面主要通过编程完成,这样用户体验就不如Origin那么方便了。
MATLAB. Matlab应该是使用编程语言画图中比较简单的一种,因为其中的画图模块基本上几行代码就可以搞定,而且其定制化可以通过界面来实现,总体来说过程比较简单。其基本上可以实现各种二维、三维图形的制作。另外其有一个非常“强悍”的功能,其可以对图像批量进行处理。比如说我有大量的Excel数据,而且其中需要根据其中不同的类型画不同的图形,这样我们可以利用Matlab编程实现一条龙的服务,比如读取Excel数据、判断数据类型、画出图片、图片个性化定制、输出图片。所以一个程序可以自动实现成千上万张图片的自动处理。而且更重要的是,整个编程简单、不会需要专门的技能。
Tecplot. 这是一款强大的数据分析和可视化处理软件,但一般不会用于简单的二维曲线图的制作。其主要处理大批量的数据,比如说其可以和FLUENT数值模拟软件接口,从而可以简单的实行大规模数值模拟输出数据的处理以及模拟动画的制作。
04 画图的Checklist
以上简单介绍了一些主要的图形以及相应作图软件的类型,具体软件的选择则是见仁见智的。但一般来讲我们需要寻找一款合适自己的软件,在软件的选择上切记贪多而造成时间上的浪费。
那么,下面我来简单介绍一下论文画图的checklist:
- 画图时尽量将图中的文字调大,论文中有很多图片的文字太小,从而造成阅读困难;
- 尽量在图片的标题中解释一下图片的含义。如果有特别图例的需要具体解释一下,比如箱体图、K线图等等;
- 画图时尽量将一个图片中包含更多的信息。比如说一个简单的直线图就相对科研论文来讲就有些简单和单薄,可以将直线图和其他图(比如柱状图、饼图)进行合并从而增加整体厚重感;
- 对于一个图片中包含不同曲线的情况,尽量不要用各种线型的线条来区分,最好用不同的散点图 线图来区别,这样图片在黑白打印时也可以容易识别。