数据可视化(Data Visualization),就是研究如何利用图形,展现数据中隐含的信息,发掘数据中所包含的规律。也就是利用人对形状、颜色、运动的感官敏感性,有效地传递信息,帮助用户从数据中发现关系、规律和趋势。它涉及计算机图形学、图像处理、计算机视觉、计算机辅助设计等多个领域,是研究数据展现、数据处理、决策分析等一系列问题的综合技术,随着数据挖掘和大数据的兴起而进一步发展。

数据可视化非常有趣,它通过技术手段,将枯燥的数据变得生动可爱。数据可视化主要目的是借助图形化手段,更清晰有效地传达数据背后的信息。

在日常生活和工作中,数据可视化的应用越来越广泛。无论是报刊杂志等传统媒体,还是日益发达的网络媒体,都将越来越多的数据结果图形化,使人们更容易理解数据背后的信息。

我们常见的图表有饼图、折线图、条形图、柱形图、散点图、气泡图、雷达图、面积图,以及在这些图表的基础上衍生出来的图表,如帕累托图、旋风图、矩阵图、漏斗图等等。除了常见的数据可视化图形,当然数据可视化图形还包括地图、标签云、热力图、树图、网络图等等。

标签云

标签云是一种关键词的视觉化方式,用于汇总一份文档或一篇新闻报道的文字内容,其字体大小或不同颜色代表了文字的重要程度或出现的频次。

图所示的是“美国总统奥巴马第二任期的就职演讲”的标签云(由标签云网站Tagxedo生成,我们能看到很醒目的一些单词,如American、people、citizens、time、freedom等字眼,这些单词在该就职演讲中出现的频率较高。

数据看板制作(数据可视化)(1)

此外,这些单词以美国地图的方式呈现,更加刺激了阅读者的视觉,提升了阅读体验。

下图所示的趋势地图是由David Honnorat设计的。它将近一个世纪的经典电影以地铁线路的方式连接起来,每条不同颜色的线路代表不同的含义。例如主轴的粉色线代表了脍炙人口的电影,如1933年的《金刚》(King Kong)、1977年的《星球大战》(Star Wars)等;绿色线代表了科幻电影,如1982年的《银翼杀手》(Blade Runner),以及2009年的《星际迷航》(Star Trek)等。

数据看板制作(数据可视化)(2)

新闻展示图

数据看板制作(数据可视化)(3)

此数据可视化图形借由树图的表现形式及算法,以区块大小、颜色深度及标题字号呈现了新闻受欢迎程度。不同颜色表示不同的新闻领域,例如红色表示世界新闻,绿色表示商业新闻,蓝色表示体育新闻等。

这种表现形式打破了空间的限制,帮助用户发现、认知和分类新闻信息,比较适合展现大量信息的聚合。

关键字展示图

是由AmazType从亚马逊网上书店收集数据,将图书的搜索结果根据所提供的关键字的字母形状进行排列而生成的,点击其中一本书,就可以进入页面查看详细信息,如图所示。

数据看板制作(数据可视化)(4)

数据可视化的意义

数据可视化为我们提供了一条清晰有效地传达与沟通信息的渠道,具体体现在三个方面,如图所示。

数据看板制作(数据可视化)(5)

★ 交互性:用户能够方便地通过交互界面实现数据的管理、计算与预测。

★ 多维性:可以从数据的多个属性或变量对数据进行切片、钻取、旋转等,以此剖析数据,从而能多角度、多方面分析数据。

★ 可视性:数据可以用图像、二维图形、三维图形和动画等方式来展现,并可对其模式和相互关系进行可视化分析。

数据可视化工具与资源

Excel是数据可视化的利器之一,我们做完数据分析写报告时就是采用Excel绘制图表的,如刚才提到的饼图、折线图、条形图、柱形图等常用图形。当然还可以在Excel中绘制数据地图,让我们清晰直观地了解用户、渠道等分布信息。甚至还可以结合Excel控件绘制动态图,展现数据的变化与趋势。

目前的Excel版本绘制的图表也相较之前的版本有不少改进,例如自Excel 2010版本起,增加了迷你图、切片器等工具,这些都是非常好的可视化工具。

,