自从Python流行后,R貌似逐渐被人遗忘,可是,每款语言和工具都有它存在的价值,R也具有强大的可视化功能,你真的了解R吗?还是说,掌握了Python就不用再掌握R了。本文科普性的介绍下R,带你走进R的世界。

R是一种应用统计软件和语言,主要为统计计算和绘图而生,而且R是一套开源的数据分析解决方案。它主要包括简单却很强大的R语言、数据存储和处理、数据运算工具、完整的统计分析工具、优秀的统计可视化以及用户可自定义功能等。与其说R是一种统计软件,还不如说R是一种数学计算的环境,这是因为R并不仅仅提供若干统计功能,在使用的时候,只需指定数据库和若干参数便可进行一次统计分析,这也是R的强大与易用方面的体现。

在使用过程中,你会发现R提供了一些集成的统计工具,但更多时候用到的是它提供的各种数学计算、统计计算的函数,从而使使用者能灵活地进行数据分析,甚至创造出新的统计计算方法,同时,R内建多种统计学及数字分析功能。

除了R语言的一些基础知识,如语法、数据结构、数据函数、数据读取与应用等,在学习R软件的同时,数据产品经理还应该多关注关于使用R软件完成数据的可视化操作。确实,R软件也是一款非常棒的可视化工具,包含了各种各样的可视化包,如graphics、lattice、plotrix、plotly、REmap等。关于这一部分内容的学习,读者可以根据《统计建模与R软件》《R语言实战》等初步了解R的可视化,了解R软件基础包是如何实现数据可视化的,这样会给你的可视化思维带来好处,并为后续的其他数据产品提供一些借鉴和思路。

其中,R的REmap软件包在实现一些地图应用场景的可视化方面,效果是非常棒的,REmap软件包是R语言地图可视化工具之一,具有友好的交互方式,简单的函数参数,使用者甚至可以直接在R中调用Echarts的API接口。在熟悉了REmap软件包的基本使用及思路以后,在其他大数据可视化工作时,我们的思路将更加开阔。可以毫不夸张地说,我们常用的地图可视化方式,基本上用REmap软件包都能画出 ,并且可以绘制完美的图形,它包含很多系统的绘图函数,如remap( )、remapB( )、remapC( )、remapH( )等函数。举个例子让我们来看一下REmap软件包的强大功能。

下图是使用REmap软件包里面的remapB函数绘制的,表示在下班高峰期人群的迁移情况。可以看出,人群分别从各栋写字楼出来,流向了地铁站,该图主要为了展示在下班高峰期该地铁站周边的交通效果,以便进一步做一些人群标签画像、交通调控等方面的规划和研究。

r 先生的记录(聊一聊被遗忘的R)(1)

使用R绘制的地图

上面这些更多的都是从数据产品角度介绍的,如果想进一步提升自己,研究一些目前比较火的数据挖掘知识,R语言同样提供了出路,如果想了解更多相关内容可以参考《数据挖掘:R语言实战》《机器学习与R语言》《R语言数据分析与挖掘实战》这几本书。

上面提到的这三本书,都以R语言作为基本工具,重点介绍在R的基础上进行数据挖掘实战,里面包含了常见的数据挖掘方法,如Knn、Logistic回归、决策树、朴素贝叶斯、神经网络、SVM、随机森林、K均值聚类、密度聚类、EM聚类、关联规则等,每一种挖掘方法都配备了详细的数据案例及实现方法,同时也讲解了数据挖掘中经常要使用的一些函数。

另外,R作为一个成熟的工具,R的官网https://www.r-project.org/,有着大量的学习资料和相关教程,可以在上面下载安装程序,开始你的R学习之旅。

Python和R,你到底喜欢哪一个呢?欢迎大家留言交流讨论。

,