散点图矩阵可以非常直观地看到多个变量两两间的相关性,是变量间相关性分析的一把利器。

基本散点图矩阵

#查看头几行数据 head(mtcars) pairs(~mpg disp drat wt,data=mtcars,main="基本散点图矩阵")

r语言读取表格数据做直方图(R语言数据可视化系列)(1)

基本散点图矩阵

散点图拟合矩阵(推荐)

library(car) scatterplotMatrix(~mpg disp drat wt,data=mtcars,spread=FALSE,lty=2,main="利用car包绘制散点图矩阵")

r语言读取表格数据做直方图(R语言数据可视化系列)(2)

  • ~mpg disp drat wt|cyl不同发动机缸数cyl下的散点图

  • diagonal="histogram",设置对角线上的图形为变量的直方图

  • ○代表4缸发动机,△代表6缸发动机,﹢代表8缸发动机

  • scatterplotMatrix(~mpg disp drat wt|cyl,data=mtcars,spread=FALSE,lty=2,diagonal="histogram",main="不同发动机缸数下的散点图矩阵")

    r语言读取表格数据做直方图(R语言数据可视化系列)(3)

    不同类别下的散点图拟合矩阵

    带颜色的排序散点图矩阵

    cor(mtcars[,c('mpg','disp','drat','wt')])

    r语言读取表格数据做直方图(R语言数据可视化系列)(4)

    相关系数矩阵

    library(gclus) data=mtcars[,c(1,3,5,6)] data.cor=abs(cor(data)) colors=dmat.color(data.cor) #生成颜色矩阵 order=order.single(data.cor) #用来排序 cpairs(data,order,panel.colors=colors,gap=0.5,main="带颜色的排序散点图矩阵") #gap=0.5,增加两个图形之间的间距

    r语言读取表格数据做直方图(R语言数据可视化系列)(5)

    带颜色的排序散点图矩阵

    从图中可以看出,相关性最高的是车重wt排量disp以及车重wt每加仑英里数mpg(标了红色,而且离主对角线近)。相关性最低的是后轴比drat每加仑英里数mpg(标了黄色,且离主对角线较远)。

    ,