背景介绍

相关系数是研究变量之间线性相关程度的量,一般用字母 r 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。相关系数是用以反映变量之间相关关系密切程度的统计指标。

今天我们来使用R语言来快速做一个相关系数图。

软件下载

R

RStudio

教程讲解

1.本节教程,使用mtcars数据包里面的数据进行演示,当然你也可以将你自己的数据读取进入R进行作图

mtcars

r语言求数据集的相关系数(R语言相关系数图)(1)

2.由于mtcars的其他列为非数值型变量,所以我们得提取出来其中的数值型变量进行作图,所以下面代码的意思就是,将mtcars数据中的第1,3-7列提取出来,然后就生成了我们作图用的数据

mtcars_cor <- mtcars[,c(1,3:7)] mtcars_cor

r语言求数据集的相关系数(R语言相关系数图)(2)

3.开始作图:首先安装相关系数图的包和加载包

install.packages("corrgram") library(corrgram)

4.开始作图:

然后图就做出来了:

corrgram(mtcars_cor, lower.panel = panel.shade, upper.panel = panel.pie, main="相关系数图")

r语言求数据集的相关系数(R语言相关系数图)(3)

5.当然,你也可以换另一种形式:也就是数字显示,根据包的默认情况,红色代表负相关,蓝色代表正相关

corrgram(mtcars_cor, lower.panel = panel.cor, upper.panel = panel.cor, main="相关系数图")

r语言求数据集的相关系数(R语言相关系数图)(4)

6.如果你觉得颜色不好,可以通过col.regions=colorRampPalette()进行设置调换,此时的红色代表正相关,蓝色代表负相关

corrgram(mtcars_cor, lower.panel = panel.fill, upper.panel = panel.cor, main="相关系数图", col.regions=colorRampPalette(c("blue","red")))

r语言求数据集的相关系数(R语言相关系数图)(5)

7.好了,今天的教程就到这里了,祝大家科研顺利!

,