维恩图用于展示在不同的事物群组(集合)之间的数学或逻辑联系,尤其适合用来表示集合(或)类之间的“大致关系”,它也常常被用来帮助推导(或理解推导过程)关于集合运算(或类运算)的一些规律。通常每个集合以一个圆圈表示。每个集合都是一组具有共同之处的物件或数据。当多个圆圈(集)相互重叠时,称为交集 (intersection),里面的数据同时具有重迭集中的所有属性。
——百度百科、数据可视化工具目录
今天我们来使用R语言绘制一下维恩图,看看到底有多简单!
软件介绍[软件1]:R (Version 4.1.2)
[软件2]:RStudio(Version 1.4.1106)
图文教程1.首先一上来就是进行安装及其加载包
install.packages("VennDiagram")
library(VennDiagram)
2.看一下该绘图函数的介绍
3.首先,我们生成一组数据,进行维恩图的绘制
set1 <- paste(rep("word_" , 200) , sample(c(1:1000) , 200 , replace=F) , sep="")
set2 <- paste(rep("word_" , 200) , sample(c(1:1000) , 200 , replace=F) , sep="")
set3 <- paste(rep("word_" , 200) , sample(c(1:1000) , 200 , replace=F) , sep="")
set4 <- paste(rep("word_" , 200) , sample(c(1:1000) , 200 , replace=F) , sep="")
set5 <- paste(rep("word_" , 200) , sample(c(1:1000) , 200 , replace=F) , sep="")
4.为了方便大家读取自己的数据,我们可以将数据写进Excel,然后再读取进来,那么首先我们将数据做成数据框
Venn_data <- data.frame(set1,
set2,
set3,
set4,
set5)
5.然后加载可以读取/写成Excel的包,将数据写成Excel文件
library(openxlsx)
write.xlsx(Venn_data,"Venn_data.xlsx")
6.使用自己的数据的同学,可以直接从这一步开始:读取数据
- sheet数值用来指定数据在哪个sheet中
Venn_data <- read.xlsx("Venn_data.xlsx",
sheet = 1)
7.使用attach将该数据读取到R中,方便直接使用列名称
attach(Venn_data)
8.使用函数绘图
- x数值为每个集合的列表
- category.names为每个集合的名称
- filename为图片名称
venn.diagram(
x = list(set1, set2, set3,set4, set5),
category.names = c("set1", "set2", "set3","set4","set5"),
filename = 'Venn_diagramm.png',
output=TRUE)
9.然后我们对维恩图的参数进一步调整
venn.diagram(
x = list(set1, set2, set3,set4, set5),
category.names = c("set1", "set2", "set3","set4","set5"),
filename = 'Venn_diagramm.png',
output=TRUE,
# 输出图片要求,包括图片类型,高和宽,分辨率,压缩等方式
imagetype="png" ,
height = 1000 ,
width = 1000 ,
resolution = 300,
compression = "lzw",
# 圆环的调节,边的宽度,是否需要虚线,以及填充的颜色
lwd = 2,
lty = 'blank',
fill = c("#EE3B3B", "#6495ED", "#8B7355", "#EEC900", "#008B8B"))
10.有些字体没显示出来,再进行调整
venn.diagram(
x = list(set1, set2, set3,set4, set5),
category.names = c("set1", "set2", "set3","set4","set5"),
filename = 'Venn_diagramm.png',
output=TRUE,
# 输出图片要求,包括图片类型,高和宽,分辨率,压缩等方式
imagetype="png" ,
height = 1000 ,
width = 1000 ,
resolution = 300,
compression = "lzw",
#圆环的调节,边的宽度,是否需要虚线,以及填充的颜色
lwd = 2,
lty = 'blank',
fill = c("#EE3B3B", "#6495ED", "#8B7355", "#EEC900", "#008B8B"),
# 对图上的数字进行调节,包括大小,是否加粗,以及字体
cex = .6,
fontface = "bold",
fontfamily = "sans",
# 对每个集合的名字进行调节,包括字体大小,是否加粗,在外部,以及位置,字体及其颜色
cat.cex = 0.7,
cat.fontface = "bold",
cat.default.pos = "outer",
cat.pos = c(0,-45,240,135,45),
cat.dist = c(0.2,0.2,0.2,0.2,0.2),
cat.fontfamily = "sans",
cat.col=c("#EE3B3B", "#6495ED", "#8B7355", "#EEC900", "#008B8B"))
11.这么详细的教程,赶紧来学学吧!
,