集合详解
一、简述- set是Python基本数据类型中的一种,主要特性是:无序、不重复的序列;
- set基本功能包括关系测试(如父集子集等)、消除重复的元素等;
- set集合还支持difference(差集)、intersection(交集)、union(联合)、sysmmetric difference(对称差集)等数学运算。
- set创建
>>> s = set('daniel')
>>> s
{'d', 'n', 'e', 'l', 'i', 'a'}
>>> type(s)
<class 'set'>
- {}创建
>>> s1 = {'a','b','c',}
>>> s1
{'a', 'c', 'b'}
>>> type(s1)
<class 'set'>
- 注意:如果要创建一个空的集合,必须使用set()。
1、添加元素
>>> s1
{1, 2, 3, 4, 5}
>>> s1.add(6)
>>> s1
{1, 2, 3, 4, 5, 6}
#add()方法一次只能接受一个参数,也就是只能添加一个元素到set里
>>> s1.add(7,8,9) #一次加3个会报错
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: add() takes exactly one argument (3 given)
#通过字符串形式添加,看能否一次添加多个
>>> l3='789abc'
>>> s1.add(l3)
>>> s1
{1, 2, 3, 4, 5, 6, '789abc'} #也是把一个字符串当成一个参数来添加
2、 清空set
>>> s1
{1, 2, 3, 4, 5, 6, '789abc'}
>>> s1.clear()
>>> s1
set()
3、copy复制
>>> s1
{1, 2, 3, 4, 5, 6, '789abc'}
>>> s2 = s1.copy()
>>> id(s1)
139851744274920
>>> id(s2)
139851744275368
>>> s1.add('789')
>>> s1
{1, 2, 3, 4, 5, 6, '789', '789abc'}
>>> s2
{1, 2, 3, 4, 5, 6, '789abc'}
4、difference 取差集
>>> s1 = {1,3,4,5,}
>>> s2 = {3,1,7,9}
>>> s1.difference(s2) #A里有的元素,B里没有的元素
{4, 5}
5、symmetric_difference 对称差集
>>> s1 = {1,3,4,5,}
>>> s3 = {11,22,3,4}
>>> s1.symmetric_difference(s3) #A中有,B没有,B有,A没有的元素
{1, 5, 11, 22}
6、difference_update intersection_update symmetric_difference_update 更新原始集合
>> s1
{1, 3, 4, 5}
>>> s2
{9, 1, 3, 7}
>>> s1.difference_update(s2)
>>> s1 #s1的值已经变成了s1和s2的交集的结果
{4, 5}
>>> s2 #s2的值没变
{9, 1, 3, 7}
#intersection_update
>>> s2
{9, 1, 3, 7}
>>> s3
{3, 4, 11, 22}
>>> s2.intersection_update(s3)
>>> s2 #s2的值变成两个交集的结果
{3}
>>> s3 #s3不变
{3, 4, 11, 22}
#symmetric_difference_update
>>> s3
{3, 4, 11, 22}
>>> s4
{3, 44, 11, 22, 55}
>>> s3.symmetric_difference_update(s4)
>>> s3 #取两个集合的对称差集写入到s3中了
{4, 55, 44}
>>> s4 #s4不变
{3, 44, 11, 22, 55}
7、discard 如果set中存在某元素,就删除
>>> s1
{4, 5}
>>> s1.discard(60) #set中没有60元素,所以没返回任何消息
>>> s1
{4, 5}
>>> s1.discard(5) #set中有元素5,所以,元素被删除
>>> s1
{4}
8、pop 删除元素,set是无序的,因此也是随机删除元素,但是会返回删除的这个元素值,pop的特性,在Python的数据类型中都是这种,删除后会返回这个删除元素;
>>> s4
{3, 44, 11, 22, 55}
>>> s4.pop()
3
>>> s4.pop(55)
>>> s4.pop()
44
9、remove 删除指定的元素,指定的元素不存在时会报错
>>> s4
{11, 22, 55}
>>> s4.remove(44) #由于set中没有44元素,所以报错
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: 44
>>> s4.remove(55) #删除55元素
>>> s4
{11, 22}
10、issubset 是否是子集,是为True,否为False
>>> s3
{4, 55, 44}
>>> s4
{33, 11, 44, 22, 55}
>>> s3.issubset(s4) #s3不是s4的子集,返回为False
False
>>> s4.issubset(s3)
False
>>> s5 = {11,22,33}
>>> s5.issubset(s4) #s5是s4的子集,返回True
True
11、issuperset 是否是父集,是为True,否为False
>>> s4
{33, 11, 44, 22, 55}
>>> s5
{33, 11, 22}
>>> s4.issuperset(s5) #s4是s5的父集合,返回True
True
12、union 联合,数据可以是字符串、list、dict、int任意类型,并且会把元素拆开,去重之后添加到set中,但是,如果需要保存的话,应该赋值给一个变量
>>> l1 = [1,2,3,4,5,] #创建一个列表
>>> s3 #查看s3以前元素
{4, 55, 44}
>>> s3.union(l1) #将l1中的每一个元素遍历,并加入到sets中打印出来
{1, 2, 3, 4, 5, 44, 55}
>>> s3 #s3中的元素还是没有变,所以如需保存,应该赋值给变量
{4, 55, 44}
>>> str1='daniel' #创建一个字符串
>>> s3.union(str1) #union会将字符串拆分,去重后加入set打印
{4, 'l', 44, 'i', 55, 'a', 'n', 'e', 'd'}
>>> t1 = (3,4,5,6,) #tuple一样
>>> s3.union(t1)
{3, 4, 5, 6, 44, 55}
>>> t1 = (3,4,5,6,99,0,234,441,34,)
>>> s3.union(t1)
{0, 34, 3, 4, 5, 6, 99, 234, 44, 55, 441}
>>> d1 = {'k1':'v1','k2':'v2','k3':[1,3,3,4,55,]} #字典默认会遍历所有key然后加入到set打印
>>> s3.union(d1)
{'k3', 'k2', 4, 55, 44, 'k1'}
13、update,和union一样,都是扩充/添加元素到set,唯一不同的是update会写入原有集合中,而union不会
>>> s1='daniel' #先创建一个字符串
>>> s2 = {'a','b','c'} #含有abc元素的set
>>> s2
{'a', 'c', 'b'}
>>> s2.update(s1) #加入元素s1
>>> s2
{'l', 'c', 'b', 'i', 'a', 'n', 'e', 'd'} #结果是直接写入到s2的set中
>>> l1 = [1,2,23,4,5,6,]
>>> s2
{'l', 'c', 'b', 'i', 'a', 'n', 'e', 'd'}
>>> s2.update(l1)
>>> s2
{1, 2, 4, 'l', 'c', 5, 6, 'b', 'i', 23, 'a', 'n', 'e', 'd'}
14、isdisjoin 判断两个set中是否有交集,有返回True,否则返回False
>>> s2
{1, 2, 4, 'l', 'c', 5, 6, 'b', 'i', 23, 'a', 'n', 'e', 'd'}
>>> s3
{4, 55, 44}
>>> s2.isdisjoint(s3)
False