分享

Python中的基础数据类型(Set集合)及其常用用法简析

 Python进阶者 2023-02-10 发布于广东

夜阑卧听风吹雨,铁马冰河入梦来。

前言

    前面的文章小编已经介绍了Number,String,List,Tuple,Dict五种基本的数据类型,今天小编来简单说一下最后一种数据类型,set集合。

特点

    set集合由{}(花括号,大括号)包裹,注意生成空的集合不能用空的{},空的{}生成的是个空字典,列表和元组可以用这种方式生成空列表或元组。

  • 不同的元素组成(没有重复的元素)

  • 无序

  • 集合中的元素必须是不可变类型

# 定义一个集合set1 = {1, 2, 3}print(set1, type(set1))
# 字符串转换为set集合set2 = set('hello')print(set2)
# set集合有不同的元素组成,天然去重复set3 = {1, 2, 3, 1, 2, 3}print(set3)
# set集合元素必须为不可变类型# set4 = {1, 2, 3, [1, 2, 3]}# TypeError: unhashable type: 'list'
# 注意生成的是一个空字典temp1 = {}print(type(temp1))
# 正确的生成空集合的姿势temp2 = set()print(type(temp2))
# 这两种方式都可以生成空列表或元组t1 = ()t2 = tuple()print(type(t1), type(t2))

set集合只能遍历取值,因为无序,所以无法索引取值

set1 = {1, 2, 3, 4, 5, 6}for i in set1:  print(i)

添加
set1 = {1, 2, 3}set1.add(4)print(set1)

更新

# 和添加一样set1 = {1, 2, 3, 4, 5, 6, 'aaa', 'sss'}# 添加一个值set1.update('a')# 添加多个值set1.update(['s','ss'])print(set1)

删除

set1 = {1, 2, 3, 4, 5, 6, 'aaa', 'sss'}temp = set1.pop() # 随机删除并返回删除的元素print(set1, temp)
set2 = {1, 2, 3, 4, 5, 6, 'aaa', 'sss'}# 指定删除,删除不存在的元素抛出异常set2.remove('aaa')# set2.remove('a') # KeyError: 'a'set2.discard('sss')# 删除不存在的元素不抛出异常set2.discard('s')print(set1)
# 清空集合set2.clear()print(set2)

定义一个不可变的集合

set1 = frozenset('hello')print(set1)# 添加抛出异常# set1.add('a') # 'frozenset' object has no attribute 'add'

数学运算

set1 = {'aa', 'bb', 'cc', 'zz'}set2 = {'aa', 'bb', 'dd', 'ee'}# 交集,方法和符号两种一样print(set1.intersection(set2))print(set1 & set2)
# 并集print(set1.union(set2))print(set1 | set2)
# 差集print(set1.difference(set2))print(set1 - set2)
# 交叉补集print(set1.symmetric_difference(set2))print(set1 ^ set2)
# 是否有交集,如果没有返回 True,否则返回 Falseprint(set1.isdisjoint(set2))
#某个集合是否是某个集合的子集,返回布尔值print(set1.issubset(set2))
#某个集合是否是某个集合的父集,返回布尔值print(set1.issuperset(set2))

总结  

    Python中set(集合),其实也是存储数据的一个容器,列表,元组,字典这三种数据类型也是存储数据的,其中列表和元组几乎一样,唯一区别就是元组无法更改(准确来说是元组的第一层索引无法更改),举个栗子:

tu = (1, 2, 3, 4, [1, 2, 3, 4])# 想把整个列表换掉就会抛出异常# tu[4] = 'a' #TypeError: 'tuple' object does not support item assignment# 改变元组内列表的值,整个元组的数据发生了一点点变化# 其实原理很简单,就是整个列表的指针从没改变,tu[4][0] = 'a'print(tu)

    嘻嘻,可能有人已经发现了,第一层的索引值无法改变,但是里面是一个可变的数据类型,就已经可以改变了。

元组适合存储数据不会发生变化的少量数据。

列表适合存储数据容易发生变化的少量数据。

    为啥是少量数据呢?举个栗子,就好像我们要在字典中的所有字中找到某个字一样(假如没有根据拼音排序过的那种),那么我们一般就需要从第一个字开始寻找,一直到寻找到这个字。

    相信大家都知道,上述的那种做法效率实在是太慢了,所以字典就加上了各种排序规则,查字典相信我们大家肯定都会。Python中的字典也是这样子的机制,存入的key按照某种规律已经排好序了,寻找键也是很快的,需要的时候直接通过键定位到相应的值,所以键只能是唯一的。

字典适合存存储大量的需要查询的数据。

集合适合存储值只能唯一的数据(去重)。

超大号重点

一个好的数据结构使程序事半功倍

------------------- End -------------------

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多