分享

使用 Python 获取两个列表的交集、并集、差集的常用方法 | Jin''''s Blog

 Z2ty6osc12zs6c 2018-04-17

在数据处理中经常需要使用 Python 来获取两个列表的交集,并集和差集。在 Python 中实现的方法有很多,我平时只使用一两种我所熟悉的,但效率不一定最高,也不一定最优美,所以这次想把常用的方法都搜集总结一下。

intersection-union-differenceintersection-union-difference

交集(Intersection)

>>> a = [1, 2, 3, 4, 5, 6]
>>> b = [2, 4, 6, 8 ,10]
>>> a and b
[2, 4, 6]

方法一:

intersection = list(set(a).intersection(b))

方法二:

intersection = list(set(a) & set(b))

方法三:

intersection = [x for x in b if x in set(a)]   # list a is the larger list b

方法四:

intersection = list((set(a).union(set(b)))^(set(a)^set(b)))

注意:如果不考虑顺序并且一定要使用 loop 的话,不要直接使用 List,而应该使用 Set。在 List 中查找元素相对 Set 慢了非常非常多。

参考资料:

并集(Union)

>>> a = [1, 2, 3, 4, 5, 6]
>>> b = [2, 4, 6, 8 ,10]
>>> a or b
[1, 2, 3, 4, 5, 6, 8, 10]

方法一:

union = list(set(a) | set(b))

方法二:

list(set(a).union(set(b)))

注意:如果不考虑顺序并且一定要使用 loop 的话,不要直接使用 List,而应该使用 Set。在 List 中查找元素相对 Set 慢了非常非常多。

参考资料:

差集(Difference Set)

>>> a = [1, 2, 3, 4, 5, 6]
>>> b = [2, 4, 6, 8 ,10]
>>> a or b
[1, 2, 3, 4, 5, 6, 8, 10]

方法一:

difference = list(set(b).difference(set(a)))    # elements in b but not in a
difference = list(set(a).difference(set(b)))    # elements in a but not in b

方法二:

difference = list(set(a_list)^set(b_list))

方法三:

difference = list(set(a)-set(b))    # elements in b but not in a
difference = list(set(a)-set(b))    # elements in a but not in b

方法四:

difference = [x for x in b if x not in set(a)]    # elements in b but not in a
difference = [x for x in b if x not in set(a)]    # elements in a but not in b

注意:如果不考虑顺序并且一定要使用 loop 的话,不要直接使用 List,而应该使用 Set。在 List 中查找元素相对 Set 慢了非常非常多。

参考资料:

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多