0

0

Python集合系统学习路线第44讲_核心原理与实战案例详解【技巧】

冷漠man

冷漠man

发布时间:2025-12-25 18:34:03

|

103人浏览过

|

来源于php中文网

原创

Python集合核心是无序、唯一、可变(元素须不可变),底层哈希表实现,查增删平均O(1);因要求元素可哈希,故列表字典等可变类型不可作为元素。

python集合系统学习路线第44讲_核心原理与实战案例详解【技巧】

Python集合(set)的核心原理其实就三点:无序、唯一、可变(但元素必须不可变)。它底层用哈希表实现,所以查、增、删都是平均 O(1) 时间复杂度——这点比列表快得多,也是它最值得用的地方。

为什么集合不能存列表或字典?

因为集合要求所有元素“可哈希”(hashable),即对象创建后内存地址和哈希值不变。列表、字典是可变类型,随时可能被修改,哈希值会变,破坏哈希表结构。常见可哈希类型有:int、str、tuple(且内部元素也都可哈希)、frozenset;不可哈希的有:list、dict、set、bytearray。

例如:

  • ✅ {1, "hello", (2, 3)} —— 合法,tuple 内部没可变项
  • ❌ {1, [2, 3]} —— 报错 TypeError: unhashable type: 'list'
  • ✅ {1, frozenset([2, 3])} —— frozenset 是不可变集合,可作元素

集合运算的实战技巧

别总用 for 循环去“去重”或“找共同项”,直接用内置方法或运算符更简洁、更快。

立即学习Python免费学习笔记(深入)”;

超会AI
超会AI

AI驱动的爆款内容制造机

下载
  • 去重并保持顺序?dict.fromkeys(iterable) 转 list,或 Python 3.7+ 可用 list(dict.fromkeys(lst));纯 set 会丢顺序。
  • 找两组数据的交集/差集/并集?
      • a & ba.intersection(b) → 共同元素
      • a - ba.difference(b) → a 有 b 没有的
      • a ^ ba.symmetric_difference(b) → 仅在其中一个里出现的
  • 判断子集/超集?a.issubset(b)a ;a.issuperset(b)a >= b

常见易错点与优化建议

很多同学写集合操作时踩坑,不是语法错,而是逻辑误判。

  • in 判断成员比用 list.index()list.count() 快一个数量级——尤其数据量大时,优先转 set 再查。
  • 避免反复创建集合:比如循环里写 if x in [1,2,3,4,5],应提前定义 valid_set = {1,2,3,4,5}
  • 更新集合别用 +=:它只对 list 有效;set 要用 .update()(批量加)或 .add()(单个加)。
  • frozenset 是唯一能当 dict 键的集合类型,适合做“组合键”,比如 cache[(frozenset(keys), mode)] = result

一个小而实用的案例:日志去重分析

假设你有一批用户行为日志,每行是“用户ID 操作类型 时间戳”,想快速统计:今天执行过“login”也执行过“pay”的用户数。

  • 读取日志,按用户ID分组,分别收集其操作类型 → 每个用户对应一个 set
  • 筛选出同时含 'login' 和 'pay' 的用户集合:login_users & pay_users
  • 比用嵌套循环或双重 if 判断快 5–10 倍,代码还少一半

理解哈希机制、掌握运算符语义、避开可变性陷阱,集合就能从“只会去重”变成高效数据协调工具

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

707

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

625

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

734

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

616

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1234

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

573

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

695

2023.08.11

笔记本电脑卡反应很慢处理方法汇总
笔记本电脑卡反应很慢处理方法汇总

本专题整合了笔记本电脑卡反应慢解决方法,阅读专题下面的文章了解更多详细内容。

1

2025.12.25

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Django 教程
Django 教程

共28课时 | 2.4万人学习

SciPy 教程
SciPy 教程

共10课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号