Series是Pandas中的一维带标签数组,可通过列表、字典等创建并支持自定义索引;可使用s['a']、s.loc、s.iloc等方式按标签或位置访问数据;支持布尔索引筛选;常用处理方法包括dropna()、fillna()、astype()、replace()及str和apply操作;统计分析涵盖mean()、sum()、describe()、value_counts()等函数,配合缺失值检测isnull(),全面支撑数据清洗与分析任务。

Series 是 Pandas 中一种一维带标签的数组结构,广泛用于数据清洗、分析和处理。掌握其常用方法能显著提升数据操作效率。以下是 Python 中 Series 常用方法的整理,涵盖创建、访问、运算、统计、处理缺失值等核心操作。
Series 可由列表、数组、字典等创建,支持自定义索引。
示例:pd.Series([1, 2, 3], index=['a', 'b', 'c']) —— 用列表创建pd.Series({'x': 10, 'y': 20}) —— 用字典创建s.values —— 获取底层 NumPy 数组s.index —— 查看索引s.name, s.index.name —— 设置或查看名称支持按标签、位置或条件筛选数据。
常用方式:s['a'] 或 s.a —— 按标签取值(若标签合法)s[1:3] —— 切片(支持标签或位置)s.loc['a'] —— 明确按标签访问s.iloc[0] —— 按位置访问s[s > 5] —— 布尔索引,筛选大于5的值对数据进行清洗、转换和类型操作。
立即学习“Python免费学习笔记(深入)”;
s.dropna() —— 删除缺失值s.fillna(0) —— 填充 NaN 值s.astype('str') —— 转换数据类型s.replace(1, 100) —— 替换特定值s.str.lower() —— 字符串操作(需为字符串类型)s.apply(lambda x: x*2) —— 对每个元素应用函数快速获取数据分布和统计信息。
s.mean(), s.median(), s.std() —— 均值、中位数、标准差s.sum(), s.min(), s.max() —— 求和、最小、最大s.describe() —— 返回综合统计摘要s.value_counts() —— 统计各值出现次数s.isnull(), s.notnull() —— 检查缺失值以上就是Python中Series常用方法整理的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号