如何使用Python高效地为DataFrame数据列添加连续序号,并使相同数据共享相同序号?

心靈之曲
发布: 2025-03-03 08:56:09
原创
649人浏览过

如何使用python高效地为dataframe数据列添加连续序号,并使相同数据共享相同序号?

高效为DataFrame数据列添加连续序号,并使相同值共享序号

本文介绍如何使用Python的pandas库,高效地为DataFrame数据列添加连续序号,且相同数据值共享同一序号。

问题描述: 需要根据DataFrame中某列的值,生成一个新的序号列。连续的相同值拥有相同的序号,不同的值则序号递增。例如,输入数据列[11, 21, 24, 24, 24, 25, 25, 26],期望输出序号列[1, 2, 3, 3, 3, 4, 4, 5]

解决方案: 利用pandas和numpy库,可以简洁地实现此功能。以下代码演示了如何使用numpy.cumsumpandas.DataFrame.diff方法:

立即学习Python免费学习笔记(深入)”;

Find JSON Path Online
Find JSON Path Online

Easily find JSON paths within JSON objects using our intuitive Json Path Finder

Find JSON Path Online 193
查看详情 Find JSON Path Online
import numpy as np
import pandas as pd

data = [11, 21, 24, 24, 24, 24, 25, 25, 26, 26, 26, 26, 23, 26, 26, 26, 26, 20, 26, 26, 26, 26]
df = pd.DataFrame({'data': data, 'nums': 0})

df['nums'] = np.cumsum(df['data'].diff() != 0) +1

print(df)
登录后复制

代码首先创建一个包含'data'列的DataFrame,并初始化一个名为'nums'的序号列为0。 df['data'].diff()计算'data'列相邻元素的差值。!= 0判断差值是否为0,结果为布尔值序列。np.cumsum对布尔序列进行累加,得到最终序号。数据变化时,差值不为0,计数器加1;数据不变时,差值为0,计数器不变,实现相同数据共享相同序号。 最后加1是为了序号从1开始。

运行结果:

    data  nums
0     11     1
1     21     2
2     24     3
3     24     3
4     24     3
5     24     3
6     25     4
7     25     4
8     26     5
9     26     5
10    26     5
11    26     5
12    23     6
13    26     7
14    26     7
15    26     7
16    26     7
17    20     8
18    26     9
19    26     9
20    26     9
21    26     9
登录后复制

此方法高效简洁地解决了问题,np.cumsum巧妙地利用了布尔值序列的累加特性。

以上就是如何使用Python高效地为DataFrame数据列添加连续序号,并使相同数据共享相同序号?的详细内容,更多请关注php中文网其它相关文章!

相关标签:
最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号