如何用Python高效地为数据列添加连续序号，使相同值拥有相同序号？-Python教程-PHP中文网

如何用Python高效地为数据列添加连续序号，使相同值拥有相同序号？

霞舞

发布： 2025-03-03 09:06:24

原创

759人浏览过

如何用python高效地为数据列添加连续序号，使相同值拥有相同序号？

高效处理重复数据：为Pandas数据列添加连续序号

在数据分析中，常常需要根据数据列的值，生成一列连续序号，且要求相同的值拥有相同的序号，不同值则序号递增。本文将演示如何使用Python的Pandas库高效实现此功能。

问题描述：

给定一列数据，需要生成对应的序号列。如果数据列中相邻值相同，则赋予相同的序号；如果相邻值不同，则序号递增。例如，数据列[11, 21, 24, 24, 24, 25, 25]，生成的序号列应为[1, 2, 3, 3, 3, 4, 4]。

立即学习“Python免费学习笔记（深入）”；

AISEO AI Content Detector

AISEO推出的AI内容检测器

查看详情

解决方案：

利用Pandas和NumPy库，我们可以简洁地解决这个问题。以下代码展示了具体实现：

import numpy as np
import pandas as pd

data = [11, 21, 24, 24, 24, 24, 25, 25, 26, 26, 26, 26, 23, 26, 26, 26, 26, 20, 26, 26, 26, 26]
df = pd.DataFrame({'data': data})

df['序号'] = np.cumsum(df['data'].diff() != 0) +1

print(df)

登录后复制

代码首先创建一个包含数据列'data'的Pandas DataFrame。核心代码df['序号'] = np.cumsum(df['data'].diff() != 0) + 1 计算数据列的差分，判断相邻数据是否相同，并对布尔值结果进行累加，实现序号递增。最后加1是为了序号从1开始。最终结果如下：

    data  序号
0     11     1
1     21     2
2     24     3
3     24     3
4     24     3
5     24     3
6     25     4
7     25     4
8     26     5
9     26     5
10    26     5
11    26     5
12    23     6
13    26     7
14    26     7
15    26     7
16    26     7
17    20     8
18    26     9
19    26     9
20    26     9
21    26     9

登录后复制

这段代码简洁高效地实现了为数据列添加连续序号的功能，满足了题目要求。

以上就是如何用Python高效地为数据列添加连续序号，使相同值拥有相同序号？的详细内容，更多请关注php中文网其它相关文章！