如何根据另一列分组填充 Pandas DataFrame 中缺失值（众数插补）

花韻仙語

发布时间：2026-01-10 19:59:21

202人浏览过

来源于php中文网

原创

如何根据另一列分组填充 Pandas DataFrame 中缺失值（众数插补）

本文介绍如何基于分组（如按 col_b）计算每组内目标列（col_a）的众数，并用该众数原地填充该组内的 nan 值，全程无需手动构建映射表，仅用 groupby + transform + fillna 即可高效、可读性强地完成众数导向的缺失值插补。

在数据预处理中，针对分类或离散型特征的缺失值，按业务逻辑分组后取众数（mode）插补是常见且稳健的做法。例如，当 col_A 的缺失值需依据 col_B 的类别分别填充时——即“若 col_B == 5，则用 col_A 在 col_B == 5 子集中的最频繁值填充”，此时直接使用 groupby().transform() 配合自定义众数填充函数，是最简洁、向量化、可扩展的解决方案。

核心思路是：对 col_A 按 col_B 分组后，对每组调用 transform，使其返回与原组等长的 Series；内部通过 .mode().iloc[0] 获取众数（注意处理空众数情形），再用 .fillna() 完成组内插补。

以下是完整可运行示例：

import pandas as pd
import numpy as np

# 构造示例数据（含真实分布，便于验证众数逻辑）
data = {
    'col_A': [1, 1, 1, 5, 5, 7, 7, 7, 8, 8, np.nan, np.nan],
    'col_B': [5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 8]
}
df = pd.DataFrame(data)

# 定义安全众数填充函数（兼容无众数或全 NaN 组）
def impute_mode(group):
    mode_series = group.mode()
    if not mode_series.empty:
        return group.fillna(mode_series.iloc[0])
    else:
        # 若无众数（如所有值唯一或全为 NaN），回退为 group 均值（数值型）或首非空值（通用）
        return group.fillna(group.dropna().iloc[0] if not group.dropna().empty else np.nan)

# 执行分组众数插补，结果写入新列（推荐）或覆盖原列
df['col_A_imputed'] = df.groupby('col_B')['col_A'].transform(impute_mode)

print(df)

输出示意：

降迹灵AI

用户口碑TOP级的降AIGC率、降重平台

下载

   col_A  col_B  col_A_imputed
0    1.0      5            1.0
1    1.0      5            1.0
2    1.0      5            1.0
3    5.0      5            5.0
4    5.0      5            5.0
5    7.0      5            7.0
6    7.0      5            7.0
7    7.0      5            7.0
8    8.0      5            8.0
9    8.0      5            8.0
10   NaN      5            1.0   ← 被 col_B==5 组的众数 1 填充
11   NaN      8            NaN   ← col_B==8 组仅一个值（NaN），无有效众数，保持 NaN

✅ 关键优势：

零中间 DataFrame：无需 groupby().size()、索引遍历、手动拼接映射表，避免冗余内存与易错逻辑；
自动对齐：transform 确保返回值严格按原始索引顺序广播，插补位置精准；
健壮性设计：函数内置空众数兜底逻辑，防止 .mode().iloc[0] 报错；
可扩展性强：可轻松替换为中位数（group.median()）、均值（group.mean()）或其他自定义规则。

⚠️ 注意事项：

mode() 返回 Series，即使唯一众数也需 .iloc[0] 提取标量；多众数时默认取第一个（Pandas 行为）；
若某 col_B 组内 col_A 全为 NaN，.mode() 返回空 Series，必须显式判断，否则抛 IndexError；
对于字符串/分类类型列，mode() 同样适用，无需额外转换；
如需就地修改原列，可写为 df['col_A'] = df.groupby('col_B')['col_A'].transform(impute_mode)。

综上，摒弃手动构建映射关系的“脏步骤”，拥抱 transform 的向量化分组能力，是实现逻辑清晰、性能优异、维护友好的缺失值插补的最佳实践。

相关标签:

pandas 字符串 transform

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何正确使用 pandas 的 explode() 处理不等长列表列下一篇：如何用Python删除具有前缀重复关系的行（保留最长连续前缀链的末尾行）

作者最新文章

如何将 Pandas DataFrame 正确转换为单层字典用于列名映射

2026-01-08 10:57

GoHighlevel AI Coaching Snapshot: 自动化你的业务

2026-01-08 11:06

InDesign如何制作渐变边框图片

2026-01-08 11:06

Abacus AI：颠覆性AI工具，赋能生活和业务增长

2026-01-08 11:10

撰写强有力的研究计划书：终极指南

2026-01-08 11:11

《江苏税务》办理电子退税申请方法

2026-01-08 11:14

Airtel Payments Bank Statement Password: 解锁你的交易记录

2026-01-08 11:24

最佳免费邮件营销软件：小企业零成本增长攻略

2026-01-08 11:27

掌握STAR法则：面试行为问题完美应对指南

2026-01-08 11:29

Ink AI终极指南：AI驱动的电子书创作和营销平台

2026-01-08 11:30

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

253

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

206

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1463

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

616

2023.11.24

java读取文件转成字符串的方法

Java8引入了新的文件I/O API，使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java，可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中，你需要将文件路径替换为你的实际文件路径，并且可能需要处理可能的IOException异常。想了解更多java的相关内容，可以阅读本专题下面的文章。

548

2024.03.22