pandas 如何在 groupby 后只对部分列做不同聚合函数

舞夢輝影

发布时间：2026-01-24 15:32:02

871人浏览过

来源于php中文网

原创

最常用方式是用字典指定列与函数映射，支持单列单函数、单列多函数（生成多级索引）及命名聚合（如agg(sales_sum=('sales','sum'))避免嵌套），需确保函数返回标量且key不冲突。

pandas 如何在 groupby 后只对部分列做不同聚合函数

用 agg() 传入字典指定列与函数映射

直接对 groupby 结果调用 agg()，并传入一个字典，键是列名，值是聚合函数（可为字符串、函数或函数列表）。这是最常用也最清晰的方式。

支持单列单函数：{'sales': 'sum', 'price': 'mean'}
支持单列多函数：用列表包裹，如 {'sales': ['sum', 'count'], 'price': 'max'}，结果列名会自动变成多级索引（('sales', 'sum')）
若想避免多级索引，可后续加 columns.droplevel(0) 或用命名元组方式（见下一条）
函数可以是内置字符串（'min'）、NumPy 函数（np.std）、自定义函数（需接受 Series 并返回标量）

用命名元组实现自定义列名（避免多级索引）

当一列需要多个聚合函数，又不想让结果列名带多级索引时，用 pd.NamedAgg（pandas ≥ 0.25）或元组形式（旧版本兼容）更可控。

pandas 1.0+ 推荐写法：agg(sales_sum=('sales', 'sum'), sales_cnt=('sales', 'count'), price_avg=('price', 'mean'))
效果是生成扁平列名：sales_sum、sales_cnt、price_avg，无嵌套
旧版本可用元组：agg([('sales_sum', 'sum'), ('sales_cnt', 'count')])，但仅适用于单列；多列需拼字典 + 元组组合，较易出错
注意：键名不能和原始列名冲突，否则会被覆盖或引发 ValueError: duplicate names

先 select 再 agg：只对特定列 groupby 聚合

如果原始 DataFrame 列很多，而你只关心其中几列的聚合，先用 [...] 选列再 groupby().agg(...)，能减少内存占用和计算开销。

SpeechEasy

SpeechEasy是一种合成语音解决方案，可以让用户从文本生成高质量、易于理解的音频。

下载

正确：df[['group_key', 'A', 'B', 'C']].groupby('group_key').agg({'A': 'sum', 'B': 'mean'})
错误：在完整 df.groupby(...).agg({...}) 中只写部分列名，其余列不会报错但会被静默丢弃——容易误以为“没生效”，其实是被过滤了
若 groupby 的 key 不在所选列中（比如 df[['A','B']].groupby('category')），会抛 KeyError: 'category'，必须确保 key 列已包含在前一步选择中

混合使用 lambda 和预定义函数要注意作用域和性能

在 agg 字典里混用 lambda x: x.max() - x.min() 和 np.ptp 看似等价，但实际行为可能不同。

lambda 接收的是每个分组的 Series，所以 x.max() - x.min() 安全；但若写成 lambda x: x['col'].max() 就会报错（x 已是 Series，无列索引）
涉及缺失值时，np.ptp 默认不跳过 NaN，而 lambda x: x.max() - x.min() 会受 skipna=True 设置影响（默认开启），结果可能不一致
大量数据下，向量化函数（如 np.mean）比 lambda 快得多；复杂逻辑建议封装成独立函数并加上 @numba.jit 或用 apply 分离处理

真正容易被忽略的是：当字典里某列对应函数返回不是标量（比如返回 list、Series 或 DataFrame），agg 会静默失败或降级为 apply 行为，输出结构不可控。务必确认每个聚合函数对任意非空分组都返回单一标量值。

使用 Pydantic 精确描述 Python 复杂字典结构

Python中复杂字典结构的高效类型定义与数据验证：Pydantic实战指南

将字节流转换为 Go 语言中的 float32 数组

Go 语言：从字节数据高效还原 float32 数组的实践指南

Go语言中高效转换字节序列为Float32数组的指南

相关标签:

go app 作用域内存占用聚合函数 numpy pandas count 封装 select 字符串 Lambda 作用域

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在 Plotly 中为 3D 散点图自定义颜色与标记形状下一篇：暂无

作者最新文章

GitHub 的官方网站是什么？GitHub 官方域名与访问方式

2026-01-23 15:25

抖音商城买东西靠谱吗_抖音商城购物安全说明

2026-01-23 15:35

如何在 Excel 中插入和修改 SmartArt 图示

2026-01-23 15:45

mcjs免费秒玩入口网址_MCJS免费秒玩入口网页版我的世界最佳中文

2026-01-23 15:46

毒蘑菇性能测试图形怎么画出来？毒蘑菇GPU渲染原理说明

2026-01-23 15:57

扫描全能王解密版风险_扫描全能王解密版安全风险详解

2026-01-23 15:58

空调加氟一般需要多少钱空调几年加一次氟

2026-01-23 16:49

手机充电口松动怎么变紧修需要多少钱

2026-01-23 17:06

手机充电变慢了怎么回事怎么解决

2026-01-23 17:09

电子邮箱怎么申请注册和使用

2026-01-23 17:16

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PC软件

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

counta和count的区别

Count函数用于计算指定范围内数字的个数，而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

198

2023.11.20

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

278

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

212

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1492

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

622

2023.11.24

java读取文件转成字符串的方法

Java8引入了新的文件I/O API，使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java，可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中，你需要将文件路径替换为你的实际文件路径，并且可能需要处理可能的IOException异常。想了解更多java的相关内容，可以阅读本专题下面的文章。

572

2024.03.22