Polars DataFrame 中高效复制行的实用指南

聖光之護

发布时间：2025-07-31 19:44:01

661人浏览过

来源于php中文网

原创

polars dataframe 中高效复制行的实用指南

本文旨在提供在 Polars DataFrame 中高效复制行的实用方法。通过 repeat_by() 和 flatten() 函数的组合使用，可以简洁高效地实现行的复制，避免了使用 map_elements() 和类型转换可能出现的错误。本文将详细介绍如何使用这两种方法，并提供示例代码，帮助读者快速掌握该技巧。

在数据处理过程中，有时需要复制 DataFrame 中的行。在 Pandas 中，可以使用 apply() 和 explode() 函数来实现。然而，在 Polars 中，我们可以使用更高效的方法来实现相同的目标。

使用 repeat_by() 和 flatten() 函数

Polars 提供了 repeat_by() 和 flatten() 函数，可以方便地复制 DataFrame 中的行。repeat_by() 函数可以根据指定的次数重复每一行的值，而 flatten() 函数可以将嵌套的列表展开。

以下是一个示例代码：

import polars as pl

df = pl.DataFrame({ "key": [1, 2, 3], "value": [4, 5, 6] })

result = df.select(pl.all().repeat_by(2).flatten())

print(result)

代码解释：

Closers Copy

营销专用文案机器人

下载

pl.all(): 选择 DataFrame 中的所有列。
.repeat_by(2): 将每一行的值重复两次。这将创建一个包含嵌套列表的 DataFrame。例如，key 列将变为 [1, 1, 2, 2, 3, 3]，value 列将变为 [4, 4, 5, 5, 6, 6]。
.flatten(): 将嵌套的列表展开，从而将 DataFrame 转换为具有所需行数的 DataFrame。

输出结果：

shape: (6, 2)
┌─────┬───────┐
│ key ┆ value │
│ --- ┆ ---   │
│ i64 ┆ i64   │
╞═════╪═══════╡
│ 1   ┆ 4     │
│ 1   ┆ 4     │
│ 2   ┆ 5     │
│ 2   ┆ 5     │
│ 3   ┆ 6     │
│ 3   ┆ 6     │
└─────┴───────┘

注意事项：

repeat_by() 函数的参数可以是整数，也可以是一个 Polars Series，用于指定每一行重复的次数。
flatten() 函数只能用于展开嵌套的列表。如果 DataFrame 中没有嵌套的列表，则 flatten() 函数不会产生任何影响。

总结：

使用 repeat_by() 和 flatten() 函数是 Polars DataFrame 中复制行的有效方法。这种方法简洁高效，避免了使用 map_elements() 和类型转换可能出现的错误。通过掌握这种技巧，可以提高数据处理的效率。

相关标签:

pandas 类型转换

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Polars 中高效复制行的方法下一篇：Polars高效复制行：使用repeat_by和flatten

作者最新文章

YDB 中如何安全地将动态参数传递给会话池执行的 SQL 查询

2025-12-30 13:46

PHP 中使用 glob() 快速定位并访问指定序号的目录

2025-12-30 13:47

实现两个开关按钮的互斥切换（一个开启时另一个自动关闭）

2025-12-30 13:49

如何在网页中安全地请求并使用文件系统编辑权限

2025-12-30 13:50

一股暴死味《007：初露锋芒》称面向“现代观众”

2025-12-30 13:54

Go 语言构建流程中如何集成额外的编译步骤？

2025-12-30 13:55

新三国志曹操传新年庆典活动速通攻略

2025-12-30 14:04

如何在 Go App Engine 项目中正确使用 go get 安装的外部包

2025-12-30 14:07

Go 中自定义结构体的可读性格式化：实现 Stringer 接口实现优雅打印

2025-12-30 14:08

如何精准固定背景上的可交互元素（如悬浮点击区域）

2025-12-30 14:09

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

C++类型转换方式

本专题整合了C++类型转换相关内容，想了解更多相关内容，请阅读专题下面的文章。

290

2025.07.15

php源码安装教程大全

本专题整合了php源码安装教程，阅读专题下面的文章了解更多详细内容。

2025.12.31

php网站源码教程大全

本专题整合了php网站源码相关教程，阅读专题下面的文章了解更多详细内容。

2025.12.31

视频文件格式

本专题整合了视频文件格式相关内容，阅读专题下面的文章了解更多详细内容。

2025.12.31

不受国内限制的浏览器大全

想找真正自由、无限制的上网体验？本合集精选2025年最开放、隐私强、访问无阻的浏览器App，涵盖Tor、Brave、Via、X浏览器、Mullvad等高自由度工具。支持自定义搜索引擎、广告拦截、隐身模式及全球网站无障碍访问，部分更具备防追踪、去谷歌化、双内核切换等高级功能。无论日常浏览、隐私保护还是突破地域限制，总有一款适合你！

2025.12.31