
本文旨在提供在 Polars DataFrame 中高效复制行的实用方法。通过 repeat_by() 和 flatten() 函数的组合使用,可以简洁高效地实现行的复制,避免了使用 map_elements() 和类型转换可能出现的错误。本文将详细介绍如何使用这两种方法,并提供示例代码,帮助读者快速掌握该技巧。
在数据处理过程中,有时需要复制 DataFrame 中的行。在 Pandas 中,可以使用 apply() 和 explode() 函数来实现。然而,在 Polars 中,我们可以使用更高效的方法来实现相同的目标。
使用 repeat_by() 和 flatten() 函数
Polars 提供了 repeat_by() 和 flatten() 函数,可以方便地复制 DataFrame 中的行。repeat_by() 函数可以根据指定的次数重复每一行的值,而 flatten() 函数可以将嵌套的列表展开。
以下是一个示例代码:
import polars as pl
df = pl.DataFrame({ "key": [1, 2, 3], "value": [4, 5, 6] })
result = df.select(pl.all().repeat_by(2).flatten())
print(result)代码解释:
输出结果:
shape: (6, 2) ┌─────┬───────┐ │ key ┆ value │ │ --- ┆ --- │ │ i64 ┆ i64 │ ╞═════╪═══════╡ │ 1 ┆ 4 │ │ 1 ┆ 4 │ │ 2 ┆ 5 │ │ 2 ┆ 5 │ │ 3 ┆ 6 │ │ 3 ┆ 6 │ └─────┴───────┘
注意事项:
总结:
使用 repeat_by() 和 flatten() 函数是 Polars DataFrame 中复制行的有效方法。这种方法简洁高效,避免了使用 map_elements() 和类型转换可能出现的错误。通过掌握这种技巧,可以提高数据处理的效率。
以上就是Polars DataFrame 中高效复制行的实用指南的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号