使用 Polars LazyFrame 进行列级乘法

心靈之曲

发布时间：2025-11-19 15:37:02

734人浏览过

来源于php中文网

原创

使用 polars lazyframe 进行列级乘法

本文介绍了如何使用 Polars 库对两个 LazyFrame 进行列级别的乘法操作。由于直接对 LazyFrame 使用乘法运算符会引发 TypeError，本文提供了一种通过 join 操作和列选择来实现相同目的的有效方法，并附带示例代码。

在使用 Polars 处理大型数据集时，LazyFrame 提供了一种延迟计算的机制，可以显著提高性能。然而，直接对两个 LazyFrame 执行列级别的乘法操作会引发 TypeError。本文将介绍一种使用 join 操作来实现此目的的有效方法。

解决方案：使用 Join 和列选择

由于 Polars 的 LazyFrame 不直接支持 df1 * df2 这种列级别的乘法，我们需要采用一种替代方案。该方案的核心思想是：

为两个 LazyFrame 添加行索引。
使用行索引将两个 LazyFrame 连接起来。
选择连接后的 LazyFrame 中的列，并执行列级别的乘法操作。
收集结果，将 LazyFrame 转换为 DataFrame。

以下是具体的代码示例：

AI发型设计

虚拟发型试穿工具和发型模拟器

下载

import polars as pl
import numpy as np

# 示例数据
n = 10
df1 = pl.DataFrame(data={
    'foo': np.random.uniform(0,127, size= n).astype(np.float64),
    'bar': np.random.uniform(1e3,32767, size= n).astype(np.float64),
    'baz': np.random.uniform(1e6,2147483, size= n).astype(np.float64)
}).lazy()

df2 = pl.DataFrame(data={
    'foo': np.random.uniform(0,127, size= n).astype(np.float64),
    'bar': np.random.uniform(1e3,32767, size= n).astype(np.float64),
    'baz': np.random.uniform(1e6,2147483, size= n).astype(np.float64)
}).lazy()


result = (
    df1.with_row_index()
    .join(df2.with_row_index(), on="index")
    .select(pl.col(col) * pl.col(f"{col}_right") for col in df1.columns)
    .collect()
)

print(result)

代码解释：

df1.with_row_index(): 为 df1 添加一个名为 "index" 的列，作为行索引。
df2.with_row_index(): 为 df2 添加一个名为 "index" 的列，作为行索引。
.join(df2.with_row_index(), on="index"): 使用 "index" 列将 df1 和 df2 连接起来。连接后的 LazyFrame 将包含 df1 的所有列，以及 df2 的所有列，其中 df2 的列名会加上 "_right" 后缀。
.select(pl.col(col) * pl.col(f"{col}_right") for col in df1.columns): 选择连接后的 LazyFrame 中的列，并执行列级别的乘法操作。对于 df1 中的每一列 col，我们将其与 df2 中对应的列 col_right 相乘。
.collect(): 将 LazyFrame 转换为 DataFrame，并执行计算。

注意事项：

此方法依赖于两个 LazyFrame 具有相同的行数和顺序。
如果两个 LazyFrame 的列名不同，需要相应地调整 select 语句中的列名。
此方法适用于列级别运算，不仅仅是乘法，可以替换为加法、减法、除法等其他运算。

总结：

虽然 Polars 的 LazyFrame 不直接支持列级别的乘法操作，但我们可以通过 join 操作和列选择来实现相同的目的。这种方法不仅有效，而且可以充分利用 LazyFrame 的延迟计算特性，提高性能。通过为 LazyFrame 添加索引，进行 join 操作，并使用 select 方法进行列级运算，可以有效地解决 LazyFrame 无法直接进行列级乘法的问题。这种方法保持了 LazyFrame 的延迟计算优势，适用于处理大型数据集。

相关标签:

运算符 for select

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：NumPy高效切片：无循环处理变长起始/结束索引的技巧下一篇：PyMC模型中自定义对数似然的性能优化：兼论JAX兼容性与数学表达式重构

作者最新文章

如何找出两个DataFrame中键列相同但值列发生变化的行

2026-01-12 15:30

网易云音乐怎么更改歌曲缓存目录

2026-01-12 15:50

标题：如何识别并标记日期数组中被多次占用的同一天（如入住与退房重叠日）

2026-01-12 15:53

恶魔秘境角斗之王冒险打法攻略

2026-01-12 15:53

winrar如何关闭声音

2026-01-12 15:57

PHP 中对象赋值默认为引用：理解 clone 的必要性

2026-01-12 15:57

抖音企业号白名单怎么弄？有什么用途？

2026-01-12 16:03

实现下拉选项值自动填充到文本域

2026-01-12 16:06

陷阱大师陷阱类别介绍与搭配攻略

2026-01-12 16:09

外媒安利种田新游《星砂岛》定档2026 Q1：融合《动森》与《星露谷》要素主打动态社交

2026-01-12 16:10

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1463

2023.10.24

Go语言中的运算符有哪些

Go语言中的运算符有：1、加法运算符；2、减法运算符；3、乘法运算符；4、除法运算符；5、取余运算符；6、比较运算符；7、位运算符；8、按位与运算符；9、按位或运算符；10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

228

2024.02.23

php三元运算符用法

本专题整合了php三元运算符相关教程，阅读专题下面的文章了解更多详细内容。

2025.10.17

Java 项目构建与依赖管理（Maven / Gradle）

本专题系统讲解 Java 项目构建与依赖管理的完整体系，重点覆盖 Maven 与 Gradle 的核心概念、项目生命周期、依赖冲突解决、多模块项目管理、构建加速与版本发布规范。通过真实项目结构示例，帮助学习者掌握从零搭建、维护到发布 Java 工程的标准化流程，提升在实际团队开发中的工程能力与协作效率。

2026.01.12