讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

如何使用 NumPy 高效移除零方差列

碧海醫心

发布时间：2025-12-31 13:27:39

|

742人浏览过

|

来源于php中文网

原创

如何使用 NumPy 高效移除零方差列

本文介绍如何用一行简洁的 numpy 代码识别并删除数组中所有方差为零（即所有非 nan 值完全相同）的列，同时正确处理含 nan 的情况。

在数据预处理中，常需剔除无信息量的列——例如全为同一数值（如全为 10）、或仅含缺失值与同一常数的列。这类列的方差为 0，对模型训练无贡献，甚至可能引发数值不稳定。NumPy 提供了高效向量化方案，无需显式循环。

核心方法是利用 np.var() 沿列方向（axis=0）计算方差，并结合布尔索引筛选：

import numpy as np

X = np.array([[1, 10, np.nan, 0],
              [2, 10, np.nan, 0],
              [3, 10, np.nan, 0]])

# 一步移除零方差列（自动跳过 NaN，仅基于有效值计算方差）
X_filtered = X[:, np.var(X, axis=0, ddof=0) != 0]
print(X_filtered)

输出：

[[ 1. nan]
 [ 2. nan]
 [ 3. nan]]

✅ 关键说明：

Endel.io

Endel.io

Endel是一款可以创造个性化舒缓声音的应用程序，可帮助您集中注意力、放松身心和入睡。

下载

np.var(X, axis=0) 默认忽略 NaN（需确保使用较新 NumPy 版本；若遇 nan 传播问题，可改用 np.nanvar(X, axis=0) 更显式）；
ddof=0（默认）表示总体方差；若需样本方差，设 ddof=1，但判断是否为 0 时结果一致；
该操作不改变原数组，返回视图或副本（取决于底层内存布局），建议显式赋值；
零方差列包含：全相同数值列（如第 2 列全为 10）、全 NaN 列（方差为 nan，nan != 0 为 False，故不会被保留——需注意！）。

⚠️ 重要提醒：np.var() 对全 NaN 列返回 nan，而 nan != 0 恒为 False，因此上述代码不会保留全 NaN 列——这通常符合预期。但若需显式控制 NaN 列行为，推荐组合使用：

# 更鲁棒的写法：显式排除全 NaN 列 + 零方差列
valid_mask = ~(np.all(np.isnan(X), axis=0) | (np.nanvar(X, axis=0) == 0))
X_filtered = X[:, valid_mask]

综上，X[:, np.nanvar(X, axis=0) != 0] 是兼顾简洁性、可读性与健壮性的首选方案，适用于绝大多数真实场景的数据清洗任务。

相关文章

Python数据标准化处理_zscore与minmax对比【指导】

PythonSeaborn统计可视化教程_分类与回归图表实践

Python日志分析与可视化_ELK日志管道与图表展示

Python全栈项目开发进阶教程_FrontendBackend完整项目

PythonMatplotlib动画制作教程_动态可视化实例讲解

相关标签:

数据清洗 red numpy 循环 var

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在Pandas中按多列分组计算并广播结果到原始DataFrame的每一行下一篇：Python区块链数据分析进阶教程_链上数据处理与可视化

作者最新文章

Laravel Sail 数据库驱动错误解决方案（Mac M1/M2 环境）

2025-12-27 21:21

JAX梯度计算中链式布尔表达式的正确写法

2025-12-27 22:13

如何在 Vaadin 23 中监听页面后退操作并弹出确认对话框

2025-12-27 22:21

如何在 Pipfile 中正确引用本地 Git 仓库的指定分支

2025-12-27 22:46

如何在 Go 中正确使用 exec.Command 调用 awk 命令

2025-12-27 22:52

如何在 Go 中实现 SoundCloud 音频流播放

2025-12-27 23:01

如何在 Vaadin 23 中拦截浏览器后退按钮并显示确认对话框

2025-12-27 23:04

如何在 Pipfile 中正确引用本地 Git 仓库的特定分支

2025-12-27 23:05

如何仅用纯 CSS 实现 HTML 多语言切换（无需 JavaScript）

2025-12-27 23:31

如何通过点击将列表项移至顶部

2025-12-27 23:52

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

更多

vlookup函数使用大全

vlookup函数使用大全

本专题整合了vlookup函数相关教程，阅读专题下面的文章了解更多详细内容。

26

2025.12.30

金山文档相关教程

金山文档相关教程

本专题整合了金山文档相关教程，阅读专题下面的文章了解更多详细操作。

28

2025.12.30

PS反选快捷键

PS反选快捷键

本专题整合了ps反选快捷键介绍，阅读下面的文章找到答案。

25

2025.12.30

表格中一行两行的方法

表格中一行两行的方法

本专题整合了表格中一行两行的相关教程，阅读专题下面的文章了解更多详细内容。

3

2025.12.30

cpu温度过高解决方法大全

cpu温度过高解决方法大全

本专题整合了cpu温度过高相关教程，阅读专题下面的文章了解更多详细内容。

5

2025.12.30

ASCII码介绍

ASCII码介绍

本专题整合了ASCII码相关内容，阅读专题下面的文章了解更多详细内容。

31

2025.12.30

GPS是什么

GPS是什么

本专题整合了GPS相关内容，阅读专题下面的文章了解更多详细内容。

3

2025.12.30

wifi拒绝接入

wifi拒绝接入

本专题整合了wifi拒绝接入相关教程，阅读下面的文章了解更多详细方法。

9

2025.12.30

丰网速运介绍

丰网速运介绍

本专题整合了丰网速运查询入口以及相关内容，阅读专题下面的文章了解更多内容。

3

2025.12.30

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

PostgreSQL 教程

PostgreSQL 教程

共48课时 | 6.3万人学习

Django 教程

Django 教程

共28课时 | 2.6万人学习

Excel 教程

Excel 教程

共162课时 | 10.1万人学习

最新文章

更多

如何在 Pandas 中正确计算含 NaN 值的加权平均（自动忽略无效权重）

如何使用 CCXT 在 Bybit 上开平仓做空（Short）头寸

如何使用 NumPy 高效删除零方差列

JAX GPU内存竞争导致的XLA运行时错误：多进程并发训练的正确配置方案

如何使用 CCXT 在 Bybit 上开仓与平仓空头头寸

如何在Python中高效构建基于随机生成与条件筛选的列表

PythonTensorFlow实践教程_模型训练与推理详解

Python人脸识别项目教程_dlibOpenCV训练与检测案例

如何在 Python 中高效生成并筛选随机键值对列表

Python日期时间进阶教程_时区转换与日期运算实践

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部