Keras二分类模型预测单一类别问题分析与解决策略

聖光之護

发布时间：2025-11-21 13:30:39

680人浏览过

来源于php中文网

原创

Keras二分类模型预测单一类别问题分析与解决策略

本文旨在解决keras二分类模型在平衡数据集上始终预测单一类别的问题。文章深入分析了数据中可能缺乏底层相关性、特征复杂性以及模型选择不当等潜在原因。我们提供了一套全面的解决策略，包括强化探索性数据分析（eda）、优先尝试传统统计模型以验证特征有效性、精细化特征工程，以及在数据理解基础上优化深度学习模型的实用建议，旨在帮助开发者构建更鲁棒、准确的分类器。

当Keras构建的二分类模型在训练后始终预测单一类别时，这是一个常见的、令人困扰的问题，即使数据集本身是平衡的。这种现象表明模型未能从数据中学习到有效的区分模式，而是采取了最保守的策略——总是输出训练集中损失最小的那个类别。

问题复现与初步分析

开发者遇到的问题是，一个用于预测“销售额”（sales）的Keras神经网络模型，在经过训练后，其混淆矩阵显示所有预测都集中在“Negative”（或类别0）上，即True Positives (TP) 和 False Positives (FP) 均为零。这意味着模型完全无法识别正类别。

开发者采取了以下典型步骤：

数据准备：

九歌
九歌--人工智能诗歌写作系统

下载
- 将sales列二值化（False或True），并使用LabelEncoder对类别和布尔类型特征进行编码。
- 将accessed_date时间戳转换为浮点数。
- 分离特征（X）和目标（Y），并对X进行Normalizer标准化处理。
```
import numpy as np
import pandas as pd
from sklearn.preprocessing import LabelEncoder, Normalizer
from sklearn.model_selection import train_test_split
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout
from tensorflow.keras.initializers import he_normal
```
假设 purchase_data 已加载

data = purchase_data.copy() labelencoder = LabelEncoder() target_sum = 120 data.loc[data['sales'] target_sum, 'sales'] = True

编码类别和布尔特征

for col in data.columns.values.tolist(): if data[col].dtype == "object" or data[col].dtype == "bool": data[col] = labelencoder.fit_transform(data[col])

转换日期时间

data['accessed_date'] = data['accessed_date'].apply(lambda x: x.timestamp())

分离特征和目标

array = data.values class_column = 'sales' X = np.delete(array, data.columns.get_loc(class_column), axis=1) Y = array[:,data.columns.get_loc(class_column)] Y = Y[:, np.newaxis] # 调整Y的形状以适应Keras

标准化输入特征

scaler = Normalizer().fit(X) X = scaler.transform(X)
数据集划分：
- 使用train_test_split将数据划分为训练集和测试集，并设置stratify=Y以确保训练集和测试集中的类别分布与原始数据保持一致。
```
seed = 1
X_train, X_test, Y_train, Y_
```

Python GIL 到底限制了什么？

Python 如何判断当前文件是否被作为主模块运行（main）

fastapi 如何实现 token 刷新机制（不使用 jwt 库）

fastapi 如何让一个 endpoint 支持同步和异步两种实现

如何在 pyzipcode 中安全地处理无效邮编错误

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：使用 Python lxml 库精准筛选不含特定属性的 XML 元素下一篇：Python多目标优化：智能座位分配与资源调度策略

作者最新文章

如何安全移除 Elementor 生成的 HTML 标签，仅保留内部文本内容

2026-01-16 22:04

如何在 Cypress 中正确处理外部文件下载而不导致测试卡死

2026-01-16 22:19

标题：将评分范围按不等长区间划分并映射到消息数组的高效算法实现

2026-01-16 22:19

如何实现 HTML 下拉菜单中的嵌套子菜单（二级下拉）

2026-01-16 22:29

Cypress 中正确处理文件下载的完整实践指南

2026-01-16 22:32

如何在 Go 程序中正确使用 os/exec 调用 go build 命令

2026-01-16 22:35

如何在 Go Web 应用中正确托管 CSS 文件并解决 404 错误

2026-01-16 22:40

如何在 Go Web 应用中正确托管 CSS 静态资源避免 404 错误

2026-01-16 22:40

标题：装饰器模式的适用边界与类型兼容性约束

2026-01-16 22:59

如何使用 cURL 正确发送 JSON 数据到 PHP 接口

2026-01-16 23:36

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词，用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章，供大家免费阅读。

745

2023.08.22

lambda表达式

Lambda表达式是一种匿名函数的简洁表示方式，它可以在需要函数作为参数的地方使用，并提供了一种更简洁、更灵活的编码方式，其语法为“lambda 参数列表: 表达式”，参数列表是函数的参数，可以包含一个或多个参数，用逗号分隔，表达式是函数的执行体，用于定义函数的具体操作。本专题为大家提供lambda表达式相关的文章、下载、课程内容，供大家免费下载体验。

204

2023.09.15