MNIST手写数字分类：像素归一化后训练精度低，是哪个步骤出了问题？-Python教程-PHP中文网

MNIST手写数字分类：像素归一化后训练精度低，是哪个步骤出了问题？

花韻仙語

发布： 2025-03-12 08:34:01

原创

960人浏览过

mnist手写数字分类：像素归一化后训练精度低，是哪个步骤出了问题？

MNIST手写数字分类：像素归一化后精度骤降的原因及修复

在使用TensorFlow进行MNIST手写数字分类时，许多开发者遇到一个难题：对图像进行像素归一化处理后，模型训练精度异常低下。本文将深入分析此问题，并提供有效的解决方案。

问题描述：

一个简单的TensorFlow线性模型用于MNIST数据集分类。对图像像素进行归一化（除以255.0）后，训练精度极低，接近随机猜测。

代码片段（问题代码）：

# ... (导入包和超参数设置) ...

# ... (下载数据集并归一化) ...
train_img /= 255.0
test_img /= 255.0

# ... (定义占位符和变量) ...

y_pred = tf.nn.softmax(tf.matmul(x, w) + b) # 问题所在

# ... (定义损失函数、优化器和准确率) ...

# ... (训练过程) ...

登录后复制

问题根源分析：

慧中标AI标书

慧中标AI标书是一款AI智能辅助写标书工具。

295

查看详情

核心问题在于 y_pred = tf.nn.softmax(tf.matmul(x, w) + b) 这一行。tf.nn.softmax 计算softmax概率，期望输入的是logits（未归一化的分数），而非已归一化的概率。原代码在计算y_pred时提前应用了softmax，导致tf.nn.softmax_cross_entropy_with_logits 函数输入不符合预期，从而导致梯度下降失效，精度极低。

解决方案：

将softmax函数的应用延迟到计算准确率阶段。修改后的代码如下：

# ... (导入包和超参数设置，数据集加载及归一化) ...

# ... (定义占位符和变量) ...

y_pred = tf.matmul(x, w) + b # 去除softmax

# ... (定义损失函数，优化器) ...

correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(tf.nn.softmax(y_pred), 1)) # 在此处应用softmax
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

# ... (训练过程) ...

登录后复制

通过移除y_pred计算中的tf.nn.softmax，确保tf.nn.softmax_cross_entropy_with_logits 函数接收的是logits，从而正确计算损失函数并进行梯度下降。在计算准确率时再应用softmax，将logits转换为概率。这修复了由于不正确的softmax应用导致的梯度计算错误。

通过以上修改，模型应该能够在像素归一化后正常训练，并达到预期的精度。记住，tf.nn.softmax_cross_entropy_with_logits 期望输入logits，而不是softmax概率。

以上就是MNIST手写数字分类：像素归一化后训练精度低，是哪个步骤出了问题？的详细内容，更多请关注php中文网其它相关文章！