Keras模型输出形状推断：处理可变与特定输入尺寸的专业指南-Python教程-PHP中文网

Keras模型输出形状推断：处理可变与特定输入尺寸的专业指南

本文深入探讨了在keras模型中，如何高效地获取具有可变或特定输入尺寸的输出形状，而无需实际运行数据。通过利用keras的符号执行能力和`kerastensor`对象，我们介绍了两种主要策略：针对初始输入尺寸为`none`的模型，可直接通过新的`input`对象进行形状推断；对于需要固定但不同输入尺寸的模型，则建议采用模型工厂函数动态创建。这些方法极大简化了复杂网络架构的调试与集成工作。

引言：Keras模型输出形状推断的挑战

在构建卷积神经网络（CNN）时，我们经常会遇到需要处理可变输入尺寸的场景。例如，一个模型可能被设计为接受任意高度和宽度的图像，其输入层定义为 keras.layers.Input((None, None, 3))。然而，在实际应用或训练过程中，我们可能需要知道对于一个特定尺寸（如 64x64 或 100x100）的输入，模型的输出形状会是怎样。

传统的做法是生成一个随机样本数据，然后将其输入到模型中，通过检查输出张量的 .shape 属性来获取。例如：

import numpy as np
import keras_core as keras

# 定义一个可变输入尺寸的简单CNN模型
ip = keras.layers.Input((None, None, 3))
op = keras.layers.Conv2D(3, (2, 2))(ip)
model = keras.models.Model(inputs=[ip], outputs=[op])

# 使用样本数据运行模型以获取输出形状
x = np.random.random((1, 64, 64, 3))
y = model(x)
print(f"样本输入形状: {x.shape}")
print(f"样本输出形状: {y.shape}")

登录后复制

这种方法虽然有效，但需要实际运行计算图，这在某些场景下可能效率低下，特别是对于复杂的模型（如ResNet101），或者当我们需要在训练前动态调整地面真值（ground truth）的尺寸时。我们的目标是寻找一种无需实际计算，仅通过符号推断即可获取输出形状的专业方法。

Keras符号执行与KerasTensor

Keras框架在构建模型时，并非立即执行数值计算，而是构建一个计算图。在这个过程中，keras.layers.Input 返回的以及层操作后产生的对象，都是 KerasTensor 类型。KerasTensor 是一个“懒惰”或符号化的张量对象，它不包含实际的数值数据，但携带着重要的元信息，例如其形状（shape）和数据类型（dtype）。

当一个 KerasTensor 流经模型的各个层时，每一层都会根据其操作规则（如卷积的步长、填充等）更新 KerasTensor 的形状信息，而不会执行任何浮点运算。通过检查最终输出 KerasTensor 的 shape 属性，我们就能在不产生计算开销的情况下，得知模型的输出形状。

例如，直接打印一个层操作后的 KerasTensor：

import keras_core as keras

ip = keras.layers.Input((100, 100, 3))
op = keras.layers.Conv2D(3, (5, 5))(ip)

print(op)
# 输出示例: <KerasTensor shape=(None, 96, 96, 3), dtype=float32, sparse=False, name=keras_tensor_39>

登录后复制

从输出中可以看出，即使没有构建完整的模型或运行数据，我们也能看到 op 这个 KerasTensor 的形状信息。

策略一：利用初始可变输入模型进行特定形状推断

当模型最初设计为接受可变输入尺寸（即输入层包含 None 维度）时，Keras提供了一种直接且高效的方式来推断特定输入尺寸下的输出形状。

适用场景： 模型定义时，其 keras.layers.Input 包含 None 维度（例如 (None, None, 3)），这使得模型能够灵活适应不同大小的输入。

方法： 可以直接将模型实例作为函数调用，并传入一个新的 keras.layers.Input 对象，该对象明确指定了你想要推断的特定输入尺寸。Keras将执行符号计算，返回一个代表输出的 KerasTensor，其 shape 属性即为所需。

示例代码：

可图大模型

可图大模型（Kolors）是快手大模型团队自研打造的文生图AI大模型

查看详情

import keras_core as keras

# 1. 定义一个初始输入尺寸为可变（None）的Keras模型
# 注意：输入层的宽度和高度为None，表示可变
ip_flexible = keras.layers.Input((None, None, 3))
op_layer = keras.layers.Conv2D(3, (5, 5))(ip_flexible)
model_flexible = keras.models.Model(inputs=[ip_flexible], outputs=[op_layer])

print("--- 策略一：利用初始可变输入模型进行特定形状推断 ---")

# 2. 使用一个特定输入尺寸的Keras Input对象进行形状推断
# 这里我们想知道输入尺寸为 (100, 100, 3) 时，模型的输出形状
specific_input_tensor = keras.layers.Input((100, 100, 3))
output_tensor_inferred = model_flexible(specific_input_tensor) # 直接调用模型实例

print(f"输入层形状 (推断时使用): {specific_input_tensor.shape}")
print(f"推断出的输出KerasTensor: {output_tensor_inferred}")
print(f"推断出的输出形状: {output_tensor_inferred.shape}")

# 另一个输入尺寸的例子
specific_input_tensor_small = keras.layers.Input((10, 10, 3))
output_tensor_inferred_small = model_flexible(specific_input_tensor_small)
print(f"输入层形状 (推断时使用): {specific_input_tensor_small.shape}")
print(f"推断出的输出形状 (小尺寸): {output_tensor_inferred_small.shape}")

登录后复制

输出示例：

--- 策略一：利用初始可变输入模型进行特定形状推断 ---
输入层形状 (推断时使用): (None, 100, 100, 3)
推断出的输出KerasTensor: <KerasTensor shape=(None, 96, 96, 3), dtype=float32, sparse=False, name=keras_tensor_3>
推断出的输出形状: (None, 96, 96, 3)
输入层形状 (推断时使用): (None, 10, 10, 3)
推断出的输出形状 (小尺寸): (None, 6, 6, 3)

登录后复制

注意事项： 这种方法要求模型最初定义时，其输入层必须包含 None 维度。如果模型定义时输入层是固定尺寸（例如 ip = keras.layers.Input((10, 10, 3))），然后你尝试用不同固定尺寸的 Input 对象去调用它，Keras会抛出形状不匹配的错误，因为模型被视为是为那个特定固定尺寸而构建的。

策略二：通过模型工厂函数创建特定输入尺寸的模型

在某些情况下，我们可能需要为不同的固定输入尺寸创建独立的模型实例。例如，一个模型可能需要针对 10x10 和 100x100 的图像分别进行优化或处理，且每个模型实例的输入尺寸都是固定的。

适用场景： 需要为不同的固定输入尺寸创建和管理多个独立的模型实例，每个实例都针对其特定的输入尺寸进行构建。

方法： 将模型的构建逻辑封装在一个函数中，该函数接受一个 keras.layers.Input 对象作为参数。每次调用此函数时，传入一个带有特定尺寸的 Input 层，即可得到一个针对该尺寸构建的独立模型实例。然后，可以通过检查每个模型实例的 model.output 属性来获取其输出形状。

示例代码：

import keras_core as keras

def create_conv_model(input_tensor):
    """
    创建一个简单的卷积模型，其输入层由传入的 input_tensor 决定。
    """
    output_tensor = keras.layers.Conv2D(3, (5, 5))(input_tensor)
    return keras.models.Model(inputs=[input_tensor], outputs=[output_tensor])

print("\n--- 策略二：通过模型工厂函数创建特定输入尺寸的模型 ---")

# 1. 为小尺寸输入创建模型实例
input_10x10 = keras.layers.Input((10, 10, 3))
model_small = create_conv_model(input_10x10)
print(f"为输入 (10, 10, 3) 创建的模型实例: {model_small.name}")
# model.output 返回一个列表，即使只有一个输出层
print(f"小尺寸模型输出KerasTensor: {model_small.output[0]}")
print(f"小尺寸模型输出形状: {model_small.output[0].shape}")

# 2. 为大尺寸输入创建另一个模型实例
input_100x100 = keras.layers.Input((100, 100, 3))
model_large = create_conv_model(input_100x100)
print(f"\n为输入 (100, 100, 3) 创建的模型实例: {model_large.name}")
print(f"大尺寸模型输出KerasTensor: {model_large.output[0]}")
print(f"大尺寸模型输出形状: {model_large.output[0].shape}")

登录后复制

输出示例：

--- 策略二：通过模型工厂函数创建特定输入尺寸的模型 ---
为输入 (10, 10, 3) 创建的模型实例: functional_1
小尺寸模型输出KerasTensor: <KerasTensor shape=(None, 6, 6, 3), dtype=float32, sparse=False, name=keras_tensor_6>
小尺寸模型输出形状: (None, 6, 6, 3)

为输入 (100, 100, 3) 创建的模型实例: functional_3
大尺寸模型输出KerasTensor: <KerasTensor shape=(None, 96, 96, 3), dtype=float32, sparse=False, name=keras_tensor_8>
大尺寸模型输出形状: (None, 96, 96, 3)

登录后复制

优势： 这种方法提供了更强的封装性和模块化。它允许你根据不同的需求动态地创建和管理多个模型实例，每个实例都精确地匹配其预期的固定输入尺寸。这对于需要处理多尺度输入或在不同场景下部署具有特定输入尺寸模型的应用非常有用。

总结与最佳实践

本文介绍了在Keras中无需实际运行数据即可推断模型输出形状的两种专业策略。这两种方法的核心优势在于它们利用了Keras的符号执行能力和 KerasTensor 对象，从而避免了不必要的计算开销，极大地提高了开发效率和灵活性。

对于初始输入尺寸为 None 的模型： 当模型被设计为处理可变尺寸输入时，可以直接通过将模型实例作为函数调用，并传入一个具有特定尺寸的 keras.layers.Input 对象来推断输出形状。这种方法最为简洁高效。
对于需要固定但不同输入尺寸的模型： 建议使用模型工厂函数。通过封装模型构建逻辑，你可以根据需要动态创建针对特定输入尺寸的独立模型实例，从而更好地管理和组织代码。

理解 KerasTensor 的符号性质是掌握这些技术的关键。这些方法在以下场景中尤其有用：