LangChain表达式语言：多链间变量传递与状态管理-Python教程-PHP中文网

LangChain表达式语言：多链间变量传递与状态管理

聖光之護

发布： 2025-08-20 13:26:01

原创

256人浏览过

langchain表达式语言：多链间变量传递与状态管理

本文深入探讨了LangChain表达式语言中跨链变量传递与状态管理的挑战与解决方案。当构建复杂的LLM应用时，常需将原始输入变量与前一链的输出结果一同传递给后续链。文章通过具体代码示例，详细阐述了如何利用operator.itemgetter高效、明确地实现这一目标，确保原始上下文信息在多链流程中得以正确维护，从而构建出逻辑连贯、功能强大的AI应用。

在构建基于大型语言模型（LLM）的复杂应用时，我们经常需要将多个处理步骤（即“链”）串联起来。LangChain的表达式语言提供了一种简洁而强大的方式来定义这些链式操作。然而，一个常见的挑战是如何在这些链之间有效地传递和维护“状态”，特别是当我们需要将原始输入中的某个变量，与前一个链的输出结果，一同作为后续链的输入时。

多链变量传递的挑战

考虑以下场景：我们有一个初始链，它接受一个name作为输入，并生成一个profession。然后，我们希望将这个生成的profession以及原始的name变量，一同传递给第二个链，以便第二个链能够基于这两个信息生成最终的响应。

最初尝试的代码可能如下所示：

from langchain.prompts import PromptTemplate
from langchain.schema import StrOutputParser
from langchain_openai import OpenAI # 推荐使用langchain_openai代替旧的langchain.llms.OpenAI
import dotenv
dotenv.load_dotenv()

# 定义第一个PromptTemplate
prompt1 = PromptTemplate(
  input_variables=["name"],
  template="I am {name}. Choose one profession for me in one word. Say AYYE when you do.",
)

# 定义第二个PromptTemplate
prompt2 = PromptTemplate(
  input_variables=["profession", "name"],
  template="I am a {profession}. Tell me king of pirates, what is my destiny? Refer to me by my given name.",
)

# 初始化LLM
llm = OpenAI()

# 定义第一个链
chain1 = prompt1 | llm | StrOutputParser()

# 尝试定义第二个链，直接引用chain1的输出和原始的name
# 注意：这种方式在没有明确指定如何获取原始输入时，会导致name变量丢失
chain2_problematic = ({"profession": chain1, } | prompt2 | llm | StrOutputParser())

# 尝试调用，预期name无法正确传递
try:
    response_problematic = chain2_problematic.invoke({"name": "Chopper"})
    print("Problematic Chain Response:", response_problematic)
except Exception as e:
    print(f"Error with problematic chain: {e}")
    print("Explanation: The 'name' variable from the initial input was not explicitly passed down to prompt2.")

登录后复制

在上述代码中，当chain2_problematic被调用时，{"profession": chain1}这部分操作会将chain1的输出映射到profession键。然而，原始输入字典中的name键并没有被自动传递到下一个阶段的输入字典中。LangChain表达式语言的设计哲学是明确的输入和输出映射，如果某个变量没有被明确地从前一个阶段的输入中提取出来，它就会丢失。因此，prompt2在执行时将无法找到name变量，导致错误或不符合预期的行为。

解决方案：使用 operator.itemgetter

为了解决这个问题，我们需要明确地告诉LangChain，除了chain1的输出（作为profession），我们还需要从原始输入中获取name变量。operator.itemgetter是Python标准库中的一个实用工具，它能够从一个字典或序列中提取指定键（或索引）的值。在LangChain中，我们可以利用它来精确地从上游的输入字典中“捕获”所需的变量。

飞书多维表格

表格形态的AI工作流搭建工具，支持批量化的AI创作与分析任务，接入DeepSeek R1满血版

查看详情

修改后的chain2定义如下：

from operator import itemgetter # 导入itemgetter

# ... (前面的导入和prompt/llm定义保持不变) ...

# 定义第二个链，使用itemgetter确保原始name变量的传递
chain2_solution = (
    {
        "profession": chain1, # chain1的输出作为profession
        "name": itemgetter("name") # 从原始输入中获取name变量
    }
    | prompt2
    | llm
    | StrOutputParser()
)

# 调用链并验证结果
response_solution = chain2_solution.invoke({"name": "Chopper"})
print("\nSolution Chain Response:", response_solution)

登录后复制

代码解析：

from operator import itemgetter: 导入itemgetter工具。
{"profession": chain1, "name": itemgetter("name")}: 这是解决问题的关键所在。
- "profession": chain1: 这部分保持不变，表示chain1的输出将作为profession键的值传递给prompt2。
- "name": itemgetter("name"): 这行代码告诉LangChain，对于name这个键，它的值应该通过itemgetter("name")从当前可用的输入字典中获取。当chain2_solution.invoke({"name": "Chopper"})被调用时，itemgetter("name")会从{"name": "Chopper"}这个初始输入字典中提取出"Chopper"，并将其作为name的值传递给prompt2。

通过这种方式，prompt2能够同时接收到由chain1生成的profession和原始输入中传递下来的name，从而正确地构建其模板。

注意事项与最佳实践

明确性是关键： LangChain表达式语言鼓励明确的输入/输出映射。当涉及到多链操作时，尤其是需要保留原始输入变量时，务必使用itemgetter或其他类似机制来明确指定变量的来源。
输入/输出模式： 在设计链时，始终清晰地理解每个链的预期输入模式和输出模式。这有助于避免变量丢失或类型不匹配的问题。
调试技巧： 如果遇到变量传递问题，可以在链的中间插入一个简单的RunnableLambda来打印当前的输入字典，这有助于调试和理解数据流。例如：... | RunnableLambda(lambda x: print(x) or x) | ...。
复杂数据结构： 对于更复杂的数据结构，itemgetter同样适用，甚至可以与RunnableParallel、RunnablePassthrough等结合使用，以更灵活地处理输入。
官方文档： LangChain的官方文档（特别是关于表达式语言和Cookbook的部分）是学习和解决此类问题的宝贵资源。建议查阅最新的文档以获取更多高级用法和最佳实践。

总结

在LangChain表达式语言中，跨链传递变量，特别是需要同时保留原始输入和中间结果时，operator.itemgetter提供了一个简洁而强大的解决方案。它通过明确指定变量的来源，确保了数据流的完整性和准确性，从而使我们能够构建出更加健壮和复杂的LLM应用。掌握这一技巧，对于有效地管理LangChain应用中的“状态”至关重要。

以上就是LangChain表达式语言：多链间变量传递与状态管理的详细内容，更多请关注php中文网其它相关文章！