
在构建基于大型语言模型(LLM)的复杂应用时,我们经常需要将多个处理步骤(即“链”)串联起来。LangChain的表达式语言提供了一种简洁而强大的方式来定义这些链式操作。然而,一个常见的挑战是如何在这些链之间有效地传递和维护“状态”,特别是当我们需要将原始输入中的某个变量,与前一个链的输出结果,一同作为后续链的输入时。
考虑以下场景:我们有一个初始链,它接受一个name作为输入,并生成一个profession。然后,我们希望将这个生成的profession以及原始的name变量,一同传递给第二个链,以便第二个链能够基于这两个信息生成最终的响应。
最初尝试的代码可能如下所示:
from langchain.prompts import PromptTemplate
from langchain.schema import StrOutputParser
from langchain_openai import OpenAI # 推荐使用langchain_openai代替旧的langchain.llms.OpenAI
import dotenv
dotenv.load_dotenv()
# 定义第一个PromptTemplate
prompt1 = PromptTemplate(
input_variables=["name"],
template="I am {name}. Choose one profession for me in one word. Say AYYE when you do.",
)
# 定义第二个PromptTemplate
prompt2 = PromptTemplate(
input_variables=["profession", "name"],
template="I am a {profession}. Tell me king of pirates, what is my destiny? Refer to me by my given name.",
)
# 初始化LLM
llm = OpenAI()
# 定义第一个链
chain1 = prompt1 | llm | StrOutputParser()
# 尝试定义第二个链,直接引用chain1的输出和原始的name
# 注意:这种方式在没有明确指定如何获取原始输入时,会导致name变量丢失
chain2_problematic = ({"profession": chain1, } | prompt2 | llm | StrOutputParser())
# 尝试调用,预期name无法正确传递
try:
response_problematic = chain2_problematic.invoke({"name": "Chopper"})
print("Problematic Chain Response:", response_problematic)
except Exception as e:
print(f"Error with problematic chain: {e}")
print("Explanation: The 'name' variable from the initial input was not explicitly passed down to prompt2.")
在上述代码中,当chain2_problematic被调用时,{"profession": chain1}这部分操作会将chain1的输出映射到profession键。然而,原始输入字典中的name键并没有被自动传递到下一个阶段的输入字典中。LangChain表达式语言的设计哲学是明确的输入和输出映射,如果某个变量没有被明确地从前一个阶段的输入中提取出来,它就会丢失。因此,prompt2在执行时将无法找到name变量,导致错误或不符合预期的行为。
为了解决这个问题,我们需要明确地告诉LangChain,除了chain1的输出(作为profession),我们还需要从原始输入中获取name变量。operator.itemgetter是Python标准库中的一个实用工具,它能够从一个字典或序列中提取指定键(或索引)的值。在LangChain中,我们可以利用它来精确地从上游的输入字典中“捕获”所需的变量。
修改后的chain2定义如下:
from operator import itemgetter # 导入itemgetter
# ... (前面的导入和prompt/llm定义保持不变) ...
# 定义第二个链,使用itemgetter确保原始name变量的传递
chain2_solution = (
{
"profession": chain1, # chain1的输出作为profession
"name": itemgetter("name") # 从原始输入中获取name变量
}
| prompt2
| llm
| StrOutputParser()
)
# 调用链并验证结果
response_solution = chain2_solution.invoke({"name": "Chopper"})
print("\nSolution Chain Response:", response_solution)代码解析:
通过这种方式,prompt2能够同时接收到由chain1生成的profession和原始输入中传递下来的name,从而正确地构建其模板。
在LangChain表达式语言中,跨链传递变量,特别是需要同时保留原始输入和中间结果时,operator.itemgetter提供了一个简洁而强大的解决方案。它通过明确指定变量的来源,确保了数据流的完整性和准确性,从而使我们能够构建出更加健壮和复杂的LLM应用。掌握这一技巧,对于有效地管理LangChain应用中的“状态”至关重要。
以上就是LangChain表达式语言:多链间变量传递与状态管理的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号