
本文探讨了在`asyncio`中处理嵌套异步生成器时,如何通过传统`await`模式导致的串行执行问题。针对`await`的阻塞特性,文章提出并详细阐述了利用`asyncio.queue`和`asyncio.event`构建生产者-消费者模式的解决方案,从而实现任务间的解耦和真正的并发执行,显著提升异步应用的效率和响应性。
在asyncio编程中,await关键字是调度协程的核心机制。当一个协程遇到await表达式时,它会暂停自身的执行,将控制权交还给事件循环,并等待被await的协程完成。一旦被await的协程完成并返回结果,原协程才会从暂停点继续执行。这种机制虽然实现了协作式多任务,但如果设计不当,也可能导致非预期的串行执行。
考虑以下场景:一个异步任务(main)需要从一个异步生成器(sentences_generator)获取数据,然后将数据传递给另一个异步任务(process_sentence)进行处理。如果main函数在每次获取到数据后,都直接await process_sentence的完成,那么在process_sentence执行期间,sentences_generator将无法继续生成新的数据。这违背了我们期望的并发处理,即当process_sentence在处理当前数据时,sentences_generator应该能够同时准备下一批数据。
以下是原始代码示例及其输出,展示了这种串行阻塞行为:
import asyncio
async def stream():
char_string = "Hi. Hello. Hello."
for char in char_string:
await asyncio.sleep(0.1) # 模拟耗时操作
print("got char:", char)
yield char
async def sentences_generator():
sentence = ""
async for char in stream():
sentence += char
if char in [".", "!", "?"]:
print("got sentence: ", sentence)
yield sentence
sentence = ""
async def process_sentence(sentence: str):
print("waiting for processing sentence: ", sentence)
await asyncio.sleep(len(sentence)*0.1) # 模拟耗时处理
print("sentence processed!")
async def main():
i=0
async for sentence in sentences_generator():
print("processing sentence: ", i)
await process_sentence(sentence) # 这里的await导致阻塞
i += 1
# asyncio.run(main())原始输出示例:
got char: H got char: i got char: . got sentence: Hi. processing sentence: 0 waiting for processing sentence: Hi. sentence processed! got char: got char: H got char: e got char: y got char: . got sentence: Hey. processing sentence: 1 waiting for processing sentence: Hey. sentence processed! ...
从输出可以看出,只有当process_sentence完全处理完一个句子后,stream和sentences_generator才能继续生成下一个字符和句子。这并不是我们期望的并发效果。
为了实现真正的并发,我们需要解耦数据的生产和消费过程,使它们能够独立运行。asyncio.Queue是实现这种生产者-消费者模式的理想工具。
核心思想:
此外,为了实现优雅的关闭和通知消费者数据已全部生产完毕,我们可以引入asyncio.Event。生产者在完成所有数据生产后设置Event,消费者则可以结合队列是否为空和Event状态来判断何时停止。
我们将修改sentences_generator作为生产者,将生成的句子放入队列;process_sentence作为消费者,从队列中取出句子进行处理。main函数将负责启动这两个独立的协程。
import asyncio
# 定义全局变量用于计数,方便观察
i = 1
async def stream():
char_string = "Hi. Hello. Thank you." # 增加一些内容以更好地展示并发
for char in char_string:
await asyncio.sleep(0.1) # 模拟耗时操作
print("got char:", char)
yield char
async def sentences_generator(q: asyncio.Queue[str], flag: asyncio.Event):
"""
生产者协程:从字符流生成句子,并放入队列。
当所有句子生成完毕后,设置flag通知消费者。
"""
sentence = ""
async for char in stream():
sentence += char
if char in [".", "!", "?"]:
print("got sentence: ", sentence)
await q.put(sentence) # 将生成的句子放入队列
sentence = ""
# 确保最后一个不以标点符号结尾的句子也被处理(如果需要)
if sentence:
print("got sentence: ", sentence)
await q.put(sentence)
flag.set() # 生产完毕,设置事件标志
async def process_sentence(q: asyncio.Queue[str], flag: asyncio.Event):
"""
消费者协程:从队列中获取句子并进行处理。
当队列为空且生产者已设置flag时,停止消费。
"""
global i
while True:
# 检查是否应该停止:队列为空且生产者已完成
if q.empty() and flag.is_set():
break
# 尝试从队列获取项目,如果队列为空则等待
item = await q.get()
print("processing sentence: ", i)
print("waiting for processing sentence: ", item)
await asyncio.sleep(len(item) * 0.1) # 模拟耗时处理
print("sentence processed!")
q.task_done() # 通知队列此任务已完成
i += 1
async def main():
global i
i = 1 # 重置计数器
event = asyncio.Event() # 用于生产者通知消费者结束
queue = asyncio.Queue[str]() # 生产者和消费者之间的通信队列
# 启动生产者和消费者作为独立的协程任务
producer_task = asyncio.create_task(sentences_generator(queue, event))
consumer_task = asyncio.create_task(process_sentence(queue, event))
# 等待所有任务完成
await asyncio.gather(producer_task, consumer_task)
# 可选:等待队列中所有任务被标记为完成,确保所有数据都被处理
await queue.join()
asyncio.run(main())预期输出示例:
got char: H got char: i got char: . got sentence: Hi. got char: got char: H processing sentence: 1 waiting for processing sentence: Hi. got char: e got char: l got char: l got char: o got char: . got sentence: Hello. sentence processed! got char: got char: T processing sentence: 2 waiting for processing sentence: Hello. got char: h got char: a got char: n got char: k got char: got char: y got char: o got char: u got char: . got sentence: Thank you. sentence processed! processing sentence: 3 waiting for processing sentence: Thank you. sentence processed!
从这个输出可以看出,当process_sentence正在处理第一个句子时,stream和sentences_generator已经继续生成了后续的字符和句子,并将其放入队列。这正是我们期望的并发行为。
通过将异步任务分解为独立的生产者和消费者,并利用asyncio.Queue进行通信,我们成功地将原本串行执行的逻辑转换为了并发执行。这种模式不仅提高了资源利用率,也使得代码结构更加清晰,易于维护和扩展。在设计复杂的asyncio应用时,当存在数据流动的依赖但又希望实现任务并行时,生产者-消费者模式与asyncio.Queue是解决这类问题的强大工具。
以上就是优化asyncio中嵌套异步任务的并发调度的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号