答案:优化I/O密集型程序需减少等待时间并提高并发效率。示例中,同步下载多个网页时,传统方式逐个请求导致I/O空闲;采用异步I/O(asyncio + aiohttp)可在等待响应时发起其他请求,提升吞吐量;使用多线程(ThreadPoolExecutor)则适合阻塞式操作或不支持异步的场景。关键点包括避免串行等待、选择合适并发模型、控制并发规模及复用连接以降低开销。

处理I/O密集型程序时,核心瓶颈通常不在CPU计算能力,而在于等待输入输出操作完成的时间。这类程序常见于文件读写、网络请求、数据库访问等场景。优化的关键是减少等待时间、提高并发效率。下面通过一个实际示例说明如何优化。
假设我们需要从多个URL抓取网页内容,使用传统的同步方式:
import requests <p>def fetch_urls_sync(urls): results = [] for url in urls: response = requests.get(url) results.append(response.text) return results</p>
这种方式每次请求都要等待前一个完成,I/O空闲时间长,整体效率低。
通过异步编程,可以在等待某个请求响应的同时发起其他请求,大幅提升吞吐量。
import asyncio import aiohttp <p>async def fetch_url(session, url): async with session.get(url) as response: return await response.text()</p><p>async def fetch_urls_async(urls): async with aiohttp.ClientSession() as session: tasks = [fetch_url(session, url) for url in urls] return await asyncio.gather(*tasks)</p><h1>调用</h1><h1>results = asyncio.run(fetch_urls_async(urls))</h1>
这种方法利用事件循环,在单线程中高效管理多个I/O任务,避免线程开销,适合高并发网络请求。
对于不支持异步的库或复杂兼容场景,可采用线程池实现并发请求。
from concurrent.futures import ThreadPoolExecutor import requests <p>def fetch_url_thread(url): response = requests.get(url) return response.text</p><p>def fetch_urls_threaded(urls, max_workers=10): with ThreadPoolExecutor(max_workers=max_workers) as executor: return list(executor.map(fetch_url_thread, urls))</p>
每个请求在独立线程中执行,主线程不再阻塞。适用于阻塞式I/O操作,但注意线程数量不宜过多,避免系统资源耗尽。
针对I/O密集型任务,优化方向明确:
基本上就这些。关键是理解I/O等待的本质,并用并发手段填补空闲时间,从而显著提升程序响应速度和吞吐能力。
以上就是I/O密集型程序优化示例的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号