
本文深入探讨kotlin协程中`async`与`await`的并发行为。通过具体示例,揭示了在表达式中直接调用`await`可能导致协程串行执行而非并行,原因在于运算符的求值顺序。文章强调了在启动所有并发任务后统一等待结果的重要性,以确保真正的并行执行,从而有效提升应用程序性能。
引言:Kotlin协程与并发
Kotlin协程为现代异步编程提供了强大且轻量级的解决方案。它允许开发者以同步的方式编写异步代码,极大地提高了代码的可读性和可维护性。在协程中,我们经常需要执行多个耗时任务并等待它们全部完成,这时async和await这两个函数就显得尤为重要。async用于启动一个并发的协程并返回一个Deferred对象,而await则用于挂起当前协程,直到Deferred对象的结果可用。
然而,对async和await的错误使用方式,尤其是涉及到运算符求值顺序时,可能会导致本应并行的任务最终以串行方式执行,从而无法达到预期的性能优化效果。
async与await基础
在深入探讨并发行为之前,我们先定义两个模拟耗时操作的挂起函数:
suspend fun doSomethingUsefulOne(): Int {
delay(3000L) // 模拟耗时3秒
return 20
}
suspend fun doSomethingUsefulTwo(): Int {
delay(3000L) // 模拟耗时3秒
return 10
}这两个函数各自需要3秒钟才能完成并返回一个整数值。我们的目标是并行执行它们,并在它们都完成后获取它们的总和。
实现并行任务的正确姿势
为了实现真正的并行执行,我们应该在所有并发任务都启动后,再统一等待它们的结果。以下是正确的实现方式:
import kotlinx.coroutines.*
fun main() = runBlocking {
val a = async { doSomethingUsefulOne() } // 启动第一个任务
val b = async { doSomethingUsefulTwo() } // 启动第二个任务
// 两个任务几乎同时开始执行
// 此时,a和b都是Deferred对象,代表了未来的结果
val result = a.await() + b.await() // 等待并获取结果
println("总和: $result")
}执行分析:
本文档主要讲述的是用Apache Spark进行大数据处理——第一部分:入门介绍;Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。 在这个Apache Spark文章系列的第一部分中,我们将了解到什么是Spark,它与典型的MapReduce解决方案的比较以及它如何为大数据处理提供了一套完整的工具。希望本文档会给有需要的朋友带来帮助;感
- val a = async { doSomethingUsefulOne() }:这个语句会立即启动一个协程,并在后台开始执行doSomethingUsefulOne()。由于async是非阻塞的,它会立即返回一个Deferred
对象给变量a,而不会等待doSomethingUsefulOne()完成。 - val b = async { doSomethingUsefulTwo() }:紧接着,这个语句也会立即启动另一个协程,并在后台开始执行doSomethingUsefulTwo()。同样,它也会立即返回一个Deferred
对象给变量b。 - 此时,doSomethingUsefulOne()和doSomethingUsefulTwo()这两个任务几乎是同时开始执行的。
- a.await() + b.await():当代码执行到这里时,它会首先调用a.await()。如果doSomethingUsefulOne()尚未完成,当前协程会挂起,直到它完成并返回结果。一旦a.await()返回,它会接着调用b.await()。由于doSomethingUsefulTwo()也是在后台并行运行的,很可能在a.await()等待期间,b也已经完成了或者接近完成了。
- 最终,整个操作的耗时大约为3秒(取决于两个任务中较长的一个)。
警惕:运算符求值顺序带来的陷阱
现在,让我们看看一个常见的误用模式,它会导致任务串行执行:
import kotlinx.coroutines.*
fun main() = runBlocking {
val result = async { doSomethingUsefulOne() }.await() + async { doSomethingUsefulTwo() }.await()
println("总和: $result")
}执行分析: 这段代码的执行耗时大约为6秒,而不是我们期望的3秒。这是因为Kotlin中的运算符(如+、-、*、/以及逻辑运算符&&、||等)遵循严格的求值顺序:左侧操作数必须完全求值完毕后,才会开始求值右侧操作数。
具体到上述代码:
- async { doSomethingUsefulOne() }.await():这是加法运算符的左侧操作数。
- 首先,async { doSomethingUsefulOne() }被执行,启动一个协程。
- 紧接着,.await()被调用。由于doSomethingUsefulOne()需要3秒才能完成,当前协程会在这里挂起整整3秒,等待第一个任务完成并返回结果。
-
只有在第一个await()返回(即3秒后),加法运算符的右侧操作数async { doSomethingUsefulTwo() }.await()才开始求值。
- async { doSomethingUsefulTwo() }被执行,启动第二个协程。
- 紧接着,.await()被调用。同样,当前协程会再次挂起3秒,等待第二个任务完成并返回结果。
- 最终,两个3秒的挂起时间是串联发生的,导致总耗时为3秒 + 3秒 = 6秒。
类比说明: 这种行为类似于编程语言中逻辑运算符的短路求值。例如,在someConditionA() || someConditionB()这个表达式中,如果someConditionA()返回true,那么someConditionB()将永远不会被执行,因为整个表达式的结果已经确定。同样,在我们的协程例子中,+运算符要求左侧的值完全确定后,才会去计算右侧的值。
最佳实践:先启动后等待
为了确保协程能够真正地并行执行,并充分利用多核处理器的优势,最佳实践是:
- 先启动所有需要并发执行的async任务,将它们返回的Deferred对象存储在变量中。
- 然后再统一调用这些Deferred对象的await()方法来获取它们的结果。
这种模式保证了所有并发任务在逻辑上几乎同时开始,而等待结果的操作则在任务启动之后进行,从而避免了因运算符求值顺序导致的串行化问题。
总结与注意事项
- async和await是实现并发的强大工具,但其使用方式需要仔细考量。
- 运算符的求值顺序至关重要:在复杂的表达式中,如果直接将async { ... }.await()作为运算符的操作数,可能会导致意想不到的串行执行。
- 遵循“先启动,后等待”的原则:将所有async任务的启动与await结果的获取分开,是确保并行执行的关键。
- 结构化并发:始终在合适的CoroutineScope中启动协程(例如runBlocking、coroutineScope或自定义作用域),确保协程的生命周期管理得当,避免资源泄露。
理解这些细微之处,将帮助你更有效地利用Kotlin协程,构建高性能的并发应用程序。









