高效合并两棵二叉搜索树并生成有序列表-Python教程-PHP中文网

高效合并两棵二叉搜索树并生成有序列表

霞舞

发布： 2025-11-21 14:56:11

原创

617人浏览过

高效合并两棵二叉搜索树并生成有序列表

本文探讨了如何以最优时间复杂度O(M+N)将两棵二叉搜索树（BST）的所有节点值合并成一个有序列表。文章分析了常见的低效实现，特别是Python中列表`pop(0)`操作的性能陷阱，并提供了多种高效的解决方案，包括利用Python内置的`sorted()`函数、`heapq.merge`模块以及优化后的直接遍历排序方法，旨在帮助开发者实现高性能的BST合并操作。

引言：问题与目标

在数据结构与算法的实践中，我们经常会遇到需要处理二叉搜索树（BST）的问题。一个常见的需求是将两棵BST的所有节点值合并到一个单一的、已排序的列表中。为了确保解决方案的效率，我们通常会追求最优的时间复杂度O(M+N)和辅助空间复杂度O(H1+H2+M+N)，其中M和N分别是两棵BST的节点数量，H1和H2分别是它们的树高。

初步尝试与性能瓶颈分析

一个直观的解决方案是利用BST的特性：中序遍历（In-order Traversal）可以得到一个节点值升序排列的列表。因此，我们可以分别对两棵BST进行中序遍历，得到两个有序列表，然后将这两个有序列表合并成一个最终的有序列表。

以下是一个基于这种思路的初步实现：

class Node:
    def __init__(self, data):
        self.left = None
        self.data = data
        self.right = None

def inorder_list(theroot):
    """
    对BST进行中序遍历，返回一个包含所有节点值的有序列表。
    时间复杂度: O(K)，其中K是BST的节点数量。
    """
    l = []
    def inorder(root):
        if root:
            inorder(root.left)
            l.append(root.data)
            inorder(root.right)
    inorder(theroot)
    return l

def merge_two_sorted_lists(list1, list2):
    """
    合并两个已排序的列表。
    """
    res = []
    while list1 and list2:
        if list1[0] <= list2[0]:
            res.append(list1.pop(0)) # 性能瓶颈所在
        else:
            res.append(list2.pop(0))
    res += list1
    res += list2
    return res

class Solution:
    def merge(self, root1, root2):
        # 步骤1: 获取两棵BST的有序节点列表
        root1_list = inorder_list(root1)
        root2_list = inorder_list(root2)
        # 步骤2: 合并这两个有序列表
        return merge_two_sorted_lists(root1_list, root2_list)

登录后复制

尽管inorder_list函数的时间复杂度是线性的O(K)，但merge_two_sorted_lists函数中存在一个严重的性能瓶颈：list.pop(0)操作。在Python中，列表（list）是动态数组实现的，从列表头部删除元素（pop(0)）需要将所有后续元素向前移动一位，其时间复杂度为O(N)，其中N是列表的当前长度。

因此，在merge_two_sorted_lists的循环中，每次pop(0)都会导致O(N)的操作。最坏情况下，如果一个列表的所有元素都比另一个列表的元素小，那么pop(0)会被执行M+N次，导致整个合并操作的时间复杂度高达O(M*N)，这远未达到O(M+N)的目标。

优化有序列表合并策略

为了达到O(M+N)的时间复杂度，关键在于高效地合并两个已排序的列表。以下是几种推荐的优化策略：

策略一：利用Python内置sorted()函数

Python的sorted()函数（以及列表的sort()方法）底层实现是Timsort算法。Timsort是一种混合排序算法，它在处理部分有序或包含已排序子序列的数据时表现出色。当我们将两个已排序的列表连接起来（list1 + list2）后，再对其调用sorted()，Timsort能够识别出这两个已排序的“运行”（runs），并高效地将它们合并，从而达到O(M+N)的时间复杂度。

import collections

class SolutionOptimized1:
    def merge(self, root1, root2):
        data = []
        def inorder(root):
            if root:
                inorder(root.left)
                data.append(root.data)
                inorder(root.right)

        # 收集root1的所有节点值
        inorder(root1)
        list1_sorted = list(data) # 复制一份，或者直接清空data再收集root2
        data.clear() # 清空data以便收集root2

        # 收集root2的所有节点值
        inorder(root2)
        list2_sorted = list(data)

        # 直接合并两个已排序的列表并排序
        return sorted(list1_sorted + list2_sorted)

登录后复制

注意：上述代码中为了演示sorted(list1 + list2)，我们先分别收集了两个列表。实际上，更简洁的方式可以直接将所有元素收集到一个列表中，然后一次性排序，详见“整合方案”部分。

落笔AI

AI写作，AI写网文、AI写长篇小说、短篇小说

查看详情

策略二：使用heapq.merge

heapq模块提供了merge()函数，专门用于高效地合并多个已排序的迭代器。它通过使用小顶堆来每次取出所有输入迭代器中最小的元素，从而在O(M+N)的时间复杂度内完成合并，并且具有很好的内存效率，因为它不需要一次性加载所有数据到内存中。

import heapq

class SolutionOptimized2:
    def merge(self, root1, root2):
        list1_sorted = inorder_list(root1) # 沿用之前的inorder_list函数
        list2_sorted = inorder_list(root2)

        # 使用heapq.merge合并两个有序列表
        return list(heapq.merge(list1_sorted, list2_sorted))

登录后复制

策略三：使用collections.deque进行高效合并

collections.deque（双端队列）是Python中一个高效的数据结构，它支持在两端进行O(1)时间复杂度的添加和删除操作。我们可以将两个有序列表转换为deque，然后使用popleft()方法进行合并，从而避免list.pop(0)的性能问题。

import collections

class SolutionOptimized3:
    def merge(self, root1, root2):
        list1_sorted = inorder_list(root1)
        list2_sorted = inorder_list(root2)

        deque1 = collections.deque(list1_sorted)
        deque2 = collections.deque(list2_sorted)

        res = []
        while deque1 and deque2:
            if deque1[0] <= deque2[0]:
                res.append(deque1.popleft())
            else:
                res.append(deque2.popleft())

        res.extend(deque1) # 添加剩余元素
        res.extend(deque2)
        return res

登录后复制

整合方案：直接遍历与一次性排序

最简洁且高效的解决方案是，不分别生成两个独立的有序列表，而是通过中序遍历将所有节点值统一收集到一个列表中，然后对这个合并后的列表进行一次性排序。由于Timsort对包含两个已排序子序列的列表进行排序时效率很高，这种方法也能达到O(M+N)的时间复杂度。

class SolutionFinal:
    def merge(self, root1, root2):
        data = [] # 用于收集所有节点值的列表

        def inorder(root):
            """
            辅助函数：对BST进行中序遍历，并将节点值添加到外部的data列表中。
            """
            if root:
                inorder(root.left)
                data.append(root.data)
                inorder(root.right)

        # 对第一棵BST进行中序遍历，收集所有节点值
        inorder(root1)
        # 对第二棵BST进行中序遍历，继续收集所有节点值
        inorder(root2)

        # 对收集到的所有节点值进行排序
        # Timsort在此处能识别出data中包含两个已排序的子序列（来自root1和root2），
        # 并高效地将它们合并，达到O(M+N)的时间复杂度。
        data.sort() 
        return data

登录后复制

这个方案的优点在于代码简洁，且利用了Python内置排序算法的优化特性。

复杂度分析

时间复杂度：
- 中序遍历root1需要O(M)时间。
- 中序遍历root2需要O(N)时间。
- 将元素添加到data列表是摊销O(1)操作，总共O(M+N)时间。
- data.sort()操作：由于data列表实际上是由root1的M个有序元素和root2的N个有序元素连接而成，Timsort算法能够识别出这两个有序的“运行”，并以O(M+N)的时间复杂度完成排序（合并）。
- 总时间复杂度：O(M+N)。
空间复杂度：
- 递归中序遍历的栈空间：最坏情况下O(H1)和O(H2)，其中H1和H2分别是两棵BST的高度。对于平衡BST，H约为logK；对于倾斜BST，H可达K。
- data列表存储所有M+N个节点值，需要O(M+N)空间。
- 总辅助空间复杂度：O(H1 + H2 + M + N)。这符合题目要求的空间复杂度。

注意事项与总结

Python列表pop(0)的性能陷阱：这是初学者常犯的错误。对于需要在列表头部频繁删除元素的场景，应优先考虑collections.deque的popleft()或采用其他数据结构和算法。
利用Python内置优化：Python的sorted()函数和列表的sort()方法在处理部分有序数据时非常高效，充分利用这些内置功能可以写出简洁且高性能的代码。
heapq.merge的适用性：当需要合并的有序迭代器数量较多，或者内存是关键考量时，heapq.merge是一个非常好的选择。
严格的辅助空间要求：如果对辅助空间有极其严格的要求，例如要求在O(H1+H2)空间内完成遍历和合并（不计入最终结果列表的空间），则需要采用迭代式中序遍历（使用栈）结合双指针合并的策略。这种方法将两个BST转换为两个“生成器”或“迭代器”，然后实时合并它们产生的元素，从而避免了中间列表的额外O(M+N)空间。然而，对于大多数实际应用，本文介绍的方案已足够高效。

综上所述，高效合并两棵二叉搜索树并生成有序列表的关键在于选择正确的列表合并算法。通过避免list.pop(0)等低效操作，并充分利用Python标准库提供的优化工具，我们可以轻松实现满足O(M+N)时间复杂度的解决方案。

以上就是高效合并两棵二叉搜索树并生成有序列表的详细内容，更多请关注php中文网其它相关文章！