Java Stream API：高效处理嵌套列表并获取唯一元素

霞舞

发布时间：2025-10-09 11:20:22

812人浏览过

来源于php中文网

原创

Java Stream API：高效处理嵌套列表并获取唯一元素

本文详细介绍了如何利用Java Stream API高效地从嵌套列表中提取并收集唯一的元素。通过对比flatMap()和mapMulti()两种核心操作，文章演示了如何将多层数据结构扁平化，并最终将目标属性（如城市名称）收集到一个Set中，从而避免了传统嵌套循环的复杂性，提升代码的简洁性和可读性。

在现代java开发中，处理集合数据是常见的任务。我们经常会遇到这样的场景：一个对象列表中，每个对象又包含一个子列表，我们需要从这些子列表中提取特定的属性，并收集其唯一值。例如，我们有一个employee（员工）列表，每个employee对象包含一个address（地址）列表，而每个address对象又有一个city（城市）属性。我们的目标是获取所有员工居住过的城市的唯一名称集合。

示例数据模型

首先，我们定义Employee和Address这两个类，它们将作为我们数据结构的基础：

import java.util.List;
import java.util.Set;
import java.util.ArrayList;
import java.util.HashSet;
import java.util.stream.Collectors;

public class StreamTutorial {

    public static class Address {
        private String city;

        public Address(String city) {
            this.city = city;
        }

        public String getCity() {
            return city;
        }

        @Override
        public String toString() {
            return "Address{" + "city='" + city + '\'' + '}';
        }
    }

    public static class Employee {
        private List addresses;

        public Employee(List addresses) {
            this.addresses = addresses;
        }

        public List getAddresses() {
            return addresses;
        }

        @Override
        public String toString() {
            return "Employee{" + "addresses=" + addresses + '}';
        }
    }

    // 传统方法（用于对比）
    public static Set getCityUniqueNameLegacy(List employees) {
        Set cityUniqueName = new HashSet<>();
        for (Employee e : employees) {
            List addList = e.getAddresses();
            for (Address add : addList) {
                cityUniqueName.add(add.getCity());
            }
        }
        return cityUniqueName;
    }

    // 主方法用于演示
    public static void main(String[] args) {
        // 准备示例数据
        List employees = new ArrayList<>();
        employees.add(new Employee(List.of(new Address("New York"), new Address("London"))));
        employees.add(new Employee(List.of(new Address("Paris"), new Address("New York"))));
        employees.add(new Employee(List.of(new Address("London"), new Address("Tokyo"))));

        System.out.println("--- 传统方法获取唯一城市 ---");
        Set legacyCities = getCityUniqueNameLegacy(employees);
        System.out.println(legacyCities); // 输出: [New York, London, Paris, Tokyo]

        System.out.println("\n--- 使用 flatMap() 获取唯一城市 ---");
        Set flatMapCities = getCityUniqueNameWithFlatMap(employees);
        System.out.println(flatMapCities); // 输出: [New York, London, Paris, Tokyo]

        System.out.println("\n--- 使用 mapMulti() 获取唯一城市 ---");
        Set mapMultiCities = getCityUniqueNameWithMapMulti(employees);
        System.out.println(mapMultiCities); // 输出: [New York, London, Paris, Tokyo]
    }
}

传统上，我们会使用嵌套的for循环来遍历Employee列表及其内部的Address列表，然后将每个城市的名称添加到HashSet中以确保唯一性。上述代码中的getCityUniqueNameLegacy方法展示了这种实现方式。虽然这种方法可行，但当逻辑变得更复杂时，嵌套循环会降低代码的可读性和简洁性。

使用 Stream API 扁平化和收集唯一值

Java 8 引入的 Stream API 提供了一种更声明式、更简洁的方式来处理集合数据。对于从嵌套集合中提取数据的场景，Stream API 中的扁平化操作（flatMap()和mapMulti()）是关键。

1. 使用 Stream.flatMap()

flatMap()操作是Stream API中用于扁平化流的强大工具。它接收一个函数作为参数，该函数将流中的每个元素转换成一个新的流，然后flatMap()会将所有这些新生成的流合并（扁平化）为一个单一的流。

立即学习“Java免费学习笔记（深入）”；

在我们的例子中，Stream需要转换为Stream

，然后才能进一步提取城市名称。flatMap()正是为此而生。

实现方式：

public static Set getCityUniqueNameWithFlatMap(List employees) {
    return employees.stream() // 将List转换为Stream
        .flatMap(employee -> employee.getAddresses().stream()) // 将每个Employee对象的地址列表(List)转换为一个Stream，然后扁平化所有这些Stream为一个单一的Stream
        .map(Address::getCity) // 从每个Address对象中提取城市名称（String）
        .collect(Collectors.toSet()); // 将所有唯一的城市名称收集到一个Set中
}

解析：

employees.stream()：首先，我们从List创建了一个Stream。
flatMap(employee -> employee.getAddresses().stream())：这是核心步骤。对于流中的每个Employee对象，我们调用employee.getAddresses()获取其List
，然后通过.stream()将其转换为Stream
。flatMap()接着将所有这些独立的Stream
连接成一个连续的Stream
。
map(Address::getCity)：现在我们有了一个Stream
，我们可以使用map()操作将每个Address对象转换成它的city字符串。Address::getCity是方法引用，等同于address -> address.getCity()。
collect(Collectors.toSet())：最后，我们使用collect()终端操作和Collectors.toSet()收集器，将流中的所有城市名称收集到一个Set中。Set的特性保证了所有收集到的城市名称都是唯一的。

2. 使用 Stream.mapMulti()

mapMulti()是Java 16中引入的一个操作，它提供了一种更灵活的方式来转换流元素，尤其适用于一个输入元素可能产生零个、一个或多个输出元素的场景。它接收一个BiConsumer作为参数，其中第一个参数是当前流元素，第二个参数是一个Consumer，用于将结果元素添加到下游流中。

松果AI写作

专业全能的高效AI写作工具

下载

实现方式：

public static Set getCityUniqueNameWithMapMulti(List employees) {
    return employees.stream() // 将List转换为Stream
        .mapMulti((employee, addressConsumer) -> // 为每个Employee应用转换
            employee.getAddresses().forEach(addressConsumer)) // 遍历当前Employee的地址列表，并将每个地址通过addressConsumer添加到下游流
        .map(Address::getCity) // 从每个Address对象中提取城市名称
        .collect(Collectors.toSet()); // 收集唯一的城市名称到Set中
}

解析：

employees.stream()：与flatMap()方法一样，首先创建Stream。
.
mapMulti((employee, addressConsumer) -> employee.getAddresses().forEach(addressConsumer))：这是mapMulti()的核心。
- 是类型提示，指定了mapMulti操作将产生Address类型的元素。
- BiConsumer的第一个参数employee是当前流中的Employee对象。
- 第二个参数addressConsumer是一个Consumer
  ，它的作用是将Address对象“推送”到下游流中。
- employee.getAddresses().forEach(addressConsumer)：对于每个Employee，我们获取其地址列表，并使用forEach方法遍历这个列表，将每个Address对象传递给addressConsumer。这样，所有的Address对象就被有效地扁平化并送入了下游流。
map(Address::getCity)：后续步骤与flatMap()方法相同，从Stream
中提取城市名称。
collect(Collectors.toSet())：将唯一的城市名称收集到Set中。

总结与注意事项

简洁性与可读性：无论是flatMap()还是mapMulti()，都比传统的嵌套for循环提供了更简洁、更具声明性的代码。它们使得数据转换的意图更加清晰。
选择合适的扁平化操作：
- flatMap()更直观地表达了“将流中的流扁平化”的概念，适用于每个输入元素明确地映射到一个新的流，且这些流需要合并的场景。
- mapMulti()提供了更细粒度的控制。当一个输入元素可能产生零个、一个或多个输出元素，且转换逻辑可能比较复杂时，mapMulti()会非常有用。在某些性能敏感的场景下，mapMulti()可能因为避免了创建中间流对象的开销而略有优势，但对于本例这种简单的扁平化操作，两者在性能上的差异通常可以忽略不计。

空值处理：在实际应用中，employee.getAddresses()可能返回null。为了避免NullPointerException，可以考虑在flatMap或mapMulti的Lambda表达式中添加null检查，或者确保getAddresses()方法总是返回一个非null的空列表。例如：

// flatMap中处理null
.flatMap(employee -> Optional.ofNullable(employee.getAddresses()).orElse(Collections.emptyList()).stream())

// mapMulti中处理null
.mapMulti((employee, consumer) -> {
    List addresses = employee.getAddresses();
    if (addresses != null) {
        addresses.forEach(consumer);
    }
})