0

0

Java Stream API:实现多条件过滤、按月分组及聚合计数

花韻仙語

花韻仙語

发布时间:2025-10-13 09:25:24

|

831人浏览过

|

来源于php中文网

原创

Java Stream API:实现多条件过滤、按月分组及聚合计数

本文深入探讨如何利用java stream api高效处理复杂数据聚合需求,包括对集合进行多条件过滤、根据日期字段的月份进行分组,并对每个分组进行计数。通过构建一个清晰的stream管道,结合`flatmap`、`filter`、`groupingby`与自定义分组键,最终将原始数据转换为结构化的统计结果,并提供完整示例代码和最佳实践。

Java Stream API 实现复杂数据聚合:过滤、分组与计数

在现代Java应用开发中,数据处理和聚合是常见的任务。Java 8引入的Stream API提供了一种声明式、函数式的方式来处理集合数据,极大地简化了代码并提高了可读性。本文将详细介绍如何使用Stream API实现多条件过滤、按日期字段的月份进行分组,并对每个分组中的元素进行计数。

1. 数据模型定义

首先,我们需要定义用于存储和传输数据的类。假设我们有一个Person类,包含人员ID、姓名、事件类型(Statement)和事件日期等信息。我们还定义了用于表示聚合结果的DTO(Data Transfer Object),以及作为分组键的辅助类MonthState。

import java.time.LocalDate;
import java.util.Objects;

// 事件类型枚举
enum State {
    JOIN, EXIT, OTHER
}

// 原始Person数据模型
class Person {
    private String id;
    private String name;
    private String surname;
    private State event; // JOIN, EXIT
    private Object value; // 示例中未使用,可根据实际需求扩展
    private LocalDate eventDate;

    public Person(String id, State event, LocalDate eventDate) {
        this.id = id;
        this.event = event;
        this.eventDate = eventDate;
    }

    // Getters
    public String getId() { return id; }
    public State getEvent() { return event; }
    public LocalDate getEventDate() { return eventDate; }

    @Override
    public String toString() {
        return "Person{" +
               "id='" + id + '\'' +
               ", event=" + event +
               ", eventDate=" + eventDate +
               '}';
    }
}

// 聚合结果DTO
class DTO {
    private int month;
    private State info;
    private int totalEmployees;

    public DTO(int month, State info, int totalEmployees) {
        this.month = month;
        this.info = info;
        this.totalEmployees = totalEmployees;
    }

    // Getters
    public int getMonth() { return month; }
    public State getInfo() { return info; }
    public int getTotalEmployees() { return totalEmployees; }

    @Override
    public String toString() {
        return "DTO{" +
               "month=" + month +
               ", info=" + info +
               ", totalEmployees=" + totalEmployees +
               '}';
    }
}

// 分组键辅助类 (Java 16+ 可以使用 record)
// 对于Java 8-15,需要手动实现 equals() 和 hashCode()
record MonthState(int month, State info) {}

/*
// Java 8-15 版本的 MonthState 类
class MonthState {
    private final int month;
    private final State info;

    public MonthState(int month, State info) {
        this.month = month;
        this.info = info;
    }

    public int getMonth() { return month; }
    public State getInfo() { return info; }

    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        MonthState that = (MonthState) o;
        return month == that.month && info == that.info;
    }

    @Override
    public int hashCode() {
        return Objects.hash(month, info);
    }
}
*/

2. 构建Stream管道进行数据聚合

我们的目标是从一个Map>结构(其中键是pId,值是该pId对应的Person列表)中,提取出所有Person对象,然后:

  1. 过滤:只保留事件类型为JOIN或EXIT的Person。
  2. 分组:根据事件日期的月份和事件类型(State)进行分组。
  3. 计数:统计每个分组中Person对象的数量。
  4. 映射:将分组结果转换为DTO对象。
  5. 排序:按月份对DTO列表进行排序。

下面是实现这一目标的Stream管道代码:

立即学习Java免费学习笔记(深入)”;

import java.time.LocalDate;
import java.util.Comparator;
import java.util.List;
import java.util.Map;
import java.util.stream.Collectors;

public class StreamAggregationTutorial {

    public static void main(String[] args) {
        // 模拟原始数据
        Map> personListById = Map.of(
            "per1", List.of(new Person("per1", State.JOIN, LocalDate.of(2022, 1, 10))),
            "per2", List.of(new Person("per2", State.JOIN, LocalDate.of(2022, 1, 10))),
            "per3", List.of(
                new Person("per3", State.EXIT, LocalDate.of(2022, 1, 10)),
                new Person("per3", State.EXIT, LocalDate.of(2022, 2, 10))
            ),
            "per4", List.of(new Person("per4", State.JOIN, LocalDate.of(2022, 3, 10))),
            "per5", List.of(new Person("per5", State.OTHER, LocalDate.of(2022, 4, 10))) // 应该被过滤掉
        );

        List result = personListById.values().stream()
            // 1. 扁平化处理:将Map中List的值转换为单个Person对象的Stream
            .flatMap(List::stream)
            // 2. 多条件过滤:只保留事件类型为JOIN或EXIT的Person
            .filter(person -> person.getEvent() == State.JOIN || person.getEvent() == State.EXIT)
            // 3. 分组与计数:
            //    - 使用Collectors.groupingBy()进行分组。
            //    - 分组键是一个MonthState对象,结合了月份和事件类型。
            //    - 下游收集器Collectors.counting()用于统计每个分组的元素数量。
            .collect(Collectors.groupingBy(
                p -> new MonthState(p.getEventDate().getMonthValue(), p.getEvent()),
                Collectors.counting()
            ))
            // 4. 将Map的entrySet转换为Stream,以便进行后续的映射操作
            .entrySet().stream()
            // 5. 映射:将Map.Entry转换为DTO对象
            //    - e.getKey()获取MonthState对象(分组键)
            //    - e.getValue()获取计数结果(Long类型,需要转换为int)
            .map(e -> new DTO(e.getKey().month(), e.getKey().info(), e.getValue().intValue()))
            // 6. 排序:根据DTO的月份进行排序
            .sorted(Comparator.comparing(DTO::getMonth))
            // 7. 收集:将Stream中的DTO对象收集到List中
            .toList(); // Java 16+,等同于 .collect(Collectors.toList())

        // 打印结果
        result.forEach(System.out::println);
    }
}

3. 代码解析与注意事项

3.1 扁平化 (flatMap)

原始数据结构是Map>,我们需要处理的是List中的每个Person对象。personListById.values().stream()会得到一个Stream>。flatMap(List::stream)的作用是将这个Stream>扁平化为一个Stream,使得后续操作可以直接作用于单个Person对象。

3.2 多条件过滤 (filter)

filter(person -> person.getEvent() == State.JOIN || person.getEvent() == State.EXIT)用于筛选出符合特定条件的Person对象。这里的条件是事件类型必须是JOIN或EXIT。filter操作是中间操作,它会根据给定的Predicate(一个返回布尔值的函数)筛选元素。

3.3 分组与计数 (groupingBy & counting)

这是聚合的核心部分:

  • Collectors.groupingBy(keyMapper, downstreamCollector):这是一个强大的收集器,用于将Stream中的元素分组到一个Map中。
    • keyMapper:p -> new MonthState(p.getEventDate().getMonthValue(), p.getEvent()) 定义了如何从每个Person对象中提取分组键。我们创建了一个MonthState实例,它结合了事件日期的月份和事件类型,作为复合键。
    • downstreamCollector:Collectors.counting() 是一个下游收集器,它作用于每个分组内部的元素。对于每个MonthState分组,counting()会统计该分组中Person对象的数量。
  • MonthState作为分组键:为了让groupingBy正确工作,作为分组键的类(MonthState)必须正确实现equals()和hashCode()方法。如果使用Java 16+的record类型,编译器会自动生成这些方法,确保基于值进行比较和哈希。如果使用普通的class,则需要手动实现它们。

3.4 结果映射 (map)

collect操作返回的是一个Map。我们需要将其转换为List

  • entrySet().stream():将Map的键值对集合转换为Stream>。
  • map(e -> new DTO(e.getKey().month(), e.getKey().info(), e.getValue().intValue())):对每个Map.Entry进行映射。e.getKey()获取到MonthState对象,从中提取月份和事件类型。e.getValue()获取到计数结果(Long类型),通过intValue()转换为int。

3.5 排序 (sorted)

sorted(Comparator.comparing(DTO::getMonth)) 用于对最终的DTO列表按月份进行升序排序,使输出结果更具可读性。

3.6 最终收集 (toList)

toList() (Java 16+) 或 collect(Collectors.toList()) (Java 8+) 将Stream中的所有元素收集到一个List中。

4. 总结

通过Java Stream API,我们可以用简洁、声明式的方式完成复杂的数据聚合任务。本教程展示了如何结合flatMap进行扁平化、filter进行多条件过滤、groupingBy与自定义复合键(如record类型)进行分组,以及counting进行聚合计数。这种链式操作不仅提高了代码的可读性,也使得数据处理逻辑更加清晰。熟练掌握Stream API是现代Java开发中不可或缺的技能。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

832

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

738

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

734

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

397

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

398

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

446

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

430

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16925

2023.08.03

Golang gRPC 服务开发与Protobuf实战
Golang gRPC 服务开发与Protobuf实战

本专题系统讲解 Golang 在 gRPC 服务开发中的完整实践,涵盖 Protobuf 定义与代码生成、gRPC 服务端与客户端实现、流式 RPC(Unary/Server/Client/Bidirectional)、错误处理、拦截器、中间件以及与 HTTP/REST 的对接方案。通过实际案例,帮助学习者掌握 使用 Go 构建高性能、强类型、可扩展的 RPC 服务体系,适用于微服务与内部系统通信场景。

8

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.5万人学习

C# 教程
C# 教程

共94课时 | 6.8万人学习

Java 教程
Java 教程

共578课时 | 46.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号