0

0

使用Java Stream API高效处理列表去重:基于ID和日期筛选最新记录

DDD

DDD

发布时间:2025-08-05 16:36:13

|

301人浏览过

|

来源于php中文网

原创

使用Java Stream API高效处理列表去重:基于ID和日期筛选最新记录

本文详细介绍了如何利用Java Stream API,特别是Collectors.toMap结合自定义合并函数,优雅地解决列表中对象去重的问题。针对具有相同ID但不同时间戳的对象,教程演示了如何保留具有最新日期时间的对象,从而实现数据清洗和筛选,提高代码的可读性和效率。

在日常的软件开发中,我们经常会遇到需要处理包含重复数据的列表。例如,一个学生列表中可能存在多个具有相同学号(id)但不同入学日期(startdatetime)的记录,而我们只希望保留每个学号对应的最新记录。传统的方法可能涉及循环遍历、使用辅助set或map进行手动去重和比较,这往往导致代码冗长且可读性差。java 8引入的stream api提供了一种更简洁、更具函数式编程风格的解决方案。

核心问题与解决方案

我们的目标是:给定一个Student对象列表,如果存在多个Student对象拥有相同的id,则只保留其中startDatetime最新的那个对象。

import java.time.LocalDateTime;
import java.util.ArrayList;
import java.util.List;
import java.util.Map;
import java.util.function.BinaryOperator;
import java.util.function.Function;
import java.util.Comparator;
import java.util.stream.Collectors;

public class StudentDeduplication {

    static class Student {
        private String id;
        private LocalDateTime startDatetime;

        public Student(String id, LocalDateTime startDatetime) {
            this.id = id;
            this.startDatetime = startDatetime;
        }

        public String getId() {
            return id;
        }

        public LocalDateTime getStartDatetime() {
            return startDatetime;
        }

        @Override
        public String toString() {
            return "Student{id='" + id + "', startDatetime=" + startDatetime + '}';
        }
    }

    public static void main(String[] args) {
        List students = new ArrayList<>() {{
            add(new Student("1", LocalDateTime.now())); // 最新的ID为1的记录
            add(new Student("1", LocalDateTime.of(2000, 2, 1, 1, 1)));
            add(new Student("1", LocalDateTime.of(1990, 2, 1, 1, 1)));
            add(new Student("2", LocalDateTime.of(1990, 2, 1, 1, 1))); // ID为2的记录
        }};

        System.out.println("原始学生列表:");
        students.forEach(System.out::println);

        // 使用Stream API进行去重和筛选
        List uniqueStudents = students.stream()
            .collect(Collectors.toMap(
                Student::getId, // Key Mapper: 使用Student的ID作为Map的键
                Function.identity(), // Value Mapper: 将Student对象本身作为Map的值
                BinaryOperator.maxBy(Comparator.comparing(Student::getStartDatetime)) // Merge Function: 处理键冲突时,保留startDatetime最新的Student对象
            ))
            .values().stream() // 获取Map中所有值(即去重后的Student对象)
            .sorted(Comparator.comparing(Student::getStartDatetime)) // (可选) 按照startDatetime排序结果
            .collect(Collectors.toList()); // 收集为List (Java 16+ 可用 .toList())

        System.out.println("\n去重并筛选后的学生列表:");
        uniqueStudents.forEach(System.out::println);
    }
}

深入解析 Collectors.toMap 的三参数版本

上述解决方案的核心在于Collectors.toMap的第三个参数——合并函数(mergeFunction)。

  1. keyMapper (Student::getId): 这个函数定义了如何从流中的每个元素(Student对象)中提取用于Map键的值。在这里,我们使用Student::getId,表示每个Student对象的id属性将作为Map的键。

  2. valueMapper (Function.identity()): 这个函数定义了如何从流中的每个元素中提取用于Map值的值。Function.identity()是一个便利的方法,它返回一个函数,该函数简单地返回其输入参数。这意味着Student对象本身将作为Map的值。

  3. mergeFunction (BinaryOperator.maxBy(Comparator.comparing(Student::getStartDatetime))): 这是解决重复问题的关键。当Collectors.toMap在处理流时遇到两个或多个元素生成了相同的键时,mergeFunction就会被调用来决定保留哪个值。

    • BinaryOperator.maxBy():这是一个静态工厂方法,它接收一个Comparator作为参数,并返回一个BinaryOperator。这个BinaryOperator会在两个输入元素中选择“更大”的那个。
    • Comparator.comparing(Student::getStartDatetime):这个Comparator用于比较两个Student对象。它通过比较它们的startDatetime属性来确定哪个对象“更大”(即时间更晚)。

    综合起来,当遇到相同id的Student对象时,BinaryOperator.maxBy(Comparator.comparing(Student::getStartDatetime))会比较这两个Student的startDatetime,并保留日期时间更晚(即最新)的那个对象。

获取最终结果

Collectors.toMap操作的结果是一个Map,其中键是Student的ID,值是对应ID下最新的Student对象。要将其转换回List,我们只需:

ImgCreator AI
ImgCreator AI

一款AI图像生成工具,适合创建插图、动画和概念设计图像。

下载

立即学习Java免费学习笔记(深入)”;

  1. 调用Map.values()获取Map中所有值的集合。
  2. 将这个集合转换为一个Stream (.stream())。
  3. (可选)如果需要对结果列表进行特定排序(例如按startDatetime升序),可以继续使用.sorted(Comparator.comparing(Student::getStartDatetime))。
  4. 最后,使用Collectors.toList()(或Java 16+的.toList())将Stream中的元素收集到一个新的List中。

注意事项与总结

  • 导入必要的类: 确保导入了java.time.LocalDateTime, java.util.ArrayList, java.util.List, java.util.Map, java.util.function.BinaryOperator, java.util.function.Function, java.util.Comparator, java.util.stream.Collectors。
  • Student类: 为了使示例代码完整可运行,Student类需要包含id和startDatetime字段,以及相应的getter方法。为了方便打印输出,建议重写toString()方法。
  • 效率: 这种基于Stream API的解决方案在处理大量数据时通常表现良好,并且代码表达力强,易于理解。它避免了显式的循环和条件判断,将业务逻辑更好地封装在函数式操作中。
  • 不可变性: 在实际应用中,如果原始列表是不可变的(例如通过List.of()创建),则需要注意在add操作时可能抛出UnsupportedOperationException。本示例中使用了new ArrayList() {{ ... }}来创建可变列表。

通过上述方法,我们可以利用Java Stream API的强大功能,以一种声明式且高效的方式,解决列表中对象的去重和筛选问题,使代码更加简洁、健壮。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

831

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

737

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

733

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

397

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

398

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

446

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

430

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16925

2023.08.03

c++主流开发框架汇总
c++主流开发框架汇总

本专题整合了c++开发框架推荐,阅读专题下面的文章了解更多详细内容。

80

2026.01.09

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
10分钟--Midjourney创作自己的漫画
10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

Midjourney 关键词系列整合
Midjourney 关键词系列整合

共13课时 | 0.9万人学习

AI绘画教程
AI绘画教程

共2课时 | 0.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号