
在实际开发中,我们经常会遇到需要处理包含重复数据的列表,但这些重复数据在某些关键字段上是唯一的。例如,一个员工列表可能包含同一个员工(通过姓氏和名字确定)在不同时间点的薪资记录。我们的目标是,对于每个唯一的员工组合(例如,相同的姓氏和名字),只保留其最新的一条记录。
假设我们有以下Employee类定义:
import lombok.AllArgsConstructor;
import lombok.Data;
import java.time.LocalDate;
@Data
@AllArgsConstructor
public class Employee {
private String firstName;
private String lastName;
private double salary;
private LocalDate date; // 使用LocalDate表示日期
}以及一个包含示例数据的List<Employee>:
import java.util.ArrayList;
import java.util.List;
import java.time.LocalDate;
public class EmployeeData {
public static List<Employee> getSampleEmployees() {
List<Employee> employees = new ArrayList<>();
employees.add(new Employee("John", "Smith", 10, LocalDate.of(2022, 9, 1)));
employees.add(new Employee("John", "Smith", 20, LocalDate.of(2022, 10, 1)));
employees.add(new Employee("John", "Smith", 5, LocalDate.of(2022, 11, 1)));
employees.add(new Employee("Kelly", "Jones", 12, LocalDate.of(2022, 3, 1)));
employees.add(new Employee("Sara", "Kim", 21, LocalDate.of(2022, 3, 1)));
employees.add(new Employee("Sara", "Kim", 7, LocalDate.of(2022, 7, 1)));
return employees;
}
}我们的目标是得到以下结果:
立即学习“Java免费学习笔记(深入)”;
Java 8 引入的 Stream API 为处理集合数据提供了强大而简洁的工具。对于上述需求,我们可以利用Collectors.toMap的重载方法,该方法允许我们定义一个合并函数来处理键冲突。
import java.util.Collection;
import java.util.List;
import java.util.function.Function;
import java.util.stream.Collectors;
import java.time.LocalDate;
public class EmployeeFilterTutorial {
public static void main(String[] args) {
List<Employee> employees = EmployeeData.getSampleEmployees();
Collection<Employee> filteredEmployees = employees.stream()
.collect(Collectors.toMap(
// keyMapper: 定义如何从Employee对象中提取键
// 这里将firstName和lastName拼接作为键
employee -> employee.getFirstName() + employee.getLastName(),
// valueMapper: 定义如何从Employee对象中提取值
// Function.identity() 表示Employee对象本身作为值
Function.identity(),
// mergeFunction: 定义当两个键相同时如何合并值
// 比较两个Employee对象的日期,保留日期最新的那个
(existingEmployee, newEmployee) -> existingEmployee.getDate().isAfter(newEmployee.getDate()) ? existingEmployee : newEmployee
))
.values(); // 获取Map中所有的值,即我们筛选后的Employee对象
// 打印结果
filteredEmployees.forEach(System.out::println);
}
}执行上述代码,将得到以下输出:
Employee(firstName=John, lastName=Smith, salary=5.0, date=2022-11-01) Employee(firstName=Sara, lastName=Kim, salary=7.0, date=2022-07-01) Employee(firstName=Kelly, lastName=Jones, salary=12.0, date=2022-03-01)
这正是我们期望的结果,对于每个唯一的员工组合,都成功筛选出了日期最新的那条记录。
通过本教程,您应该已经掌握了如何使用Java Stream API结合Collectors.toMap,根据对象的多个字段进行分组,并从每个分组中筛选出符合特定条件的唯一记录。这种模式在数据处理和聚合中非常常见且实用。
以上就是使用Java Stream API按多字段分组并筛选最新记录的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号