
在处理金融或交易数据时,一个常见的需求是,针对特定实体(如货币)在每天的记录中,只保留最新(即时间戳最大)的一条。例如,我们可能有一系列关于某种货币在不同时间点接收到的数据,但我们只关心每天的最终更新状态。
假设我们有以下 Currency 类定义:
import java.time.LocalDateTime;
import java.time.LocalDate; // 用于日期部分
class Currency {
private Integer id;
private String name;
private LocalDateTime lastReceived;
public Currency(Integer id, String name, LocalDateTime lastReceived) {
this.id = id;
this.name = name;
this.lastReceived = lastReceived;
}
public Integer getId() { return id; }
public String getName() { return name; }
public LocalDateTime getLastReceived() { return lastReceived; }
@Override
public String toString() {
return "Currency{" +
"id=" + id +
", name='" + name + '\'' +
", lastReceived=" + lastReceived +
'}';
}
}以及以下示例数据:
| ID | NAME | LAST_RECEIVED |
|---|---|---|
| 1 | USD | 2022-05-18 09:04:01.545 |
| 2 | USD | 2022-05-18 08:04:01.545 |
| 3 | USD | 2022-05-19 08:04:01.545 |
| 4 | USD | 2022-05-20 08:04:01.545 |
| 5 | USD | 2022-05-20 11:04:01.545 |
| 6 | BUSD | 2022-05-18 08:04:01.545 |
我们的目标是获取如下结果:
| ID | NAME | LAST_RECEIVED |
|---|---|---|
| 1 | USD | 2022-05-18 09:04:01.545 |
| 3 | USD | 2022-05-19 08:04:01.545 |
| 5 | USD | 2022-05-20 11:04:01.545 |
可以看到,对于每天的USD记录,我们只保留了时间戳最晚的那一条。
立即学习“Java免费学习笔记(深入)”;
Java 8的Stream API提供了强大的数据处理能力,我们可以利用 groupingBy 和 collectingAndThen 组合来解决这个问题。核心思路是:首先根据货币名称和日期对数据进行分组,然后在每个组内找到时间戳最大的记录。
为了实现对所有货币的每日最新记录提取,我们需要一个复合键来分组:货币名称和 lastReceived 的日期部分。
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Comparator;
import java.util.List;
import java.util.Optional;
import java.util.stream.Collectors;
public class CurrencyProcessor {
public static void main(String[] args) {
List<Currency> data = Arrays.asList(
new Currency(1, "USD", LocalDateTime.parse("2022-05-18T09:04:01.545")),
new Currency(2, "USD", LocalDateTime.parse("2022-05-18T08:04:01.545")),
new Currency(3, "USD", LocalDateTime.parse("2022-05-19T08:04:01.545")),
new Currency(4, "USD", LocalDateTime.parse("2022-05-20T08:04:01.545")),
new Currency(5, "USD", LocalDateTime.parse("2022-05-20T11:04:01.545")),
new Currency(6, "BUSD", LocalDateTime.parse("2022-05-18T08:04:01.545")),
new Currency(7, "EUR", LocalDateTime.parse("2022-05-18T10:00:00.000")),
new Currency(8, "EUR", LocalDateTime.parse("2022-05-18T09:00:00.000"))
);
// 1. 获取所有货币在每天的最新记录 (无序)
List<Currency> lastByDate = new ArrayList<>(data
.stream() // Stream<Currency>
.collect(Collectors.groupingBy(
// 分组键:货币名称 + 日期 (LocalDate)
curr -> Arrays.asList(curr.getName(), curr.getLastReceived().toLocalDate()),
// 在每个组内,找到lastReceived最大的Currency对象
Collectors.collectingAndThen(
Collectors.maxBy(Comparator.comparing(Currency::getLastReceived)),
Optional::get // 将Optional<Currency>转换为Currency
)
)) // 结果是一个 Map<List<Object>, Currency>
.values() // 获取Map中所有的Currency值,形成一个Collection
);
System.out.println("所有货币在每天的最新记录 (无序):");
lastByDate.forEach(System.out::println);
// 2. 如果需要排序,可以对结果列表进行排序
lastByDate.sort(
Comparator.comparing(Currency::getName)
.thenComparing(Currency::getLastReceived)
);
System.out.println("\n所有货币在每天的最新记录 (按名称和时间排序):");
lastByDate.forEach(System.out::println);
}
}代码解析:
如果我们的需求是针对某个特定的货币(例如 "USD"),那么我们可以先进行过滤,然后简化分组键。
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Comparator;
import java.util.List;
import java.util.Optional;
import java.util.stream.Collectors;
public class CurrencyProcessorSpecific {
public static void main(String[] args) {
List<Currency> data = Arrays.asList(
new Currency(1, "USD", LocalDateTime.parse("2022-05-18T09:04:01.545")),
new Currency(2, "USD", LocalDateTime.parse("2022-05-18T08:04:01.545")),
new Currency(3, "USD", LocalDateTime.parse("2022-05-19T08:04:01.545")),
new Currency(4, "USD", LocalDateTime.parse("2022-05-20T08:04:01.545")),
new Currency(5, "USD", LocalDateTime.parse("2022-05-20T11:04:01.545")),
new Currency(6, "BUSD", LocalDateTime.parse("2022-05-18T08:04:01.545"))
);
String targetCurrency = "USD";
List<Currency> lastUSDByDate = new ArrayList<>(data
.stream()
.filter(curr -> targetCurrency.equalsIgnoreCase(curr.getName())) // 过滤特定货币
.collect(Collectors.groupingBy(
curr -> curr.getLastReceived().toLocalDate(), // 分组键现在只需日期
Collectors.collectingAndThen(
Collectors.maxBy(Comparator.comparing(Currency::getLastReceived)),
Optional::get
)
))
.values()
);
// 对结果按时间排序
lastUSDByDate.sort(Comparator.comparing(Currency::getLastReceived));
System.out.println("\n特定货币 (" + targetCurrency + ") 在每天的最新记录:");
lastUSDByDate.forEach(System::out::println);
}
}代码解析:
对于存储在数据库中的数据,使用原生SQL查询通常是更高效和更推荐的方法,特别是当数据集非常大时。SQL中的窗口函数(Window Functions)非常适合解决这类“每个分组内取Top N”的问题。
以PostgreSQL为例,我们可以使用 ROW_NUMBER() OVER (PARTITION BY ... ORDER BY ...) 来实现。
SELECT id, name, last_received
FROM (
SELECT
c.*,
ROW_NUMBER() OVER (
PARTITION BY name, to_char(last_received, 'yyyy-MM-dd') -- 按货币名称和日期分区
ORDER BY last_received DESC -- 在每个分区内按时间倒序排序
) AS rn -- 为每行分配一个行号
FROM Currency c
WHERE c.name = :currName -- 如果需要筛选特定货币
) tbl
WHERE rn = 1 -- 只保留每个分区的第一行(即时间最新的记录)
ORDER BY last_received; -- 最后按时间排序SQL查询解析:
JPA集成注意事项:
目前,JPA(Java Persistence API)标准通常不支持直接在JPQL中使用窗口函数。因此,如果你正在使用JPA,你可能需要通过以下方式来执行此类查询:
选择哪种方法取决于你的数据量、数据存储位置以及对性能和代码可维护性的要求。通常,数据库原生查询是处理大规模数据这类问题的首选方案。
以上就是Java 8与SQL:高效获取每日最新货币数据教程的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号