
在java中,hashmap是一种基于哈希表的map实现,它提供了高效的键值对存储和检索能力。然而,hashmap的设计初衷是为了优化性能,而不是为了维护元素的插入顺序。这意味着当你向hashmap中添加键值对时,它们在内部的存储顺序是不确定的,并且可能会随着哈希冲突的解决或内部扩容而改变。
对于Excel这类结构化数据源,列的顺序通常是固定的且具有业务意义。例如,一个Excel表格可能有“姓名”、“年龄”、“城市”三列,如果使用HashMap存储每一行数据,那么读取后,Map中键值对的顺序可能是“年龄”->“姓名”->“城市”,而非原始的“姓名”->“年龄”->“城市”。当需要将这些数据写回Excel或进行依赖列顺序的进一步处理时,这种顺序的丢失就会成为一个严重的问题。
为了解决HashMap不保留插入顺序的问题,Java提供了两种特殊的Map实现:
考虑到我们的目标是保留Excel中“从左到右”的原始列顺序,LinkedHashMap是最佳选择。
下面我们将修改原始代码,将每一行数据的存储容器从HashMap替换为LinkedHashMap,以确保列顺序的保留。
立即学习“Java免费学习笔记(深入)”;
import org.apache.poi.ss.usermodel.*;
import java.util.*;
import java.util.stream.Collectors;
public class ExcelDataReader {
/**
* 从Excel工作表中读取数据,并将其存储为List<Map<String, String>>。
* 每个Map代表一行数据,键为列标题,值为单元格内容。
* 使用LinkedHashMap确保列的顺序与Excel中一致。
*
* @param sheet 要读取的Excel工作表对象。
* @return 包含所有行数据的List,每行数据是一个LinkedHashMap。
* 如果工作表为空,则返回一个空列表。
*/
public static List<Map<String, String>> readExcelSheet(Sheet sheet) {
Iterator<Row> rows = sheet.iterator();
// 检查工作表是否为空
if (!rows.hasNext()) {
return Collections.emptyList();
}
// 读取表头(第一行)以获取列名和它们的顺序
Row headerRow = rows.next();
List<String> columnHeaders = new ArrayList<>();
// 遍历表头单元格,获取所有非空列名
for (Cell cell : headerRow) {
String headerValue = cell.getStringCellValue().trim(); // 获取并清理列名
if (!headerValue.isEmpty()) {
columnHeaders.add(headerValue);
} else {
// 如果遇到空列名,认为后续没有有效列,停止读取表头
// 实际应用中可能需要更复杂的逻辑来处理空列名或合并单元格
break;
}
}
List<Map<String, String>> allRowsData = new ArrayList<>();
// 遍历剩余的行(数据行)
while (rows.hasNext()) {
Row dataRow = rows.next();
// 使用LinkedHashMap来保证列的插入顺序与表头一致
Map<String, String> rowDataMap = new LinkedHashMap<>();
// 遍历已识别的列头,按顺序获取对应单元格的值
for (int i = 0; i < columnHeaders.size(); ++i) {
String columnName = columnHeaders.get(i);
// 获取单元格,如果单元格不存在则创建为空白单元格
Cell cell = dataRow.getCell(i, Row.MissingCellPolicy.CREATE_NULL_AS_BLANK);
String cellValue = getCellValueAsString(cell); // 统一处理单元格值
rowDataMap.put(columnName, cellValue);
}
// 仅添加非空行到结果列表
// 判断行是否为空的逻辑:如果所有值都为空字符串,则认为是空行
if (!rowDataMap.values().stream().allMatch(String::isEmpty)) {
allRowsData.add(rowDataMap);
}
}
return allRowsData;
}
/**
* 辅助方法:将单元格内容统一转换为字符串。
* 处理不同类型的单元格,避免toString()直接调用可能带来的问题。
*
* @param cell 单元格对象。
* @return 单元格内容的字符串表示。
*/
private static String getCellValueAsString(Cell cell) {
if (cell == null) {
return "";
}
switch (cell.getCellType()) {
case STRING:
return cell.getStringCellValue().trim();
case NUMERIC:
if (DateUtil.isCellDateFormatted(cell)) {
// 处理日期类型
return cell.getDateCellValue().toString(); // 或者使用SimpleDateFormat格式化
} else {
// 处理数字类型,避免科学计数法或精度问题
return String.valueOf(cell.getNumericCellValue());
}
case BOOLEAN:
return String.valueOf(cell.getBooleanCellValue());
case FORMULA:
// 对于公式单元格,尝试获取其计算结果
try {
return String.valueOf(cell.getNumericCellValue()); // 假设公式结果为数字
} catch (IllegalStateException e) {
try {
return cell.getStringCellValue().trim(); // 假设公式结果为字符串
} catch (IllegalStateException ex) {
return ""; // 无法获取结果
}
}
case BLANK:
return "";
default:
return cell.toString().trim(); // 其他类型直接转字符串
}
}
// 示例用法
public static void main(String[] args) {
// 假设你有一个Excel文件 "example.xlsx"
// 这里只是一个模拟,实际使用需要引入Apache POI库并加载Workbook
// Workbook workbook = new XSSFWorkbook(new FileInputStream("example.xlsx"));
// Sheet sheet = workbook.getSheetAt(0);
// 为了演示,我们创建一个模拟的Sheet对象
// 在实际项目中,你需要使用Apache POI加载真实的Excel文件
// 以下代码仅为概念性演示,不能直接运行,需要POI库支持
// 假设 sheet 对象已经通过 Workbook.getSheetAt(0) 或其他方式获得
// 模拟一个简单的Excel工作表
Workbook mockWorkbook = new org.apache.poi.xssf.usermodel.XSSFWorkbook();
Sheet mockSheet = mockWorkbook.createSheet("SampleData");
// 创建表头
Row header = mockSheet.createRow(0);
header.createCell(0).setCellValue("column1");
header.createCell(1).setCellValue("column2");
// 创建数据行1
Row row1 = mockSheet.createRow(1);
row1.createCell(0).setCellValue("value1");
row1.createCell(1).setCellValue("value2");
// 创建数据行2
Row row2 = mockSheet.createRow(2);
row2.createCell(0).setCellValue("value3");
row2.createCell(1).setCellValue("value4");
List<Map<String, String>> data = readExcelSheet(mockSheet);
System.out.println("读取到的数据 (LinkedHashMap 保持顺序):");
for (int i = 0; i < data.size(); i++) {
Map<String, String> rowMap = data.get(i);
System.out.println(i + " = " + rowMap);
// 验证顺序
rowMap.forEach((key, value) -> System.out.println(" \"" + key + "\" -> " + value));
}
// 预期输出:
// 0 = {column1=value1, column2=value2}
// "column1" -> value1
// "column2" -> value2
// 1 = {column1=value3, column2=value4}
// "column1" -> value3
// "column2" -> value4
}
}代码解释:
<!-- Maven -->
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi</artifactId>
<version>5.2.3</version> <!-- 使用最新稳定版本 -->
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>5.2.3</version> <!-- 用于.xlsx格式 -->
</dependency>通过将存储每行数据的Map实现从HashMap替换为LinkedHashMap,我们可以轻松解决Java读取Excel数据时列顺序混乱的问题。LinkedHashMap能够完美地保留键值对的插入顺序,这对于依赖列顺序的Excel数据处理至关重要。结合对表头列名的有序提取和单元格内容的健壮处理,我们可以构建出高效且准确的Excel数据读取器,为后续的数据操作提供可靠的基础。
以上就是Java读取Excel数据并保持列顺序的实用指南的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号