
在数据交换和存储中,csv(comma separated values)和xml(extensible markup language)是两种常见格式。有时,我们需要将结构化的csv数据转换为xml,并且要求csv的列数据在xml中以元素的属性(attributes)形式呈现,而非子元素(child elements)。例如,将如下csv数据:
Col1,Col2,Col3,Col4,Col5 All,0,,0,0 All,935,231,0,30 None,1011,257,0,30
转换为如下XML格式:
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<root>
<row col1="All" Col2="0" Col3="" Col4="0" Col5="0"></row>
<row col1="All" Col2="935" Col3="231" Col4="0" Col5="30"></row>
<row col1="None" Col2="1011" Col3="257" Col4="0" Col5="30"></row>
</root>传统的基于DocumentBuilder和Transformer的DOM操作在处理将CSV列映射为XML属性时,往往需要更复杂的逻辑来手动创建和设置属性。当列数量增多或结构复杂时,这种方式会变得繁琐且易出错。为此,JAXB提供了一种更简洁、声明式的方法来解决这类问题。
原始的DOM操作代码示例尝试读取CSV文件,并为每一行创建一个<row>元素,然后为每个CSV字段创建一个子元素。例如,它会生成:
<dataset>
<row>
<Col1>All</Col1>
<Col2>0</Col2>
<Col3></Col3>
<Col4>0</Col4>
<Col5>0</Col5>
</row>
<!-- ... -->
</dataset>这与我们期望的属性格式(<row col1="All" ...>)不符。要通过DOM API实现属性,需要使用Element.setAttribute()方法,而非Element.appendChild(newDoc.createElement(fieldName))。手动管理这些细节会增加代码的复杂性。
立即学习“Java免费学习笔记(深入)”;
JAXB(Java Architecture for XML Binding)提供了一种将Java对象(POJO)与XML文档相互映射的机制。通过在POJO类上使用特定的注解,我们可以声明性地控制Java对象的哪些字段应映射为XML元素、哪些应映射为XML属性。
首先,我们需要定义两个POJO类:一个用于表示XML的根元素(<root>),另一个用于表示每个数据行(<row>)。
Root.java (用于表示XML的根元素)
import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlRootElement;
import java.util.ArrayList;
import java.util.List;
@XmlRootElement(name = "root") // 映射到XML的根元素 <root>
public class Root {
private List<RowData> rows = new ArrayList<>();
@XmlElement(name = "row") // 映射到XML的子元素 <row>
public List<RowData> getRows() {
return rows;
}
public void setRows(List<RowData> rows) {
this.rows = rows;
}
}RowData.java (用于表示XML的每一行 <row> 元素及其属性)
import javax.xml.bind.annotation.XmlAttribute;
import javax.xml.bind.annotation.XmlRootElement; // 也可以不加,因为它是作为Root的子元素
public class RowData {
private String col1;
private String col2;
private String col3;
private String col4;
private String col5;
// JAXB需要一个无参构造函数
public RowData() {}
public RowData(String col1, String col2, String col3, String col4, String col5) {
this.col1 = col1;
this.col2 = col2;
this.col3 = col3;
this.col4 = col4;
this.col5 = col5;
}
@XmlAttribute(name = "col1") // 映射到XML属性 col1
public String getCol1() { return col1; }
public void setCol1(String col1) { this.col1 = col1; }
@XmlAttribute(name = "Col2") // 映射到XML属性 Col2 (注意大小写与期望输出一致)
public String getCol2() { return col2; }
public void setCol2(String col2) { this.col2 = col2; }
@XmlAttribute(name = "Col3") // 映射到XML属性 Col3
public String getCol3() { return col3; }
public void setCol3(String col3) { this.col3 = col3; }
@XmlAttribute(name = "Col4") // 映射到XML属性 Col4
public String getCol4() { return col4; }
public void setCol4(String col4) { this.col4 = col4; }
@XmlAttribute(name = "Col5") // 映射到XML属性 Col5
public String getCol5() { return col5; }
public void setCol5(String col5) { this.col5 = col5; }
}注解说明:
接下来,我们将编写一个方法来读取CSV文件,将每一行数据解析并填充到 RowData 对象中,最后使用JAXB将这些对象集合转换为XML文件。
import javax.xml.bind.JAXBContext;
import javax.xml.bind.Marshaller;
import java.io.BufferedReader;
import java.io.FileReader;
import java.io.File;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
public class CsvToXmlConverter {
public void convertCsvToXmlWithAttributes(String csvFileName, String xmlFileName, String delimiter) {
try {
// 1. 读取CSV文件并解析数据
List<RowData> rowDataList = new ArrayList<>();
try (BufferedReader csvReader = new BufferedReader(new FileReader(csvFileName))) {
String line;
boolean isFirstLine = true; // 用于跳过CSV头行
while ((line = csvReader.readLine()) != null) {
if (isFirstLine) {
isFirstLine = false;
// 假设CSV文件的第一行是标题,我们跳过它
// 如果CSV文件没有标题行,请移除此if块
continue;
}
String[] fields = line.split(delimiter, -1); // -1 参数保留空字符串
// 确保字段数量与POJO的属性数量匹配
if (fields.length == 5) {
RowData row = new RowData(
fields[0], fields[1], fields[2], fields[3], fields[4]
);
rowDataList.add(row);
} else {
System.err.println("警告: CSV行字段数量不匹配,跳过此行: " + line);
}
}
}
// 2. 将解析后的数据封装到根对象中
Root root = new Root();
root.setRows(rowDataList);
// 3. 使用JAXB进行对象到XML的转换(Marshalling)
JAXBContext jaxbContext = JAXBContext.newInstance(Root.class);
Marshaller jaxbMarshaller = jaxbContext.createMarshaller();
// 设置JAXB Marshaller的属性
jaxbMarshaller.setProperty(Marshaller.JAXB_FORMATTED_OUTPUT, true); // 格式化输出,使其可读
jaxbMarshaller.setProperty(Marshaller.JAXB_ENCODING, "UTF-8"); // 设置编码
// 将对象写入XML文件
jaxbMarshaller.marshal(root, new File(xmlFileName));
System.out.println("CSV文件 '" + csvFileName + "' 已成功转换为XML文件 '" + xmlFileName + "'。");
} catch (IOException e) {
System.err.println("文件操作异常: " + e.getMessage());
e.printStackTrace();
} catch (Exception e) {
System.err.println("JAXB转换或未知异常: " + e.getMessage());
e.printStackTrace();
}
}
public static void main(String[] args) {
// 创建一个示例CSV文件
String csvContent = "Col1,Col2,Col3,Col4,Col5\n" +
"All,0,,0,0\n" +
"All,935,231,0,30\n" +
"None,1011,257,0,30";
String csvFileName = "input.csv";
String xmlFileName = "output.xml";
String delimiter = ",";
try {
java.nio.file.Files.write(java.nio.file.Paths.get(csvFileName), csvContent.getBytes());
System.out.println("示例CSV文件 '" + csvFileName + "' 已创建。");
} catch (IOException e) {
System.err.println("创建示例CSV文件失败: " + e.getMessage());
return;
}
CsvToXmlConverter converter = new CsvToXmlConverter();
converter.convertCsvToXmlWithAttributes(csvFileName, xmlFileName, delimiter);
}
}要运行此代码,您可能需要确保您的Java环境支持JAXB。 对于Java 9及更高版本,JAXB API已从JDK中移除,需要手动添加Maven/Gradle依赖:
<!-- Maven 依赖 -->
<dependency>
<groupId>jakarta.xml.bind</groupId>
<artifactId>jakarta.xml.bind-api</artifactId>
<version>2.3.3</version> <!-- 或更高版本 -->
</dependency>
<dependency>
<groupId>org.glassfish.jaxb</groupId>
<artifactId>jaxb-runtime</artifactId>
<version>2.3.3</version> <!-- 或更高版本 -->
<scope>runtime</scope>
</dependency>执行 main 方法后,将生成 output.xml 文件,其内容将严格按照我们期望的属性格式:
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<root>
<row col1="All" Col2="0" Col3="" Col4="0" Col5="0"></row>
<row col1="All" Col2="935" Col3="231" Col4="0" Col5="30"></row>
<row col1="None" Col2="1011" Col3="257" Col4="0" Col5="30"></row>
</root>通过JAXB提供的注解机制,我们可以以声明式的方式将Java对象映射到XML结构,包括将对象的字段映射为XML元素的属性。这种方法比手动使用DOM API创建和设置属性更为简洁、高效且易于维护,特别适用于将CSV数据转换为具有特定属性结构的XML文件。理解并熟练运用JAXB,能够极大地简化Java中XML数据处理的开发工作。
以上就是Java中将CSV数据转换为带属性的XML文件教程的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号