
1. 文件读取模块设计中的常见挑战
在开发需要处理多种文件格式(如CSV、Excel)的应用程序时,我们通常会为每种文件类型创建独立的读取逻辑。例如,使用Apache POI处理Excel文件,使用OpenCSV处理CSV文件。随着文件类型的增多和业务需求的演变,如何设计一个既能统一接口又能保持高度可扩展性的文件读取模块,成为了一个关键的设计问题。
一个常见的初步尝试是为每种文件类型创建独立的读取类,并期望通过一个公共接口来抽象它们。例如:
// CSV 文件读取器
class CsvReader {
void open() { /* 实现 */ }
List get1() { /* 实现 */ }
List get2() { /* 实现 */ }
void close() { /* 实现 */ }
}
// Excel 文件读取器
class ExcelReader {
void open() { /* 实现 */ }
List get3() { /* 实现 */ }
List get4() { /* 实现 */ }
void close() { /* 实现 */ }
} 为了统一这些读取器,我们可能会尝试定义一个 FileReadable 接口:
interface FileReadable {
void open();
List get1(); // 仅存在于CsvReader
List get2(); // 仅存在于CsvReader
List get3(); // 仅存在于ExcelReader
List get4(); // 仅存在于ExcelReader
void close();
} 然而,这种设计模式存在明显的问题:FileReadable 接口包含了所有文件类型特有的方法。这意味着 CsvReader 实现 get3() 和 get4() 时将不得不返回 null 或抛出异常,反之亦然。这导致了接口污染,降低了接口的内聚性,并且客户端在使用时仍然需要知道具体的文件类型才能调用正确的方法,违背了接口抽象的初衷。
2. 核心设计原则:数据抽象与通用接口
问题的关键在于,虽然底层的文件格式不同,但它们所承载的“数据”在业务层面可能具有相同的结构或含义。例如,CsvDto1 和 ExlDto1 可能都代表某种“用户记录”或“产品信息”。因此,解决方案的核心在于将数据表示从其文件来源中解耦,即使用通用的数据传输对象(DTO)。
我们应该将关注点从“如何读取特定文件”转移到“读取出什么类型的数据”。无论数据来源于CSV还是Excel,如果它们在业务逻辑中代表相同概念,就应该使用相同的DTO。
3. 优化设计:通用DTO与策略模式应用
基于上述原则,我们可以重新设计 FileReadable 接口和相关的DTO。
3.1 定义通用DTO
首先,定义与文件来源无关的通用DTO。例如,如果 CsvDto1 和 ExlDto1 都代表“订单信息”,那么我们可以定义一个统一的 OrderDto。同理,CsvDto2 和 ExlDto2 可以统一为 ProductDto。
// 通用订单数据传输对象
public class OrderDto {
private String orderId;
private String customerName;
private double amount;
// ... 其他字段和getter/setter
}
// 通用产品数据传输对象
public class ProductDto {
private String productId;
private String productName;
private double price;
// ... 其他字段和getter/setter
}3.2 重新定义 FileReadable 接口
现在,FileReadable 接口可以专注于提供通用的数据访问方法,而无需关心数据的原始文件类型。
技术上面应用了三层结构,AJAX框架,URL重写等基础的开发。并用了动软的代码生成器及数据访问类,加进了一些自己用到的小功能,算是整理了一些自己的操作类。系统设计上面说不出用什么模式,大体设计是后台分两级分类,设置好一级之后,再设置二级并选择栏目类型,如内容,列表,上传文件,新窗口等。这样就可以生成无限多个二级分类,也就是网站栏目。对于扩展性来说,如果有新的需求可以直接加一个栏目类型并新加功能操作
import java.util.List;
/**
* 通用文件读取接口
* 定义了读取各种类型文件所需的基本操作和数据获取方法。
*/
public interface FileReadable {
/**
* 打开文件或初始化读取资源。
*/
void open();
/**
* 获取订单数据列表。
* @return 包含OrderDto对象的列表。
*/
List getOrders();
/**
* 获取产品数据列表。
* @return 包含ProductDto对象的列表。
*/
List getProducts();
/**
* 关闭文件或释放读取资源。
*/
void close();
} 3.3 实现具体文件读取器
CsvReader 和 ExcelReader 现在将实现这个统一的 FileReadable 接口,并在其内部逻辑中负责将特定文件格式的数据映射到通用的 OrderDto 和 ProductDto。
import java.util.ArrayList;
import java.util.List;
// 假设有OpenCSV和Apache POI的相关导入
/**
* CSV文件读取器实现
*/
public class CsvReader implements FileReadable {
// 假设的CSV文件路径或输入流
private String csvFilePath;
// ... 其他内部状态
public CsvReader(String csvFilePath) {
this.csvFilePath = csvFilePath;
}
@Override
public void open() {
System.out.println("CsvReader: 打开CSV文件 " + csvFilePath);
// 实际的OpenCSV文件打开逻辑
}
@Override
public List getOrders() {
System.out.println("CsvReader: 读取订单数据...");
List orders = new ArrayList<>();
// 实际的CSV读取逻辑,将CSV行数据映射到OrderDto
orders.add(new OrderDto(/* 从CSV行解析数据 */));
return orders;
}
@Override
public List getProducts() {
System.out.println("CsvReader: 读取产品数据...");
List products = new ArrayList<>();
// 实际的CSV读取逻辑,将CSV行数据映射到ProductDto
products.add(new ProductDto(/* 从CSV行解析数据 */));
return products;
}
@Override
public void close() {
System.out.println("CsvReader: 关闭CSV文件 " + csvFilePath);
// 实际的OpenCSV资源关闭逻辑
}
}
import java.util.ArrayList;
import java.util.List;
// 假设有OpenCSV和Apache POI的相关导入
/**
* Excel文件读取器实现
*/
public class ExcelReader implements FileReadable {
// 假设的Excel文件路径或输入流
private String excelFilePath;
// ... 其他内部状态
public ExcelReader(String excelFilePath) {
this.excelFilePath = excelFilePath;
}
@Override
public void open() {
System.out.println("ExcelReader: 打开Excel文件 " + excelFilePath);
// 实际的Apache POI文件打开逻辑
}
@Override
public List getOrders() {
System.out.println("ExcelReader: 读取订单数据...");
List orders = new ArrayList<>();
// 实际的Apache POI读取逻辑,将Excel单元格数据映射到OrderDto
orders.add(new OrderDto(/* 从Excel行解析数据 */));
return orders;
}
@Override
public List getProducts() {
System.out.println("ExcelReader: 读取产品数据...");
List products = new ArrayList<>();
// 实际的Apache POI读取逻辑,将Excel单元格数据映射到ProductDto
products.add(new ProductDto(/* 从Excel行解析数据 */));
return products;
}
@Override
public void close() {
System.out.println("ExcelReader: 关闭Excel文件 " + excelFilePath);
// 实际的Apache POI资源关闭逻辑
}
} 3.4 客户端使用示例
现在,客户端代码可以完全面向 FileReadable 接口编程,而无需关心具体的文件类型,实现了与底层实现的解耦。
public class DataProcessor {
public static void processFile(FileReadable reader) {
reader.open();
try {
List orders = reader.getOrders();
System.out.println("处理订单数据:共 " + orders.size() + " 条");
// 对订单数据进行业务处理
for (OrderDto order : orders) {
System.out.println("订单ID: " + order.getOrderId() + ", 客户: " + order.getCustomerName());
}
List products = reader.getProducts();
System.out.println("处理产品数据:共 " + products.size() + " 条");
// 对产品数据进行业务处理
for (ProductDto product : products) {
System.out.println("产品ID: " + product.getProductId() + ", 名称: " + product.getProductName());
}
} finally {
reader.close();
}
}
public static void main(String[] args) {
// 使用CSV文件读取器
FileReadable csvReader = new CsvReader("data.csv");
System.out.println("\n--- 处理CSV文件 ---");
processFile(csvReader);
// 使用Excel文件读取器
FileReadable excelReader = new ExcelReader("data.xlsx");
System.out.println("\n--- 处理Excel文件 ---");
processFile(excelReader);
}
} 4. 扩展与注意事项
4.1 区分数据来源
如果业务上确实需要知道数据来源于CSV还是Excel,可以在通用DTO中添加一个字段来标识来源:
public class OrderDto {
private String orderId;
private String customerName;
private double amount;
private String sourceFileFormat; // 例如:"CSV", "EXCEL"
// ... 构造函数和getter/setter
}在具体的 CsvReader 或 ExcelReader 实现中,在创建 OrderDto 实例时设置 sourceFileFormat 字段即可。
4.2 适用设计模式
这种设计方案体现了策略模式(Strategy Pattern)的思想。FileReadable 接口定义了客户端所需的通用操作(策略),而 CsvReader 和 ExcelReader 是具体的策略实现。客户端通过注入不同的具体策略来处理不同文件类型,而无需修改自身代码。
如果需要根据文件扩展名动态创建相应的读取器实例,可以进一步引入简单工厂模式(Simple Factory Pattern)或工厂方法模式(Factory Method Pattern)。
4.3 灵活性与局限性
- 灵活性: 这种设计极大地提高了模块的灵活性和可扩展性。当需要支持新的文件格式(如XML、JSON)时,只需创建一个新的类实现 FileReadable 接口,并确保它能将数据映射到现有的通用DTOs即可,无需修改现有代码。
- 局限性: 这种方法的前提是不同文件格式的数据能够被映射到一组通用的DTOs。如果不同文件格式所包含的数据结构差异巨大,以至于无法抽象出共同的DTO,那么可能需要更复杂的映射逻辑,或者为不同类型的数据定义不同的接口。
5. 总结
通过将文件读取模块的设计重点从“文件格式”转移到“数据结构”,并采用通用的数据传输对象(DTO)和统一的接口,我们能够构建出高度可维护和可扩展的文件读取系统。这种设计不仅解耦了客户端代码与底层文件格式的依赖,也为未来添加新的文件类型提供了清晰的扩展点,是处理多文件格式读取场景的有效策略。









