Java中用DJL加载和运行预训练模型只需三步:添加依赖(如djl-api、pytorch-engine等)、选择模型(URL/本地路径/模型ID)、构建Predictor执行推理;DJL自动适配PyTorch等引擎,无需编写底层计算逻辑。

Java中用DJL加载和运行预训练模型,核心是三步:添加依赖、选择模型(本地或远程)、构建Predictor执行推理。不需要写底层计算逻辑,DJL自动处理引擎适配(如PyTorch、TensorFlow、ONNX Runtime)。
DJL支持多引擎,推荐从PyTorch开始(生态成熟、模型丰富)。在pom.xml中引入:
djl-api
model-zoo + pytorch-engine
pytorch-native-auto(自动匹配系统架构)示例依赖片段:
<dependency> <groupId>ai.djl</groupId> <artifactId>api</artifactId> <version>0.27.0</version> </dependency> <dependency> <groupId>ai.djl.pytorch</groupId> <artifactId>pytorch-engine</artifactId> <version>0.27.0</version> </dependency> <dependency> <groupId>ai.djl.pytorch</groupId> <artifactId>pytorch-native-auto</artifactId> <version>2.1.2</version> </dependency>
DJL内置ModelZoo,可直接用HuggingFace ID或DJL Model Zoo地址加载。例如加载bert-base-uncased文本分类模型:
立即学习“Java免费学习笔记(深入)”;
Criteria声明输入输出类型、模型来源、设备(CPU/GPU)ModelLoader.loadModel()获得Model实例~/.djl.ai/cache)代码示例:
Criteria<String, Classifications> criteria = Criteria.builder()
.setTypes(String.class, Classifications.class)
.optModelUrls("https://resources.djl.ai/test-models/pytorch/transformers/bert-base-uncased.zip")
.optEngine("PyTorch")
.optTranslator(new BertTranslator())
.build();
Model model = Model.newInstance("bert");
model = ModelLoader.loadModel(criteria);Predictor是执行推理的入口,封装了预处理、前向传播、后处理。创建后调用predict()即可:
Translator负责输入转NDArray、输出转业务对象(如Classifications)close()释放资源(推荐try-with-resources)完整推理示例:
try (Predictor<String, Classifications> predictor = model.newPredictor(new BertTranslator())) {
Classifications result = predictor.predict("I love DJL!");
System.out.println(result);
// 输出类似:positive: 0.982, negative: 0.018
}实际使用时容易卡在环境或格式上,注意以下几点:
pytorch-native-cu118等对应版本依赖Translator定义(如Bert要tokenize,CNN图像要resize+normalize)model.pt和synset.txt等放在同目录,用optModelPath(Paths.get("models/my-model"))
setLimit(1)限制线程数,或用Model.setBlock()手动指定计算图以上就是Java DJL模型加载推理_Java怎么用DJL加载和运行预训练模型的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号