首页 > Java > java教程 > 正文

Java DJL模型加载推理_Java怎么用DJL加载和运行预训练模型

舞夢輝影
发布: 2025-12-22 15:24:23
原创
958人浏览过
Java中用DJL加载和运行预训练模型只需三步:添加依赖(如djl-api、pytorch-engine等)、选择模型(URL/本地路径/模型ID)、构建Predictor执行推理;DJL自动适配PyTorch等引擎,无需编写底层计算逻辑。

java djl模型加载推理_java怎么用djl加载和运行预训练模型 - php中文网

Java中用DJL加载和运行预训练模型,核心是三步:添加依赖、选择模型(本地或远程)、构建Predictor执行推理。不需要写底层计算逻辑,DJL自动处理引擎适配(如PyTorch、TensorFlow、ONNX Runtime)。

1. 添加DJL依赖(Maven)

DJL支持多引擎,推荐从PyTorch开始(生态成熟、模型丰富)。在pom.xml中引入:

  • 核心APIdjl-api
  • PyTorch引擎model-zoo + pytorch-engine
  • 预编译本地库(免编译)pytorch-native-auto(自动匹配系统架构)

示例依赖片段:

<dependency>
  <groupId>ai.djl</groupId>
  <artifactId>api</artifactId>
  <version>0.27.0</version>
</dependency>
<dependency>
  <groupId>ai.djl.pytorch</groupId>
  <artifactId>pytorch-engine</artifactId>
  <version>0.27.0</version>
</dependency>
<dependency>
  <groupId>ai.djl.pytorch</groupId>
  <artifactId>pytorch-native-auto</artifactId>
  <version>2.1.2</version>
</dependency>
登录后复制

2. 加载预训练模型(支持URL/本地路径/模型ID)

DJL内置ModelZoo,可直接用HuggingFace ID或DJL Model Zoo地址加载。例如加载bert-base-uncased文本分类模型:

立即学习Java免费学习笔记(深入)”;

Voicv
Voicv

克隆你的声音,就像Ctrl+C, Ctrl+V一样

Voicv 165
查看详情 Voicv
  • Criteria声明输入输出类型、模型来源、设备(CPU/GPU)
  • 调用ModelLoader.loadModel()获得Model实例
  • 注意:首次加载会自动下载模型权重到本地缓存(~/.djl.ai/cache

代码示例:

Criteria<String, Classifications> criteria = Criteria.builder()
    .setTypes(String.class, Classifications.class)
    .optModelUrls("https://resources.djl.ai/test-models/pytorch/transformers/bert-base-uncased.zip")
    .optEngine("PyTorch")
    .optTranslator(new BertTranslator())
    .build();

Model model = Model.newInstance("bert");
model = ModelLoader.loadModel(criteria);
登录后复制

3. 构建Predictor并运行推理

Predictor是执行推理的入口,封装了预处理、前向传播、后处理。创建后调用predict()即可:

  • Translator负责输入转NDArray、输出转业务对象(如Classifications)
  • 支持批量输入(List),也支持单条字符串
  • 用完记得close()释放资源(推荐try-with-resources)

完整推理示例:

try (Predictor<String, Classifications> predictor = model.newPredictor(new BertTranslator())) {
    Classifications result = predictor.predict("I love DJL!");
    System.out.println(result);
    // 输出类似:positive: 0.982, negative: 0.018
}
登录后复制

4. 常见问题与建议

实际使用时容易卡在环境或格式上,注意以下几点:

  • GPU支持需安装CUDA驱动+cuDNN,并用pytorch-native-cu118等对应版本依赖
  • 模型输入必须匹配Translator定义(如Bert要tokenize,CNN图像要resize+normalize)
  • 自定义模型:把model.ptsynset.txt等放在同目录,用optModelPath(Paths.get("models/my-model"))
  • 性能优化:启用setLimit(1)限制线程数,或用Model.setBlock()手动指定计算图

以上就是Java DJL模型加载推理_Java怎么用DJL加载和运行预训练模型的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号