
本文介绍如何在 dvc 项目中使用 python 常量文件(如 `constants.py`)集中定义数据路径,并在 `dvc.yaml` 中通过 `vars` 正确引用,实现路径配置的单一维护源。
DVC 支持通过 vars 字段从外部 Python 文件导入变量,从而实现跨 stage 的路径复用与集中管理。你提出的方案——使用 constants.py 定义路径并在 dvc.yaml 中通过 vars: [- constants.py] 引入——完全正确且官方支持,无需额外插件或变通方式。
✅ 正确用法示例:
# constants.py MY_DATA = "data/location" MY_OUT = "data/out"
# dvc.yaml
vars:
- constants.py
stages:
preprocess:
deps:
- ${MY_DATA}
outs:
- ${MY_OUT}
cmd: python src/preprocess.py⚠️ 注意事项:
- constants.py 必须是合法的 Python 模块:仅包含变量赋值(不执行函数、不依赖未安装包),且文件名不能含特殊字符或空格;
- 变量名需为纯大写蛇形命名(如 MY_DATA),DVC 当前仅支持顶层模块级变量(不支持嵌套对象或动态计算);
- 确保 constants.py 位于 dvc.yaml 同目录或其子目录中;若放在上层目录,需使用相对路径(如 - ../config/constants.py);
- 修改 constants.py 后,需运行 dvc repro 或 dvc dag 触发重解析(DVC 不自动监听 .py 文件变更);
- 避免在 constants.py 中使用 os.path.join 或 pathlib 构造路径——DVC 变量解析阶段不执行代码,仅做静态导入。
? 进阶建议:
若需环境差异化(如开发/生产路径不同),可结合 DVC 的 params.yaml + --params 参数,或使用 YAML 多环境变量(vars: [- params.yaml:paths]),但对纯静态路径场景,constants.py 是最轻量、最直观的选择。
总结:你的原始写法无误。若仍报错(如 Variable 'MY_DATA' not found),请检查:
- constants.py 是否存在且可被 Python 导入(尝试 python -c "from constants import MY_DATA");
- DVC 版本是否 ≥ 2.30(vars from .py 文件自该版本起稳定支持);
- dvc.yaml 缩进是否严格(YAML 对空格敏感)。
如确认配置无误仍失败,建议升级 DVC 并提交最小复现案例至 DVC GitHub Issues。










