首页 > Java > java教程 > 正文

JOLT Shift转换:如何从任意嵌套层级收集数据并强制输出为数组

花韻仙語
发布: 2025-07-21 15:16:11
原创
817人浏览过

JOLT Shift转换:如何从任意嵌套层级收集数据并强制输出为数组

本文深入探讨了JOLT shift 转换中一个常见挑战:如何从深度不定的嵌套JSON结构中提取特定字段的值,并将其统一收集到一个列表中,即使只有一个匹配项也强制生成数组。核心解决方案是利用JOLT shift 规范中目标路径后的 [] 语法,确保无论输入数据量多少,输出结果始终是期望的数组格式,从而实现数据扁平化与标准化。

引言

jolt(json to json transformation language)是一个强大的json数据转换工具,尤其适用于对复杂json结构进行重塑、过滤和聚合。在数据处理场景中,我们经常会遇到需要从多层嵌套的数据中提取特定信息,并将其扁平化为一个列表的需求。然而,当匹配到的元素只有一个时,jolt的默认行为可能不会生成数组,这给下游系统处理带来了不便。本文将详细介绍如何利用jolt shift 操作的特性,优雅地解决这一问题,确保输出始终为数组。

问题剖析:多层嵌套与数组输出的挑战

假设我们有一个JSON结构,其中包含多层嵌套的item数组,并且我们希望从最内层的foo对象中提取nn字段的值,最终将所有这些值汇集到一个名为type的数组中。关键挑战在于:

  1. 未知嵌套深度:虽然示例中展示了固定的嵌套层级,但在实际应用中,item数组的嵌套深度可能不确定。
  2. 强制数组输出:无论匹配到的nn值是一个还是多个,最终的type字段都必须是一个数组。

输入示例:

{
  "id": 1,
  "item": [
    {
      "id": "1_1",
      "foo": {
        "id": 1232,
        "nn": "sdfsd"
      }
    }
  ]
}
登录后复制

期望输出:

{
  "type": [ "sdfsd" ]
}
登录后复制

用户尝试的JOLT Spec及其遇到的问题:

用户尝试编写了一个JOLT shift 规范来解决此问题:

[
  {
    "operation": "shift",
    "spec": {
      "item": {
        "*": {
          "item": {
            "*": {
              "item": {
                "*": {
                  "foo": {
                    "nn": "type"
                  }
                }
              },
              "foo": {
                "nn": "type"
              }
            }
          },
          "foo": {
            "nn": "type"
          }
        }
      }
    }
  }
]
登录后复制

然而,当输入中只有一个匹配的nn值时,上述Spec产生的输出是:

{
  "type": "sdfsd"
}
登录后复制

type字段被转换为一个字符串,而非期望的数组。这表明JOLT在默认情况下,如果只有一个值映射到目标路径,它会直接将该值赋给目标字段,而不是将其包裹在数组中。

解决方案:利用JOLT shift 的数组强制转换 []

解决上述问题的关键在于JOLT shift 操作的一个简洁而强大的特性:在目标路径(右侧值)后添加[]。这会指示JOLT,无论有多少个值被映射到该路径,都应该将它们收集到一个数组中。

即构数智人
即构数智人

即构数智人是由即构科技推出的AI虚拟数字人视频创作平台,支持数字人形象定制、短视频创作、数字人直播等。

即构数智人 36
查看详情 即构数智人

核心思想:

将JOLT Spec中所有将nn值映射到type的地方,将其右侧的type改为type[]。

修正后的JOLT Spec:

[
  {
    "operation": "shift",
    "spec": {
      "item": {
        "*": {
          "item": {
            "*": {
              "item": {
                "*": {
                  "foo": {
                    "nn": "type[]"
                  }
                }
              },
              "foo": {
                "nn": "type[]"
              }
            }
          },
          "foo": {
            "nn": "type[]"
          }
        }
      }
    }
  }
]
登录后复制

修正后的输出:

使用上述修正后的JOLT Spec对原输入进行转换,将得到期望的输出:

{
  "type": [ "sdfsd" ]
}
登录后复制

即使只有一个sdfsd值,它也被正确地包裹在了一个数组中。如果输入包含多个item层级或多个item元素,所有匹配的nn值都将被收集到同一个type数组中,例如:

{
  "type": [ "sdfsd", "dfsds", "fjghi", ... ]
}
登录后复制

注意事项与最佳实践

  1. [] 的应用场景:[] 后缀是JOLT shift 操作中用于强制生成数组的通用模式。当你不确定输入数据会产生一个还是多个值,但希望输出始终是数组时,应始终使用此模式。
  2. 处理多层嵌套的策略
    • 硬编码路径:如本例所示,通过重复的路径匹配(item.*.item.*)可以处理已知最大深度的嵌套。这种方法在深度固定或有上限时有效。
    • 递归转换:对于真正任意深度的嵌套,JOLT shift 本身可能无法一步到位。可能需要结合其他JOLT操作(如flatten或cardinality)或者进行多次JOLT转换,甚至在JOLT外部进行预处理或后处理。本例中,通过重复item.*来“捕获”不同深度的foo对象是一种常见的折衷方案。
  3. *通配符 `的使用**:在shift操作中,*` 作为通配符用于匹配数组索引或对象键,这使得Spec能够适应结构中的动态部分。
  4. JOLT的聚合行为:当多个输入路径映射到同一个输出路径(例如,多个nn都映射到type[])时,JOLT会自动将这些值聚合到同一个数组中。这是shift操作的强大之处。

总结

在JOLT shift 转换中,确保输出字段始终为数组是一个常见的需求。通过在目标路径后简单地添加 [],我们可以强制JOLT将所有匹配到的值收集到一个数组中,无论匹配项的数量是一个还是多个。这一技巧极大地提高了JOLT转换的鲁棒性和输出的标准化程度,是处理复杂JSON数据结构时不可或缺的技能。掌握这一方法,将使你的JOLT转换规范更加灵活和强大。

以上就是JOLT Shift转换:如何从任意嵌套层级收集数据并强制输出为数组的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号