0

0

DuckDB SQL查询结果直接转换为JSON的实用指南

霞舞

霞舞

发布时间:2025-11-28 14:40:17

|

583人浏览过

|

来源于php中文网

原创

DuckDB SQL查询结果直接转换为JSON的实用指南

本教程详细介绍了如何在duckdb中直接将sql select查询结果转换为特定格式的json对象,无需借助外部工具或中间文件。通过利用duckdb的`list`聚合函数和`struct`数据类型,您可以高效地将多行数据聚合为以列名为键、列值列表为值的json结构。本文将提供具体示例和操作步骤,帮助您在duckdb中实现数据的高级json输出。

在数据处理和分析场景中,将SQL查询结果直接导出为JSON格式是一种常见需求。特别是在集成数据服务或构建API时,能够直接从数据库层面生成结构化的JSON数据可以极大地简化开发流程并提高效率。DuckDB作为一款高性能的OLAP数据库,提供了强大的SQL功能,包括对JSON数据类型的原生支持,使得这种转换变得直接且高效。

本教程将专注于解决一个具体的需求:将SELECT查询的多行结果,转换为一个JSON对象,其中JSON的键是查询的列名,对应的值是该列所有结果的列表。例如,对于查询SELECT city, temp_hi FROM weather;,期望的JSON输出是{"city": ["San Francisco", "Vienna"], "temp_hi": [50, 35]}。

核心概念:LIST聚合函数与STRUCT数据类型

要实现上述JSON转换,我们需要理解DuckDB的两个关键特性:

  1. LIST聚合函数: LIST(expression)是一个聚合函数,它将指定表达式在所有行中的值收集到一个列表中。例如,LIST(city)会返回所有城市名称的列表。
  2. STRUCT数据类型: STRUCT允许您将多个字段(可以是不同类型)组合成一个单一的复合数据类型。在DuckDB中,可以使用大括号{}或struct_pack()函数来定义STRUCT。通过将LIST聚合函数的结果作为STRUCT的字段值,我们可以构建所需的键值对结构。

结合这两者,我们可以先创建一个包含所有聚合列表的STRUCT,然后将其显式转换为JSON类型。

示例数据准备

首先,我们创建一个示例表并插入一些数据,以便进行后续的查询和转换操作:

CREATE TABLE weather (
      city    VARCHAR,
      temp_lo INTEGER, -- minimum temperature on a day
      temp_hi INTEGER, -- maximum temperature on a day
      prcp    REAL,
      date    DATE
  );
INSERT INTO weather VALUES ('San Francisco', 46, 50, 0.25, '1994-11-27');
INSERT INTO weather VALUES ('Vienna', -5, 35, 10, '2000-01-01');

实现方法

DuckDB提供了两种主要方式来定义STRUCT,进而实现SQL查询结果到指定JSON格式的转换。

方法一:使用大括号定义STRUCT并聚合

这是最直观的方式,通过在大括号内直接指定键值对来创建STRUCT。键通常是列名,值则是使用LIST函数聚合后的列数据。

Shakespeare
Shakespeare

一款人工智能文案软件,能够创建几乎任何类型的文案。

下载
SELECT {city: list(city), temp_hi: list(temp_hi)}::JSON AS j FROM weather;

代码解析:

  • {city: list(city), temp_hi: list(temp_hi)}: 这部分创建了一个匿名的STRUCT。
    • city: list(city):将weather表中所有city列的值聚合成一个列表,并将其作为STRUCT中名为city的字段的值。
    • temp_hi: list(temp_hi):同理,将所有temp_hi列的值聚合成一个列表,作为STRUCT中名为temp_hi的字段的值。
  • ::JSON: 这是一个类型转换操作符,将创建的STRUCT显式地转换为JSON数据类型。DuckDB会根据STRUCT的结构自动生成对应的JSON对象。
  • AS j: 为最终生成的JSON列指定别名j。

方法二:使用 struct_pack 函数

struct_pack函数提供了另一种创建STRUCT的方式,尤其适用于需要动态构建或参数化STRUCT字段的场景。其语法是struct_pack(key := value_expression, ...)。

SELECT struct_pack(city := list(city), temp_hi := list(temp_hi))::JSON AS j FROM weather;

代码解析:

  • struct_pack(city := list(city), temp_hi := list(temp_hi)): 这部分使用struct_pack函数创建了一个STRUCT。
    • city := list(city):与方法一类似,将city列的聚合列表赋值给STRUCT中的city字段。:=是用于在struct_pack中定义字段名和值的语法。
    • temp_hi := list(temp_hi):同理,将temp_hi列的聚合列表赋值给STRUCT中的temp_hi字段。
  • ::JSON AS j: 同样将生成的STRUCT转换为JSON类型并指定别名。

结果展示

无论采用哪种方法,上述查询都将产生相同的JSON输出,精确符合我们的需求:

┌───────────────────────────────────────────────────────┐
│                           j                           │
│                         json                          │
├───────────────────────────────────────────────────────┤
│ {"city":["San Francisco","Vienna"],"temp_hi":[50,35]} │
└───────────────────────────────────────────────────────┘

注意事项

  1. JSON格式的特异性: 本教程介绍的方法生成的是一个JSON对象,其中键是查询的列名,值是该列所有数据的列表。如果您的需求是生成一个JSON数组,其中每个元素代表一行数据(即[{"city": "San Francisco", "temp_hi": 50}, {"city": "Vienna", "temp_hi": 35}]),则需要采用不同的策略,例如先将每行转换为STRUCT,然后使用LIST聚合这些STRUCT,或者利用DuckDB的to_json函数与子查询结合。
  2. 性能考量: 对于包含海量行和/或列的查询结果,将整个列的数据聚合成一个列表并存储在一个JSON对象中可能会消耗大量内存。在处理非常大的数据集时,请评估这种方法的内存开销,并考虑是否需要分批处理或采用其他数据导出策略。
  3. DuckDB版本: 确保您使用的DuckDB版本支持LIST聚合函数和STRUCT数据类型,以及::JSON类型转换。这些功能在DuckDB的现代版本中是标准配置。
  4. 数据类型映射: DuckDB在将STRUCT转换为JSON时,会根据其内部数据类型进行适当的JSON类型映射(例如,INTEGER映射为JSON数字,VARCHAR映射为JSON字符串,DATE映射为JSON字符串等)。

总结

DuckDB通过其强大的LIST聚合函数和灵活的STRUCT数据类型,提供了一种直接且高效的方式来将SQL查询结果转换为特定结构的JSON对象。这种方法避免了将数据导出到中间文件或通过外部编程语言进行转换的复杂性,使得数据处理流程更加流畅和集成。理解并掌握这些技巧,将有助于您在DuckDB中更有效地处理和输出结构化数据。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

678

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

320

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

346

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1095

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

357

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

675

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

572

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

414

2024.04.29

Golang gRPC 服务开发与Protobuf实战
Golang gRPC 服务开发与Protobuf实战

本专题系统讲解 Golang 在 gRPC 服务开发中的完整实践,涵盖 Protobuf 定义与代码生成、gRPC 服务端与客户端实现、流式 RPC(Unary/Server/Client/Bidirectional)、错误处理、拦截器、中间件以及与 HTTP/REST 的对接方案。通过实际案例,帮助学习者掌握 使用 Go 构建高性能、强类型、可扩展的 RPC 服务体系,适用于微服务与内部系统通信场景。

6

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
WEB前端教程【HTML5+CSS3+JS】
WEB前端教程【HTML5+CSS3+JS】

共101课时 | 8.3万人学习

JS进阶与BootStrap学习
JS进阶与BootStrap学习

共39课时 | 3.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号