清华首次提出数据驱动控制新形式，算法效率直翻三倍

DDD

发布时间：2025-09-17 08:12:01

453人浏览过

来源于php中文网

原创

当大数据浪潮席卷各个行业，控制理论也迎来了关键转折点：从依赖精确模型转向依赖海量数据。

然而，在数据驱动控制（datatic control）领域，长期缺乏一种统一、高效的数据表达规范。

为解决这一难题，清华大学李升波教授领导的iDLab课题组首次将经典控制理论中的“标准型”思想引入数据驱动范式，提出了一种全新的基于数据的系统描述方式——数据标准型。

每条数据样本由两部分构成：必需的转移信息与可灵活配置的属性模块，分别用于刻画系统的动态演化规律和承载人工定义的功能特征。

清华首次提出数据驱动控制新形式，算法效率直翻三倍

更进一步，这种数据结构支持根据具体算法需求定制附加属性，有效减少重复计算，显著提升控制器设计速度，为数据驱动控制的效率优化开辟了新路径。

该研究成果已被ACC2025录用发表。

从模型标准型到数据标准型

人工智能的飞速发展，离不开高质量数据的支持。

近年来，随着AI技术在各领域的渗透，以数据为核心的方法逐渐进入控制系统的设计流程。

控制方法正经历一场深刻变革：从传统的模型驱动控制（modelic control），逐步迈向数据驱动控制（datatic control）。

清华首次提出数据驱动控制新形式，算法效率直翻三倍

△图 1：两种控制范式的对比示意图

在模型驱动控制（上图路径）中，首先通过系统辨识建立数学模型，再基于该模型设计控制器；
而在数据驱动控制（下图路径）中，控制器直接由原始数据生成，跳过了建模环节。

在传统模型驱动框架下，“标准型”是极为重要的工具。
例如，控制理论奠基人鲁道夫·卡尔曼（Rudolf E. Kálmán）指出：若将状态空间模型表示为可控或可观标准型，则无需额外验证即可保证系统的可控性或可观性。

同样，数学家卡米耶·若尔当（Camille Jordan）提出的约旦标准型，可将系统矩阵转化为对角形式，其对角线元素即为系统特征值。
由此，仅需检查所有特征值是否具有负实部，便可快速判断系统稳定性。同时，不同特征值对应不同动态模态，有助于实现精准控制设计。

但在数据驱动控制范式中，是否存在类似的“标准型”？这是一个尚未被解答的问题。

随着机器人、自动驾驶等具身智能系统的兴起，系统交互过程中产生的数据量呈指数级增长。这些复杂、高维的数据给传统控制算法带来巨大压力，也催生了一个核心问题：

能否构建一种标准化的数据表达方式，使大规模数据能被高效利用？

答案正是本研究提出的数据标准型。

数据的组织形式直接影响后续算法的效率与扩展能力。
以强化学习为例，训练过程常涉及大量迭代和高维运算，容易陷入重复计算的困境——比如每次迭代都重新计算样本间的距离或相似度。

这类冗余操作不仅耗时，还严重消耗算力资源，限制了算法在实际场景中的部署。

因此，如何对数据进行高效、规范化的组织，避免重复计算、提升运行效率，成为数据驱动控制面临的关键挑战。

受模型标准型启发，该研究首次提出适用于数据驱动系统的标准数据结构（如图2所示）：

清华首次提出数据驱动控制新形式，算法效率直翻三倍

△图 2：数据标准型结构示意图

（1）转移部分：记录状态转移信息，包含系统动力学的关键数据；
（2）属性部分：可插拔模块，可根据算法需要预置奖励、特征编码等辅助信息。

前者为控制器设计提供必要基础，后者则按需启用，兼顾灵活性与存储效率，从而全面提升算法性能。

实验验证：加速近邻搜索

研究人员通过一个典型应用场景展示了数据标准型的优势。

在强化学习中，许多算法依赖回放缓冲区中的样本进行策略优化，常需执行“最近邻搜索”操作——例如比较当前策略行为与历史数据之间的差异：

清华首次提出数据驱动控制新形式，算法效率直翻三倍

由于需遍历整个数据集寻找最接近的样本，计算开销极大。

薏米AI

YMI.AI-快捷、高效的人工智能创作平台

下载

为此，研究团队提出一种空间属性预置机制：在数据标准型中引入一组预先设定的锚点（anchor points），并为每个样本提前计算其到各锚点的距离，作为可插拔的空间属性保存下来。

清华首次提出数据驱动控制新形式，算法效率直翻三倍

△图 3：空间属性构造示意图

基于此，研究提出了空间筛选条件定理，用于快速缩小候选样本范围。

定理 1（空间筛选条件）

设数据集中存在 n 个锚点，C 为目标样本，S 为任意其他样本。若 S 位于 C 的 R-邻域内，则必须满足以下条件：

清华首次提出数据驱动控制新形式，算法效率直翻三倍

其中 ∧ 表示逻辑与运算符。

利用该条件，只需一次判断指令即可排除大量无关样本，大幅压缩搜索空间。

清华首次提出数据驱动控制新形式，算法效率直翻三倍

△图 4：空间筛选机制示意图

实验在D4RL数据集的Hopper任务中开展，对比使用空间标准型前后的训练时间。

结果如图5所示：原始版本（蓝色曲线）耗时约20小时，而引入空间标准型后（橙色曲线），训练时间缩短至7小时，提速近三倍。

清华首次提出数据驱动控制新形式，算法效率直翻三倍

△图 5：训练时间对比图

由此可见，数据标准型以极小的存储代价，换取了显著的时间效率提升。

此外，其模块化设计允许按需启用属性字段，降低存储负担，具备良好的可扩展性，为未来数据驱动控制算法的发展提供了全新思路。

论文链接：https://www.php.cn/link/c1927a57de5c455d3bb1e6cdae59fab5

一键三连「点赞」「转发」「小心心」

欢迎在评论区分享你的看法！

— 完 —

点亮星标

科技前沿进展每日见

年底装机英特尔主板推荐补贴促销闭眼入不亏

谷歌Pixel 9 Pro上手体验：原生安卓AI大脑与计算摄影的新高度

真我GT8 Pro评测：创意设计越级体验街拍神器

易简设计颜值在线 OPPO Find X9系列外观抢先看

小米17 Pro系列上手评测对标苹果屏幕大突破

驱动精灵

驱动精灵基于驱动之家十余年的专业数据积累，驱动支持度高，已经为数亿用户解决了各种电脑驱动问题、系统故障，是目前有效的驱动软件，有需要的小伙伴快来保存下载体验吧！

下载

相关专题

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1428

2023.10.24

Go语言中的运算符有哪些

Go语言中的运算符有：1、加法运算符；2、减法运算符；3、乘法运算符；4、除法运算符；5、取余运算符；6、比较运算符；7、位运算符；8、按位与运算符；9、按位或运算符；10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

221

2024.02.23

php三元运算符用法

本专题整合了php三元运算符相关教程，阅读专题下面的文章了解更多详细内容。

2025.10.17

treenode的用法

在计算机编程领域，TreeNode是一种常见的数据结构，通常用于构建树形结构。在不同的编程语言中，TreeNode可能有不同的实现方式和用法，通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

529

2023.12.01

C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化，涵盖排序算法（快速排序、归并排序）、查找算法、图算法、动态规划、贪心算法等，并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构（链表、树、堆、哈希表等），帮助开发者提升在复杂应用中的算法设计与性能优化能力。

2025.12.22

页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章，大家可以免费体验。

383

2023.08.14

人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容，供大家免费下载体验。

393

2023.08.17

人工智能的基本概念是什么

人工智能的英文缩写为AI，是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学；该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

286

2024.01.09

ip地址修改教程大全

本专题整合了ip地址修改教程大全，阅读下面的文章自行寻找合适的解决教程。

2025.12.26

热门下载

网站特效

网站源码

网站素材

前端模板