强化学习:赋能机器人,突破速度与能力极限
当大模型的扩展定律逼近瓶颈时,强化学习为构建更强大的模型开辟了新的途径。在机器人领域,这一技术也取得了令人瞩目的进展。
波士顿动力机器狗Spot,想必大家已非常熟悉。它曾多次登上热搜,展现令人惊叹的技能,例如喷火的同时跳踢踏舞。然而,许多人曾质疑其四足设计,认为轮式设计更具速度和地形适应性。
如今,Spot已实现了飞跃式进步。它不再是小心翼翼地踱步,而是能够快速敏捷地奔跑。 其速度提升近三倍,达到惊人的18.7公里/小时,接近小型犬的平均奔跑速度。
传统观点认为,机器人速度受限于电机性能。然而,RAI研究所与波士顿动力合作,利用强化学习对机器狗的电机和动力系统建模后,发现了一个意想不到的瓶颈:电池供电能力。模拟环境下的并行训练,显著提升了Spot的实际性能。 这颠覆了之前的认知。
Spot的电力系统仍有优化空间。目前,限制其速度的主要因素是电池电压数据无法完全融入强化学习模型。这意味着,更强大的电池将进一步提升Spot的奔跑速度。
值得注意的是,高速奔跑时的Spot姿态与真实犬类有所不同。这并非缺陷,而是由于其执行器和关节结构与生物体存在差异,导致最优运动方式也不尽相同。
Spot提速的关键在于,在原有小跑步态的基础上,增加了四足同时离地的“飞行”阶段,从而实现了真正的奔跑。 四足离地“飞行”阶段 这个“飞行”阶段对于维持高速至关重要。
强化学习与传统模型预测控制(MPC)方法截然不同。MPC如同给机器人提供详细的动作指南,可靠但保守;而强化学习则让机器人通过在虚拟环境中反复练习,自主学习最优动作方案,并将其应用于现实。
RAI研究所还利用强化学习训练了一款名为UMV的自行车机器人,使其能够完成平衡、驾驶甚至跑酷等动作。 值得一提的是,UMV无需平衡陀螺仪,完全依靠AI保持平衡。
强化学习的优势在于发现新的行为模式,并提升其在复杂环境下的稳定性和可靠性。 UMV倒车时的不稳定性 虽然UMV已能熟练完成各种特技动作,但一些看似简单的动作,例如倒车,仍然面临挑战。
UMV在虚拟环境中练习下楼梯
RAI研究所的研究表明,强化学习等基于学习的方法,能够突破机器人硬件的固有性能限制,实现更广泛的功能。关键在于理解并突破硬件系统的隐藏限制,不断拓展控制的边界。
以上就是3倍提速!现在你跑不过机器狗了,限制波士顿动力机器狗的竟然是电池功率?的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号