0

0

鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6

WBOY

WBOY

发布时间:2023-06-15 21:49:54

|

1501人浏览过

|

来源于51CTO.COM

转载

让机器狗学完真狗子的运动数据,真有二哈那感觉了!

它轻松跨个栏,后面“主人”差点没跟上:

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6

钻个“狗洞”倒是轻车熟路:

鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6

还能两只狗一起撒欢儿,它追、它逃……

鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6

这就是鹅厂机器狗的最新进展。

利用预训练模型喂给机器狗真狗子的运动数据、并通过强化学习,机器狗Max不仅在行为上更灵动,而且还能根据已经掌握的技能“举一反三”,去适应更加复杂的环境。

总结来说,就是里里外外都“更狗”了一些。

鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6

有策略地追逐撒欢儿

这次机器狗学习的新技能里,最强的一项还是玩游戏。

机器狗不仅能遵守规则,还能自己想出策略赢比赛,可能比真狗子还要聪明些。

具体来看,这是一个障碍追逐比赛,受到“World Chase Tag”启发,规则如下:

鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6

研究人员设置了不同游戏难度,最简单的就是空旷场地:

鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6

玩游戏过程里,机器狗很明显是有策略的。

比如,一般等到躲避者离棋旗子较远时,追击者才会发起猛攻,把它逼到死角,游戏结束。

鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6

如果追击者发现躲避者离旗子很近,自己根本没机会追上它时,它会先放弃追逐,等待下一个旗子出现:

有障碍物干扰也没关系,俩狗子一样玩得很6:

而能够有如此表现,并不是机器狗从一开始就拿这个游戏训练。

它其实是基于自己已经学到的一些动作、知识和技能,来应对这个游戏场景。

具体怎么实现?往下看。

学了真·狗的数据

研究一共分为三个阶段。

  • 学习动物运动姿态
  • 将运动姿态和外界感知联系起来
  • 附加网络获取和复杂任务有关信息

第一阶段,是通过游戏中常用的动作捕捉系统,通过收集真狗的姿态数据,包括走、跑、跳、站立等动作,在仿真器中构建一个模仿学习任务。

然后将这些数据中的信息抽象并压缩到深度神经网络模型中,使其在涵盖运动姿态信息的同时,还具有一定可解释性。

腾讯RoboticsX机器人实验室和腾讯游戏合作,用游戏技术提高了仿真引擎的准确性和高效性,同时游戏制作和研发过程中积累了多元的动捕素材。

鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6

这些技术以及数据对基于物理仿真的智能体训练以及真实世界机器人策略部署也起到了一定的辅助作用。

造次
造次

Liblib打造的AI原创IP视频创作社区

下载

鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6

在模仿学习的过程中,神经网络仅接受机器狗的本体感知信息作为输入,例如机器人身上电机的状态等。

再下一步,模型引入周边环境的感知数据,例如通过其他传感器“看到”的脚下的障碍物。

鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6

第二阶段,通过额外的网络参数,将第一阶段掌握的动物姿态和外界感知联系在一起。

这样机器狗就能通过已经学会的动作,来应对外界环境。

当机器人能够适应多种复杂的环境后,这些将动物姿态与外界感知联系在一起的知识也会被固化下来,存在神经网络结构中。

然后机器狗就能自如上楼梯了。

鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6

或者在不连续、不平整地面上奔跑:

鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6

然后就到了最后一阶段,让机器狗根据上面学会的技能,去解决实际问题

也就是上面提到的做游戏环节。

鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6

据介绍,游戏中机器狗的所有控制策略都是神经网络策略。

在仿真中进行学习并通过zero-shot transfer(零调整迁移),让神经网络模拟人类的推理方式,来识别从未见过的新事物,并把这些知识部署到真实机器人上。

比如在预训练模型中学会了躲避障碍物的知识,那么在游戏里设置障碍,机器狗也能轻松应对。

本次研究新进展由腾讯Robotics X机器人实验室带来。

该实验成立于2018年,目前推出的机器人项目包括机器狗Max一代/二代、机器狗Jamoca、轮式机器人Ollie、自平衡自动驾驶摩托车等。

One More Thing

值得一提的是,之前UC伯克利的学者也将一种“真狗子”的训练方法,用在了机器狗上。

吴恩达开山大弟子Pieter Abbeel等,让机器狗自己在地上打滚一个小时,学会了走路。

鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6

而去年腾讯发布机器狗Max二代时,一段小花絮里,这狗会“扑脚”、“撒欢跑”,确实有家里毛孩子那味儿。

(当然,如果想让它成为一只听主人话的狗, 通过指令即可对其发号施令。)

鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6

咱就是说,现在机器狗的发展方向,不朝着翻跟头卷,反倒是要和真狗子“抢饭碗”了吗?

相关专题

更多
传感器故障解决方法
传感器故障解决方法

传感器故障排除指南:识别故障症状(如误读或错误代码)。检查电源和连接(确保连接牢固,无损坏)。校准传感器(遵循制造商说明)。诊断内部故障(目视检查、信号测试、环境影响评估)。更换传感器(选择相同规格,遵循安装说明)。验证修复(检查信号准确性,监测异常行为)。

468

2024.06.04

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

72

2026.01.16

全民K歌得高分教程大全
全民K歌得高分教程大全

本专题整合了全民K歌得高分技巧汇总,阅读专题下面的文章了解更多详细内容。

131

2026.01.16

C++ 单元测试与代码质量保障
C++ 单元测试与代码质量保障

本专题系统讲解 C++ 在单元测试与代码质量保障方面的实战方法,包括测试驱动开发理念、Google Test/Google Mock 的使用、测试用例设计、边界条件验证、持续集成中的自动化测试流程,以及常见代码质量问题的发现与修复。通过工程化示例,帮助开发者建立 可测试、可维护、高质量的 C++ 项目体系。

54

2026.01.16

java数据库连接教程大全
java数据库连接教程大全

本专题整合了java数据库连接相关教程,阅读专题下面的文章了解更多详细内容。

39

2026.01.15

Java音频处理教程汇总
Java音频处理教程汇总

本专题整合了java音频处理教程大全,阅读专题下面的文章了解更多详细内容。

19

2026.01.15

windows查看wifi密码教程大全
windows查看wifi密码教程大全

本专题整合了windows查看wifi密码教程大全,阅读专题下面的文章了解更多详细内容。

85

2026.01.15

浏览器缓存清理方法汇总
浏览器缓存清理方法汇总

本专题整合了浏览器缓存清理教程汇总,阅读专题下面的文章了解更多详细内容。

43

2026.01.15

ps图片相关教程汇总
ps图片相关教程汇总

本专题整合了ps图片设置相关教程合集,阅读专题下面的文章了解更多详细内容。

11

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
CSS3 教程
CSS3 教程

共18课时 | 4.7万人学习

PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.4万人学习

Git 教程
Git 教程

共21课时 | 2.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号