Think2Drive:首个用于自动驾驶的基于模型的RL方法(上海交大)

王林
发布: 2024-03-01 16:31:02
转载
792人浏览过

在carla v2中以专家级的熟练程度运行。

题目:Think2Drive: Efficient Reinforcement Learning by Thinking in Latent World Model for Quasi-Realistic Autonomous Driving (in CARLA-v2)

作者单位:上海交通大学

现实世界中的自动驾驶(AD),尤其是城市驾驶,涉及许多corner case。最近发布的AD仿真器CARLA v2在驾驶场景中增加了39个常见事件,并提供了比CARLA v1更接近真实的测试平台。这给社区带来了新的挑战,到目前为止,还没有文献报告CARLA v2中的新场景取得了任何成功,因为现有的工作大多都必须依赖于特定规则进行规划,但它们无法涵盖CARLA v2中更复杂的情况。这项工作主动直接训练一个规划器,希望能够灵活有效地处理corner case,认为这也是AD的未来方向。据我们所知,我们开发了第一个基于模型的强化学习方法,名为Think2Drive,用于AD,具有一个世界模型来学习环境的转变,然后它充当神经仿真器来训练规划器。这种范式极大地提高了训练效率,因为世界模型中的低维状态空间和张量的并行计算。

结果,Think2Drive能够在单个A6000 GPU上进行3天的训练后,在CARLA v2中以专家级的熟练程度运行,据我们所知,迄今为止尚未报告有关CARLA v2的成功(100%的路线完成)。还提出了CornerCase-Repository,这是一个支持通过场景评估驾驶模型的基准。此外,提出了一个新的平衡指标来评估性能,包括路线完成、违规次数和场景密度,以便驾驶分数可以提供更多关于实际驾驶表现的信息。

实验结果

Think2Drive:首个用于自动驾驶的基于模型的RL方法(上海交大)

Think2Drive:首个用于自动驾驶的基于模型的RL方法(上海交大)

写在最后

欢迎您来到我们的仓库!这里涵盖了众多技术领域,包括BEV、多模态融合、车辆占用检测、毫米波雷达视觉感知、车道线检测以及3D感知等。我们还分享了关于在线地图、多传感器校准、Nerf、大型模型、规划控制和轨迹预测的综述和论文。希望您喜欢我们的内容,并且不忘star和follow我们的仓库以获取更多精彩信息!感谢您的支持!

以上就是Think2Drive:首个用于自动驾驶的基于模型的RL方法(上海交大)的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
相关标签:
来源:51CTO.COM网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号