近日,理想汽车自动驾驶研发高级副总裁郎咸朋在与媒体交流时,首次对外回应了关于vla技术的争议,并系统梳理了理想智驾团队的发展脉络。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

据公开信息显示,今年3月理想正式推出VLA(Visual Language Action)技术后,业内部分企业及专家对其可行性提出了质疑。例如,博世智能驾驶与控制系统事业部(XC)中国区总裁吴永桥指出,VLA面临“多模态特征对齐难度大”等关键技术挑战。华为智能汽车解决方案BU CEO靳玉志也表示,华为将聚焦于WA(World Action)路径,而非VLA方向。
面对这些观点,郎咸朋逐一作出回应:
首先是关于多模态对齐问题。他指出,博世并未自研基础大模型,也缺乏大模型相关经验。而理想已组建专门的基座模型研发团队,在此前开发视觉语言模型(VLM)的过程中,已积累了丰富的视频与文本多模态对齐经验。虽然该技术确实存在挑战,但正是难点所在,才体现技术壁垒,对我们而言并非不可逾越。
其次是数据规模与训练能力。针对外界认为理想数据不足的说法,郎咸朋强调:“我们一直坚持自主采集,截至目前累计行驶数据仍高达十几亿公里。”这意味着我们在真实场景下的数据储备非常可观。
再者是关于大语言模型可能出现的“幻觉”问题。他表示,不能仅从生成式AI的角度看待VLA,毕竟当前模型经过多轮迭代,幻觉现象已显著减少。此外,理想还引入了强化学习和超级对齐技术,具备有效抑制和纠正模型误判的能力。
对于靳玉志提到的corner case难题,郎咸朋表示认同。他在推动端到端系统落地过程中发现,最关键的问题在于数据分布不均和高质量数据获取困难。即使拥有海量数据,也无法覆盖所有极端场景。因此,必须让车辆具备类似人类的推理与泛化能力,单纯依赖数据堆砌无法解决问题。

相关报道
郎咸朋进一步指出,竞争对手对VLA的质疑,反而印证了这条技术路线的前瞻性。出于安全优先的原则,在VLA和端到端系统初期应用阶段,首要目标是确保安全性不低于现有水平,随后再持续提升性能上限。他透露,目前VLA的潜力尚未完全释放,预计在今年底至明年初,用户将能看到其显著进步,“到时候你会感觉这辆车真的有了生命”。
他还补充道,VLA本身具备通向L4自动驾驶的潜力,但未来必然会出现更先进的技术形态。他认为,驾驶并不需要极高智商,普通人经过训练都能掌握,因此VLA已足够应对实际需求。然而,随着人工智能整体发展,若未来AI能达到人人如专家的水平,那必将催生比VLA更为强大的新架构。
以上就是理想郎咸朋:他们反对VLA,恰恰说明VLA是正确的的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号