首页 > 新闻 > IT新闻 > 正文

新型 AI 模型“读心”能力惊人:不仅看穿动作,更能预判意图

花韻仙語
发布: 2025-12-17 20:34:03
原创
566人浏览过

人工智能在解析人类行为方面实现了关键性突破。得克萨斯农工大学(texas a&m university)的研究团队近期推出了一款名为“omnipredict”的创新人工智能系统,该系统展现出前所未有的意图预判能力——它不仅可识别视觉中的人体动作,更能融合多源环境信息,实时推演人类即将采取的行为意图。

新型 AI 模型“读心”能力惊人:不仅看穿动作,更能预判意图

这项成果标志着自动驾驶技术正由“感知响应”迈向“认知预判”的全新阶段。传统自动驾驶系统大多依赖对行人位置与运动轨迹的即时检测,而 OmniPredict 则深度融合了多模态大语言模型(MLLM)架构,赋予系统类人的因果推理能力。该系统能精准捕捉行人的姿态微调、短暂迟疑、躯干转向乃至眼部凝视压力等细微线索,进而区分其真实意图:是准备横穿马路、仅驻足观望,抑或存在不可预知的突发举动。

研究团队强调,OmniPredict 的本质跃升在于跳脱了单纯像素级识别的局限,转而深入探究行为背后的动因逻辑。借助对多样化输入信号(如图像、空间关系、时序动态等)的联合建模,该模型可将人类行为稳定划分为过街决策、视线遮蔽、精细动作执行及注视焦点定位等核心语义类别。实测数据显示,OmniPredict 的意图预测准确率达到67%,较当前行业领先模型提升达10个百分点。尤为突出的是,在行人被车辆、广告牌等部分遮挡,或仅通过眼神与智能体发生交互的高难度场景下,系统仍展现出卓越的鲁棒性与一致性。

新型 AI 模型“读心”能力惊人:不仅看穿动作,更能预判意图

Veo
Veo

Google 最新发布的 AI 视频生成模型

Veo 567
查看详情 Veo

项目首席科学家斯里坎特·萨里帕利(Srikanth Saripalli)博士指出,OmniPredict 为机器注入了一种真正意义上的“街头智慧”(Street Smarts)。当自动驾驶车辆能够像经验丰富的驾驶员那样,读懂路人“欲行又止”的肢体暗示并提前预判其行动路径,道路安全水平将迎来根本性提升。除交通领域外,这一具备心理状态与非语言行为解码能力的技术,未来亦有望深度赋能军事侦察、灾害搜救等高危任务场景,通过赋予机器类人直觉,重塑人机协同的新范式。

编译自/ScitechDaily

源码地址:点击下载

以上就是新型 AI 模型“读心”能力惊人:不仅看穿动作,更能预判意图的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号