新型 AI 模型“读心”能力惊人：不仅看穿动作，更能预判意图-IT新闻-PHP中文网

新型 AI 模型“读心”能力惊人：不仅看穿动作，更能预判意图

花韻仙語

发布： 2025-12-17 20:34:03

原创

566人浏览过

人工智能在解析人类行为方面实现了关键性突破。得克萨斯农工大学（texas a&m university）的研究团队近期推出了一款名为“omnipredict”的创新人工智能系统，该系统展现出前所未有的意图预判能力——它不仅可识别视觉中的人体动作，更能融合多源环境信息，实时推演人类即将采取的行为意图。

新型 AI 模型“读心”能力惊人：不仅看穿动作，更能预判意图

这项成果标志着自动驾驶技术正由“感知响应”迈向“认知预判”的全新阶段。传统自动驾驶系统大多依赖对行人位置与运动轨迹的即时检测，而 OmniPredict 则深度融合了多模态大语言模型（MLLM）架构，赋予系统类人的因果推理能力。该系统能精准捕捉行人的姿态微调、短暂迟疑、躯干转向乃至眼部凝视压力等细微线索，进而区分其真实意图：是准备横穿马路、仅驻足观望，抑或存在不可预知的突发举动。

研究团队强调，OmniPredict 的本质跃升在于跳脱了单纯像素级识别的局限，转而深入探究行为背后的动因逻辑。借助对多样化输入信号（如图像、空间关系、时序动态等）的联合建模，该模型可将人类行为稳定划分为过街决策、视线遮蔽、精细动作执行及注视焦点定位等核心语义类别。实测数据显示，OmniPredict 的意图预测准确率达到67%，较当前行业领先模型提升达10个百分点。尤为突出的是，在行人被车辆、广告牌等部分遮挡，或仅通过眼神与智能体发生交互的高难度场景下，系统仍展现出卓越的鲁棒性与一致性。

新型 AI 模型“读心”能力惊人：不仅看穿动作，更能预判意图

Veo

Google 最新发布的 AI 视频生成模型

567

查看详情

项目首席科学家斯里坎特·萨里帕利（Srikanth Saripalli）博士指出，OmniPredict 为机器注入了一种真正意义上的“街头智慧”（Street Smarts）。当自动驾驶车辆能够像经验丰富的驾驶员那样，读懂路人“欲行又止”的肢体暗示并提前预判其行动路径，道路安全水平将迎来根本性提升。除交通领域外，这一具备心理状态与非语言行为解码能力的技术，未来亦有望深度赋能军事侦察、灾害搜救等高危任务场景，通过赋予机器类人直觉，重塑人机协同的新范式。

编译自/ScitechDaily

源码地址：点击下载

以上就是新型 AI 模型“读心”能力惊人：不仅看穿动作，更能预判意图的详细内容，更多请关注php中文网其它相关文章！