近日,第33届acm国际多媒体会议(acmmm 2025)在爱尔兰都柏林顺利召开,智象未来团队凭借其创新成果荣获大会最佳演示奖,成为国内首家获此殊荣的多模态生成式人工智能初创企业,充分展现了其在多模态ai技术领域的领先科研水平与强大创新能力。

ACM国际多媒体会议由国际计算机学会(ACM)发起并主办,聚焦于推动多媒体技术的研究进展与产业转化,是全球范围内最具权威性和影响力的多媒体学术盛会之一。每年颁发的最佳演示奖竞争激烈,评审标准严苛,综合考量技术的创新性、实用性、成熟度以及现场展示效果,获奖项目往往代表了当前领域内的前沿方向和最高认可。
此次智象未来获奖的“灵感智能体”(ChatGeneration)是一款统一架构的多模态智能系统,通过革命性设计将复杂的视觉内容生成过程转化为自然的对话交互体验。该系统打破传统多模态工具分散割裂的局面,在单一界面中集成文本生成图像、指令驱动图像编辑、以及文图生成视频等多项功能,有效攻克跨模态语义对齐这一行业难题。其核心技术基于参数规模达170亿的HiDream-I1模型,采用稀疏扩散Transformer(DiT)结构与动态混合专家(MoE)机制,在HPS、GenEval等国际主流评测基准上表现卓越。针对图像编辑任务,团队进一步优化上下文视觉条件建模能力,显著提升了模型对精细化修改指令的理解与执行精度。

“灵感智能体”重新定义了人机协作下的视觉叙事方式,首次实现生成与编辑全流程的对话化操作,极大降低了高质量视觉内容创作的技术门槛,同时大幅缩短创意迭代周期,真正实现了从构思到成品的“一次会话”闭环。目前,该技术已成功应用于智象未来的旗舰产品vivago.ai中,为其对话生成功能提供核心支撑,为用户带来更流畅、个性化的多模态交互体验。

此外,在本届ACM国际多媒体大会上,智象未来还主导举办了Identity-Preserving Video Generation(IPVG)挑战赛。赛事吸引了包括北京大学、上海交通大学、腾讯等在内的众多国内外顶尖高校与企业团队参与,聚焦于视频生成过程中身份一致性的保持问题,涵盖人脸及全身身份稳定生成等关键技术场景。作为赛事主办方,智象未来再次彰显其在全球多模态视觉生成领域的技术引领地位和技术号召力。


智象未来始终坚持将前沿研究成果快速转化为实际应用,以核心技术驱动产品持续升级,并在激烈的市场竞争中赢得广泛认可。自成立以来,团队始终精准把握行业趋势与市场需求,无论是在基础模型研发方面的持续突破,还是在产业化落地路径上的深入探索,均走在行业前列。此次斩获ACM国际多媒体会议最佳演示奖,正是对其技术实力与产品创新能力的双重权威认证,凸显其科研成果的前瞻性与颠覆性。
智象未来成立于2023年3月,由加拿大工程院外籍院士梅涛领衔创办。在坚持自主创新的同时,公司积极推进高质量AI模型的开源开放,成功打造了多个登顶国际权威榜单的国产自研生成式AI模型。作为一家专注于多模态生成式人工智能的初创企业,智象未来正以技术创新为核心引擎,不断推动中国生成式AI迈向全球领先地位,并以开放合作、务实进取的姿态深度融入世界人工智能生态体系,展现中国科技企业的创新力量与责任担当。
以上就是智象未来突破“对话式AI视觉创作”,荣膺ACMMM 2025最佳演示奖的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号