infinityhuman 是由字节跳动与浙江大学联合研发的商用级音频驱动人物视频生成模型,标志着 ai 数字人迈向实用化的重要一步。该模型采用 coarse-to-fine(由粗到精) 的生成框架,首先生成低分辨率的动作序列作为基础,再通过姿态引导细化器逐步升维至高分辨率长时视频。其创新性地引入手部专属奖励机制,显著提升了手部动作的自然度与语音同步性,有效缓解了身份漂移、画面抖动及手势僵硬等长期存在的问题。在 emtd 和 hdtf 等权威数据集上的实验表明,infinityhuman 在生成质量与稳定性方面均达到领先水平,为虚拟主播、在线教育、智能客服等应用场景提供了强有力的技术支持。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
InfinityHuman的核心功能
以上就是InfinityHuman— 字节联合浙大推出的AI数字人视频生成模型的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号