微软在 ignite 大会上发布了一项名为“azure ai speech text to speech (tts) avatar”的ai工具,声称可以生成逼真的虚拟人物形象。这项工具已经开放给公众进行预览试用
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

微软表示,用户使用 Azure AI Speech text to speech (TTS) avatar,可以建立基于“输入文字说出内容”的虚拟化身,并结合现实人物照片训练,建立以真实人物为基础的“互动式聊天机器人”,可用于企业的营销、业务或客户服务等场景。
据报道,Azure AI Speech文字转语音(TTS)avatar主要由三个模块构成,分别是文字分析器、TTS声音合成器和TTS虚拟化身合成器
文字分析器会首先分析用户输入的文字内容,并生成音素序列。然后,TTS声音合成器中的TTS语音模型将预测用户输入文字的声学特征,然后合成声音。最后,神经网络声音合成模型Avatar会根据上述声学特征预测人物的唇形图像,从而最终形成虚拟化身影像
微软解释,传统虚拟化身制作费时耗工,需要建立专用拍摄环境、而拍摄剪辑后期过程也相当花成本。而当下运用微软最新的 Azure AI Speech text to speech (TTS) avatar 服务,在初次建立模型后,用户只要输入文字就可以制作各种产品介绍、互动视频等。配合微软 Azure OpenAI Service 及神经网络 TTS 功能,还能呈现更自然的互动体验。


IT之家报道称,微软举例说明,用户可以利用Azure AI Speech TTS avatar来批量制作各种视频内容,比如企业文化影片、产品介绍,或者CEO在大会上的数字分身。此外,还可以制作虚拟直播数字人、聊天机器人、业务机器人,以及线上教学的AI老师等等

微软宣布,Azure AI语音合成(TTS)虚拟形象已经在Azure订阅用户中推出,并支持多种语言。用户可以从预设的虚拟形象选项中选择所需角色,也可以自定义虚拟形象

如果用户想要自行定制虚拟化身,则需要上传一批人物视频片段,Azure 平台就会在线上处理这些视频,从而生成虚拟化身。角色本身与音源分开,用户可以选择官方提供的默认音源,也可以自行上传训练音源。
以上就是微软公布 Text To Speech Avatar AI工具,可制作虚拟3D数字人的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号