欢迎访问装备制造资讯网!

装备制造资讯网

您现在的位置是: 首页 > 制造技术 >详情

智能制造人3d建模技术(微软公布Text To Speech Avatar AI工具,可制作虚拟3D数字人)

发布时间:2024-06-09 12:52:05 制造技术 153次 作者:装备制造资讯网

IT之家11月16日消息,微软在Ignite大会中,为AzureAISpeech推出了一项名为“AzureAISpeechtexttospeech(TTS)avatar”的AI工具,号称可以生成人类逼真虚拟化身(数字人),目前这款工具已经开放给大众预览试用。

微软表示,用户使用AzureAISpeechtexttospeech(TTS)avatar,可以建立基于“输入文字说出内容”的虚拟化身,并结合现实人物照片训练,建立以真实人物为基础的“互动式聊天机器人”,可用于企业的营销、业务或客户服务等场景。

智能制造人3d建模技术(微软公布Text To Speech Avatar AI工具,可制作虚拟3D数字人)

据悉,这项AzureAISpeechtexttospeech(TTS)avatar主要包含三个模块,分别是文字分析器、TTS声音合成器及TTS虚拟化身合成器:

文字分析器会先分析用户输入的文字内容,产生音素序列(phonemesequence)。接着TTS声音合成器中的TTS语音模型会预测用户输入文字的声学特征,再合成声音。最后,由神经网络声音合成模型Avatar,根据上述声学特征预测人物的唇形影像,最终形成虚拟化身影像。

微软解释,传统虚拟化身制作费时耗工,需要建立专用拍摄环境、而拍摄剪辑后期过程也相当花成本。而当下运用微软最新的AzureAISpeechtexttospeech(TTS)avatar服务,在初次建立模型后,用户只要输入文字就可以制作各种产品介绍、互动视频等。配合微软AzureOpenAIService及神经网络TTS功能,还能呈现更自然的互动体验。

IT之家发现,微软举例声称,用户可利用AzureAISpeechTTSavatar批量制作各种视频内容,例如企业文化影片、产品介绍或CEO在大会上的数字分身。也可以制作虚拟直播数字人、聊天机器人、业务机器人、或线上教学的AI老师等。

微软表示,AzureAISpeechtexttospeech(TTS)avatar目前已经向Azure订阅用户推出,支持各种语言,用户可以从预设的虚拟化身选项中挑选想要的角色,也可以自行定制虚拟化身。

如果用户想要自行定制虚拟化身,则需要上传一批人物视频片段,Azure平台就会在线上处理这些视频,从而生成虚拟化身。角色本身与音源分开,用户可以选择官方提供的默认音源,也可以自行上传训练音源。