之前有接触过数字人的朋友,都知道合成语音是制作数字人的关键一步。有不少AI工具可以合成语音,但要不就是收费的,要不就是在网页端使用,有隐私泄露风险。
之前给大家分享过一款网易有道开源的一款AI语音合成工具EmotiVoice,能合成不同情感的语音。AI技术不断进步,最近Glen的朋友 @思路基于EmotiVoice制作了一款支持多人剧本对话功能的EmotiVoice-Plus版,赶快随我去看看吧~
我们先来回顾一下EmotiVoice,它是网易有道出品的一款功能强大文本转语音引擎。主要特点如下:
- 提供中英文两种语言结果生成,支持超过 2000 种不同的说话者声音;
- 最突出的功能是情感合成,允许你创建具有多种情感的语音,包括快乐、兴奋、悲伤、愤怒等,而且可以直接通过提示词来控制情感;
- EmotiVoice还提供了一个易于使用的网页界面,甚至还有一个可用于批量生成结果的接口。
而这次带来的EmotiVoice-Plus版,带来最大的变化是支持生成多人故事剧本!
老规矩,大家自行在本地部署比较麻烦,已经为大家制作好了一款离线整合包了,下载到本地解压即用。
①双击“一键启动.bat”:
②双击一键启动程序后,会打开一个命令提示窗口,项目会自动运行。加载成功后,会看到以下网址“ http://localhost:8501/”,而且将自动打开一个网页(如果没有自动打开网页,请复制链接访问):
界面已经为大家汉化好了,合成单人音频, 请参考以前内容,这里仅介绍多人故事剧本合成的使用方法:
- 在区域1中,输入多人故事剧本的内容,格式为:
-
- 角色:内容(例如“旁白:从前,有一个可爱的小姑娘”)
- 在输入完毕内容后,按下“Ctrl+Enter”组合键,区域2会自动识别角色和内容。
- 接下来需要在区域3中,针对每个角色选择其独立的音色。(这部切记一定要选择哦,不然会报错)
- 勾选底部两个选项。
全部输入完成后,点击“合成音频”按钮,等待处理即可,处理速度非常快,在底部可以看到合成的全新音频了。经过我的测试,生成的语音效果也非常强哦,拿去做数字人的音频,或者直接合成一些音频内容,比如电子书,都是非常棒的选择!
注意事项:
①该项目CPU可以运行,但有显卡运行更快
②请确保安装路径不包含中文,不然可能会引起奇怪的适配问题
再次感谢我的朋友 @思路!