当前位置: 编码机 >> 编码机发展 >> 用你自己的声音说外语跨语言神经编解码器语
微软亚洲研究院最近发布了VALL-EX,这是一个令人惊叹的新工具,可以通过一个几秒的源语音片段生成目标语言的语音,并保留说话者的声音、情感和声学环境。VALL-EX不需要说话人的跨语言语音进行训练即可执行各种语音生成任务,例如跨语言文本到语音、语音合成和语音到语音翻译。
这个工具基于Meta在年10月开源的EnCodec技术之上,并在Meta组建的LibriLight音频库进行了训练。LibriLight音频库包含了来自多名演讲者的6万小时英语演讲,大部分来自LibriVox公共领域的有声读物。这使得VALL-EX可以进行更准确和高质量的语音合成。
VALL-EX的应用范围非常广泛,可以用于跨语言文本到语音、语音合成和语音到语音翻译等各种任务。无论是商业用途还是个人用途,VALL-EX都可以帮助用户更轻松地进行跨语言交流和文本转语音任务。
此外,微软亚洲研究院还提供了一个演示示例(
转载请注明:http://www.aideyishus.com/lktp/5118.html