编码机

用你自己的声音说外语跨语言神经编解码器语

发布时间:2023/6/28 16:04:50   
北京中科忽悠 http://www.csxsl.com/zjtd/

微软亚洲研究院最近发布了VALL-EX,这是一个令人惊叹的新工具,可以通过一个几秒的源语音片段生成目标语言的语音,并保留说话者的声音、情感和声学环境。VALL-EX不需要说话人的跨语言语音进行训练即可执行各种语音生成任务,例如跨语言文本到语音、语音合成和语音到语音翻译。

这个工具基于Meta在年10月开源的EnCodec技术之上,并在Meta组建的LibriLight音频库进行了训练。LibriLight音频库包含了来自多名演讲者的6万小时英语演讲,大部分来自LibriVox公共领域的有声读物。这使得VALL-EX可以进行更准确和高质量的语音合成。

VALL-EX的应用范围非常广泛,可以用于跨语言文本到语音、语音合成和语音到语音翻译等各种任务。无论是商业用途还是个人用途,VALL-EX都可以帮助用户更轻松地进行跨语言交流和文本转语音任务。

此外,微软亚洲研究院还提供了一个演示示例(

转载请注明:http://www.aideyishus.com/lktp/5118.html

------分隔线----------------------------