多语言语音合成
该存储库为论文“提供了,和数据,源代码和。
它包含Tacotron 2的实现,该实现支持多语言实验并且实现了不同的编码器参数共享方法。 它提出了一个模型,该模型结合了“交流”的思想,以及。
我们提供了用于比较三种多语言文本转语音模型的数据。 第一个共享整个编码器,并使用对抗性分类器从编码器中删除与说话者相关的信息。 第二种针对每种语言具有单独的编码器。 最后,第三项是我们尝试结合两种先前方法中的最佳方法,即第一种方法的有效参数共享和第二种方法的灵活性。 它具有一个全卷积编码器,该编码器具有由参数生成器生成的特定于语言的参数。 它还利用遵循领域对抗训练原理的对抗说话者分类器。 参见上图。
和分别提供了介绍代码切换功能和生成模型的联合多语言培训(在增强CSS10数据集上进行培训)的交互式演示。
使用这三个比较模型合成的许多样本都在此网站上。 它也包含一些样本,这些样本是
评论0
最新资源