伴随着生成式深度学习模型的飞速发展,自然语言处理(NLP)和计算机视觉(CV)已经经历了根本性的转变,从有监督训练的专门模型,转变为只需有限的明确指令就能完成各种任务的通用模型。
在语音处理和文本到语音(TTS)领域,这样的转变也正在发生,模型能够利用数千小时的数据,使合成结果越来越接近类人语音。
在最近的一项研究中,亚马逊正式推出了BASETTS,将TTS模型的参数规模提升到了前所未有的10亿级别。
BASETTS是一个多语言、多说话人的大型TTS(LTTS)系统,在约10万小时的公共领域语音数据上进行了训练,比此前的训练数据量最高者VALL-E翻了一番。受LLM成功经验的启发,BASETTS将TTS视为下一个token预测的问题。这种方法通常与大量训练数据结合使用,以实现强大的多语言和多说话人能力。
相关文章
热门标签
-
Wish如何发货到国外?必须几天发货?
2024-03-19 16:03
-
抖音全球购骑士卡有何用?
2024-03-19 16:03
-
Wish平台入驻是否需要保证金?Wish的入驻条件是什么?
2024-03-19 16:03
-
抖音发布混淆信息实施细则是真的吗?
2024-03-19 16:03
-
亚马逊运营专员靠谱吗?亚马逊运营岗位怎么样?
2024-03-19 16:03
-
抖音小店差评申诉流程是什么?
2024-03-19 16:03
-
怎么加入wishhack?wishhack怎么注册?
2024-03-19 16:03
-
抖音小店成交扣点多少?违规受啥惩罚?
2024-03-19 16:03
-
亚马逊邮箱怎么注册?亚马逊注册邮箱地址该怎么填?
2024-03-19 16:03
-
抖音精选联盟有用吗?如何加入?
2024-03-19 16:03
-
Wish个人开店怎么发货?开店入驻条件
2024-03-19 16:03
-
抖音小店保证金需要多少钱?怎样做好推广?
2024-03-19 16:03
-
亚马逊迟发货率高多久会封店?有补救的机会吗?
2024-03-19 16:03
-
抖音直播认证可以解绑吗?
2024-03-19 16:03
-
跟卖亚马逊自营的产品会怎样?亚马逊跟卖的好处与风险
2024-03-19 16:03
-
抖音巨量星图开通有要求吗?
2024-03-19 16:03
-
Wish上卖什么产品好?平台有什么不能卖?
2024-03-19 16:03
-
抖音认领门店的效果如何?
2024-03-19 16:03
-
亚马逊卖家不发货惩罚是什么?缺货一般等多久?
2024-03-19 16:03
-
wish选品及标签关键词查询工具大全是什么?选品技巧是什么?
2024-03-19 16:03