AWS文本转语音服务Amazon Polly提供更真实的人声发音

AWS在2016年的re:Invent大会上,发布了文本转语音服务Amazon Polly,用户只需要调用API,就能够将文本转为逼真的语音,现在AWS更新了这项服务,增加了神经文本转语音(Neural Text-To-Speech,NTTS)以及新闻播报员风格功能。

Amazon Polly是一个完全托管的云计算服务,使用深度学习技术将文本流畅的转成语音,并且也提供即时串流功能,当用户将文本通过API发送给Amazon Polly后,音频会以串流的方式回传,让开发者以简单的方式,就能在应用程序中加入语音功能。目前Amazon Polly共支持29种语言以及59种声音。

现在AWS使用新的机器学习方法,发布NTTS新功能以提升合成语音的品质,AWS提到,NTTS改善了两个让语音听起来更加真实的两个关键要素,除了语音更加自然之外,而且声音表现更富有表现性,目前NTTS能以即时或批次的方式,将文本转成11种声音,分别为3种英国英语以及8种美国英语。

而通过NTTS技术,AWS在语音合成上加入了新闻播报员风格,而这能够让新闻或是博客文章,以更真实的语音呈现。目前新闻播报员风格支持两种美国英语的声音。目前这些新功能在美东北维吉尼亚、美西俄勒冈以及欧洲爱尔兰提供。