Amazon Chime SDK通话分析新功能,可即时分析语音情感和搜索说话者记录

AWS更新其通信服务Amazon Chime的软件开发工具包,加入即时语音通话分析功能,可执行包括语音转录、情感分析和说话者搜索任务,而且开发者只要操作管理控制台,就能够在音频应用程序简单地集成这些机器学习功能。

Amazon Chime SDK新提供的语音通话分析功能,分别为情感分析和说话者搜索。情感分析可以判断说话者的语气,像是积极、中立或是消极态度。该情感分析技术应用机器学习,对词汇、语言资讯,诸如字词选择和语法结构,以及声学和语调上的资讯,像是音高、音量和语速进行综合分析,以进一步判断语音中的情感。

除了情感分析之外,用户还可以使用Amazon Chime SDK开发说话者搜索应用,通过在现有语音数据库比对说话者语音特征,找出错含说话者的联系历史和转录文本。说话者搜索仅需要一个简短的语音样本,系统便可以迅速找出相关的音频记录,这项功能的应用除了可以查询特定说话者的相关资料外,也能够应用在即时通信中,替不同的说话者添加标记。

用户在AWS管理控制台就能简单集成这些功能,不需要编写任何集成程序代码,只要选择转录或是语音分析等服务,AWS系统便会自动处理人工智能服务与应用程序的集成,用户在控制台中可以定义分析资料发送的位置,同时语音分析也可以向Lambda函数和SNS等服务发送即时通知。

用户可以使用Amazon QuickSight或Tableau构建仪表板,以获取即时的语音分析结果,而语音分析也可以通过事件,发布到Amazon EventBridge生成即时警示,将这些事件路由到用户选择的目标。音频分析功能的付费方式,根据用户使用情况收费,收费基础为每分钟所分析的资料,目前用户已经可以在AWS美东、美西和欧洲地区使用到该新功能。