微软让用户贡献可用于人工转录的语音片段

微软宣布更新语音资料收集政策,借由征求用户同意,让微软收集用户,跟有使用语音识别技术服务的录音,供开发人员在研发产品时进行人工审阅,用户可以查看所有被收集的语音片段,以及语音片段对人工智能系统所做的贡献。

在新的语音片段设置中,用户需要明确同意微软收集语音资料,微软才会将用户的语音资料,用在开发人工智能产品中,让微软员工以及相关人员,听到这些收集来的语音片段,并且人工转录成文本。微软期望借由收集更多语音资料集,来提升人工智能系统的性能。

微软员工以及承承包商,仅会在用户许可的情况,聆听用户贡献的语音,而对其他用户来说,微软仍会继续访问用户语音活动的相关资料,诸如用户与语音识别系统交互时,所自动产生的转录文本。通过新的语音片段配置,能让人们积极同意微软员工与承承包商,可以聆听他们与服务交互的语音,并且提高用户的意识,明确知道正在与微软共享语音,以及了解语音片段被使用的方式。

微软之所以要取的用户积极同意,便是要让语音片段的使用能够透明化,并让用户了解这些语音片段,被如何用来改善语音识别技术,微软提到,语音片段处理过程,会消除用户识别资料,包括识别码、电话号码、社会安全码以及电子邮件信箱,因此相关消息,不会再出现于微软用户的账户隐私信息中心里。另外,微软强调,他们不会人工收听从企业产品收集来的音频资料。

微软从2020年10月30日之后,就停止存储语音识别技术处理的语音片段,并在接下来几个月内,会在微软的翻译器、SwiftKey、Windows、Cortana、HoloLens、Mixed Reality和Skype语音翻译等产品,推出新的语音片段配置。当用户同意让微软员工及其承承包商,听取语音记录来改善人工智能技术,微软会保留所有语音资料两年,如果这些语音片段还进一步供人工转录使用,则可能会保留两年以上。