微软让用户贡献可用于人工转录的语音片段

微软宣布更新语音资料收集政策，借由征求用户同意，让微软收集用户，跟有使用语音识别技术服务的录音，供开发人员在研发产品时进行人工审阅，用户可以查看所有被收集的语音片段，以及语音片段对人工智能系统所做的贡献。

在新的语音片段设置中，用户需要明确同意微软收集语音资料，微软才会将用户的语音资料，用在开发人工智能产品中，让微软员工以及相关人员，听到这些收集来的语音片段，并且人工转录成文本。微软期望借由收集更多语音资料集，来提升人工智能系统的性能。

微软员工以及承承包商，仅会在用户许可的情况，聆听用户贡献的语音，而对其他用户来说，微软仍会继续访问用户语音活动的相关资料，诸如用户与语音识别系统交互时，所自动产生的转录文本。通过新的语音片段配置，能让人们积极同意微软员工与承承包商，可以聆听他们与服务交互的语音，并且提高用户的意识，明确知道正在与微软共享语音，以及了解语音片段被使用的方式。

微软之所以要取的用户积极同意，便是要让语音片段的使用能够透明化，并让用户了解这些语音片段，被如何用来改善语音识别技术，微软提到，语音片段处理过程，会消除用户识别资料，包括识别码、电话号码、社会安全码以及电子邮件信箱，因此相关消息，不会再出现于微软用户的账户隐私信息中心里。另外，微软强调，他们不会人工收听从企业产品收集来的音频资料。

微软从2020年10月30日之后，就停止存储语音识别技术处理的语音片段，并在接下来几个月内，会在微软的翻译器、SwiftKey、Windows、Cortana、HoloLens、Mixed Reality和Skype语音翻译等产品，推出新的语音片段配置。当用户同意让微软员工及其承承包商，听取语音记录来改善人工智能技术，微软会保留所有语音资料两年，如果这些语音片段还进一步供人工转录使用，则可能会保留两年以上。