亚马逊研究提升自然语言运算系统的隐私保护能力

自然语言运算系统是目前人工智能应用中,非常受重视的范围,不过分析大量文本数据时,如何保护敏感信息和隐私是难题。最近亚马逊(Amazon)公布研究报告,讲述如何改善隐私保护。

亚马逊表示,数据隐私虽然很容易被认为可用“匿名化”解决,但不少研究指出,攻击者只需使用其他数据来源的数据比对,就可抵消匿名化。因此亚马逊的办法就是加入噪声,让信息更难用来关注提供的人。加入噪声后,虽然准确度会下降,但随着数据组扩展,就可消除负面影响。

据研究人员指,此技术可将更多通用术语以更具体的术语替代,使个人数据更难以提取。亚马逊打算下个月在休斯顿举行的ACM Web搜索和数据挖掘(WSDM)大会详细介绍新发现。改善隐私保护除了保障个人利益,也可让用户有更多信心面对这类技术,对未来技术开发和普及也有一定帮助。