Google开源用于自家核心产品的差分隐私函数库

Google为其自家核心产品创建的差分隐私(Differential Privacy)函数库,现在对外开源,所有组织和开发人员都可以免费使用。Google提到,这个函数库重点放在那些难以从头开始创建的功能,让开发者可以更简单地上手,为应用程序加入自动计算用户贡献界线等功能。

差分隐私是一种限制算法,用来防范因为统计信息发布,进而造成用户个人信息外泄的问题。当一个受信任的组织,拥有众多个人敏感信息,在对外提供全局的统计数据时,就会需要用到差分隐私算法​​,因为虽然个别数据库中的数据,并不会对用户的隐私造成威胁,但是当多个数据库组合使用,其匿名化等隐私保护技术可能都会失效。

差分隐私提供一个隐私框架,确保组织能从这些数据中获取信息,但是又无法区分或是重新识别出个人信息。其用途很广泛,像是政府单位要发布人口统计信息,或是企业收集用户行为,作为内部分析之用时,就需要使用差分隐私算法​​,确保最终的统计输出,不会泄漏特定个人的信息。

Google发布的开源项目,包含了ε-差分隐私算法​​的C++函数库,可用于为私密或是敏感数据产生聚合统计信息,主要功能提供了常见的数据科学操作,开发人员可以使用函示库提供的计数、总和、平均值、中位数和百分位数等统计功能。

另外,项目还包含了测试程序,Google表示,执行差分隐私是一件有挑战的工作,因此开发者可以使用项目提供的广泛的组件进行测试,其中还有一个可扩展的随机差分隐私模型检查函数库,能用来检查算法的正确性。Google特别设计了函数库,使其易于扩展其他功能,增加像是附加机制、聚合功能或是隐私预算管理等功能。

Google目前已经在自家产品广泛地使用差分隐私方法,像是Google地图中店家一天的繁忙程度,特定餐厅的餐点当地图中受欢迎的程度,甚至还用于改进Google Fi。