微软、杜克及斯坦福悄悄撤下人脸识别数据库

计算机视觉暨隐私研究人员Adam Harvey最近披露,微软、杜克大学及斯坦福大学已悄悄地撤下了原本采用了创用CC(Creative Commons)授权的人脸识别数据库。

其中,微软在2016年上传的MS Celeb号称是全球最大的公开人脸识别数据库,存放了820万张人脸照片;杜克大学的Duke MTMC则存放200万张人脸;斯坦福大学的Brainwash则有约1.2万张的人脸照片。

外界猜测这些组织的举动与金融时报在今年4月刊出的一篇报导有关。当时Harvey在一个人脸识别的数据库中发现了朋友Jillian York的照片,York在电子前线基金会(Electronic Frontier Foundation,EFF)任职,而Harvey则是在美国政府研究组织Iarpa旗下的人脸识别项目Janus中看到York的多张照片,包括York在不同时期所拍摄的照片,以及在YouTube视频中的人脸镜头。

York说她并不知道自己的照片被收藏了,而且连10年前的照片都有。

Harvey的分析则发现,该委外构建的Janus人脸识别数据库搜集了超过2万张的人脸,平均每个人具备6张照片及3张从视频中截取的照片,并采用CC授权,除了York之外,数据库中至少还有3名EFF董事会成员、1名记者、1名科技作家及3名中东政治家,不过,没有一个人曾被征求同意,他们都不知道自己的照片被纳入人脸数据库了。

CC授权为一网络版权协议,代表这些数据库可被复制或使用,且同时支持学术与商业使用,等于是任何人都可访问。而不管是MS Celeb、Duke MTMC、Brainwash或Janus都可被用来训练各种人脸识别模型。

不只是Janus专门搜集名人的脸部数据,微软的MS Celeb也是。

微软并未承认MS Celeb是因为该篇报导而被撤下,只表示那是个基于学术目的的网站,而原本负责的员工离职了,于是微软便删除了该数据库。

不过,就算这些人脸数据库已被下架,但它们也许还躺在全球研究人员的硬盘里,或者有朝一日仍然会在网络上曝光。