推特照片剪裁算法被指存在种族偏差,推特承诺进一步研究并开源成果

推特会对推文照片进行剪裁,以突出呈现照片重点,不过,有用户却发现,当照片同时存在黑人与白人脸孔时,推特照片的算法会优先选择有白人脸孔的部分,而且甚至在卡通人物上,也有同样的现象发生。

在这个BLM(Black Lives Matter,黑人的命也是命)之火还在燃烧的时刻,官方也迅速回应社群,表示虽然他们有检查机器学习模型的偏差,但是显然还有一些课题需要研究,之后会把相关成果开源出来。

这件事的起源,是由加密货币基础设施厂商Iqlusion共同创办人Tony Arcieri开始,他在推特上发了多张共和党参议院领袖Mitch McConnell以及美国前总统Barack Obama的拼贴照,实验推特照片算法,结果发现,肤色较白的Mitch McConnell总是被算法选中,在缩略图中突出显示。

接着许多网友开始进行各种实验,包括更换人物身上的领带颜色、帮奥巴马戴上眼镜,还有在拼贴图中增加奥巴马的照片的数量,甚至拿歌手Michael Jackson的照片进行比对,似乎在特定的情况下,算法会倾向选择突出显示白皮肤人物,但有一些实验却呈现相反的结果,推特首席设计师Dantley Davis以穿着同一套西装的黑人与白人上半身照片为例,推特算法选择将黑人重点呈现,而把白人剪裁掉。

为了研究推特照片剪裁算法是否存在偏差,身份认证平台UnifyID首席科学家Vinay Prabhu进行了更为严谨的实验,以探索算法的特性,他使用了93张经本人同意的自拍照,这些照片控制了饱和度、大小、分辨率、光照条件、脸部表情和衣着等条件。他制作了多张拼贴图,每张拼贴图都有两张人脸,这些拼贴图被实际发布到推特上,以观察照片剪裁算法的行为。

实验结果出乎意料,93张照片有92张成功发送出去,其中有1张因为自动随机发送推文失误而失败,而成功发送的92张拼贴图中,算法重点呈现白人与黑人的比例为40:52。对于这项实验结果,Vinay Prabhu提到,这样的结果,虽然表面上看起来,算法并没有种族偏见,但是因为种族主义是经验性的,并非统计可以说明。另外,这项实验使用的资料集也有缺陷,自然的人像背景通常不会是白色,而这可能会影响算法的判断。

对于推特算法的行为众说纷纭,Dantley Davis表示,他们仍在研究神经网络技术,而看起来的确有一些变量需要进一步查看,而推特的公关团队也即时地跳出来回应,说明推特对部署的模型,都有经过偏差测试,但是在测试结果,他们并没有发现任何性别或是种族偏差存在的证据,但从结果看起来,他们需要进行更多的分析,而之后将会公布他们的发现以及新的行动,也会开源相关研究结果。

由于最近脸部识别开始被大量应用在各种场景,从社交平台的好友标记,到政府单位执法甚至是边境管控,因此脸部识别算法,是否存在种族偏差的议题被大量的讨论。

美国国家标准暨技术研究院(NIST)在去年的时候,研究了市面上200多种脸部识别算法,发现其中大部分算法存在种族偏差,尤其是美国开发的算法,亚裔和非裔美国人脸孔伪阳性误判率,比白人高出10到100倍,且在部分应用下,非裔美国女性错误率明显偏高。NIST提到,伪阳性误判会把错误的人摆进需要审查的名单中,对这些人造成权利上的侵害,用户不应该完全相信系统,而且应质疑用途的合理性。