Meta AI尝试解决维基百科人物传记所存在的性别偏见问题

Meta研究人员创建人工智能系统,来编写出维基百科风格的传记草稿,使得维基百科编辑能够以最少的编辑,在维基百科上提供女性人物的传记,以补充目前维基百科上,男女性人物传记数量失衡的状况。

维基百科一直是全球访问量前10名的网站,是许多人搜索历史人物与领创者资讯的第一站,但这些人的传记,并不总是被平等的呈现在维基百科上,根据维基媒体自己的研究资料,英文网站上只有大约20%的传记是关于女性。Meta研究人员提到,交叉性群体像是科学界女性、非洲女性或是亚洲女性的传记数量可能更少。

虽然女性可能更倾向于撰写其他女性的传记,但Meta研究人员在维基媒体《2021年社群洞察报告》中发现,维基百科中只有15%的编辑是女性,他们提到,女性在历史上,对科学、政治、社会甚至是企业家精神,都产生巨大的影响,但是这些女性人物却被忽视,或是被以不成比例的方式在维基百科上呈现。

研究人员举例,像是加拿大物理学家Donna Strickland,在2018年的时候获得诺贝尔物理学奖,却在维基百科上无法找到任何关于他的资讯,一直到Donna Strickland获得该领域最大的奖项,他的传记才终于被发布。

因此Meta研究人员,开发了一个端到端人工智能模型,作为解决问题的起点,该模型能够自动创建现实公众人物的传记文章。模型会先在网络上搜索相关的资讯,并且写出关于该人物的维基百科式条目,并且附上引用资料。

由于该人工智能系统仍还存在一些限制,因此定位上需要能与维基百科编辑互补,由人工智能系统产生草稿,接着再由编辑进行事实查证和补充。模型的限制包括,用来创建维基百科条目的网页内容,可能存在文化偏见,而且在技术上,文本生成系统容易产生幻觉(Hallucination),也就是非事实的内容。

以下彩色文本,是由模型替无脊椎动物的研究先驱Libbie Hyman,所生成的简短传记,绿色文本来自参照文章,紫色文本则来自网络上的证据,橘色文本则表示幻觉,是由模型脑补,无法被验证的资讯。

虽然模型所生成的结果无法直接被使用,但是模型检索了Libbie Hyman相关资料,包括对无脊椎动物的研究、重要出版物和工作等,使得维基百科编辑能根据这项基础,借由验证内容的正确性,并且补充Libbie Hyman的生活和成就,更快速地完成传记。

虽然在技术上还是有不足的地方,但这却是对维基百科内容的性别平等踏出重要的一步,这项研究接下来还有许多工作要做,研究人员提到,他们目前的工作,仅是解决一个复杂问题的一小部分,其他问题像是在参照网络资料时,女性的传记通常包含更多额外的生活细节,像是离婚这个词,出现在女性传记的频率是男性传记的4倍,来自小报的素材,往往更关注女性的生活,而这些细节可能冲淡更应该专注的成就。

Meta研究人员提到,目前该模型把重点摆在女性,不过维基百科上还有许多内容存在偏见,根据维基百科对社群文章偏见的研究,发现跨性别和二元性别人物的传记,往往长度更长,但是大部分章节都是描写个人生活,而非个人成就,因此要在当前的内容中,识别不同的偏见形式,也是接下来需要继续研究的部分。