Social Science One及脸书终于发布内置3,800万个网址的数据集

在2018年7月由非盈利的美国社会科学研究协会(Social Science Research Council)及脸书(Facebook)共同成立的独立组织Social Science One,终于在本周发布内置3,800万个网址的数据集,号称是全球规模最大的社会科学数据集之一,目的是供学者及研究人员用来探讨社交媒体在选举及民主上所扮演的角色。

该社会科学数据集内置脸书上从2017年1月1日到2019年7月31日之间,超过100次分享的10万亿则摘录信息,涉及3,800万个网址,同时也备注了这些网址是否曾经过事实核实,或是被用户列为仇恨言论等信息,以及被哪类的用户读取、分享、点赞、分享或交互。

Social Science One表示,该数据集将让社会科学家得以取得过去他们无法访问的数据,借以研究社交媒体对民主与选举的影响。

其实Social Science One原本计划要在宣布的两个月内就产出数据集,但后来却花了20个月才完成,关键就在隐私。

参与该项目的斯坦福大学法学教授Nathaniel Persily向Protocol透露,这是他这辈子所参与的项目中最令人感到挫败的,2018年3月爆发的剑桥分析(Cambridge Analytica)丑闻,让脸书在处理用户隐私上更加谨慎,2018年5月上路的《通用数据保护规则》(GDPR),更让该数据子集的创建雪上加霜。

这是因为GDPR在保护用户隐私时,并未考虑到研究人员访问用户信息的需求,且GDPR虽然制定了适用于欧盟的规范,但各国的执行标准不一。

脸书前任首席安全官Alex Stamos则指出,各监管机关对剑桥分析一案的反应过度,造成大量的学术研究无法运用这些平台的数据。

不过,Social Science One认为生产该数据集的过程还是有些收获,至少可在其它平台、政府与学术机构执行其它数据分享项目时作为参考。