Google发布可简单为模型加入公平性限制的函数库TFCO

Google发布了TensorFlow受限优化(TensorFlow Constrained Optimization,TFCO)函数库,这是一个监督式学习函数库,可用多指标增加机器学习模型的限制,解决模型公平性的问题。

机器学习技术被用在各种领域上,许多监督式机器学习的应用,已经在日常生活中产生重大影响,因此模型的公平性问题也愈来越重要,公平性研究人员认为,仅满足最小化单个损失函数(Loss Function)难以解决广泛的社会问题,公平性需要考量更多竞争因素。Google提到,但即便是完全考虑了这些因素,也可能有诸多原因使系统无法使用,像是因为伪阴性造成的问题,可能比伪阳性还要严重。

为此,Google发布了可优化公平限制的TFCO函数库,来解决这个问题,TFCO能够以各种不同指标训练机器学习问题,这些指标诸如特定群体成员的预测精准度,以及与年龄或性别有关的癌症诊断召回率(Recall)等。Google表示,虽然这些指标都是简单的概念,但TFCO提供用户最小化和限制这些概念的能力,可公式化和解决许多公平性问题,也使得机器学习更加通用。

Google以银行贷款的例子来说明TFCO的功能,银行会训练分类器来决定是否放款给客户,使用的训练数据集,由能够偿还贷款与无法偿还贷款人的数据组成,要在TFCO中设置这个问题,用户需要选择一个目标函数(Objective Function),奖励模型同意放款给会偿还贷款的人,并加入公平性限制,避免模型拒绝放款给部分受保护的人士。

在没有公平性限制时,TFCO最小化线性模型分类器的总体错误率,可能产生如下图般的决策边界。

Google表示,这个可能是一个良好的分类器,但是在部分应用上可能被认为不够公平,因为阳性标签蓝色范例比阳性标签橘色范例,更容易收到阴性预测,而这违反机会均等原则,因此只要添加机会均等限制,则分类器便会更公平,呈当下图的样子。

在2018年的时候,Google首席执行官Sundar Pichai发布了Google的人工智能原则,创建Google应用人工智能的规范,而这个TFCO函数库,则能让Google的人工智能原则付诸实现,还能进一步引导道德发展和人工智能的研究与实践。Google希望借由TFCO,开发人员能更好地识别模型可能存在的风险和危害,并设置限制条件确保模型获得理想的结果。