Google云计算AI平台内置TabNet表格模型,可替代传统决策树算法

Google在云计算平台新加入内置深度学习模型TabNet,用户可以简单地使用深度学习来处理表格资料,TabNet具有两项优点,除了可解释性之外,还提供高效的执行性能,Google提到,这个算法很适合用于零售、金融和保险业,实例像是预测信用评分、欺诈侦测和数值预测等应用。

Google提到,虽然表格资料是人工智能应用中,最常见的资料类型,但是将表格资料应用于深度学习中,并没有获得充分的研究,目前大多数应用程序,仍然使用决策树算法,Google进一步解释其中的原因,因为决策树很适合用于表格资料,而且具有很好的可解释性,这在金融服务这类高风险的实际应用中非常重要,另外一个原因则是,过去的深度学习架构并不适合用于表格资料。

之所以要在表格资料使用深度学习技术,Google认为,跟图像、语音和语言等领域相同,新的深度学习架构能带来明显的性能改善,由于深度学习近期在图像以及语言的发展,也驱使了研究团队开发可将深度学习用于表格资料的架构。

而且神经网络与决策树算法相比,神经网络使用称为反向传播方法,是能够直接从错误信号学习的有效方法,Google提到,深度神经网络可以于表格资料,提供基于梯度下降的端到端学习方法,这带来的好处包括从部分标记的资料中学习,或称半监督式学习,还能够使用另一个训练模型的信息,以学习解决相关的任务。

TabNet被设计能够学习类决策树的映射方式,以获取决策树可解释性的优点,而且又因为使用深度学习方法,因此能获得高性能的好处。TabNet采用称为顺序注意力(Sequential Attention)的机器学习技术,用户可以了解模型中的每一个步骤,选择模型特征的原因,这个机制可以解释模型获得最终预测结果的过程,还可用来改进模型,增加精准度,Google提到,因为顺序注意力机制,TabNet的性能表现比其他神经网络和决策树方法都还要好,还提供可解释的特征归因。

现在Google发布TabNet,作为云计算人工智能平台训练服务内置的算法,TabNet提供了超参数调整功能,因此即便用户不了解该方法背后的技术原理,仍可以达到高执行性能。超参数调校会在单一训练工作中,进行多次试验后开始作用,Google提到,虽然超参数比预测值性能还要好,但因为需要经过多次的试验,因此超参数调校功能需要付出较高的计算成本。