AWS发布写三行程序代码就能创建高性能神经网络模型的函数库AutoGluon

AWS发布只要需要开发人员撰写三行程序代码,便能产出高性能神经网络模型的开源函数库AutoGluon,供开发人员应用在处理图像、文本和表帧数据集的机器学习应用程序。AWS应用科学家Jonas Mueller表示,AutoGluon能让机器学习的应用更加普及,赋给所有开发人员运用深度学习的能力。

要部署深度学习模型并达到最佳的性能,开发人员需要具有广泛的专业知识,AWS提到,尽管目前深度学习的应用,仍局限于数量有限的专家,但过去十年简化深度学习,努力让专业人员更容易使用深度学习的工作,已经大有斩获。

AWS举例,像是过去开发人员需要投入大量的时间,以计算深度学习模型所需要的梯度(Gradient),梯度是矢量,用来表示最有效参数的更新,以最大程度降低训练数据中范例的错误,而后来则出现像是Theano等软件函数库,可以自动计算高度复杂神经网络的梯度,并且提供样板程序代码,让开发人员可以更简单地利用日益复杂的神经网络架构。

另外,还有像是Keras函数库,则是深度学习函数库TensorFlow的抽象,让开发人员仅需撰写几行程序代码,就能指定像是输入的数量和层数等参数,让开发者少写许多重复的程序代码。AWS提到,虽然有了这些改进,但是应用深度学习技术仍有许多麻烦,像是超参数调整、数据预处理、神经架构搜索以及转移学习相关的决定等问题。

为此,AWS开发了AutoGluon,AWS提到,开发人员不再需要于设计深度学习模型时,手动尝试数百种选择,只要简单地指定模型训练进程,AutoGluon就可以便用被分配的计算资源,在时间内运算出最佳的模型。

以往开发人员为了要找出模型的超参数,需要作出许多选择,诸如神经网络的层数,以及决定网络的结构,同时也要选择神经网络训练的方法。Jonas Mueller提到,由于深度学习的不透明性,专家在不少时候做出的选择,都是依赖主动,而非依据可预期的结果,做出合理的判断,AutoGluon解决了这个问题,因为所有选择都会在默认范围中自动调整,而默认范围可在特定任务和模型表现良好。

AutoGluon网站提供了许多现成的范例,可让开发者学习将AutoGluon用于表格、文本和图像数据的方法,对高端的开发人员,AutoGluon网站还有教导使用AutoGluon API的说明,在定制化应用程序中自动改进预测性能的方法。