AWS发布写三行程序代码就能创建高性能神经网络模型的函数库AutoGluon

AWS发布只要需要开发人员撰写三行程序代码，便能产出高性能神经网络模型的开源函数库AutoGluon，供开发人员应用在处理图像、文本和表帧数据集的机器学习应用程序。AWS应用科学家Jonas Mueller表示，AutoGluon能让机器学习的应用更加普及，赋给所有开发人员运用深度学习的能力。

要部署深度学习模型并达到最佳的性能，开发人员需要具有广泛的专业知识，AWS提到，尽管目前深度学习的应用，仍局限于数量有限的专家，但过去十年简化深度学习，努力让专业人员更容易使用深度学习的工作，已经大有斩获。

AWS举例，像是过去开发人员需要投入大量的时间，以计算深度学习模型所需要的梯度（Gradient），梯度是矢量，用来表示最有效参数的更新，以最大程度降低训练数据中范例的错误，而后来则出现像是Theano等软件函数库，可以自动计算高度复杂神经网络的梯度，并且提供样板程序代码，让开发人员可以更简单地利用日益复杂的神经网络架构。

另外，还有像是Keras函数库，则是深度学习函数库TensorFlow的抽象，让开发人员仅需撰写几行程序代码，就能指定像是输入的数量和层数等参数，让开发者少写许多重复的程序代码。AWS提到，虽然有了这些改进，但是应用深度学习技术仍有许多麻烦，像是超参数调整、数据预处理、神经架构搜索以及转移学习相关的决定等问题。

为此，AWS开发了AutoGluon，AWS提到，开发人员不再需要于设计深度学习模型时，手动尝试数百种选择，只要简单地指定模型训练进程，AutoGluon就可以便用被分配的计算资源，在时间内运算出最佳的模型。

以往开发人员为了要找出模型的超参数，需要作出许多选择，诸如神经网络的层数，以及决定网络的结构，同时也要选择神经网络训练的方法。Jonas Mueller提到，由于深度学习的不透明性，专家在不少时候做出的选择，都是依赖主动，而非依据可预期的结果，做出合理的判断，AutoGluon解决了这个问题，因为所有选择都会在默认范围中自动调整，而默认范围可在特定任务和模型表现良好。

AutoGluon网站提供了许多现成的范例，可让开发者学习将AutoGluon用于表格、文本和图像数据的方法，对高端的开发人员，AutoGluon网站还有教导使用AutoGluon API的说明，在定制化应用程序中自动改进预测性能的方法。