AWS SageMaker现提供托管竞价型训练,用户可节省最高90%的训练成本

AWS为模块化机器学习服务SageMaker加入托管竞价型训练(Managed Spot Training)功能,其使用Amazon EC2竞价型执行实例,可以让用户在SageMaker的机器学习模型训练成本,下降多达90%。

 

开发人员可以使用AWS SageMaker构建、训练和部署任意规模的模型,除了选用自定义或是内置的算法外,甚至也能在AWS Marketplace找到适用的算法训练模型,并简单地将实验规模的机器学习模型,扩展至正式生产规模,开发者通过选择需要的EC2执行实例类型以及数量,配置工作负载需要的计算资源。

竞价型执行实例是AWS云计算中未被使用的执行实例,用户能以比按需型执行实例还低的价格,使用这些计算资源。而现在开发者也可以在AWS SageMaker中使用竞价型执行实例,来训练机器学习模型,该功能称为托管竞价型训练,

托管竞价型训练和按需训练最大的不一样,就是按需训练的执行实例在训练完成之后才会结束,但是托管竞价型训练使用的执行实例,是AWS云计算上闲置的执行实例,因此当AWS需要这些计算资源的时候,机器学习训练任务会被终止,并由AWS收回这些被占用的执行实例。

不过,由于AWS SageMaker是一个全托管的服务,因此当机器学习训练任务需要中断时,服务会自动处理整个过程,并且在拥有足够计算资源时,重新启动并恢复训练工作。

这个AWS SageMaker托管竞价型训练功能,可以用于所有类型的训练配置,支持所有AWS SageMaker支持的执行实例类型,可用于各种内置算法所训练的模型,或是自定义的模型,而且无论是单执行实例训练、分布式训练或是自动模型调校,也都可以采用托管竞价型训练。

用户要使用托管竞价型训练功能,可以在控制台激活,或是在Amazon SageMaker SDK中,将Estimator构建器train_use_spot_instances配置成true。