Amazon Redshift机器学习功能正式推出

现在用户可以直接在AWS云计算数据仓库Amazon Redshift中,以SQL指令创建机器学习模型。这项称作Redshift ML的功能,让用户可以使用SQL语法,查询训练资料以及指定预测的输出值,不需要麻烦地人工移动资料,就能快速启动机器学习模型训练流程。现在Redshift ML已经在美东、美西、欧洲和南美上线,而亚太则在香港、东京与雪梨地区提供。

Amazon Redshift是AWS的云计算数据仓库服务,供用户以SQL跨数据仓库、运营数据库和资料湖等EB级存储,对结构化和半结构化资料进行查询,AWS提到,当用户要使用这些资料,训练机器学习模型时,需要将资料从Amazon Redshift导出到对象存储S3存储桶中,并且配置像是Amazon SageMaker服务,来启动机器学习训练流程,这个过程繁琐且需要多项技能,通常要集结多人才能完成。

为了简化使用Amazon Redshift资料,进行机器学习运算的麻烦,AWS在Redshift加入机器学习功能,供用户直接从Redshift集群创建、训练和部署机器学习模型,通过SQL指令创建模型后,Redshift ML会自动将资料从Redshift导出至S3存储桶,并且调用SageMaker Autopilot来准备资料,进行预处理和特征工程。接着会选择适当的预构建算法,并在资料上使用该算法以训练模型,当然,用户也能选择使用特定的算法。

Redshift ML功能自动处理了Redshift、S3和SageMaker之间的所有交互操作,包括训练和编译涉及到的所有步骤。在模型训练完成后,Redshift ML还会使用SageMaker Neo来优化模型进行部署,并且以SQL函数的形式,来提供机器学习运算,因此用户就能够使用SQL函数,将机器学习模型用于查询、报告和仪表板上的资料。

另外,用户可以导入SageMaker模型到Redshift集群中,执行本地端推理,也能够创建在既有SageMaker端点执行远程推理的SQL函数,不过,在后者的模式,Redshift ML将会进行批处理,以加速处理速度。