Amazon Redshift机器学习功能正式推出

现在用户可以直接在AWS云计算数据仓库Amazon Redshift中，以SQL指令创建机器学习模型。这项称作Redshift ML的功能，让用户可以使用SQL语法，查询训练资料以及指定预测的输出值，不需要麻烦地人工移动资料，就能快速启动机器学习模型训练流程。现在Redshift ML已经在美东、美西、欧洲和南美上线，而亚太则在香港、东京与雪梨地区提供。

Amazon Redshift是AWS的云计算数据仓库服务，供用户以SQL跨数据仓库、运营数据库和资料湖等EB级存储，对结构化和半结构化资料进行查询，AWS提到，当用户要使用这些资料，训练机器学习模型时，需要将资料从Amazon Redshift导出到对象存储S3存储桶中，并且配置像是Amazon SageMaker服务，来启动机器学习训练流程，这个过程繁琐且需要多项技能，通常要集结多人才能完成。

为了简化使用Amazon Redshift资料，进行机器学习运算的麻烦，AWS在Redshift加入机器学习功能，供用户直接从Redshift集群创建、训练和部署机器学习模型，通过SQL指令创建模型后，Redshift ML会自动将资料从Redshift导出至S3存储桶，并且调用SageMaker Autopilot来准备资料，进行预处理和特征工程。接着会选择适当的预构建算法，并在资料上使用该算法以训练模型，当然，用户也能选择使用特定的算法。

Redshift ML功能自动处理了Redshift、S3和SageMaker之间的所有交互操作，包括训练和编译涉及到的所有步骤。在模型训练完成后，Redshift ML还会使用SageMaker Neo来优化模型进行部署，并且以SQL函数的形式，来提供机器学习运算，因此用户就能够使用SQL函数，将机器学习模型用于查询、报告和仪表板上的资料。

另外，用户可以导入SageMaker模型到Redshift集群中，执行本地端推理，也能够创建在既有SageMaker端点执行远程推理的SQL函数，不过，在后者的模式，Redshift ML将会进行批处理，以加速处理速度。