甲骨文推出MySQL HeatWave ML,添加机器学习功能

甲骨文宣布,Oracle MySQL HeatWave除了支持交易处理和分析之外,现在也支持数据库机器学习 (ML)。这是目前唯一提供此功能的MySQL云计算数据库服务。HeatWave ML可完全自动化ML生命周期,并将所有经过训练的模型存储在MySQL数据库中,无需将资料或模型转移至ML工具或服务。消除截取、变换及加载 (ETL) 流程可降低应用程序的复杂性及成本,并提升资料和模型的安全性。

HeatWave ML包含在所有37个Oracle Cloud Infrastructure (OCI) 区域的MySQL HeatWave数据库云计算服务中。相较于其他云计算数据库服务,HeatWave ML提供以下功能:全自动化模型训练、 模型和推论解释、超参数调整、算法选择、智能资料抽样,以及功能选择。

目前为止,为MySQL应用程序添加机器学习功能对于许多开发人员来说非常困难且耗时。首先,需要将资料从数据库截取到另一个系统,以创建与部署ML模型。通过此方式,将机器学习应用于应用程序资料时会创建多个孤岛,并随着资料移动而出现延迟。同时也导致数据库中资料的扩散,使其安全性更容易受到威胁,并增加了开发人员在多个环境中编程的复杂性。其次,现有服务期望开发人员为指导ML模型训练过程的专家,否则模型此次佳的,并会降低预测的准确性。最后,大多数现有的ML解决方案不包含解释功能,说明开发人员构建的模型为何能提供特定预测。

MySQL HeatWave ML通过在MySQL数据库中原生集成机器学习功能来解决这些问题,无需要将资料截取、变换及加载到另一个服务。HeatWave ML可完全自动化训练过程,并为指定资料集和特定作业创建具有最佳算法、最佳功能以及最佳超参数的模型。同时,HeatWave ML产生的所有模型都可以提供模型和预测说明。

甲骨文发布的ML基准是针对众多公开访问的机器学习分类与回归资料集 (例如Numerai、Nomao及Bank Marketing等) 执行。在较大的HeatWave集群上进行训练时,更能显现HeatWave ML相较于Redshift ML在性能上的优势。训练是一个耗时的过程,由于使用MySQL HeatWave可以非常高效和快速地完成,客户现在可以更频繁地重新训练模型,并且随时掌握资料的变更。这样一来,模型可保持在最新状态,并提升预测的准确性。

除了机器学习功能之外,甲骨文还为MySQL HeatWave服务推出了更多创新功能。即时弹性功能可让客户将HeatWave集群扩展或缩小至任意数目的节点,无需任何停机时间或只读时间,也无需手动重新平衡集群;资料压缩功能可让客户在每个节点多处理2倍的资料量,并降低近50%的成本,同时保持相同的性价比;而添加的暂停与恢复功能则可让客户暂停HeatWave,以节省成本。恢复时,MySQL Autopilot所需的资料和统计资料都会自动重新加载HeatWave中。