D2iQ推出企业级端到端机器学习平台

D2iQ宣布其云计算原生端到端机器学习平台Kaptain 1.0上市,Kaptain以Kubernetes机器学习工具包Kubeflow为基础,让开发者能够快速地开发和部署人工智能工作负载,Kaptain提供了一系列完整的机器学习工具,包括Jupyter Notebooks,并提供现成可用的GPU训练框架、工具和函数库,此外,用户也可以按需求安装需要的组件。

D2iQ之前的名字称为Mesosphere,其主要的产品是创建于Apache Mesos上的软件,被称为数据中心的操作系统,在2019年时,Mesosphere重命名为D2iQ,而Kaptain这个产品,最早于2020年6月的时候出现,但是当时被称为KUDO for Kubeflow,而现在正式发布,被更名为Kaptain,其目的是要用来简化在Kubernetes上进行机器学习开发的复杂度。

D2iQ提到,企业将机器学习投入生产,主要会遇到几个障碍,云计算原生人工智能和机器学习技术因为较新,近5年才出现,企业可能缺乏相关技术,而且相关的工具很复杂,云计算原生机器学习工具约将近300种。此外,结合Kubernetes和机器学习技术,让问题更加复杂,且对企业来说,还需要关注可靠性、安全性和可扩展性等重点。

Kaptain便是D2iQ创建来解决这些问题的解决方案,Kaptain是一个以Kubeflow为基础的企业端到端机器学习平台,能够解决结构性和组织性的问题,加速机器学习雏形到真正投入生产的过程,企业可以使用Kaptain开发和部署大规模机器学习工作负载,满足对安全性和法遵需求。Kaptain使用D2iQ Konvoy Kubernetes版本,可以在公有云、裸机和虚拟机上,或是混合云环境上部署。

除了Kubeflow项目,Kaptain还加入不少机器学习必要的工具,诸如TensorFlow、PyTorch和MXNet等,以及开箱即用的GPU支持,用户可以使用熟悉的笔记本进行操作,让资料科学家也能够简单地使用,所有工作都可以在Jupyter Notebooks中完成。而Kaptain SDK让资料科学家可以不降采样的利用整个人信息料集,训练机器学习模型。

Kaptain的一大优点便是能提升机器学习应用开发速度,用户可以在几分钟内,将机器学习项目雏形直接转为生产可用的部署,其借助了Kubernetes的扩展性和可靠性,强健地自动扩展基础设施,使其适用于训练、调校和部署模型。