大数据即服务公司BlueData推出Bluek8s开源项目,加速Stateful应用程序部署

云计算原生运算基金会成员之一的大数据即服务厂商BlueData,近日也加码押宝Kubernetes,推出了开源项目BlueK8s。 而在此项目中第一个即将发布的项目是KubeDirector,让有态应用(Stateful)在Kubernetes平台运行时,能更容易部署、管理。

当今Kubernetes已经可说是容器调度平台的同义词,不过BlueData表示,当企业想部署机器学习、大数据、人工智能应用在Kubernetes执行时,仍会碰到许多挑战。相对之下,以容器技术为基础的微服务架构,就没有持久存储的需要,而云计算原生网页应用,本身HTTP协议就是Stateless,与本地容器存储更没有存在相依性之问题。而BlueData表示,执行有态应用当中一个大挑战,源自于大数据平台生态系统的复杂性,像是Hadoop、Spark、Kafka或TensorFlow等分布式框架,BlueData认为,Kubernetes还不足作为这些有态应用的执行平台,因为这些服务执行,都非常依赖持久存储。

而BlueData共同创办人兼首席架构师Tom Phelan表示,由于在Kubernetes平台部署这些框架的痛点,该公司开始要发布BlueK8s项目。而第一波要推出的就是KubeDirector,该项目是以Kubernetes自资源定义(Cutsom Resource Definition,CRD)功能为基础,而KubeDirector的功用,可以将大数据、AI应用的打包、部署及管理流程,一并串接及简化。

在具体功能面上,KubeDirector导入Kubernetes原生的API延伸套件,减低开发者的新学习门槛,而此项目,利用YAML格式,就可以保存应用程序的组态设置及状态数据。目前KubeDirector所支持的大数据、深度学习框架,包含Spark、Kafka、Hadoop、Cassandra、TensorFlow等。此外,Tom Phelan表示,企业用户也不需要刻意将既有应用程序,拆解成微服务架构。

成立于2012年的BlueData,其核心产品是BlueData Epic软件平台,以Docker容器技术为基础,让企业可以更快拥抱大数据、AI应用。而该解决方案可以同时部署在混合云、公有云或私有云架构上执行。

KubeDirector导入Kubernetes原生的API延伸套件,而利用YAML格式,KubeDirector就可以保存应用程序的组态设置及状态数据。目前KubeDirector所支持的大数据、深度学习框架,包含Spark、Kafka、Hadoop、Cassandra、TensorFlow。图片来源:BlueData