Databricks并购8080 Labs强化低程序代码数据科学工具组合

数据科学工具供应商Databricks宣布收购德国创业公司8080 Labs,该创业公司开发一种称为Bamboolib的UI数据科学工具,而Databricks通过收购8080 Labs,要在自己的资料湖仓储Lakehouse平台集成Bamboolib,供用户以低程序代码的方式探索资料。

Bamboolib是一个可扩展的GUI,能够导出Python程序代码,就像是在Excel中的宏一样,能够快速简单地进行资料探索和转换;而基于UI的工作流程,可降低资料操作的门槛,无论是无技术基础的公民数据科学家还是技术专家,都能够取用Databricks上的资料。

低程序代码使用案例包括资料准备,用户只要点击鼠标,就能够清理和组织原始资料,并将其用于下游任何应用中,也能在UI中进行资料转换,简单地聚合和转换高度复杂的资料集,而资料可视化功能,供用户快速创建和导出Plotly搭建图,提高达10倍的资料可视化速度。另外,用户也可以使用DataFrame功能,在数分钟内开始于Databricks探索资料。

通过收购8080 Labs,Databricks能够更快地在其产品组合,提供低程序代码资料操作工具,Bamboolib无缝集成Python生态系统统,并且生成可直接用于产品的程序代码。Databricks计划降低程序代码功能和新的AutoML、可视化和仪表板产品集成,在Lakehouse平台扩展UI功能,降低用户操作资料的门槛,使具有基本知识的人,就能在资料集上训练模型。

Databricks提到,低程序代码工具可让非技术人员,也能够利用资料和人工智能工具,发挥在业务上的影响力,多数的公民数据科学工具虽然可以提供简单的资料探索功能,但是仍需要工程背景才能应用在机器学习用例上。

Databricks正创建解决方案来解决这项问题,让公民数据科学家也有能力,完成具有影响力的数据科学和人工智能用例。在今年先前Databricks已经发布AutoML,通过自动化进行预处理、特征工程、模型训练和调校,使得用户能够快速构建和部署任何规模的机器学习模型。

而AutoML所创建的基准模型,具有完整可编辑的笔记本,结合上Bamboolib,就能让企业中公民数据科学家,不需要专家帮忙,开发资料分析和机器学习应用。