Databricks针对制造业推出资料湖仓,加速资料分析和AI用例开发

Databricks持续扩展其资料湖解决方案,推出制造业专用资料湖仓平台,在其原有的核心资料湖仓平台上,开发出适用于制造业的资料分析解决方案,并且提供预构建加速器,支持数字双生、物料预测和设备效率分析等用例。

Databricks的资料湖仓是一种新形态的资料架构,通过集成资料湖和数据仓库的优势,提供更灵活的资料分析解决方案。资料湖仓可同时处理结构化和非结构化资料,且支持即时资料的处理与分析,借由集成资料生态系中多种数据源和工具,像是Delta Lake、Apache Spark、Pandas等,提供企业高效且可扩展的资料处理平台。

应对不同产业独有特性,Databricks针对象是医疗保健或是金融服务等不同产业,皆推出专用的资料湖仓解决方案,而Databricks现在进一步发布制造业使用的资料湖仓平台,解决制造产业的资料应用痛点。

官方指出,制造业所产生的庞大资料量,较零售、媒体和金融服务高出2到4倍。制造业庞大的资料,在发展资料应用上会遭遇各种障碍,包括传统本地存储和云计算数据仓库连接的复杂性,而且不断增长的庞大资料量,也使得处理成本过于高昂,另外,生产过程所产生的结构化和非结构化资料,使资料分析工具碎片化,使用成本更高也更花耗时间,还有过去批次资料处理节奏,也难以运用资料即时做出运营决策。

制造业专用资料湖仓平台创建在Databricks核心资料湖仓平台之上,能够克服这些资料应用障碍,在单一平台提供资料分析、资料工程和机器学习功能,并且统一资料治理,使得制造业更容易发展资料应用。而且用户还可方便地采用,支持各种工业资料用例的预构建解决方案加速器,现在该平台可以使用的加速器包括数字双生、物料预测、设备效率分析、计算机视觉和预测性维护等。