Google公共云计算资料集解决方案现加入商业资料集

Google更新云计算资料集解决方案,让企业用户能以更加统一的方式,同时取用公共和商业资料。另外,Google还开源公共资料集参照基础架构,使得公开数据源更透明,用户也可以分叉到自己的Google账户,以便上线私有资料集并将其用于商业目的。

Google这项针对企业的云计算资料集解决方案,是创建在现有的公共资料集计划之上,只是现在将应用的范围,从公共资料扩展到商业资料集、综合资料集和第一方Google资料资产上,来增加分析和人工智能服务的价值。

在2016年的时候,Google公共资料集计划和美国国家海洋暨大气总局(NOAA)、美国国家研究院等许多资料供应商合作,将经过格式优化的资料放在BigQuery和云计算存储上,作为精选公共资料资产目录,Google提到,许多资料可供各行业进行各种分析,像是NOAA的严重风暴事件的公共资料集,在结合零售商自己的库存资料后,就可以分析恶劣天气对销售与库存的影响。

而通过将商业、合成以及第一方的资料加到计划中,用于资料分析和人工智能,可进一步强化分析的能力,另外,用户也可以通过Earth Engine和Kaggle的目录,来探索并且取用这些资料集。

除了丰富云计算的资料集之外,Google还发布用于资料导入的开源参照基础架构,这样即便用户不将企业私人资料放到Google云计算上,也能使用这些资料进行综合分析。Google提到,可以把新的参照基础架构想成网页框架,网页框架可以用来处理构建网页应用程序所要进行的繁琐工作,而参照基础架构,则可以用来减少开发和维护资料工作管线的额外工作。

参照基础架构是一个人信息料集上线的工作管线基础架构,使用YAML配置文件来简化控制。Google宣布将公共资料集的参照基础架构开源,让用户不只可以清楚数据源,并且也让有意想要公开资料集的组织,能够研究利用该架构,将资料放上Google云计算,而企业也可以借由分叉基础架构项目,并在自有的Google云计算账户上线资料集进行商业使用。