AWS更新ETL服务推Glue 2.0,作业启动速度是前一代的10倍

AWS更新其ETL(Extract、Transform、Load)服务发布AWS Glue 2.0,能够执行Spark ETL作业,启动时间较前一代还要快10倍,最小计耗时间更短,可被灵活地用来处理交互性高的工作负载。目前AWS Glue 2.0已经在美东、欧洲、亚太、中东和南美各区上线。

AWS Glue是一项无服务器ETL服务,用户无需配置或是管理主机,能够简单地准备和加载需要分析的资料。最新的Glue服务,主打能快速启动的Spark ETL作业,启动速度是前一代的10倍,官方提到,启动等待时间减少,可以降低整体作业时间,而且通过脚本开发和资料探索,能良好地支持微批次、高交互性的工作负载,并提升生产力。

除此之外,AWS Glue 2.0的Spark作业能以每秒计费,而且还降低了最小计耗时间,从原本最少计耗时间10分钟降到了1分钟,如此用户能够以更划算的价格,将AWS Glue灵活地用来处理较小且交互性高的工作负载。

AWS提到,因为AWS Glue 2.0的启动作业速度更快,用户能够更可靠地执行SLA资料工作管线,并且使资料探索和实验更具交互性。另外,AWS Glue 2.0还有一项新功能,能让用户从Wheel文件或是存储库中,安装Python模块。