微软云计算数据集成服务开始支持GitHub

今年6月微软砸75亿美元并购GitHub的消息,震撼科技圈。而微软也陆续将自家产品与GitHub集成,如Visual Studio Team Service(VSTS)、Team Foundation Server(TFS),改善开发者体验。 而近日微软又宣布了新集成策略,这次换到自家公有云Azure,现在该云计算数据集成服务(Azure Data Factory,ADF),也开始支持GitHub。

现在该服务与GitHub集成之后,开发者可以利用云计算数据集成服务的可视化工具,与现有开发流程进行串接,像是开发协作、程序代码来源管控等。要开始导入此新服务前,开发者只需要通过点击操作,选择GitHub作为存储库,让它开始与ADF进行串接。

微软表示,根据业务需求,企业用户可以选择要集成公开GitHub版或者企业版。而结合ADF后,开发者可以同步Azure云计算环境及GitHub存储库内容。微软解释,ADF会自动将Pipeline、数据集等开发数据,汇到GitHub存储库。用户必须输入要串接的GitHub帐号、存储库名称、根文件夹(Root folder)、是否要将Data Factory数据导入存储库,并且指定ADF数据未来要导入的版本分支。

Azure Data Factory的主要功能是混合式数据集成(Extract Transform Load,ETL)服务,让企业用户在云计算代管环境、内部环境中处理数据。微软也有提供超过70个原生连接套件,可以支持Azure数据服务、AWS S3、Google BigQuery、SAP HANA、甲骨文数据库等,让企业用户可以加速搬迁工作。

想要激活该新功能,开发者得先在Azure Data Factory菜单中,点击“设置程序代码存储库”,之后系统就会引导用户集成ADF及GitHub。图片来源:微软

接着,开发者就可以设置ADF与GitHub的集成。用户必须输入要串接的GitHub帐号、存储库名称、根文件夹(Root folder)、是否要将Data Factory数据导入存储库,并且指定ADF数据未来要导入的分支。图片来源:微软