微软终于发布ML.NET 1.0,能自动为输入的数据决定ML算法

微软在2018年Build大会中,发布了由微软研究院开发的跨平台机器学习框架ML.NET,现在终于成熟发布了ML.NET 1.0,加入了自动机器学习AutoML、模型构建器(Model Builder)以及ML.NET命令行工具,共三项功能预览。

ML.NET 1.0的自动机器学习功能,将能自动决定适用于输入数据的算法,帮开发者快速构建自定义机器学习模型,微软提到,在构建自定义机器学习模型的时候,开发者必须要为使用案例选择机器学习的类型,决定是分类或回归的任务之后,再将数据转换成适用算法的格式,通过微调算法以取得最好的性能,而新手会在这过程遇到非常多的障碍,自动机器学习则能简化这个过程。

自动机器学习支持价格预测等回归类任务,也支持情感分析、垃圾邮件侦测等分类任务,开发者可以使用模型构建器、ML.NET命令行工具或是AutoMLAPI执行自动机器学习,微软建议,可以在Visual Studio中开始进行自动机器学习,此外,在需要动态构建模型的使用案例,AutoML也很有帮助。

而模型构建器则是一个用户接口工具,让开发人员可以使用AutoML为输入的数据构建最佳的机器学习模型,并产生模型训练与部署的程序代码,让开发者可以快速的为应用程序,加入机器学习功能。另外,ML.NET 1.0还提供命令行工具(下图),功能与模型构建器相似,只是模型构建器提供的是图形接口,而开发者则可以使用命令行工具,以指令走访数据集产生最佳模型,或是产生训练与应用模型的程序代码。ML.NET命令行工具支持跨平台,为.NET命令行工具的扩展组件。

接下来,微软还会为AutoML增加更多支持的使用场景,还要原生集成Apache Spark,并支持更多的数据来源,像是QL Server、CosmosDB以及Azure Blob存储等。