LinkedIn发布机器学习函数库Dagli

近期LinkedIn发布机器学习函数库Dagli,它适用于Java,具有容易编写、不容易产生bug的特性,方便开发者构建机器学习应用。

Dagli环境有大量的工作管线组件,也能避免大部分的逻辑错误

虽然企业的机器学习成熟度普遍提高,但根据算法创业公司Algorithmia在2019年的调查,多数企业部署机器学习模型需要8到90天的时间,而18%的企业耗时超过90天。多数企业将原因归咎于无法规模化,其次是模型可复制性的挑战、缺乏上层的支持、以及糟糕的工具。

Dagli环境具有大量的工作管线组件(pipeline components),包含神经网络、逻辑回归、梯度提升决策树、FastText、交叉验证、交叉训练、特征选择、数据读取器、评估、特征转换等。而Dagli环境提供工作管线定义、静态类型、不变性等特性,从根本上避免大部分的逻辑错误。此外,Dagli也提供高度可移植性,开发者能应用于服务器、Hadoop、CLI、IDE,与其他典型的JVM环境中工作。

对资深的机器学习工程师来说,Dagli提供提供开发高性能且生产就绪的模型,能够长期维护,也能扩展,与现在基于JVM技术的堆栈集成。对于机器学习新手工程师,Dagli提供直观的API,能结合熟悉的JVM工具使用,并避免常见的逻辑错误。

参考资料

《The Machine》、《Analytics India Mag》