LinkedIn开源时间串行预测函数库

LinkedIn开源了Greykite函数库,这是LinkedIn为满足自家时间串行预测需求,而开发的Python函数库,Greykite主要使用一个称为Silverkite的算法,可以提供快速、准确且主动的预测结果,适合用于大规模且需要交互的预测应用。

时间串行预测可以用来预测,随时间变化的指标以及各种数值,官方提到,虽然专家可以产生精确的预测,但是算法的自动化优势,可以带来可扩展性和可重复性,而且还能提高准确度,下游算法也可以使用自动化产生的结果进行决策。

LinkedIn所开发的Greykite,包含了一个简单的建模界面,可促进资料探索和模型调整,而Silverkite算法有很大的自定义空间,能够调整参数以截取各种时间串行特征,输出的结果也具可解释性,能够以可视化的方式反应趋势、季节性和其他影响统计的要素。

官方提到,Silverkite对具有时间变化的趋势、季节性和重复事件等时间串行预测效果很好,在LinkedIn中,他们已经将其应用在每小时、每天和每周等各种时间频率,以及短期与长期等时间范围的指标预测上。

由于Greykite具有高度灵活特性,能提供趋势、季节性、变化点(Changepoint)以及自动回归等时间串行回归功能,用户可以按需求使用,并应用在选择的机器学习模型上,而且Greykite有探索性图表功能、调校模板和可解释性预测,因此可提供用户直观的使用体验,另外,Greykite高性能的特性,可以支持大规模快速雏形开发和部署。

LinkedIn在资源规划、绩效管理、优化和分析生态系统等各种领域,广泛地使用时间串行预测,像是预测高峰流量以准备足够的基础设施,或是用于设置业务指标,并且关注运营进度,还可以预测市场的增长,来优化预算运用。官方提到,Greykite就很适合用于COVID-19疫情冲击后,预测各国的恢复速度。

Greykite主要采用高度可自定的算法Silverkite,官方表示,Greykite能够扩展支持多种算法,并通过单一界面进行基准测试,目前Greykite还支持脸书Prophet算法,LinkedIn预计未来还会支持更多开源算法。Greykite函数库现在已于GitHub和PyPI上公开。