MLOps怎么做?吴恩达:确保机器学习周期“这一点”,项目至少快2倍完成!

吴恩达近期在Deeplearning.ai的一场论坛,说明了自己对于机器学习(Machine Learning)和MLOps的最新看法。

在过去,机器学习社群在意的是建模、参数调整、架构选择,来达到对性能的监控。现在产业运用AI的幅度大增,开始转向了新的阶段,一大面临问题是,当模型投入了生产,许多无法预期的因素,会影响模型性能。

产业、学界对MLOps定义具分歧?吴恩达:这仍是一个新兴学科

企业开始追求大幅扩展这些机器学习模型—试想,当一家公司的信用卡用户,从一百万上升到十亿人,传统的检查点还能全然适用吗?这就是专家提倡MLOps的原因—汇集DevOps和机器学习的所有优点,确实,产业对于具备相关技能的人才也正急剧上升。

一些专家提出MLOps是目前可用的最佳解决方案,但由于这是非常新颖的领域,所以仍然存在歧义,通常没有一套标准考参考。

为解决这些问题,吴恩达创办的Deeplearning.ai最近主持了一个MLOps专家论坛,来切入讨论机器学习生产的关键面向,以及MLOps出现在一家企业其中,究竟会是什么样子。

吴恩达承认,AI、深度学习等领域在过去十年中取得了巨大的进步,他也强调MLOps将帮助每个人完成机器学习项目的整个生命周期:一路从范围界定、数据搜集管理,训练模型、改进数据、优化模型,再到部署监控、管理数据驱动模型维护的完整概念。

“我认为MLOps是一门令人兴奋的新兴学科,可以解决机器学习项目的整个生命周期,是极为前沿的议题”,吴恩达说。

MLOps的第一步到底该怎么跨出?吴恩达:高品质资料

任何涉及机器学习企业,都必须关心客户对产品的需求—毕竟,目的终究是要商业化。

不过,谈到对MLOps工具的看法时,吴恩达则表示,目前工具大多有明显的限制,比方说,把数据喂入,不代表就能直接提高性能。

在创建MLOps团队时,吴恩达推荐了一套他认为可靠的原则:要求团队进行长期、认真的审视,以确保在整个生命周期中,始终保有品质好的数据。高品质数据究竟多重要?

特别是针对后续模型表现不佳时,应做的资料改善,吴恩达建议,MLOps团队可利用不同工具和准则,来确保连续性的高品质资料,光是做好这一点,就足以解决很多问题,甚至项目还能以两倍以上的速度加快完成,“两倍,甚至更快,只要你做好资料品质管控这件事。”

MLOps是一个尚未完全成型的新兴领域,吴恩达说,数据品质管理、MLOps等重要关键字眼,大家不一定会在所谓职缺的工作描述中看到,但假设你想在机器学习领域更上一层楼,就千万不要忽视。

许多公司都在找寻懂得构建、部署机器学习系统的人才,即使在面试过程中,也可能会被问有关MLOps观念的问题。吴恩达总结,在现阶段或是不久的未来,MLOps将会是非常重要且加分的一项重要技能。