强生首席信息官披露如何靠AI加速疫苗生产效率

在全球有超过250家的子公司、产品销售170多个国家的医药产品大厂强生(Johnson & Johnson),近期发布了全球首支只需施打一剂、且冷藏保存即可的COVID-19疫苗,强生首席信息官Jim Swanson在今年Nvidia全球GPU技术大会(GTC)中表示,疫苗在短短一年半就研发成功的一大关键,正是AI结合数字分身的运用,先通过虚拟软件模拟分子架构,再通过AI验证模拟结果,大幅将疫苗生产效率提升4倍;也不只是疫苗,强生在制药业、医疗设备开发、顾客端的健康看护、连内部运行都大规模运用AI。强生不只让2千位资料科学家更善用AI,更通过一套做法,要让13万员工都具备资料科学素养。

Jim Swanson指出,导入AI得先创建一个观念:“开发AI模型永远不会一次到位,”从训练资料、问题的假设、算法开发等不同环节的选择,都可能成为模型表现不佳的原因,因此他认为,企业必须创建起资料科学的迭代学习方法,而第一步,就从问对问题开始,找出试图通过AI来回答或解决的问题,且要谨记,“如果没有人可以针对问题创建相应的答案,那就不要去创建模型,一定先把问题找对。”

接着,必须创建起一个可以迭代、重复使用的模型开发流程,不只是因为找到问题后,投入AI开发会面临重复试验的过程,将开发完成的模型投入使用后,也会不断找到新的问题,滚动开发新的模型、产生新的洞察。因此,Jim Swanson建议,企业需要具备AI开发的基础技术架构(technology foundation),包括创建起用于存储资料与模型的数据库、能够快速访问数据的API,甚至是资料偏误、算法漂移等监测机制,才有办法扩大AI开发的规模,比如强生自己的做法,是直接采用了市售MLOps解决方案,来创建能够迭代循环的AI开发流程。

借由创建起一套企业开发AI的基础技术架构,强生要推动资料科学走向民主化,Jim Swanson表示:“强生并非拥有一群具高度技术能力的资料科学家,而是创建起AI技术基础架构,让资料科学家更能发挥所长。”尤其,确保有一套AI开发技术架构,是扩大AI开发规模时的关键任务。

同时,强生也提出了“双语资料科学家(bilingual data scientist)”的概念,这边的双语资料科学家,指的并非同时具备Python与R语言的技能,而是同时拥有领域知识(Domain Knowledge)以及资料科学、资料工程、软件工程等技术能力,这也是为什么强生要创建起AI开发的基础技术架构,如此一来,才能更有效的赋能资料科学家,通过AI开发工具与流程快速创建起AI模型,将领域知识应用到AI开发上,更大规模的实现双语资料科学家的目标。

为了推动资料科学的民主化,强生更成立了一个人信息料科学委员会(Data Science Council),主要负责推动三项任务,第一,持续通过一套AI规划,找到对的问题来开发AI;第二,创建起可以支撑并加速AI成功上线的技术基础;第三,不只要找到人才,更要培养企业内的人才增长与独当一面。尤其在人才的部分,Jim Swanson认为,除了培养资料科学的相关人才,也需要教育实际上采用AI服务的业务人员,使他们乐于接受AI,并且能运用开发完成的AI模型,来辅助业务执行,才能在企业内真正推行AI落地。

强生目前拥约2,000位资料科学家,但有13.5万名员工。Jim Swanson指出,要落地AI,必须将数据科学的技术嵌入到业务的工作流程中,同时取得业务单位的反馈来改进模型,加速驱动数据飞轮;不过,若资料科学团队在企业内成为孤岛,与业务单位脱节,就算开发出世界上表现最好的AI模型,业务单位也不愿意使用。换句话说,强生需要进一步培训业务人员具备数字能力,更要培养业务单位具备AI的思维,才能让2,000名员工的研发成果,成功推动13.5万名员工来使用。

除了创建资料科学委员会,强生每年也会制作企业影响报告,点出资料科学带给企业的影响,借此来唤起员工的注意(awareness),促成更多AI的开发与采用、解决更多困难的问题。且为了集思广益,强生也举办企业内的AI黑客马拉松,来征求提升AI模型预测准确率的点子,也要借此机会将不同领域的专家聚集在一起,一同解决一个重大问题,产出一个具影响力的结果。

最后,Jim Swanson企业在导入AI的过程提出三点建议。第一,他认为,无论是刚开始导入AI的企业,或是高端应用AI的企业,都必需要创建起企业自行开发AI的核心能力,就算一开始是采购AI解决方案,后续也需逐渐培养企业内的AI开发技能。其次,是业务单位时常会有担忧,认为AI可能会影响、甚至取代自己的工作方式,企业应该去理解不愿采用AI背后的抗拒心理,来进一步说服业务单位视AI为一种支持,而非取代。第三,则是要在企业内创建敏捷的文化,通过不断迭代、演进、获得洞察的方式来学习新知,培养敏捷文化来促进企业增长。