企业导入AI的初步商业评估

自从2016年,AlphaGo以4胜1败的战绩击败了世界棋王,人工智能(AI)开始被视为继互联网与智能手机的发明之后,必将会带来第三次重大改变人类生活的科技革命。在这股趋势下,许多任务商团体都提倡呼吁要导入AI,进行产业的数字转型,不过至今为止,除了大集团企业积极启动AI的部署之外,大部分的中小企业则多半没有太多动静。

目前AI的落地应用,主要涵盖的范畴有:

  1. 金融科技
  2. 农业
  3. 医疗与防疫
  4. 自驾无人车
  5. 无人商店
  6. 长期看护看护
  7. 客服(聊天机器人)
  8. 物流仓储

Google、微软、Amazon等这些科技巨头已经推出不少具体的AI服务,虽然其中有许多功能仍在起步阶段,还正在不停的测试与迭代,然而根据美国科技专业研究机构国际数据信息(International Data Corporation, IDC)在2018年3月,公布全球对于AI的技术研究支出总额调查是191亿美元,相较2017年增加54.2%,预计2021年底前将增至522亿美元,显见AI的蓬勃发展是可预期的。

一般的企业公司若想要导入AI,该从何开始下手呢?首先,应该要厘清一个概念上的认知,自动化并不等于智能化,自动化是帮助你完成执行(做),智能化是帮助你完成决策(怎么做)。比如工厂生产线的设备,用户按下电源开关,材料被输送进入机器,即可按照既定的程序被做成规划好的产品,这样的过程是自动化;而能够因应不同环境或变动条件,对当前的状况完成判断、识别与预测,以利用户做出下一步的决策行动,这才是智能化。

目标不是AI,解决问题才是重点

许多企业之所以想要导入AI,是因为现在AI的话题被炒得很热、AI的强大一再被新闻媒体报道,比如人脸识别不只已经被落实在门禁系统,更预期在不久的将来,可以使用AI来提款、算命、应征面试、保险健康判断、表情测谎等等,靠脸吃饭、以貌取人的时代即将来临。

许多企业误以为只要能成功导入AI,后续就一切万事大吉,但这恐怕是搞错努力的重点、落入盲目的趋势跟风。同样也是必需要先创建一个认知上的理解,所谓的导入AI,目标不是为了拥有AI技术,而是AI可以帮助解决什么问题,换句话说,重点应该聚焦在怎么解决企业的问题。

以人脸识别为例,如果人员A带着人员B的面具、或人员A拿一张人员B的照片来对着摄影机镜头,人员A是否就能被判定为人员B而通过门禁系统呢?于是在系统加入一个新功能,即要求镜头前的人必须眨眼或摇头来识别这张脸不是照片或面具;但如果人员A事先录制人员B眨眼跟摇头的视频,拿来在摄影机前播放,这样是否又能骗过系统呢?于是系统又加入可以判断3D图片与可以侦测皮肤微血管颜色变化的功能,来识别这张会眨眼跟摇头的脸是不是一张真实的人脸……

AI判断眼睛是否眨眼。

对于处理活体检测(Liveness Detection),也就是区分系统前的人脸是真的人脸,还是照片、面具或视频,要如何解决这个问题才是导入AI这件事情的重点,要怎么做可以有很多种方式,目标是要能解决问题。方法并不局限于单一形式,而是可以经由组合而成,甚至不是使用机器学习或深度学习也没关系。

(编按:现在已有厂商开发出通过距离与光影的运算,检测前方的人脸真伪,成效有待评估。)

不是只有AI才能智能化,其他方法也有机会能够一起完成智能化,以汽车驾驶的安全监控为例,在驾驶座上方装设摄影机拍摄司机,若判断当司机眼睛闭起来的时间过长、打哈欠、看手机、低头、左右张望没有注视前方……状况发生时,即立即触发警报并发送消息告知后端管理员,此外,也能借由司机身上的穿戴设备,记录血压、心跳和血糖等生理状态,一旦检测到不正常的数据,便立即发出警告通知,加强预防意外发生。

AI的铁三角——技术,资料,问题

有一家洗衣店本来是由人工一件一件区分衣服是外套、衬衫或长裤,再经由不同的项目定价来结算总金额,现在洗衣店计划转型成无人洗衣店,上述动作打算全部改由机器来完成,一开始的部署该怎么做呢?

首先是装设摄影机,摄影机的画面经过内部芯片的一连串图片处理后,再对资料进行外套、衬衫、毛衣、长裤、短裤、裙子等等不同衣物的识别,再将结果传递给计算机,计算机结算金额后,最后通过打印机打印出来给客人。

针对此案例,进行导入这个系统的初期实务分析:

(一)技术

摄影机之所以能够识别衣服,是芯片上加载了一个事先训练好的模型,在此以Google Cloud Platform(GCP)提供的两个方法为例,其他不同的方法也与这两个方法原理类似。

  1. 使用Machine Learning API写成应用程序后,将应用程序放在摄影机上的CPU执行。Machine Learning API是Google根据不同领域,已经训练好的机器学习模型,应用程序直接调用API即可得到识别结果。
  2. 使用TensorFlow这个框架训练出自己的模型,再将模型置入摄影机上的芯片执行,同样需要开发CPU上的应用程序,任务是与芯片上的模型沟通与交换资料,应用程序就可以得到识别结果。

大企业或大公司会创建自己的技术部门,工程问题只要责成相关部门去处理就行了,但若是中小企业,或像是洗衣店这种家庭式经营的小店,如果没有技术团队,最简单的做法是委外发包,所需要负担的是外包与使用GCP的费用。

(二)资料

采取上述的第1个方法,也就是使用Machine Learning API,这在难度上会是比较简单的,但假如饮料公司想要识别出自家的饮料与别家公司的饮料,那恐怕就难以实行了,因为每家饮料的外形包装可能很接近,都是铝箔包、矿泉水瓶或易开罐,而Machine Learning API所提供的是泛通用的模型,如果需要高度定制化,比如识别出饮料瓶装上的Logo,那就要采用上述的第2个方法,训练出自己的模型。

至于自己训练模型的最大麻烦之处,在于训练资料的搜集,以无人洗衣店为例,需要准备各式各样的衣服照片,若以饮料公司为例,则是准备各种饮料的照片,而照片数量通常都需要至少几十万张以上。

在此,有几个问题必须特别注意:

  1. 不是所有照片都能当作训练的素材,有些照片光影灰暗不清,或构图复杂,不仅无法帮助训练,还可能会破坏训练效果。
  2. 有些训练方法需要事先标记(Label)衣服在照片里的坐标位置,这样执行训练的程序才能知道照片中的什么位置是衣服,程序才得以进行学习这是衣服。而对照片做标记是一项极度耗费人力的工程,企业可以自行处理,当然也可以付费外包给专业的labeling公司处理。
  3. 训练所需的资料虽然也可以花钱购买,但建议最好是使用企业内部产生的资料当作训练素材,因为企业所产生的资料最符合企业真正实际的环境状况,因此能得到最接近正确的训练效果。不过,另一个衍生出来的问题是,你会愿意把这些宝贵的资料交给外包的软件技术团队或者是硬件的设备供应商吗?虽然他们可以通过这些资料帮你调校系统,达到优化改善,但这也等同于帮助其他竞争对手优化改善
  4. 承第3点,还需要考量这些资料是否涉及客户信息,是否可能发生个人信息外泄的疑虑。

(三)问题

企业需要解决问题、以提供服务、并得到效益。以洗衣店为例,是通过AI打造无人洗衣店,解决人力不足问题,可以24小时提供服务,樽节成本,之后展开连锁店经营,扩大营收。

因此确立目标与评估问题是最一开始就要先进行的,因为这些都会影响到上述的(一)技术与(二)资料所采取的策略。而且评估问题时必须抱持开放,因为问题的发生肯定是动态变化的,很难一开始就能完全预期掌控,所以(一)技术会需要不断改良与修正程序,(二)资料也会需要调整更能符合实际需求的资料。目标确立之后,问题、技术与资料这三者,会相互影响并且需要多次的迭代。

AI的铁三角—技术、资料、问题。

比如洗衣店的摄影机在识别外套、衬衫、长裤等等,已经达到高度正确率,可是如果将衣物折起来或是乱扭成一团,摄影机就会无法识别,诸如此类的问题,在各种不同的案例中,都会时常发生。

图左为可以被识别的长裤;图右则识别失败。

他山之石,可以攻错

本文尽量避免使用技术上的专有名词,主要是想让非技术领域的人士也可以快速理解,在企业导入AI初期的实务上,与技术会有相关联的因素,以及一些对于智能化认知上的理解,而这些都将会左右整体部署的商业思维。

AI的范畴相当广,而在实际应用上所遭遇到的问题,虽然未必一开始就可以全部预测,但还是要先针对问题聚焦,设计出对应的方法解决,一定要先聚焦,并且一次解决一个问题,逐渐的迭代和优化。

大公司能够从头到尾打造专属于自己的AI系统,而就资金与人力上的考量,中小企业若想导入AI,还是可以利用Google、微软或Amazon已经架构好的平台往上开发,站在巨人的肩膀上同样也可以看得很广、走得很远。

有人说现在AI的热度只是一时的,就像上世纪末的互联网崛起,到本世纪初就发生网络泡沫化,但从历史来看,互联网的发展丝毫没有衰退或停滞,反而是更加活跃的往前行进,一路下来兴起了网拍、电商、影音流媒体、云计算服务、社群媒体等等这些彻底颠覆改变人类生活的应用。

同样的,AI也是相同,科技的发展始终来自于人性的追求,人性的追求不停止,科技的发展便不会停止,相信终有一天,AI甚至可以帮助推断出婴儿、甚至宠物想表达但无法用语言表达的内容。