让高端工程师更省力,若水帮企业练AI数据基本功

AI应用近年来在台湾逐步落地,许多产业也开始思考如何导入AI,进而降低生产成本、增加整体营收。专门提供数据处理与咨询服务的若水强调,企业对AI的思维转型,不应只着重于算法,更要加强检验并优化数据的处理。

若水首席执行官陈洁如表示,大公司的AI团队规划,对AI的整体发展造成很大的问题。许多老板认为,钱应该花在算法上而不是在数据处理上。这使得高端AI工程师得花上很大的时间成本处理基本的数据。

“我曾听过工程师分享,一天工作八小时,他们可能花上五个小时在处理基本数据,只剩三小时来写算法。”
若水国际首席执行官陈洁如

陈洁如强调,AI产业才刚开始发展,所以它很需要长出产业分工链。企业高层的思维,应该通过不同阶段AI工作的专业分工,与拥有专业AI数据标注团队的公司合作,进而有效分配高级工程师的工作内容,把钱花在刀口上。

AI模型总是跑出“垃圾数据”?最初的数据规则定义是关键

要启动AI应用,首先必须搜集大量数据进行分析。但数据种类繁杂,有优劣之分,把未经处理的数据丢进AI,很容易就会“garbage in, garbage out”,最终也只是徒劳。因此,寻求专业的AI数据处理,为数据进行精准的规则设置,成了一大重点。

对于AI数据处理,若水AI数据服务业务部策略顾问简季婕给出了三个秘诀:“准确定义、准确执行、准确反馈。”

 

所谓的精准数据处理又包含哪些层面?若水业务发展协理简季婕表示, 在一开始就问对问题,并准确定义数据,是创造成功AI模型的关键。

简季婕说,进行应用时,她会先思考要如何设置筛选标准,才能在最后得到优质、有用的数据。她以若水与日本厂商共同分析桥梁安全度的项目为例,她说,这间厂商希望明确标记出桥梁生锈的部分,但他们的AI却把与铁锈相似的苔藓、脏污以及阴影处都一并标记起来,降低数据的准确性。

借由数据处理的专业分工,若水协助他们找到更准确的数据筛检方式,定义出铁锈的形状及颜色等特征,进而得到更精准的成果。“ 好的处理方式会增值AI数据的养成, ”简季婕强调。

搜集的难易度、多样使用场景,数据处理比想象中更繁杂

对许多企业来说,将数据导入AI模型运算时有许多挑战。其中,如何定义有效数据、并在出状况时知道要去调整数据或是运算模型,都有一定难度。


身为社会企业的若水,其专业AI数据标注团队为居家工作的身障人士,若水提供他们专业的培训,并审核他们的能力,提供技术证照。

简季婕说,要使用数据训练AI模型,事前必须经过全面性思考。数据搜集的难易度以及数据使用的多样场景,都需纳入考量。以大量运用AI的自动驾驶汽车产业来说,天气好的时候路况较单纯,标注周边环境与对象是相对容易的事。然而在雨天,对象就可能变得模糊,AI需要特别进行训练。

AI模型的培养是一个循序渐进的过程, ”简季婕说。数据就如同AI的土壤,土壤的成分、性质、湿度、含氧量,都需经过精确的设置、调配,才能开花结果。精准的数据标注就如同这个概念,这也是若水所强调的,AI产业链分工的重要性所在。