整合商用与消费AI产品线,Line首度揭4大AI研发趋势

在商用AI竞争上,和海外科技巨头如Google、脸书相比,Line仍旧是新进的挑战者。Line在2017年开始跨入AI市场,去年才正式定位自己是一家AI公司,推出商用AI计划LINE Brain,将AI视为下一阶段的发展重心。在去年开发日也披露了更详细的AI战略蓝图,包括了8大发展方向,但细数这些技术方向,自然语言处理、语音识别、计算机视觉、OCR、脸部识别、影音处理、资料分析到语音合成,大多是核心、基础的AI技术领域,而非更应用面的前瞻AI发展趋势。

今年中,Line旗下AI公司首席执行官砂金信一郎在一场AI日线上研讨会中,透露进军商用AI市场一年来的成果,过去1年已有280家企业采用了Line商用AI产品,也再度精简发展重心,将优先聚焦语音识别合成、自然语言处理以及OCR三项技术的产品研发。

年中他也披露了13项开发中的AI新功能,第一类新AI功能是与聊天机器人和语音订位助手AiCall有关的功能,包括了通用对话管理机制(Unified Dialog Manager)、AiCall Console、扩展式语义条件(Slot Extension)、插播支持(Barge-in Support)、Line官方账号VoIP支持、对话分析,以及细节不明的Streaming NEST。另有2项则是与eKYC服务有关的新功能,包括账号开设自动审查,以及伪造身份的检查机制(Fake-check),以及4项OCR第二版的新功能,包括了特定收据形式的识别、特定发票形式的识别、表格识别(Table Recognition)和地址校正。

商用AI策略先聚焦3项技术的企业级服务

在今年年底这场2020开发者大会上,Line进一步宣布,将去年发布的商用AI产品线Line Brain,并入Clova品牌中,但会继续提供企业级商用AI服务,也就是NLP、OCR、语音识别这三项的企业级服务。换句话说,Clova品牌下将包括了AI产品(Chatbot、OCR、语音、影音、文本分析、脸部识别等),AI解决方案(智能助理OCR、AiCall、eKYC)和AI设备(Clova智能音箱、Clova桌面设备和Wave设备)。Line资料实验室和资料平台负责人池边智洋强调:“Line的AI发展目标是让AI成为日常生活中到处可用的技术。”

砂金信一郎预告,将会逐渐发布更多AI产品让Line开发者社群先试用。他在开发者大会中,展示了一项正在开发中的新功能Clova Dubbing(配音功能)编辑画面,将文本语音生成结合虚拟人像(Avatar)的表情动作,可以针对一段动画来进行配音,只要需要输入文本,就会自动产生这段文本的声音,而且还可以搭配虚拟人像表情自动生成功能,在动画中,仿佛由虚拟人像念出这段文本的动画。不过,他没有透露,何时会推出这项功能。

Line更首度披露4大AI研发趋势和潜在应用场景

Line旗下AI公司资料实验室技术顾问Minoru Etoh披露Line未来四大AI研发趋势,更可以一窥,Line未来数年在AI产品的发展方向。图片来源/Line

在这次开发者大会上,除了产品发展新策略之外,Line更首度在今年开发者大会中,公布了长期AI研发愿景和方向。Line旗下AI公司资料实验室技术顾问Minoru Etoh表示,Line未来将聚焦四大AI研发趋势,包括了数字我(Digital Me)、生成式AI(Generative Intelligence)、值得信任的AI(Trustworthy AI)和暗资料(Dark Data)。从Minoru Etoh对这四大趋势的潜在发展特色,更可以一窥,Line未来数年在AI产品的发展方向。

数字我就是利用各种数字世界的个性化资料,来打造出个人在线上的数字分身,可强化各种个性化服务。Minoru Etoh指出,数字我发展架构上,最底层是一个分布式的信任平台,再用来发展出一个线上的数字身份平台(KYC),可以用于健康看护、智能程序、旅游、e政府、金融服务和电商服务上。这个架构也点出为何Line同时力推eKYC平台和区块链平台的背后思考。以健康看护应用为例,有了数字我的机制,就可以用来结合更多个人资料,打造更贴近个人需求的预先看护,个性化的治疗等。

第二项生成式AI是则是当前热门AI研发话题之一,Line希望研发各种类型内容的自动生成,不只是影音、声音、图片、文本、音乐,甚至还包括程序代码自动生成。Minoru Etoh补充,应用场景上,生成式AI可以用来打造更多靠AI自动化的工作场所(Autonomous AI Workforce),例如提供多功能AI、复杂任务的简化、垂直产业AI等。也可以用于发展可理解相依脉络的语音识别,来识别出噪音或未知的用词。在数字学习上,也能用来自动产生符合不同学习者能力的适性学习内容。而用于即时通信场景下,也能用来自动生成强化双向沟通的内容,来提供更高交互的虚拟经验。从Line在另一场演讲中透露,准备将贴图功能、有表情的虚拟角色图像等集成到视频通话功能,就可一窥这个研发趋势的影响。

另一项也是当红AI议题的研发趋势是值得信任的AI。Minoru Etoh强调,这是必须做的事,而不是选项。其下有3项重点目标,使用的自由、公共安全、隐私保护。在隐私保护上,可以通过联合学习、加密式AI服务来将隐私信息保留在用户端,而不用上传给服务提供者。另外在资料、模型和评估上都要考量AI公平性,避免造成偏差。

促进庞大暗资料利用,可发展非标记资料交换市场

最后一项暗资料,则是指目前仍有大量AI技术还没有运用到的资料,如何创建一套工具或技术,可以用来处理大量非结构化、无标记或隐藏的资料,例如Open AI的语言模型GPT-3就是一个暗资料可用的技术。Line也计划和母公司Naver联手打造一个用了100亿页日文语料训练的超大型语言生成模型。

另外,暗资料研发趋势上,Minoru Etoh认为,需要发展一个非标记资料的资料交换市场,这个市场可以提供隐私法遵规范,或将用户行为资料碎片化来达到去识别化的作用等。尽管没有透露更多研发重点,但Line强调,Line的AI产品将持续投入与这四大类趋势相关的研发项目。