用AI打造多人声分离引擎,RelaJet给听障者更好的聆听体验

对许多人而言,“听得见”、“听得清楚”是再自然不过的事。不过大多数人不知道,对听障者而言,即使配戴助听器,他们听见的世界依然与健全者不同。

在多人交谈的情况下,传统助听器只是将接收到的声音全部混在一起,无所谓远近层次之分,因该串串字句交叠在一块变得混杂破碎,听障者无法专注在想听清楚的声音上,“鸡尾酒问题”成了听障者最大挑战。

编按:“鸡尾酒问题”指人能选择聆听的能力,在多人交谈的吵杂环境中,能将注意力集中在特定对象并自动忽略背景音,识别不同对象之谈话内容。

洞见未来科技RelaJet创办人陈柏儒本身也是听障者,自身有感于传统助听器价格高昂且使用体验不佳,在经过深入研究评估后,他选择以“多人声分离”作为研发重点,希望打造出对听障者更友善的助听器,给他们更好的聆听体验。

低功耗低延时,RelaJet推多人声分离助听器

洞见未来科技(以下简称洞见)专注于提供具多人声分离功能的助听器,通过其今年3月推出的R1898DSP芯片方案,让用户在配带洞见的助听器时,能将人声从环境音中拉出,细分不同对象的声音纹路,并靠助听器屏蔽想过滤的背景噪音,在人多嘈杂的场景中也能在10毫秒内分离出一个最主要的人声,让听障者能专注地接收特定声音。

R1898DSP芯片

 

“10毫秒这个数据与助听器相关规范有关,规定要求助听器之延时不得超过10~20毫秒。”洞见未来科技COO陈宥任指出,助听器延迟时间若超过10毫秒,用户就会感受到声音延迟,容易产生头晕不适等情况。洞见并非市面上唯一能将助听器声音延迟控在10毫秒的团队,他们的优势在于做到低延时的同时,也完成低功耗的成就。“助听器跟耳机不同,对听障者而言是除睡觉外都要戴着的必需品,因此产品续航力相当重要。”陈宥任表示,洞见助听器待机时的功耗是0.5mA、功能全开时则是3mA,在后者的状态下产品续航力至少能撑到15小时以上。

跨出听障领域应用场景再延伸

根据世界卫生组织研究数据显示:2018年,全球听力受损(须配戴助听器)的人口数高达5亿,目前却只有5,000万人配戴助听器;2050年,由于长时间暴露在高分贝环境下,全球会有近10亿人听力受损,相当于每10人中就有1人患有听觉障碍,对学习、工作、社交各方面都将产生极大影响。从数据中找市场,再从自身体验找痛点,柏儒与宥任两兄弟的创业项目虽以助听器为产品本位,实际上,他们已预见多人声分离引擎的潜力值无限,能应用之产业领域也相当广泛。

“我们的芯片原型是为助听器而生,不过推出后也有耳机厂商找上我们。”陈柏儒指出,一般无线耳机为讲求方便性,通常都会牺牲音质,因此现在有耳机品牌商直接将洞见的技术用于“通话降噪”及“延长续航力”;至于多人声分离引擎,除了用于帮助听障者外,未来在夜店、工厂、大型活动现场等吵杂环境中也有发挥空间;若能在识别后将多人声音分离成不同音轨,并搭配语音转文本相关技术,在会议纪录、客服中心、逐字稿音频 等用途上都会更加便利。目前洞见也已提出相关服务:用户可将特定型号录音笔之音频丢上云计算,洞见后台即能自动识别不同人声,并将其分离成相对应音轨供用户使用。

洞见未来科技团队成员,左起首席执行官陈柏儒、首席运营官陈宥任。

 

RelaJet, To be your ear.

市场应用场景潜力无穷,洞见团队期盼他们能变成声音的入口,除了帮助用户有更好的聆听体验外,也希望能帮助机器“听”得更好。“很多人都知道Dolby以及DTS (杜比环绕与DTS环绕) 是听觉输出端体验的龙头,但是在听觉接收端我们会通过更有竞争力的方式让各家产品发挥独特的特色。”陈宥任表示,下一步,团队预计先将R1898DSP芯片推广出去,并为芯片投放之庞大成本筹措资金,期望能在短期内创建起完整产业供应链。未来若洞见的产品用户越来越多,也希望能妥善利用用户数据做更好的开发应用。