科学家正在开发能回声定位的AI,不出声也能掌握一举一动

我们都曾经在电影中看过这样的场景:由于怀疑有窃听设备,主角们运用纸张沟通并不出声响的进行任务。在语音助理应用普及后,许多人也都开始有了被智能型产品监听的疑虑,以现在来说,“不说话”确实能够应对被监听的可能,只是随着科学家开发出能以高频率声波掌握环境的设备,在未来,即使是在独处不说话的时候,这些产品仍可能知道你的一举一动。

许多动物都能通过回声定位(echolocation)掌握周边环境状况,过去研究也曾成功让盲人及视力正常者学会回声定位,而在中国武汉理工大学的研究中,团队则是成功运用麦克风数组(microphone array)和算法让机器也具有相同能耐。

在这项已刊载于《应用物理快报》(Applied Physics Letters)期刊的研究中,团队打造了一台与笔记本大小差不多的设备,能够发出人耳无法听见的极高频率声波,并使用其中嵌入的数百个麦克风来监听回声,再通过AI技术从声音反射中解读人的行为,尽管目前技术仍处于发展阶段,但团队已经取得了一些有希望的初步成果。

在初步研究中,团队对4名不同的大学生进行了测试,结果发现通过回声定位,他们可以完全准确的识别出确定这个人究竟是坐着、站着、走路还是摔倒,虽然这项技术是否适用于更多人、是否能辨别更广泛的行为都还有待确认,但这项研究已经显示出一种识别人体动作的新技术潜力。

就像现在流行的智能手表一样,团队开发的设备也是收集信号后通过计算机进行分析,在设备收集回声之后,算法会去除一些环境噪声并开始分析数据的模式,Guo认为如果使用更多的麦克风来获取回声,各种动作间的音调差异将会更为明显,算法的准确性也将随之提高。

团队的麦克风数组总计共有256个麦克风,由于太过笨重且成本过于昂贵,设备并无法大规模生产,团队在尝试提高精确度的同时也在试图在减少麦克风的数量。以目前来说,并未有公司将类似的行为检测技术发展为商业产品,但Guo已经对未来的应用有了一些想法。

除了能将纳入类似Amazon Echo的设备中,让用户能更轻松关心自己家中的老人,在一些图片监视无法很好辨别的环境,也能够作为图片识别软件的替代品。Guo甚至认为基于声音的监控能比视频监控更好的去保护个人隐私,这或许会使人们更愿意在家中接受这种技术。

然而其他人并不这么想。纽约研究机构Data&Society技术伦理学家Jake Metcalf认为,声音监控很容易就能和图片结合,打造出一种更深入的监控形式。就像历史上的许多发明一样,尽管原始开发者希望的是某种正向用途,但他们并无法控制人们最终如何使用。

Metcalf认为,集成监控或许真能挽救一些年迈长者的生命,但也可能被国家用来寻找、迫害特定群体,像是需要定时跪拜祈祷的穆斯林,同时也可能被黑客用来“偷听”特定对象的亲密行为。

以目前来说,团队还必须进一步开发这种设备,才能将其应用到任何产品中。为了需要缩小硬件并保持功效,团队计划进行更多测试,来确保算法适用于更多群体及环境,随着设备越来越进化,也许有人会为其找到适合的应用方式。

只是最终会应用在什么样的环境中,就不得而知了。