科学家正在开发能回声定位的AI，不出声也能掌握一举一动

我们都曾经在电影中看过这样的场景：由于怀疑有窃听设备，主角们运用纸张沟通并不出声响的进行任务。在语音助理应用普及后，许多人也都开始有了被智能型产品监听的疑虑，以现在来说，“不说话”确实能够应对被监听的可能，只是随着科学家开发出能以高频率声波掌握环境的设备，在未来，即使是在独处不说话的时候，这些产品仍可能知道你的一举一动。

许多动物都能通过回声定位（echolocation）掌握周边环境状况，过去研究也曾成功让盲人及视力正常者学会回声定位，而在中国武汉理工大学的研究中，团队则是成功运用麦克风数组（microphone array）和算法让机器也具有相同能耐。

在这项已刊载于《应用物理快报》（Applied Physics Letters）期刊的研究中，团队打造了一台与笔记本大小差不多的设备，能够发出人耳无法听见的极高频率声波，并使用其中嵌入的数百个麦克风来监听回声，再通过AI技术从声音反射中解读人的行为，尽管目前技术仍处于发展阶段，但团队已经取得了一些有希望的初步成果。

在初步研究中，团队对4名不同的大学生进行了测试，结果发现通过回声定位，他们可以完全准确的识别出确定这个人究竟是坐着、站着、走路还是摔倒，虽然这项技术是否适用于更多人、是否能辨别更广泛的行为都还有待确认，但这项研究已经显示出一种识别人体动作的新技术潜力。

就像现在流行的智能手表一样，团队开发的设备也是收集信号后通过计算机进行分析，在设备收集回声之后，算法会去除一些环境噪声并开始分析数据的模式，Guo认为如果使用更多的麦克风来获取回声，各种动作间的音调差异将会更为明显，算法的准确性也将随之提高。

团队的麦克风数组总计共有256个麦克风，由于太过笨重且成本过于昂贵，设备并无法大规模生产，团队在尝试提高精确度的同时也在试图在减少麦克风的数量。以目前来说，并未有公司将类似的行为检测技术发展为商业产品，但Guo已经对未来的应用有了一些想法。

除了能将纳入类似Amazon Echo的设备中，让用户能更轻松关心自己家中的老人，在一些图片监视无法很好辨别的环境，也能够作为图片识别软件的替代品。Guo甚至认为基于声音的监控能比视频监控更好的去保护个人隐私，这或许会使人们更愿意在家中接受这种技术。

然而其他人并不这么想。纽约研究机构Data&Society技术伦理学家Jake Metcalf认为，声音监控很容易就能和图片结合，打造出一种更深入的监控形式。就像历史上的许多发明一样，尽管原始开发者希望的是某种正向用途，但他们并无法控制人们最终如何使用。

Metcalf认为，集成监控或许真能挽救一些年迈长者的生命，但也可能被国家用来寻找、迫害特定群体，像是需要定时跪拜祈祷的穆斯林，同时也可能被黑客用来“偷听”特定对象的亲密行为。

以目前来说，团队还必须进一步开发这种设备，才能将其应用到任何产品中。为了需要缩小硬件并保持功效，团队计划进行更多测试，来确保算法适用于更多群体及环境，随着设备越来越进化，也许有人会为其找到适合的应用方式。

只是最终会应用在什么样的环境中，就不得而知了。