一、Apple 宣布 AirPods Pro “对话增强”
在 2021 年 6 月 7 日举行的年度全球开发者大会 (WWDC21) 上,Apple 在其即将推出的 iOS 15 中宣布了新功能——在噪声环境下语音增强功能,定义为“对话增强”(Conversation Boost)。该功能是基于音频计算处理(computational audio)和波束成形(beamforming)的麦克风技术,并应用于 AirPods Pro 耳机。Apple 的 iOS 15 计划于 2021 年 9 月发布,以与新的 iPhone 机型同时发布。
“对话增强(conversation boost)旨在帮助有轻度至中度听力障碍的人在对话中可以无障碍沟通,”Apple 高级工程项目经理 Gagan Gupta 在 WWDC21 YouTube 视频(大约 34:49)中说。“通过音频计算和波束成形的麦克风技术,在面对面谈话的过程中Conversation Boost 将您的 AirPods Pro 聚焦在讲话者的身上,让您在面对面谈话中更容易听到对方所讲内容并且能够及时跟进对方的讲话节奏。为了帮助您更好地聆听对话,还可以 [通过应用程序] 减少环境噪音”,如图1所示。
图1:AirPods Pro 应用中“环境降噪”控件的屏幕截图
AirPods Pro 目前(iOS 14)共有三种降噪模式:主动降噪(Active Noise Cancellation)、 通透模式(Transparency mode)、和降噪关闭(Off)。主动降噪使用面向外的麦克风来检测和消除外部声音(通过反向相位消除),而通透模式是让外部声音进入,因此耳机使用者可以听到周围的环境音。“对话增强”(conversation boost)则是在通透模式上的一个增强功能。
“对话增强”实际上是医疗助听器在日常使用中针对对话场景进行人声增益的一个简化版,也称为辅听功能。实际上,APPLE 不是第一家引入这个功能的公司,三星在 2021 年 3 月发布了新闻稿,介绍了他们的辅听耳机概念。三星 Galaxy Buds Pro 的 TWS 耳机除了提供 ANC 主动降噪、环境音侦测、以及语音检测这些中高端耳机的功能外,另外在透传模式基础上添加了语音增强功能,帮助轻中度听损人士更好地听到周围的声音。
二、波束成形技术介绍
波束成形(beamforming)是 APPLE 在讨论对话增强时提到的 2 个技术之一。这实际上是一个比较成熟的音频技术。波束成形是天线技术与数字信号处理技术的结合,目的用于定向信号传输或接收。在面对面谈话场景中,用来确定对话者的方位。
图2:BEAMforming的工作原理示意图
波束成形,源于自适应天线的一个概念。接收端的信号处理,可以通过对「多天线阵元」接收到的各路信号进行加权合成,形成所需的理想信号。从天线方向图(pattern)视角来看,这样做相当于形成了规定指向上的波束。例如,将原来全方位的接收方向图转换成了有零点、有最大指向的波瓣方向图。同样原理也适用于发射端。对天线阵元馈电进行幅度和相位调整,可形成所需形状的方向图。
三、音频计算处理
音频计算处理(computational audio)是APPLE在讨论对话增强时提到的第 2 个技术。
这个技术更为关键,针对这个技术 APPLE 在 WWDC21 中没有做细节披露。实际上,computational audio 是个很宽泛的概念。从医疗助听的角度来看,对话增强涉及到几个关键步骤:
- 噪音识别:识别噪音的特征或模式。
- 噪声消除:在人声和噪声的混合声音环境中,通过噪声特征,将噪声消减(noise reduction),提取人声。
- 人声增强:在噪声消减的基础上,将人声增强,增加信噪比(S/N)在技术上,由于人声的频谱分布和噪声的频谱分布重合性很高,技术复杂性很高。最新的技术处理是引进了人工智能的算法。
这种对话增强功能,现在才开始受到消费级耳机的关注,但是在医疗助听器产品上早已是一个最典型的功能了。图 3 和图 4是北京聆通科技公司(http://www.lyratone.net)做的噪音消除和人声增强的算法的结果。
图3:地铁环境中的人声提取和增强的音频图(处理前)
图4:地铁环境中的人声提取和增强的音频图(处理后)
在这两个场景中,噪音被消除的同时,讲话者(男士)和地铁报话员(女士)的声音被提取和加强。
四、总结
从技术来看,计算处理的技术难度要高于波束成形。从未来的市场和产品趋势看,虽然“对话增强”,或者“对话降噪”这个功能的初始目的是给轻度到中度的听损人群使用,但是这个应用已经开始在一般的消费级耳机产品中开始推广。对于听力正常者,他们在噪音环境中的对话、日常使用APP的过程中,都会用到“对话增强”,或者“对话降噪”的模式。
随着三星和苹果开始在高端耳机上增加“对话增强”功能,这个辅听功能在高端耳机中有很大可能成为继 ANC 降噪之后一个新的标配功能。
参考资料:【1】New Binaural Strategies for Enhanced Hearing,Hearing Review, Homayoun Kamkar, 2014)。
想了解辅听耳机的更多信息,请与我联系~