AEC - 参考信号完整指南

声学回声消除 (AEC) 参考信号的正确路由和处理,对于防止会议室中出现回声至关重要。这也是会议室设计最具挑战性的一个方面。

会议室路由器 (CRR) 对于确保正确完成 AEC 参考信号大有助益。然而经常存在的问题是,CRR 以外的处理对 AEC 参考信号有何影响,而且可能会有一些设计使用了 AEC 而未使用 CRR。

以下是理想会议室设计中使用 AEC 参考信号的一些原则,以及关于常见应用的一些建议。

参考信号必须包含正确的信号
通常,AEC 参考信号应当接收到所有远端和节目音频的混合音频,以通过扬声器播放。此外,房间内的所有扬声器都应播放相同的混合音频。

参考信号中有信号缺失
如果某个信号未被包含在 AEC 参考信号中,那么 AEC 不会将其消除。如果远端输入和 AEC 参考信号之间的矩阵交叉点被误设为静音,那么在远端会听到回声,但这个问题在本地房间内不会引起注意。这是可以借助 CRR 解决的一个常见缺陷。

如果参考信号中缺少节目音频,则远端可能会听到模糊或混响的节目音频(包括发送到远端的节目音频和麦克风在本地所拾取声音的直接混合)。这个问题不像远端回声那么严重,但还是不够理想。大多数情况下,在 AEC 参考信号中包含节目音频是更好的做法。一个例外是位置性音源,具体如下所述。

参考信号中的额外信号
如果一个信号被发送至 AEC 参考信号,但没有通过扬声器播放,那么只要该信号处于激活状态,AEC 就会发散。在该信号处于激活状态时,麦克风不会检测到相应的音频。AEC 将收敛到一个没有回声的信号路径,并且必须在远端信号(属于该 AEC 参考信号)变为激活状态时重新收敛。

声音提升
一些设计者将麦克风信号放在自己的 AEC 参考信号中,以尝试改善声音提升系统的增益前反馈。这样做的好处尚存在疑问,但在某些房间里可能效果很好。在其他情况下,AEC 的反馈减少行为可能不一致,或是在双端会话期间远端可能听到残余回声。

在大多数情况下,最好使用 AEC 前麦克风信号进行声音提升,并将麦克风从 AEC 参考信号中移除。这为本地增强提供了最低的延迟,并且不会导致 AEC 出现问题。

立体声
单声道 AEC 参考信号中的立体声信号在理论上是一个问题。如果立体声信号有较高的分离度,则左右扬声器将播放明显不同的信号。左右扬声器和麦克风之间的回声路径具有不同的脉冲响应,而单声道 AEC 不能同时收敛到这两个信号。带有立体声参考信号的 AEC 可恰当处理这个问题,但单声道 AEC 无法做到。

在实践中,具有单声道参考信号的 AEC 大多数时候在立体声会议室中效果都很好。除了高度定制化的网真会议室以外,即使发送到立体声编解码器,麦克风也很少调整声像。远端音频几乎总是单声道,而远端音频是 AEC 的主要关注点。

有大量对话的节目音频也可能将其大部分能量集中到中心,即使采用单声道 AEC 参考信号也会将其消除。 如果来自节目音频的残余回声能够被听到,则它的延时较低,并且可能被远端感知为额外的混响或浑音,而不是明显的回声。

位置性音源
位置性音源不同于立体声,每个扬声器播放的是截然不同的通道。例如,一个网真会议室可能有两个编解码器连接到不同的位置点,并通过相应显示屏附近的扬声器播放每个位置点的音频。在这种类型的系统中,需要具有多通道参考信号的 AEC 来正确消除回声。在此类系统中,如果使用单声道 AEC 参考信号,只要另一远端有人开始讲话,可能会经常听到回声。

如果一次只使用一个扬声器位置,则位置性音源可能有用。例如,在一个纯语音会议过程中,天花板或会议桌上的扬声器可能效果更好,因为本地与会者将面向会议桌中心。而在视频会议过程中,则建议使用靠近显示屏的扬声器。如果在视频会议期间,纯语音的远端音频也通过显示屏扬声器播放,则单声道 AEC 参考信号可处理这两种情况(虽然在两种模式之间切换后可能会听到回声,直至通话开始时 AEC 收敛)。

如果节目音频选择的扬声器与远端音频的扬声器不同(例如,节目音频来自前置扬声器,远端音频来自吸顶扬声器),则最好将节目音频从 AEC 参考信号中移除。这可能会导致远端听到的节目音频有些浑音,但不太可能产生回音。

会议室组合

会议室组合本身并不是导致 AEC 问题的原因。但是,如果通过调整矩阵交叉点的参数场景,手动设置会议室组合,则很容易出错。某些 AEC 参考信号可能很容易包含额外的远端或节目音频信号,或者缺少必要的信号。可能会从关联的麦克风听到回声,并且问题可能很难诊断。幸运的是,会议室组合器可以消除设计人员在这方面的困扰,防止这种类型的错误发生。

即使是配置合理的会议室组合系统,在房间配置发生变化后,也可能会听到短暂的回声。这会更改不同分区中麦克风和扬声器对之间的回声路径,并且在发生这种情况后 AEC 需要重新收敛。

回声路径不得包含非线性或时变处理
AEC 的自适应滤波器只能模拟线性、非时变的回声路径。回声路径中的任何非线性或时变都会严重影响 AEC 的性能。回声路径可以描述为

•   对扬声器输出进行的任何 AEC 参考信号中没有的处理
•   扬声器和麦克风之间的声学路径(包括扬声器和麦克风本身)
•   在 AEC 之前对麦克风输入进行的任何处理

下图显示了一个典型的会议室设计。回声路径中的信号以红色突出显示。

动态
动态处理可以不断改变其增益。当应用于回声路径时,AEC 必须不断地适应这些变化,产生频繁残留回声的可能性很大。

压缩器/限幅器通常应用于扬声器输出,以防止削波。如果需要进行此类处理,则必须使用经过了压缩器/限幅器的扬声器信号作为 AEC 参考信号(这意味着将不直接使用 CRR 的 AEC 参考信号输出)。如果扬声器信号是立体声,则必须在压缩/限幅后将其混合为单声道信号,然后再传递到 AEC 参考信号。

在 AEC 参考信号之前,使用相同设置对扬声器输出进行相同的处理,从而对动态处理进行补偿的做法,可能无法可靠地工作。存在的风险是,两个动态处理模块可能不会同时应用相同的增益,特别是 CRR 中的立体声到单声道转换,可能导致单声道压缩器/限幅器上的电平与经过立体声压缩器/限幅器处理的扬声器输出相比,存在些许不同。
 

如果麦克风输入需要动态处理,则应在 AEC 之后应用它们。

自动麦克风混音
自动话筒混音器可以频繁地更改每个麦克风通道的增益。当在不同的麦克风之间切换时,将显著改变混音中的回声路径。由于 AEC 资源有限,很容易会将 AMM 放在单个 AEC 通道之前。然而,回声路径中的增益变化通常会使得 AEC 性能较差。对于每个麦克风信号,应当将 AEC 置于 AMM 之前。

音量控制

音量控制与动态具有相同的问题,但不太频繁。如果在回声路径中应用音量控制,则在用户改变音量后可能会短暂地听到残留回声。

失真
在会议系统的信号路径中故意引入失真是不太可能的。但不好的增益结构或质量较差的设备可能会在回声路径中引入失真。失真无法通过 AEC 来建模,并且会导致残余回声。这种回声听起来明显失真(远远超出 AEC 前麦克风信号)。

线性、非时变处理(通常)是安全的
任何线性和非时变处理都可以通过 AEC 自适应滤波器进行建模。这种类型处理只有极端设置才有可能引起问题。

增益
除非使用极端的增益设置(例如,较差的增益结构),否则固定增益通常不会导致 AEC 出现问题。不良增益设置引起的问题通常来自其所引发的失真,而不是增益本身。

在一些设计中,对功放应用了大量增益,并且音量控制会导致信号产生大幅衰减。这可能导致 AEC 参考信号的电平非常低,从而影响 AEC 双通话检测决定何时做出调整的能力。理想情况下,当音量控制的设置合理时,AEC 参考信号应当具有良好的额定电平。

均衡
均衡通常可以应用在回声路径中而不会引起问题。无需根据信号的不同均衡而设置不同的 AEC 参考信号,或者对 AEC 参考信号应用重复的 EQ。如果使用 EQ 来展平扬声器和房间响应,则未均衡的 AEC 参考信号可能更能代表回声路径。

同样,麦克风输入之上的任何滤波器通常不会导致问题,如果需要可以在 AEC 之前应用。在某些情况下,例如在具有大量低频噪声的话筒上使用高通滤波器,应用 AEC 前 EQ 可能是有益的。

如果使用了分频器,AEC 参考信号必须接收全频带信号,而不是分频器的某个输出。

如果 EQ 应用了大量音效,那么如果 AEC 参考信号中考虑了该音效,则 AEC 的表现可能会略好一些。

延时
回声路径中的适度延时不会导致 AEC 出现问题。由于扬声器和麦克风之间存在距离以及系统中的音频缓冲,一些延时是自然存在的。

过度延时(超过几十毫秒)可能会导致 AEC 出现问题。延时会降低 AEC 自适应滤波器的可用拖尾长度。它还可能造成 AEC 参考信号和回声之间时间校准的偏移,从而混淆 AEC 的双通话检测。

设计者不一定会在回声路径中添加延时。多个显示屏会增加唇音同步的延时(有时超过 100 毫秒)。为补偿这一问题,可能需要只向 AEC 参考信号增加延时。

必须注意,在 AEC 参考信号之前插入的延时不能超过回声路径中已经存在的延时。这会导致回声是非因果的(回声在参考信号之前到达),而这无法通过 AEC 建模,并导致远端听到回声。