AEC: guía de referencia completa

El ruteo y el procesamiento correctos de la referencia de cancelación de eco acústico (AEC) son fundamentales para evitar el eco en salas de conferencias. Además, es uno de los aspectos más desafiantes del diseño de las salas de conferencia.

El enrutador para sala de conferencias (CRR) es útil para garantizar que la referencia de AEC se realice correctamente. Sin embargo, a menudo hay preguntas sobre cómo el procesamiento fuera del CRR afecta la referencia de AEC, y puede haber diseños que usan la AEC sin usar el CRR.

A continuación, se presentan algunos principios del uso de la referencia de AEC en los diseños adecuados de salas de conferencias y algunos consejos sobre aplicaciones comunes.

La referencia debe contener las señales correctas
En general, la referencia de AEC debe recibir una mezcla de todo el audio del extremo lejano y del programa que se reproducirá a través de los altavoces. Además, todos los altavoces de la sala deben reproducir la misma mezcla.

Señales que faltan en la referencia
Si una señal no está en la referencia de AEC, la AEC no la cancelará. Si se silencia por error un punto cruzado de la matriz entre una entrada del extremo lejano y la referencia de AEC, el eco se escuchará desde ese extremo pero el problema no será evidente en la sala local. Este es un error común que el CRR evita.

Si el audio del programa no se encuentra en la referencia, en el extremo lejano se puede escuchar una versión sucia o reverberante del audio del programa (incluida la mezcla directa de audio del programa enviado al extremo lejano, junto con lo que se capta localmente por los micrófonos). Esto es menos grave que el eco del extremo lejano, pero sigue sin ser ideal. En la mayoría de los casos, es preferible incluir el audio del programa en la referencia de AEC. Una excepción a esto es el caso del audio de posición, que se describe a continuación.

Señales adicionales en la referencia
Si se envía una señal a la referencia de AEC pero no se reproduce fuera del altavoz, la AEC podría desviarse cuando la señal esté activa. Cuando la señal está activa, el micrófono no detectará el audio correspondiente. La AEC convergerá en una ruta de señal sin eco en ella y deberá volver a converger cuando se active una señal del extremo lejano (que pertenece a la referencia de AEC).

Realce de voz
Algunos diseñadores ponen señales de micrófonos en sus propias referencias de AEC para intentar mejorar la ganancia antes del punto de retroalimentación en los sistemas de realce de voz. La ventaja de hacer esto es cuestionable, pero puede funcionar bien en algunas salas. En otros casos, el comportamiento de la reducción de retroalimentación de la AEC podría ser inconsistente o el eco residual podría ser audible en el extremo lejano durante una conversación simultánea.

En la mayoría de los casos, es preferible usar señales de micrófono antes de la AEC para el realce de voz y dejar los micrófonos fuera de las referencias de AEC. Esto proporciona la latencia más baja para el refuerzo local y no causará problemas con las señales de AEC.

Estéreo
Las señales estéreo en una referencia de AEC mono son, en teoría, un problema. Si la señal estéreo tiene demasiada separación, se reproducirán señales significativamente diferentes desde los altavoces izquierdo y derecho. La ruta del eco entre los altavoces izquierdo y derecho y el micrófono tiene diferentes respuestas de impulso, y una AEC mono no puede converger en ambos al mismo tiempo. Una AEC con una referencia estéreo está diseñada para manejar esto correctamente, mientras que una AEC mono no lo está.

En la práctica, una AEC con una referencia mono funcionará bien la mayor parte del tiempo en una sala de conferencias estéreo. A excepción de las salas de telepresencia altamente personalizadas, los micrófonos rara vez se panean, incluso cuando se envían a códecs estéreo. El audio del extremo lejano casi siempre es mono, y nuestra principal preocupación para la AEC es el audio del extremo lejano.

También es probable que el audio del programa con alta densidad de diálogos tenga la mayor parte de su energía en el centro y se cancele incluso con una referencia de AEC mono. Si el eco residual del audio del programa es audible, tendrá una latencia baja y es probable que el extremo lejano lo perciba como una reverberación o falta de claridad adicional en lugar de un eco distinto.

Audio posicional
El audio posicional es diferente del estéreo en el sentido de que cada altavoz está reproduciendo un canal claramente diferente. Por ejemplo, una sala de telepresencia puede tener 2 códecs conectados a diferentes sitios y reproducir el audio de cada sitio desde altavoces cerca de la pantalla correspondiente. Se requiere una AEC con una referencia multicanal para cancelar correctamente el eco en este tipo de sistema. Con una referencia de AEC mono, es probable que se escuche el eco con frecuencia en este tipo de sistema cada vez que alguien en un extremo lejano diferente comience a hablar.

El audio posicional puede funcionar si solo se usa una posición de altavoz a la vez. Por ejemplo, es posible que se prefieran altavoces en el techo o la mesa durante una conferencia solo por voz, ya que los participantes locales estarán frente al centro de la mesa. Durante una videoconferencia, se preferirán los altavoces cerca de la pantalla. Si el audio del extremo lejano de solo voz también se procesa en los altavoces de la pantalla durante una videoconferencia, una referencia de AEC mono puede manejar ambas situaciones (aunque el eco puede ser audible hasta que el AEC converge al comienzo de una llamada después de cambiar entre los 2 modos).

Si el audio del programa se reproduce en altavoces diferentes del audio del extremo lejano (por ejemplo, el audio del programa de los altavoces frontales y el audio del extremo lejano de los altavoces del techo), puede ser preferible dejar el audio del programa fuera de la referencia de AEC. Esto puede producir un audio del programa sucio que se escucha desde el extremo lejano, pero es menos probable que se genere un eco audible.

Combinación de sala

La combinación de sala en sí no es una causa de problemas de AEC. Sin embargo, si la combinación de sala se realiza manualmente con los ajustes de parámetros que ajusten los puntos cruzados de la matriz, es fácil cometer errores. Algunas de las referencias de AEC pueden contener fácilmente las señales adicionales de audio del extremo lejano o del programa, o pueden perder aquellas que se requieren. El eco de los micrófonos asociados se podrá oír y el problema puede ser muy difícil de diagnosticar. Afortunadamente, el combinador de sala de conferencias quita esta carga al diseñador y evita este tipo de errores.

Incluso con un sistema de combinación de sala configurado correctamente, el eco se puede oír brevemente después de cambiar la configuración de sala. Esto cambia la ruta del eco entre pares de micrófonos o altavoces en diferentes particiones, y la AEC se debe volver a converger después de realizar estos cambios.

La ruta del eco no debe contener procesamiento no lineal o con variación de tiempo
El filtro adaptativo de AEC puede modelar solo una ruta de eco lineal sin variación de tiempo. Cualquier elemento que no sea lineal o que tenga variación de tiempo en la ruta del eco puede dificultar significativamente el rendimiento de la AEC. La ruta del eco se puede describir como lo que se indica a continuación:

• Cualquier procesamiento en la salida del altavoz que no esté presente en la referencia de AEC
• La ruta acústica entre el altavoz y el micrófono (incluidos el altavoz y el micrófono mismos)
• Cualquier procesamiento en la entrada del micrófono antes de la AEC

En el diagrama que se muestra a continuación se ilustra un diseño típico de una sala de conferencias. Las señales que son parte de la ruta del eco están resaltadas en rojo.

Dinámica
El procesamiento de la dinámica puede cambiar constantemente su ganancia. Cuando se aplica en la ruta del eco, la AEC debe volver a adaptarse continuamente a estos cambios, lo que genera una alta probabilidad de la presencia de un eco residual frecuente.

Los compresores/limitadores a menudo se aplican en las salidas de los altavoces para evitar la saturación. Si se requiere dicho procesamiento, la referencia de AEC se debe crear a partir de la señal de los altavoces después de la compresión/limitación (lo que significa que la salida de la referencia de AEC del CRR no se usaría). Si la señal del altavoz es estéreo, se debe adaptar a mono después de la compresión/limitación antes de que pase a la referencia de AEC.

Si se intenta compensar el procesamiento dinámico en la salida del altavoz colocando el mismo procesamiento con los mismos ajustes antes de la referencia de AEC, es posible que esto no funcione de manera confiable. Existe el riesgo de que los 2 bloques de procesamiento dinámico no apliquen la misma ganancia al mismo tiempo, especialmente si la conversión de estéreo a mono en el CRR hace que aparezca un nivel ligeramente diferente en un compresor/limitador mono en comparación con los que detecta un compresor/limitador estéreo en las salidas del altavoz.
 

Si se necesita dinámica en las entradas del micrófono, se debe aplicar después de la AEC.

Mezcla automática de micrófono
Los mezcladores automáticos de micrófonos cambian frecuentemente la ganancia en cada canal de micrófono. Cuando se alterna entre micrófonos, esto cambia drásticamente la ruta del eco en la mezcla. Puede parecer una buena idea colocar un AMM antes de un solo canal de AEC, ya que los recursos de AEC son limitados. Sin embargo, los cambios de ganancia en la ruta del eco hacen que la AEC tenga un rendimiento deficiente en general. Se debe colocar una AEC en la señal de cada micrófono antes del AMM.

Control de volumen

El control de volumen tiene el mismo problema que la dinámica, pero es menos frecuente. Si se aplica el control de volumen en la ruta del eco, se puede oír brevemente un eco residual después de que un usuario cambia el volumen.

Distorsión
Es poco probable que la distorsión se produzca intencionalmente en la ruta de la señal en un sistema de conferencias. Una estructura de ganancia deficiente o componentes de baja calidad pueden provocar distorsión en la ruta del eco. La distorsión no se puede modelar con la AEC y causará eco residual. Este eco sonará evidentemente distorsionado (mucho más que la señal de micrófono antes de la AEC).

El procesamiento lineal sin variación de tiempo es (generalmente) seguro
Cualquier procesamiento que sea lineal y que no tenga variación de tiempo se puede modelar con el filtro adaptativo de la AEC. Solo los ajustes extremos de este tipo de procesamiento pueden suponer un problema.

Ganancia
La ganancia fija generalmente no provoca problemas para la AEC, a menos que se usen ajustes de ganancia extremos (es decir, una estructura deficiente de ganancia). A menudo, el problema causado por los ajustes deficientes de ganancia se genera a partir de la distorsión resultante en lugar de la ganancia por sí sola.

En algunos diseños, se aplica una ganancia considerable en el amplificador y el control de volumen aplica una gran cantidad de atenuación en la señal. Esto puede generar un nivel muy bajo en la referencia de AEC, lo que puede afectar la capacidad del detector de conversación simultánea de AEC para determinar cuándo debe adaptarse. Idealmente, la referencia de AEC debe detectar los niveles nominales adecuados cuando el control de volumen está en un ajuste cómodo.

Ecualización
La ecualización se puede aplicar normalmente en la ruta del eco sin causar problemas. No es necesario que la referencia de AEC se base en la versión ecualizada de la señal o aplicar una ecualización duplicada a la referencia de AEC. Si la ecualización se usa para nivelar el altavoz y la respuesta de la sala, una referencia de AEC sin ecualizar probablemente representa mejor la ruta del eco.

Del mismo modo, los filtros en las entradas del micrófono generalmente son inofensivos y se pueden aplicar antes de la AEC si lo desea. En algunos casos, como en aquellos con un HPF en un micrófono con una gran cantidad de ruido de baja frecuencia, puede ser útil aplicar una ecualización antes de la AEC.

Si se usan crossovers, la referencia de AEC debe recibir la señal de banda completa, y no una de las salidas de crossover.

Si la ecualización está aplicando una gran cantidad de aumento, la AEC puede tener un rendimiento levemente superior si la referencia de AEC incluye ese aumento.

Retraso
Un retraso moderado en la ruta no es un problema para la AEC. De forma natural, existe un poco de retraso debido a la distancia entre el altavoz y el micrófono, y la amortiguación de audio en el sistema.

El retraso excesivo (más de unas decenas de milisegundos) puede ser un problema para la AEC. El retraso tiene el efecto de reducir la longitud de cola disponible del filtro adaptativo de la AEC. También puede confundir al detector de conversación simultánea de la AEC porque desvía la alineación de tiempo de la referencia de AEC y el eco.

El diseñador no agrega necesariamente el retraso en la ruta del eco. Muchas pantallas agregan retraso (algunas veces más de 100 ms) para la sincronización de voz. Puede ser necesario agregar retraso solo a la referencia de AEC a fin de compensar esto.

Se debe tener cuidado con no insertar más retraso antes de la referencia de AEC que el que existe en la ruta del eco. Esto provoca que el eco deje de ser casual (el eco llega antes de la referencia). La AEC no puede modelar esto y se generará un eco audible en el extremo lejano.