Das korrekte Routing und die Verarbeitung der AEC-Referenz (Acoustic Echo Cancellation) sind von entscheidender Bedeutung, wenn es darum geht, Echos in Konferenzräumen zu vermeiden. Es handelt sich dabei außerdem um einen der anspruchsvollsten Aspekte der Konferenzraumgestaltung.
Der Conference Room Router (CRR) trägt wesentlich dazu bei, dass die AEC-Referenz korrekt verarbeitet wird. Allerdings stellt sich auch häufig die Frage, wie sich die Verarbeitung außerhalb des CRR auf die AEC-Referenz auswirkt. Es kann sogar Installationen geben, die AEC verwenden, ohne dabei auf den CRR zurückzugreifen.
Weiter unten sind daher einige Prinzipien und Ratschläge zu gängigen Empfehlungen aufgeführt, die bei der Verwendung der AEC-Referenz in gut eingerichteten Konferenzräumen zu beachten sind.
Die Referenz muss die korrekten Signale beinhalten
Im Allgemeinen sollte die AEC-Referenz einen Mix aus allen Audiosignalen der Gegenseite und Programmaudiosignalen erhalten, die über die Lautsprecher wiedergegeben werden. Außerdem sollten alle Lautsprecher im Raum den gleichen Mix wiedergeben.
Signale fehlen in der Referenz
Wenn ein Signal nicht in der AEC-Referenz vorhanden ist, wird es von der AEC auch nicht kompensiert. Wenn ein Matrix-Kreuzungspunkt zwischen einem Eingang der Gegenseite und der AEC-Referenz versehentlich stummgeschaltet wird, wird das Echo von dieser Gegenseite aus zu hören sein, aber das Problem wird sich im betreffenden Raum nicht bemerkbar machen. Das ist ein häufiger Fallstrick, der sich durch den Einsatz eines CRR vermeiden lässt.
Wenn Programmaudiosignale nicht in der Referenz enthalten sind, wird auf der Gegenseite unter Umständen eine unsauber klingende oder hallende Version der Programmaudiosignale zu hören sein (dazu zählen auch der direkte Mix der Programmaudiosignale, der an die Gegenseite weitergeleitet wird, sowie die von den Mikrofonen aufgenommenen Umgebungsgeräusche). Die Auswirkungen sind nicht ganz so stark wie bei einem Echo von der Gegenseite, aber eine ideale Tonabmischung sieht natürlich anders aus. In den meisten Fällen ist es besser, die Programmaudiosignale in die AEC-Referenz aufzunehmen. Die im Folgenden beschriebene positionale Audiowiedergabe ist dabei eine Ausnahme.
Zusätzliche Signale in der Referenz
Wenn ein Signal an die AEC-Referenz gesendet, aber nicht über den Lautsprecher wiedergegeben wird, könnte die AEC immer dann abweichen, wenn das Signal aktiv ist.Sobald das Signal aktiv ist, wird kein entsprechendes Audiosignal vom Mikrofon erkannt. Die AEC konvergiert zu einem Signalpfad ohne Echo und muss erneut konvergieren, wenn ein Signal der Gegenseite (das in die AEC-Referenz gehört) aktiv wird.
Sprachwiedergabe
Einige Integratoren versehen ihre eigenen AEC-Referenzen mit Mikrofonsignalen, um die Rückkopplungsgrenze in Sprachwiedergabesystemen zu erhöhen. Die damit einhergehenden Vorteile sind fragwürdig, könnten in einigen Räumen aber gut zum Tragen kommen. In anderen Fällen kann die Rückkopplungsreduzierung durch die AEC inkonsistent oder ein Restecho bei doppelter Sprachwiedergabe auf der Gegenseite hörbar sein.
Im Idealfall sollten Mikrofonsignale erst gar nicht in die AEC-Referenzen aufgenommen werden. Dadurch wird die geringste Latenz bei einer lokalen Beschallung ermöglicht und es treten keine Probleme mit der AEC auf.
Stereo
Stereosignale in einer Mono-AEC-Referenz stellen theoretisch ein Problem dar. Wenn das Stereosignal stark getrennt ist, werden sehr unterschiedliche Signale aus den linken und rechten Lautsprechern wiedergegeben. Der Echopfad zwischen den linken und rechten Lautsprechern und dem Mikrofon weist unterschiedliche Impulsantworten auf und eine Mono-AEC kann nicht beide gleichzeitig konvergieren. Eine AEC mit einer Stereoreferenz wurde genau dafür konzipiert, aber eine Mono-AEC nicht.
In der Praxis wird eine AEC mit einer Monoreferenz in einem Konferenzraum mit Stereo-Beschallung jedoch die meiste Zeit gute Dienste leisten. Wenn man einmal von in hohem Maße angepassten Telepräsenzräumen absieht, werden Mikrofone selbst im Stereomodus nur selten neu ausgerichtet. Das Audiosignal von der Gegenseite ist fast immer ein Monosignal und bei der AEC geht es in erster Linie um das Audiosignal von der Gegenseite.
Dialoglastige Programmaudiosignale sind in der Regel auch größtenteils auf die Mitte ausgerichtet und würden selbst bei einer Mono-AEC-Referenz kompensiert werden. Wenn das Restecho des Programmaudiosignals hörbar ist, wird es eine niedrige Latenz aufweisen und auf der Gegenseite wahrscheinlich als zusätzlicher Nachhall oder unsaubere Klangwiedergabe wahrgenommen und nicht als ein deutlich zu hörendes Echo.
Positionale Audiowiedergabe
Die positionale Audiowiedergabe unterscheidet sich insofern von der Stereowiedergabe, als dass jeder Lautsprecher einen anderen Kanal wiedergibt. In einem Telepräsenzraum können beispielsweise zwei Codecs an verschiedenen Standorten angeschlossen sein und die Audiosignale von jedem Standort über Lautsprecher in der Nähe des entsprechenden Displays wiedergeben werden. Eine AEC mit Mehrkanalreferenz ist erforderlich, um das Echo in dieser Art von System zu kompensieren. Bei einer Mono-AEC-Referenz würde ein solches System wahrscheinlich häufig ein Echo erzeugen, wenn jemand auf der Gegenseite zu reden beginnt.
Die positionale Audiowiedergabe kann unter Umständen funktionieren, wenn nur jeweils eine Lautsprecherposition genutzt wird. Bei einer Konferenz, die lediglich eine Sprachwiedergabe erfordert, könnten daher beispielsweise Lautsprecher in der Decke oder auf dem Tisch eine gute Wahl sein, da die Teilnehmer auf die Mitte des Tisches schauen. Bei einer Videokonferenz wären hingegen Lautsprecher in der Nähe des Displays zu bevorzugen. Wenn die Sprachsignale der Gegenseite bei einer Videokonferenz auch über die Lautsprecher am Display wiedergegeben werden, könnten mithilfe einer Mono-AEC-Referenz beide Szenarien bewältigt werden (auch wenn ein Echo zu hören sein kann, bis die AEC zu Beginn des Anrufs und nach dem Umschalten zwischen den beiden Modi die Konvertierung vornimmt).
Wenn die Programmaudiosignale über andere Lautsprecher als die Audiosignale der Gegenseite wiedergegeben werden (zum Beispiel die Programmaudiosignale über die vorderen Lautsprecher und die Audiosignale der Gegenseite über die Deckeneinbaulautsprecher), kann es besser sein, die Programmaudiosignale nicht in die AEC-Referenz aufzunehmen. Dies kann zwar dazu führen, dass auf der Gegenseite eine unsaubere Klangwiedergabe der Programmaudiosignale zu hören ist, aber dafür ist es weniger wahrscheinlich, dass ein hörbares Echo erzeugt wird.
Room Combining
Durch das Room Combining allein werden keine AEC-Probleme verursacht. Wenn das Room Combining jedoch manuell und mithilfe von Parametersätzen zur Anpassung der Matrix-Kreuzungspunkten erfolgt, können sich leicht Fehler einschleichen. Einige der AEC-Referenzen könnten zum Beispiel zusätzliche Audiosignale der Gegenseite oder Programmaudiosignale enthalten. Die erforderlichen Signale könnten aber auch fehlen. Durch die zugehörigen Mikrofone wird ein hörbares Echo erzeugt und das Problem kann sehr schwer ausfindig zu machen sein. Glücklicherweise nimmt der Conference Room Combiner dem Integrator diese schwierige Aufgabe ab und verhindert somit, dass es zu derartigen Fehlern kommt.
Selbst bei einem korrekt konfigurierten Room-Combining-System kann das Echo nach Änderungen der Raumkonfiguration noch kurzzeitig zu hören sein. Dadurch ändert sich der Echopfad zwischen den Mikrofon- und Lautsprecherpaaren in verschiedenen Bereichen und die AEC muss danach erneut konvergieren.
Der Echopfad darf keine nichtlineare oder zeitlich veränderliche Verarbeitung aufweisen
Der adaptive Filter der AEC kann nur einen linearen, zeitlich unveränderlichen Echopfad modellieren. Wenn sich nichtlineare oder zeitlich veränderliche Elemente auf dem Echopfad befinden, kann sich dies erheblich auf die Leistung der AEC auswirken. Der Echopfad lässt sich wie folgt beschreiben:
• Jede am Lautsprecherausgang stattfindende Verarbeitung, die nicht in der AEC-Referenz enthalten ist.
• Der Signalpfad zwischen dem Lautsprecher und dem Mikrofon (schließt den Lautsprecher und das Mikrofon mit ein).
• Jede am Mikrofoneingang vor der AEC stattfindende Verarbeitung.
In der untenstehenden Abbildung ist eine typische Konferenzrauminstallation zu sehen. Die zum Echopfad gehörenden Signale sind rot markiert.
Dynamik
Bei der Dynamikverarbeitung kann sich die Verstärkung kontinuierlich ändern. Wenn sie auf den Echopfad angewandt wird, muss sich die AEC immer wieder an diese Änderungen anpassen. Dadurch können häufig Restechos auftreten.
Kompressoren/Limiter kommen oftmals an den Lautsprecherausgängen zum Einsatz, um eine Übersteuerung zu vermeiden. Wenn eine solche Verarbeitung erforderlich ist, muss die AEC-Referenz nach der Komprimierung/Begrenzung anhand des Lautsprechersignals erstellt werden (was bedeutet, dass der AEC-Referenzausgang des CRR nicht genutzt wird). Wenn es sich bei dem Lautsprechersignal um ein Stereosignal handelt, muss es nach der Komprimierung/Begrenzung in ein Monosignal umgewandelt werden, bevor es an die AEC-Referenz weitergeleitet wird.
Der Versuch, die Dynamikverarbeitung am Lautsprecherausgang zu kompensieren, indem man die gleiche Verarbeitung mit den gleichen Einstellungen vor der AEC-Referenz erfolgen lässt, funktioniert möglicherweise nicht so zuverlässig. Es besteht ein gewisses Risiko, dass die beiden Dynamikverarbeitungsblöcke nicht die gleiche Verstärkung zur gleichen Zeit erzeugen. Das ist insbesondere dann der Fall, wenn die Stereo-Mono-Konvertierung im CRR dafür sorgt, dass an einem Mono-Kompressor/-Limiter ein leicht anderer Pegel auftritt als jener, der von einem Stereo-Kompressor/-Limiter an den Lautsprecherausgängen erkannt wird.
Wenn eine Dynamikverarbeitung an den Mikrofoneingängen erforderlich ist, sollte sie nach der AEC erfolgen.
Automatischer Mikro-Mix
Automatik-Mixer ändern häufig die Verstärkung an jedem Mikrofonkanal. Wenn sie zwischen den Mikrofonen umschalten, ändert sich der Echopfad im Mix dadurch auf drastische Weise. Es ist verlockend, einen AMM vor einem einzelnen AEC-Kanal zu positionieren, da die AEC-Ressourcen begrenzt sind. Die Änderungen der Verstärkung auf dem Echopfad führen jedoch dazu, dass die AEC im Allgemeinen eine schlechte Leistung erbringt. Die AEC sollte an jedem Mikrofonsignal vor dem AMM erfolgen.
Lautstärkeregelung
Bei der Lautstärkeregelung tritt das gleiche Problem wie bei der Dynamikverarbeitung auf, allerdings nicht ganz so häufig. Wenn die Lautstärkeregelung auf den Echopfad angewandt wird, kann kurzzeitig ein Restecho hörbar sein, wenn ein Benutzer die Lautstärke ändert.
Verzerrung
Es ist unwahrscheinlich, dass eine Verzerrung auf dem Signalpfad eines Konferenzsystems bewusst herbeigeführt wird. Verzerrungen sind vielmehr auf eine schlechte Verstärkungsstruktur oder minderwertige Komponenten zurückzuführen. Eine Verzerrung kann nicht von der AEC modelliert werden und führt daher zur Entstehung eines Restechos. Dieses Echo wird sich stark verzerrt anhören (viel stärker, als es bei einem vor der AEC angeordneten Mikrofonsignal der Fall ist).
Die lineare, zeitlich unveränderliche Verarbeitung ist (normalerweise) sicher
Jede lineare und zeitlich unveränderliche Verarbeitung kann vom adaptiven Filter der AEC modelliert werden. Nur wenn extreme Einstellungen für diese Art der Verarbeitung ausgewählt werden, kann es zu Problemen kommen.
Verstärkung
Eine feste Verstärkung verursacht für gewöhnlich keine Probleme für die AEC, außer es werden extreme Verstärkungseinstellungen verwendet (z. B. schlechte Verstärkungsstruktur). Häufig liegt das Problem, das durch schlechte Verstärkungseinstellungen verursacht wird, eher in der daraus resultierenden Verzerrung als in der Verstärkung an sich.
Bei einigen Installationen erfolgt ein großer Teil der Verstärkung im Verstärker selbst. Die Lautstärkeregelung bewirkt dabei eine starke Dämpfung des Signals. Dies kann zu einem sehr geringen Pegel bei der AEC-Referenz führen, was wiederum die Funktion zur Erkennung einer doppelten Sprachwiedergabe der AEC beeinträchtigen kann, durch die bestimmt wird, wann eine Anpassung erfolgen muss. Im Idealfall sollten gute Nominalpegel von der AEC-Referenz erkannt werden, wenn die Lautstärkeregelung auf eine angenehme Einstellung eingestellt ist.
Entzerrung
Eine Entzerrung kann für gewöhnlich ohne Probleme auf dem Echopfad angewendet werden. Es ist nicht erforderlich, die entzerrte Version des Signals als Basis für die AEC-Referenz zu verwenden oder eine doppelte Entzerrung auf die AEC-Referenz anzuwenden. Wenn die Entzerrung dazu verwendet wird, um den Lautsprecher und die Raumresonanz flach einzustellen, stellt eine nicht entzerrte AEC-Referenz wahrscheinlich eine bessere Repräsentation des Echopfades dar.
Filter an den Mikrofoneingängen sind in der Regel ebenfalls unbedenklich und können bei Bedarf vor der AEC angewendet werden. In einigen Fällen, zum Beispiel bei einem Hochpassfilter (HPF) an einem Mikrofon, das viele Geräusche im tieferen Frequenzbereich empfängt, kann sich die Anwendung der Entzerrung vor der AEC als vorteilhaft erweisen.
Bei der Verwendung von Frequenzweichen muss die AEC-Referenz die ganze Bandbreite des Signals empfangen und nicht den Output einer der Frequenzweichen.
Wenn bei der Entzerrung eine starke Bassverstärkung zum Einsatz kommt, kann die AEC eine etwas bessere Leistung erbringen, wenn diese Bassverstärkung in der AEC-Referenz berücksichtigt wird.
Verzögerung
Wenn eine geringfügige Verzögerung auf dem Echopfad auftritt, ist das kein Problem für die AEC. Aufgrund des Abstands zwischen dem Lautsprecher und dem Mikrofon und der Audiopufferung im System kann es naturgemäß zu einer gewissen Verzögerung kommen.
Eine übermäßige Verzögerung (mehr als zehn Millisekunden) kann ein Problem für die AEC darstellen. Sie führt dazu, dass die verfügbare Verzögerung des adaptiven Filters der AEC reduziert wird. Außerdem kann sie die Funktion zur Erkennung einer doppelten Sprachwiedergabe der AEC beeinträchtigen, indem sie die zeitliche Ausrichtung der AEC-Referenz und des Echos verzerrt.
Eine Verzögerung auf dem Echopfad muss nicht zwangsläufig auf den Integrator zurückzuführen sein. Bei vielen Displays wird eine Verzögerung (manchmal mehr als 100 ms) hinzugefügt, um die Lippensynchronität zu gewährleisten. Um dies zu kompensieren, kann es erforderlich sein, der AEC-Referenz eine gewisse Verzögerung hinzuzufügen.
Dabei muss darauf geachtet werden, dass vor der AEC-Referenz nicht mehr Verzögerung hinzugefügt wird, als auf dem Echopfad vorhanden ist. Dies führt dazu, dass kein ursächlicher Zusammenhang zum Echo besteht (das Echo kommt vor der Referenz an). In diesem Fall kann keine Modellierung durch die AEC vorgenommen werden, was zur Folge hat, das auf der Gegenseite ein hörbares Echo entsteht.