Si un seul des microphones est allumé, il n’y a pas de problème. On appelle cela une communication en semi-duplex, et ce n’est pas une expérience très satisfaisante. Le microphone de chaque interlocuteur est coupé lorsqu’un autre parle. Cela vous empêche d’entendre l’extrémité lointaine lorsque vous parlez, et ainsi de réagir immédiatement ou de demander à votre interlocuteur des précisions avant que ce dernier ait fini de parler. C’est pourquoi le semi-duplex ne convient pas à la plupart des situations.
S’applique à:

Le traitement d’annulation d’écho acoustique (AEC) évite aux participants d’une téléconférence d’entendre l’écho de leur propre voix. Dans le contexte d’un appel téléphonique ou d’une téléconférence, on trouve une extrémité proche et une extrémité lointaine. L’extrémité proche est l’endroit où vous vous situez, tandis que l’extrémité lointaine est l’endroit où se situe votre interlocuteur. À chaque extrémité, on trouve au moins un micro et une enceinte.

Lorsque vous parlez, votre microphone capte le son de votre voix avant de le transmettre à l’extrémité lointaine, où l’enceinte permet à votre interlocuteur de vous entendre. Lorsque ce dernier parle à son tour, le micro de l’extrémité lointaine et l’enceinte de l’extrémité proche vous permettent d’entendre l’extrémité lointaine.

Pourtant, faire fonctionner deux microphones en même temps pose problème. C’est ce qu’on appelle un duplex complet. Lorsque votre interlocuteur parle, le son de sa voix est capté par le microphone de l’extrémité lointaine et diffusé par l’enceinte de l’extrémité proche. Le son de l’enceinte d’extrémité proche est alors capté par le micro d’extrémité proche et renvoyé vers l’enceinte d’extrémité lointaine. Le problème n’est peut-être pas évident, mais la latence provoquée par les allers-retours d’un appel utilisant des lignes analogiques se situe entre 80 et 100 millisecondes. Les appels VoIP ont une latence plus grande encore, et la latence d’un appel vidéo peut durer plus d’une seconde. Cela signifie que votre interlocuteur entend l’écho de sa propre voix, ce qui rend la communication impossible.

Si un signal audio peut être éliminé en négatif au mixage, il ne devrait pas être impossible d’empêcher le microphone de transmettre le son de l’enceinte. Nous connaissons parfaitement le signal audio envoyé vers l’enceinte. Pourtant, ce signal ne coïncide pas totalement avec le son capté par le microphone. Le son émis par l’enceinte est réfléchi plusieurs fois par les surfaces de la pièce, et ces réflexions arrivent au microphone à des moments différents. De plus, les différentes surfaces et les objets de la pièce ont pu absorber ou bloquer différentes fréquences de chacune de ces réflexions. Celles-ci se distinguent l’une de l’autre et diffèrent grandement du signal original.
Pour soustraire le son de l’enceinte du signal transmis par le microphone, l’algorithme d’AEC doit d’abord déterminer l’aspect du son produit par l’enceinte lorsqu’il atteint le microphone. L’algorithme d’AEC compare le son capté par le microphone au son envoyé vers l’enceinte pour générer la réponse impulsionnelle de la pièce. La réponse impulsionnelle de la pièce sert de base à la création d’un filtre utilisé pour éliminer le son de l’enceinte du signal transmis par le microphone.