ちらかの部屋のマイクだけが常時オンになっていれば、問題はありません。これは半二重通信と呼ばれ、あまり満足度の高い体験ではありません。各参加者のマイクは、別の参加者が話している間はミュートされます。このため、話し手側が話しているときに聞き手側の声を聞くことはできません。また相手が話している間はマイクがミュートされるため、途中でコメントしたい場合や確認したい場合に、相手が話し終わるまで聞き手側に通信する手段がありません。こうした理由から、多くの場合、半二重通信による会議は実用的ではありません。

アコースティックエコーキャンセレーション(AEC)は、電話会議で聞き手側の参加者が自分の声のエコーが聞こえるのを防ぎます。電話や電話会議には、話し手側と聞き手側があります。話し手側がユーザー側、聞き手側が通話での別の参加者の側になります。双方には、少なくともマイク1台とスピーカー1台が設置されています。

さらに、双方のマイクが同時にオンになると問題が発生します。これが全二重通信による会議です。聞き手側が話始めると、聞き手側のマイクにより聞き手側の話し手が拾われ、話し手側のスピーカーに送信されます。その後、話し手側のスピーカー音声が話し手側のマイクに拾われ、聞き手側のスピーカーに送信されます。一見、問題ないようですが、アナログ回線を使用した電話の往復のレイテンシーは通常、80から100ミリ秒です。VoIP通話ではそのレイテンシーはさらに高くなり、ビデオ会議のレイテンシーは1秒以上になることもあります。その結果、聞き手側の話し手は話すたびに常に自分の声のエコーを聞くことになり、このエコーによって通信はほぼ不可能になります。

音声信号は、反転させた信号と合わせることで除去することができます。これにより、スピーカーからの音声をマイクで無視させることができます。スピーカーに送信された音声信号がどのようなものかは、ご存知のとおりです。しかし、これはマイクで拾われた音声と完全には一致しません。スピーカーから発せられる音声は部屋の中で複数回反射され、これらの反射音がマイクに別々のタイミングで到達します。それぞれの反射音は、部屋の中のさまざまな面や物体により異なる周波数を吸収、遮断されています。これらひとつひとつの反射音は、元の信号からも、相互にも異なる聞こえ方をします。
マイク信号からスピーカー音声を除去するには、まずAECアルゴリズムで、スピーカー音声がマイクに到達した際の聞こえ方を検出する必要があります。AECアルゴリズムでは、マイク音声とスピーカーに送られた音声を比較し、室内インパルス応答を生成します。この室内インパルス応答が、マイク信号からスピーカー音声を除去するのに使用されるフィルターの基準になります。