VAD (Voice Activity Detection)
RTP Silence Suppression

Los terminales IP (endpoints) que envían audio como un flujo RTP no están obligados a enviar paquetes durante los períodos de silencio. La capacidad de detener el envío de paquetes RTP durante periodos de silencio se conoce como RTP "Supresión de Silencio" o RTP Silence Suppression y trabaja en forma conjunta con la función VAD (Detección de Actividad de Voz) o Voice Activity Detection que detecta la ausencia/presencia de sonido en el canal de audio.
El uso de la "supresión de silencio" suele ser una opción de configuración en algunas terminales IP.
Cuando se procesa un flujo de paquetes RTP, la especificación RFC 3389 detalla lo siguiente sobre la "Supresión del Silencio":
RTP permite la transmisión discontinua (supresión de silencio) en cualquier formato de carga útil de audio.
El receptor puede detectar la supresión de silencio en el primer paquete recibido tras el silencio observando que la marca de tiempo RTP no es contigua al final del intervalo cubierto por el paquete anterior, aunque el número de secuencia RTP se haya incrementado sólo en uno.
El bit marcador RTP también se activa normalmente en un paquete de este tipo.
El algoritmo de detección de actividad vocal (VAD) clasifica la señal de entrada como habla activa o silencio. El objetivo de VAD es reducir el número de paquetes durante el habla inactiva y enviar todos los paquetes disponibles durante el habla activa.
Otra función relacionada con VAD es la función CNG (Comfort noise generation). La generación de ruido de confort (CNG) recrea un fondo adecuado como continuidad de la región inactiva. Para un funcionamiento completo de extremo a extremo, se necesita VAD en el lado emisor y CNG en el lado receptor. El VAD se requiere para detectar y decidir entre habla y silencio, en el emisor.
Silence insertion description (SID)
La descripción de inserción de silencio (SID) es el nombre de la carga útil o paquete de silencio creado desde el emisor. La transmisión del paquete desde el lado
del emisor se controla mediante un algoritmo de transmisión discontinua (DTX), que reside en la operación del módulo VAD.