Voz en alta definición

Esta tecnología aumenta la calidad del audio de las conversaciones y puede ser el nuevo estándar para la telefonía
Por Antonio Delgado 7 de abril de 2010
Img hdvoice portada
Imagen: MetalPhoeniX

La voz a través del teléfono tiene una calidad muy baja. Sin embargo, hasta el momento, la telefonía tradicional ha ignorado estas limitaciones porque lo importante era que los mensajes fueran comprensibles. Ahora, estas limitaciones pueden superarse gracias a la voz en alta definición. Esta tecnología de banda ancha proporciona una calidad considerable en las comunicaciones de voz al disponer de un mayor rango de frecuencias de audio. En el ámbito comercial y de marketing, se conoce como Voz HD. Las principales operadoras de telefonía móvil se plantean ya implementarla como un valor añadido de sus servicios, pero será con la entrada de la telefonía LTE (o 4G) cuando se imponga.

Décadas sin evolucionar

A pesar del aumento de la calidad en la captura y la transmisión de sonido y vídeo en las tecnologías de ámbito doméstico, como la televisión en alta definición, los grabadores HD como Blu-Ray o los equipos de audio de alta fidelidad, la transmisión de la voz en una comunicación telefónica tradicional no ha evolucionado de igual forma.

Una manera de percibir el sonido deficiente de una conversación por teléfono consiste en compararlo con la calidad de audio de una llamada por VoIP (voz sobre protocolo de Internet), que utiliza aplicaciones como Skype o el protocolo abierto SIP. Estas tecnologías disponen de diferentes formatos de codificación/descodificación (códecs) que permiten una transmisión de voz con una calidad de sonido notablemente superior a una llamada telefónica convencional (RTB o Red Telefónica Básica).

La calidad del sonido de voz en alta definición es similar a la de una radio en FM o un CD

La tecnología que hace posible la transmisión del sonido en una llamada telefónica utiliza protocolos y tecnología creadas hace varias décadas. Además, los usuarios están tan acostumbrados a esta calidad baja, que pocas veces perciben las limitaciones en la comunicación, como la dificultad en el reconocimiento y distinción de sonidos similares, o pequeños cambios de tono.

La denominada voz en alta definición, Voz HD, es una tecnología con una calidad de sonido similar a una radio en FM o a un CD, con un ancho de banda menor que el necesario para una llamada telefónica básica. La calidad de sonido de una llamada telefónica actual sería comparable a una emisora de radio en AM.

El peso de una llamada telefónica

El oído humano percibe variaciones periódicas de presión -sonido- entre 20 Hz (hercios) y 20.000 Hz (20 kHz o kilohercios). Por debajo de 20 Hz, se halla el “infrasonido” y por encima de los 20.000 Hz, el “ultrasonido”. Estas frecuencias, en su mayoría, no son audibles pero afectan al ser humano. Respecto al rango de sonido percibido, cuanto mayor sea el rango de frecuencias audibles, mejor será la calidad del sonido captado.

Para evitar el excesivo trasiego de información por las redes telefónicas, la voz humana se simplifica mucho y se eliminan sus matices

No obstante, mayor calidad también significa más peso de datos. Cuando se capta en un teléfono una señal de sonido, no se toma la totalidad, sino que se hace un muestreo de la voz, un resumen de los caracteres más importantes. Una muestra de 7.000 Hz implica que cada segundo se toman 7.000 muestras del sonido. Por lo tanto, para una muestra de sonido determinada, la cantidad de memoria o espacio que se precisa para transmitir los datos resultantes aumenta a medida que lo hace el rango de frecuencia. Es decir, cuanto más alta sea la calidad del sonido más espacio ocupará.

Para evitar el excesivo trasiego de información por las redes telefónicas, la voz humana se simplifica mucho y se eliminan sus matices. Aunque ésta abarca un rango de frecuencia desde 80 Hz a 11 kHz (11.000 Hz), sólo se transmite durante una llamada telefónica convencional una fracción de todo el sonido captado en la conversación. El resto se excluye. De esta forma, el sonido no es de máxima fidelidad, pero sí más que suficiente para que la comunicación entre dos usuarios se produzca de forma correcta y ocupe poco espacio en la transmisión.

Como norma general, cuanto mayor sea el rango de frecuencias captadas por el teléfono, mejor será la calidad del sonido

La telefonía tradicional hace un muestreo del flujo de sonido de 8.000 veces por segundo y en un rango de espectro de audio entre 200 Hz y 3,4 kHz (3.400 Hz). Esta cantidad es muy baja, comparada con los datos que puede comprender una canción o el audio de una película, ya que la calidad no es tan primordial en el teléfono como lo es en una composición musical, cuyo rango de frecuencias se sitúa, en general, en torno a 44,1 kHz (44.100 Hz).

Éste es el caso de los discos compactos y las tarjetas de sonido de los ordenadores domésticos. Respecto a la telefonía tradicional, disponer de un ancho de banda de transmisión y una buena capacidad para el almacenamiento de datos es más importante que la calidad del sonido. Además, la voz en la telefonía tradicional necesita un mínimo de 64 Kbps de ancho de banda libres para la codificación y descodificación de los datos, ya que por el cable, y por las redes en el caso de la telefonía móvil, viajan codificados.

Primeras ofertas de los operadores móviles

Primeras ofertas de los operadores móviles

Algunos operadores de telecomunicaciones están dispuestos a integrar la tecnología de voz en HD en sus redes de transmisión de datos. A medio plazo, se espera que haya en el mercado dispositivos y aplicaciones capaces de realizar videoconferencias de banda ancha mediante audio y vídeo en alta definición a un coste entre 600 y 1.000 euros. En la actualidad, estos dispositivos sólo están a la venta para entornos profesionales a precios muy elevados.

La empresa Orange fue la primera en lanzar esta tecnología a sus clientes de telefonía móvil en Moldavia, en septiembre de 2009. Durante 2010, Orange tiene previsto extender este servicio en Francia, España y Luxemburgo y comenzar en periodo de pruebas en Gran Bretaña. Se espera que otros operadores implementen también la voz en HD.

Para utilizar esta tecnología, es necesario que tanto el emisor como el receptor de la llamada dispongan de un terminal conectado mediante 3G a las redes

En España, está previsto que esta nueva tecnología se lance comercialmente en el segundo trimestre del año y que su punto de partida sea el área metropolitana de Barcelona. Este servicio no tendrá un coste adicional para los clientes de la empresa, al ser una mejora en sus redes de comunicaciones.

En un plano técnico, el servicio de voz de alta definición del operador Orange para sus clientes de telefonía móvil se basa en el códec Widebrand AMR (WB-AMR), que mejora el rango de frecuencias de la telefonía móvil desde los 300 Hz a 3.400 Hz de la tecnología actual, hasta el rango de 100 Hz a 7.000 Hz. Para adaptar la red de Orange a esta tecnología, el operador de telecomunicaciones se ha apoyado en el fabricante Ericsson.

Por el lanzamiento de este servicio, se ha reconocido a la empresa con el galardón “Best mobile technology breakthrough”, en el pasado congreso anual Mobile World Congress celebrado en Barcelona. Sin embargo, para utilizar esta tecnología, es necesario que tanto el emisor como el receptor de la llamada dispongan de un terminal conectado mediante 3G a las redes del operador de telecomunicaciones y que el dispositivo sea compatible con la voz en HD.

El operador tiene previsto poner a la venta a través de sus puntos de distribución una nueva gama de terminales compatibles con la voz en HD. En el caso de smartphones de última generación, esta compatibilidad se puede conseguir mediante una actualización autorizada del software del dispositivo, al añadir los códecs necesarios utilizados por cada operador.

Sigue a Consumer en Instagram, X, Threads, Facebook, Linkedin o Youtube