Saltar el menú de navegación e ir al contenido

EROSKI CONSUMER, el diario del consumidor

Buscador

logotipo de fundación

Canales de EROSKI CONSUMER

Secciones dentro de este canal: Tecnología


Estás en la siguiente localización: Portada > Tecnología > Internet y telecomunicaciones

Tipos de contenidos: Tecnología

^

Voz en alta definición

Esta tecnología aumenta la calidad del audio de las conversaciones y puede ser el nuevo estándar para la telefonía

Imagen: Steffen

La voz a través del teléfono tiene una calidad muy baja. Sin embargo, hasta el momento, la telefonía tradicional ha ignorado estas limitaciones porque lo importante era que los mensajes fueran comprensibles. Ahora, estas limitaciones pueden superarse gracias a la voz en alta definición. Esta tecnología de banda ancha proporciona una calidad considerable en las comunicaciones de voz al disponer de un mayor rango de frecuencias de audio. En el ámbito comercial y de marketing, se conoce como Voz HD. Las principales operadoras de telefonía móvil se plantean ya implementarla como un valor añadido de sus servicios, pero será con la entrada de la telefonía LTE (o 4G) cuando se imponga.

Décadas sin evolucionar

A pesar del aumento de la calidad en la captura y la transmisión de sonido y vídeo en las tecnologías de ámbito doméstico, como la televisión en alta definición, los grabadores HD como Blu-Ray o los equipos de audio de alta fidelidad, la transmisión de la voz en una comunicación telefónica tradicional no ha evolucionado de igual forma.

Una manera de percibir el sonido deficiente de una conversación por teléfono consiste en compararlo con la calidad de audio de una llamada por VoIP (voz sobre protocolo de Internet), que utiliza aplicaciones como Skype o el protocolo abierto SIP. Estas tecnologías disponen de diferentes formatos de codificación/descodificación (códecs) que permiten una transmisión de voz con una calidad de sonido notablemente superior a una llamada telefónica convencional (RTB o Red Telefónica Básica).

La calidad del sonido de voz en alta definición es similar a la de una radio en FM o un CD

La tecnología que hace posible la transmisión del sonido en una llamada telefónica utiliza protocolos y tecnología creadas hace varias décadas. Además, los usuarios están tan acostumbrados a esta calidad baja, que pocas veces perciben las limitaciones en la comunicación, como la dificultad en el reconocimiento y distinción de sonidos similares, o pequeños cambios de tono.

La denominada voz en alta definición, Voz HD, es una tecnología con una calidad de sonido similar a una radio en FM o a un CD, con un ancho de banda menor que el necesario para una llamada telefónica básica. La calidad de sonido de una llamada telefónica actual sería comparable a una emisora de radio en AM.

El peso de una llamada telefónica

El oído humano percibe variaciones periódicas de presión -sonido- entre 20 Hz (hercios) y 20.000 Hz (20 kHz o kilohercios). Por debajo de 20 Hz, se halla el "infrasonido" y por encima de los 20.000 Hz, el "ultrasonido". Estas frecuencias, en su mayoría, no son audibles pero afectan al ser humano. Respecto al rango de sonido percibido, cuanto mayor sea el rango de frecuencias audibles, mejor será la calidad del sonido captado.

Para evitar el excesivo trasiego de información por las redes telefónicas, la voz humana se simplifica mucho y se eliminan sus matices

No obstante, mayor calidad también significa más peso de datos. Cuando se capta en un teléfono una señal de sonido, no se toma la totalidad, sino que se hace un muestreo de la voz, un resumen de los caracteres más importantes. Una muestra de 7.000 Hz implica que cada segundo se toman 7.000 muestras del sonido. Por lo tanto, para una muestra de sonido determinada, la cantidad de memoria o espacio que se precisa para transmitir los datos resultantes aumenta a medida que lo hace el rango de frecuencia. Es decir, cuanto más alta sea la calidad del sonido más espacio ocupará.

Para evitar el excesivo trasiego de información por las redes telefónicas, la voz humana se simplifica mucho y se eliminan sus matices. Aunque ésta abarca un rango de frecuencia desde 80 Hz a 11 kHz (11.000 Hz), sólo se transmite durante una llamada telefónica convencional una fracción de todo el sonido captado en la conversación. El resto se excluye. De esta forma, el sonido no es de máxima fidelidad, pero sí más que suficiente para que la comunicación entre dos usuarios se produzca de forma correcta y ocupe poco espacio en la transmisión.

Como norma general, cuanto mayor sea el rango de frecuencias captadas por el teléfono, mejor será la calidad del sonido

La telefonía tradicional hace un muestreo del flujo de sonido de 8.000 veces por segundo y en un rango de espectro de audio entre 200 Hz y 3,4 kHz (3.400 Hz). Esta cantidad es muy baja, comparada con los datos que puede comprender una canción o el audio de una película, ya que la calidad no es tan primordial en el teléfono como lo es en una composición musical, cuyo rango de frecuencias se sitúa, en general, en torno a 44,1 kHz (44.100 Hz).

Éste es el caso de los discos compactos y las tarjetas de sonido de los ordenadores domésticos. Respecto a la telefonía tradicional, disponer de un ancho de banda de transmisión y una buena capacidad para el almacenamiento de datos es más importante que la calidad del sonido. Además, la voz en la telefonía tradicional necesita un mínimo de 64 Kbps de ancho de banda libres para la codificación y descodificación de los datos, ya que por el cable, y por las redes en el caso de la telefonía móvil, viajan codificados.

Cuestión de códecs

La voz en HD duplica la tasa de muestreo de la telefonía tradicional, hasta llegar a las 16.000 muestras por segundo, y aumenta el rango de espectro de 50 Hz a 7 kHz (7.000 Hz). De esta forma, agrega una mayor profundidad y matices para el sonido. Además, para la voz HD hay diferentes códecs pensados para capturar y transmitir el sonido a mayor calidad con un tamaño menor. Estos formatos de codificación/descodificación reducen el ancho de banda necesario para codificar y descodificar a 32 Kbps, la mitad del ancho de banda necesario hasta ahora.

Una de las claves de la voz en HD son los códecs que utiliza y que reducen el ancho de banda necesario para la descodificación

Los más utilizados son los códecs G.772, G.722.1, MPEG-4, ACC y Low Delay Codec. Este último, desarrollado por el Instituto de circuitos integrados de Fraunhofer (Alemania), consigue una calidad de sonido similar a un CD -una tasa de muestreo de 48.000 Hz por segundo- con un ancho de banda entre 48 y 64 Kbps.

Los usuarios pueden experimentar la diferencia de calidad entre una llamada de voz tradicional y una llamada realizada mediante Voz en HD, de igual forma que son capaces de distinguir una grabación de audio analógica en casetes respecto a un CD. Ésta es la diferencia cualitativa.

Paginación dentro de este contenido


Al publicar un comentario aceptas la política de protección de datos



Otros servicios


Buscar en
Fundación EROSKI

Validaciones de esta página

  • : Conformidad con el Nivel Triple-A, de las Directrices de Accesibilidad para el Contenido Web 1.0 del W3C-WAI
  • XHTML: Validación del W3C indicando que este documento es XHTML 1.1 correcto
  • CSS: Validación del W3C indicando que este documento usa CSS de forma correcta
  • RSS: Validación de feedvalidator.org indicando que nuestros titulares RSS tienen un formato correcto