Usos del servicio de reconocimiento de voz en Internet

Combinados con el teléfono móvil, transcriben mensajes orales y los envían por correo electrónico y a distintas redes sociales
Por Benyi Arregocés Carrere 3 de marzo de 2010
Img voicenet portada
Imagen: m.caimary

El manejo de Internet se asocia todavía con el teclado y el ratón que acompañan a casi todos los ordenadores. Pero las posibilidades han aumentado y se ha convertido en algo habitual que determinados procesos se puedan manejar con la voz. Tales posibilidades se multiplican en combinación con un teléfono móvil y cada día nacen nuevas plataformas capaces de transcribir los fonemas en texto y de convertir las pulsaciones del teclado en archivos de audio.

Servicios de transcripción

La mayor parte de la Web es un conjunto de páginas basadas en texto, a pesar del crecimiento del uso de audio y vídeo, gracias a tecnologías como flash Video de YouTube y similares. Ahora bien, cada vez surgen más aplicaciones web que se pueden manejar sólo con la voz a través de un teléfono móvil.

Dictar un texto es más rápido que escribirlo, sobre todo, si se tiene poca pericia con el teclado. Antes, la única solución consistía en recurrir a otra persona para que mecanografiara el texto mientras escuchaba de manera presencial o por teléfono. Ahora, en Internet se pueden encontrar diversas aplicaciones web que automatizan este proceso, con la flexibilidad de que se manejan a través de teléfonos móviles.

Esta práctica es posible gracias al uso de software especializado en reconocimiento de voz, pero todavía se debe añadir el trabajo de personas que revisan y corrigen las transcripciones, ya que se deben solventar varios problemas: los diferentes acentos, que pueden despistar al programa, las pronunciaciones distintas a las estándares o sin buena dicción o el ruido que puede perturbar la inteligibilidad del mensaje. Por estas cuestiones, cuando se utiliza un servicio web que se maneja con la voz, hay que hablar despacio y claro.

Dial2Does uno de los mejores ejemplos de estos programas. Dispone de una cuenta gratuita que permite probar su modo de proceder. Se enfoca al uso mediante los sistemas de manos libres en los coches, para que los conductores graben sus mensajes, entre otras situaciones, durante los atascos propios de las grandes urbes. Con llamar a uno de sus números, identificarse y empezar a hablar, la grabación permanecerá activa hasta que el usuario cuelgue.

Con la voz, se puede ordenar al sistema que las palabras se conviertan en un correo electrónico, crear recordatorios o anotar ideas

Con la voz, se puede ordenar al sistema que las palabras se conviertan en un correo electrónico, crear recordatorios, anotar ideas en Evernote, leer la agenda semanal (en Google Calendar o 30 Boxes), los sitios web con RSS a los que se esté suscrito (entre una muestra de algunos de los más representativos en inglés) o escuchar los nuevos mensajes de correo que se hayan recibido, con la posibilidad de responderlos de inmediato de forma oral o, incluso, mandar mensajes cortos de móvil.

Dispone de números fijos en más de 25 países, entre ellos España, para que la llamada sea más económica. Reconoce el número del usuario de manera automática para transcribir el mensaje (hasta tres números distintos), pero el sistema sólo funciona si se habla en inglés.

La solución para que se transcriban los textos a español de modo directo pasa por servicios como SpinVox. Funciona en España, entre otros países, aunque se debe llamar a un número de teléfono móvil, lo que puede encarecer el precio. Como peculiaridad, permite pasar los textos transcritos a sistemas de mensajería instantánea para establecer un chat con quien se quiera.

QuickTate, con traducción

Otra opción es QuickTate. Sus posibilidades son inferiores a las de Dial2Do porque se centra en transcribir los mensajes recibidos en el contestador del teléfono móvil y en realizar la misma operación con las grabaciones de una persona que quiera recordar algún pensamiento en un momento dado. Luego envía las transcripciones por correo electrónico, por mensajes cortos de móvil o a través de un widgetque se puede instalar en el iPhone.

Es un servicio de pago, con diferentes precios al mes, según la cantidad de mensajes que se transcriban. Dispone de una modalidad gratuita para realizar hasta cinco grabaciones mensuales. Por otro lado, destaca por su servicio de traducción del texto generado, que puede convertirlos a otros idiomas.

Otras aplicaciones de la voz en Internet

Además de los servicios de transcripción con fines personales o de organización, también se puede usar el teléfono móvil para crear contenidos, en principio, más elaborados, como los post de un blog. Tumblr, un sistema que elabora blogs especiales que reúnen en un sólo espacio contenidos diseminados por diversas redes sociales, permite crear una nueva entrada en la bitácora a partir de una llamada a un número de teléfono. Se crea un archivo de audio al que se puede acceder a través de un reproductor que se inserta en la página de modo automático.

También se puede usar el teléfono móvil para crear contenidos, en principio, más elaborados, como los post de un blog

Twilioresulta interesante por sus posibilidades de uso de la voz en Internet. Ha creado una API que permite a otros programadores idear combinaciones de servicios en los que la voz interactúe con Internet. Esta empresa comercializa números de teléfono propios (aunque sólo de Estados Unidos y Canadá) que reciben las llamadas de cualquier terminal, ya sea fijo, móvil o de VoIP, para, a continuación, comunicarse con el servicio web que demande el usuario y enviar las respuestas precisas.

Entre los programas que se han creado, se puede señalar TweetToCall, que permite hablar por voz a dos usuarios de Twitter sin necesidad de revelar sus auténticos números de teléfono. Call My Wall introduce grabaciones de voz con un enlace que lleva al archivo de audio, en el muro de Facebook, mientras que ShoutNowextiende esta posibilidad también a Twitter. Twilio cobra las transcripciones a 5 centavos de dólar por minuto de grabación, en caso de que el usuario esté interesado.

Microblogging con voz

Otro ejemplo del uso de la voz para una posterior transcripción son los mensajes grabados para Twitter. Han surgido varias aplicaciones que se encargan de transformar en textos inferiores a 140 caracteres las palabras pronunciadas por una persona. TwitterFoneestá en fase de pruebas y funciona a través del teléfono móvil en España y otros países. Es un servicio gratuito que también permite escuchar los mensajes de las personas a quienes se sigue y responderles si se desea, en público o por mensaje privado.

TweetCall, por su parte, no se limita a los móviles, sino que se pueden transmitir mensajes desde cualquier terminal. Se diferencia porque une en la misma actualización de Twitter la transcripción y un archivo de audio con la voz original de la persona, aunque sólo proporciona un número de teléfono estadounidense para comunicar el mensaje.

Podcast desde el teléfono

Al podcast, el género radiofónico por excelencia de Internet, también ha llegado la posibilidad de grabar programas directos desde un teléfono móvil. Los usuarios de Estados Unidos y Reino Unido pueden acceder, por el coste de una llamada local, a PhoneCasting, una red social especializada en este tipo de contenidos. Reúne números para que los podcasters puedan registrar sus nuevos episodios y los distribuye por Internet y a las personas que estén interesadas en escucharlos a través del teléfono, mediante una llamada convencional que paga el usuario.

Sigue a Consumer en Instagram, X, Threads, Facebook, Linkedin o Youtube