Article traduït per un sistema de traducció automàtica. Més informació, aquí.

Usos del servei de reconeixement de veu en Internet

Combinats amb el telèfon mòbil, transcriuen missatges orals i els envien per correu electrònic i a diferents xarxes socials
Per Benyi Arregocés Carrere 3 de març de 2010
Img voicenet portada
Imagen: m.caimary

El maneig d’Internet s’associa encaraamb elteclat i el ratolí que acompanyen a gairebé tots els ordinadors. Peròles possibilitats han augmentat i s’ha convertit en una cosa habitualque determinats processos es puguin manejar amb la veu. Talspossibilitats es multipliquen en combinació amb un telèfon mòbil i cada dia neixen noves plataformes capaces de transcriure els fonemes en text i de convertir les pulsacions del teclat en arxius d’àudio.

Serveis de transcripció

La major part de la Web és un conjuntde pàginesbasades en text, malgrat el creixement de l’ús d’àudioi vídeo, gràcies a tecnologies com a flaix Vídeo de YouTubei similars. Ara bé, cada vegada sorgeixen més aplicacions web que es podenmanejar només amb la veu a través d’un telèfon mòbil.

Dictar un text és mésràpid queescriure’l, sobretot, si es té poca perícia amb el teclat.Abans, l’única solució consistia a recórrer a una altra persona perquè mecanografiés el text mentre escoltava de manera presencial o per telèfon. Ara, en Internet es poden trobar diversesaplicacions web que automatitzen aquest procés, amb la flexibilitat que es manegen a través de telèfons mòbils.

Aquesta pràctica és possible gràcies a l’ús de programariespecialitzat en reconeixement de veu, però encara s’ha d’afegir el treball de personesque revisen i corregeixen les transcripcions, ja que s’hande solucionar diversos problemes: els diferents accents, que podendespistar al programa, les pronunciacions diferents a les estàndardo sense bona dicció o el soroll que pot pertorbar la intel·ligibilitatdel missatge. Per aquestes qüestions, quan s’utilitza un servei webque es maneja amb la veu, cal parlar a poc a poc i clar.

Dial2Doés un dels millors exemples d’aquests programes. Disposa d’uncompte gratuït que permet provar la seva manera de conducta. S’enfocaa l’ús mitjançant els sistemes de mans lliures en els cotxes, perquèels conductors gravin els seus missatges, entre altres situacions, durant els embussos propis de les grans urbs. Amb cridar a undels seus números, identificar-se i començar a parlar, l’enregistramentromandrà activa fins que l’usuari pengi.

Amb la veu, es pot ordenar al sistema que les paraules es converteixin en un correu electrònic, crear recordatoris o anotar idees

Amb la veu, es pot ordenar al sistemaque les paraules es converteixin en un correu electrònic, crearrecordatoris, anotar idees en Evernote,llegir l’agenda setmanal (en GoogleCalendar o 30 Boxs), els llocs web amb RSS als quals s’estiguisubscrit (entre una mostra d’alguns dels més representatius enanglès) o escoltar els nous missatges de correu que s’haginrebut, amb la possibilitat de respondre’ls immediatament de manera oral o, fins i tot, enviar missatges curts de mòbil.

Disposade númerosfixos en més de 25 països, entre ells Espanya, perquèla crida sigui més econòmica. Reconeix el número de l’usuaride manera automàtica per a transcriure el missatge (fins a tresnúmeros diferents), però el sistema només funciona si es parla enanglès.

La solució perquè es transcriguinels textos a espanyol de manera directa passa per serveis com SpinVox.Funciona a Espanya, entre altres països, encara que s’ha de cridar a unnúmero de telèfon mòbil, la qual cosa pot encarir el preu. Com a peculiaritat, permet passar els textos transcrits a sistemesde missatgeria instantània per a establir un xat ambqui es vulgui.

QuickTate, amb traducció

Una altra opció és QuickTate.Les seves possibilitats són inferiors a les de Dial2Do perquè se centra entranscriure els missatges rebuts en el contestador del telèfonmòbil i a realitzar la mateixa operació amb els enregistramentsd’una persona que vulgui recordar algun pensament enun moment donat. Després envia les transcripcions per correuelectrònic, per missatges curts de mòbil o a través d’un ginyque es pot instal·lar en l’iPhone.

És un servei de pagament, ambdiferents preus al mes, segons la quantitat de missatges que es transcriguin. Disposa d’una modalitat gratuïta per a realitzar fins a cincenregistraments mensuals. D’altra banda, destaca pel seu servei de traducciódel text generat, que pot convertir-los a altresidiomes.

Altres aplicacions de la veu en Internet

A més dels serveis de transcripcióamb finalitats personals o d’organització, també es pot usar eltelèfon mòbil per a crear continguts, en principi, més elaborats,com els post d’un blog. Tumblr,un sistema que elabora blogs especials que reuneixen en un nomésespai continguts disseminats per diverses xarxes socials, permetcrear una nova entrada en la bitàcola a partir d’una anomenada a unnúmero de telèfon. Es crea un arxiu d’àudio al qual es potaccedir a través d’un reproductor que s’insereix en la pàginade manera automàtica.

També es pot usar el telèfon mòbil per a crear continguts, en principi, més elaborats, com els post d’un blog

Twilioresulta interessant per les seves possibilitats d’ús de la veuen Internet. Ha creat una API que permet a altres programadorsidear combinacions de serveis en els quals la veu interactui ambInternet. Aquesta empresa comercialitza números de telèfon propis(encara que només dels Estats Units i el Canadà) que reben les trucadesde qualsevol terminal, ja sigui fix, mòbil o de VoIP, per a, a continuació, comunicar-se amb el servei web que demandi l’usuarii enviar les respostes precises.

Entre els programes que s’han creat,es potassenyalar TweetToCall,que permet parlar per veu a dos usuaris de Twitter sense necessitat de revelarels seus autèntics números de telèfon. CallMy Wall introdueix enregistraments de veu amb un enllaç que portaa l’arxiud’àudio, en el mur de Facebook, mentre que ShoutNowestén aquesta possibilitat també a Twitter. Twilio cobra lestranscripcions a 5 centaus de dòlar per minut d’enregistrament, en cas que l’usuari estigui interessat.

Microblogging amb veu

Un altre exemple de l’ús de la veu per a unaposteriortranscripció són els missatges gravats per a Twitter.Han sorgit diverses aplicacions que s’encarreguen de transformar entextos inferiors a 140 caràcters les paraules pronunciades per unapersona. TwitterFoneestà en fase de proves i funciona a través del telèfonmòbil a Espanya i altres països. És un servei gratuïtque també permet escoltar els missatges de les persones als quise segueix i respondre’ls si es desitja, en públic o per missatgeprivat.

TweetCall,per part seva, no es limita als mòbils, sinó que es podentransmetre missatges des de qualsevol terminal. Es diferencia perquè uneix en la mateixa actualització de Twitter la transcripció i un arxiu d’àudioamb la veu original de la persona, encara que només proporciona unnúmero de telèfon estatunidenc per a comunicar el missatge.

Podcast des del telèfon

Al podcast, el gènere radiofònic per excel·lènciad’Internet, també ha arribat la possibilitat de gravar programes directes des d’un telèfon mòbil. Elsusuaris dels Estats Units i Regne Unit poden accedir, pel cost d’una trucada local, a PhoneCasting ,una xarxa social especialitzada en aquesta mena de continguts. Reuneix números perquè els podcasters puguin registrar els seus nousepisodis i els distribueix per Internet i a les persones que estiguin interessades a escoltar-los a través del telèfon, mitjançant una trucada convencional que paga l’usuari..