Salta el menú de navegació i ves al contingut

EROSKI CONSUMER, el diari del consumidor

Cercador

logotip de fundació

Canals d’EROSKI CONSUMER


Estàs en la següent localització: Portada > Noves tecnologies > Internet i telecomunicacions

Aquest text ha estat traduït per un sistema de traducció automàtica. Més informació, aquí.

Programes per transcriure veu a text

Aquest servei facilita la conversió de la veu en text digital

Les aplicacions de reconeixementde veu permeten al nostre ordinador i el nostre telèfonconvertirles paraules en un text que després podrem editar. Són programes quehan millorat al llarg dels últims anys gràcies al desenvolupamentde processadors molt més potents i que permeten realitzar lestranscripcions de forma gairebé instantània. Al principi, aquestesaplicacions estaven orientades a entorns professionals on fosnecessari un ús intensiu de la transcripció de discursos i notes,o bé per als usuaris amb discapacitat, com una formad’interactuar amb un ordinador de manera més accessible. No obstant això, enels últims anys s’han obert a totes les persones i s’han adaptat als dispositius mòbils com una forma mésnatural de comunicar-se.

Quan desitgem utilitzar aquestes
aplicacions, és imprescindible que estiguem correctament situats davant
del micròfon intern de l’ordinador o telèfon, o bé hem d’adquirir un
conjunt d’auriculars i micròfon que li permeti al programa captar la veu i
timbre de forma més precisa i correcta. D’altra banda,
són programes que sovint disposen de mecanismes d’autoentrenamiento
per aprendre el to en el qual parlem i, d’aquesta forma,
minimitzar el nombre d’errors comesos en la transcripció. És
imprescindible realitzar aquests exercicis previs per aconseguir una
major precisió i que l’aplicació treballi de forma correcta en un
ús habitual.

Dragon
Naturally
és un programa molt popular orientat a
convertir en text la nostra veu. Inclou altres funcions de
reconeixement per navegar per Internet i controlar el
ordinador mitjançant comandos de veu. Aquesta aplicació disposa de
diferents versions, segons les necessitats i requeriments del
sistema operatiu de l’ordinador: Windows o Mac Us X. La versió
domèstica té un cost de 99 euros i permet prendre notes de veu para
transcriure-les en text, que després pot enviar-se per correu
electrònic.

Els usuaris poden prendre notes de veu i enviar el text transcrit per correu electrònic sense necessitat d’utilitzar el teclat

El mateix fabricador, Nuance, disposa de
una línia de productes pensada per transcriure la veu en text des de
dispositius portàtils i smartphones. D’aquesta forma, els usuaris
poden prendre notes de veu i enviar el text transcrit per correu
electrònic sense necessitat d’utilitzar el teclat, que sovint és petit i poc usable. Dragon
Dictation
està disponible de forma gratuïta per els
dispositius d’Apple iPhone, iPad i iPad Touch, juntament amb versions
per a telèfons Blackberry i els models que funcionin amb Android.

Com a funció inclosa en el navegador
Els usuaris no solament podem transcriure la veu a
text mitjançant l’ús de
aplicacions informàtiques. Una de les últimes especificacions d’HTML.
5
, la nova versió del llenguatge bàsic que estructura la
Web, està orientada a proveir d’una API -conjunt d’instruccions de
programació- per incorporar el reconeixement de veu. Aquesta
especificació, impulsada
per Google
, és de moment un esborrany de treball orientat al
dictat de paraules i frases que després puguin transcriure’s per la seva
ús en formularis de text o en diferents serveis web. D’aquesta
forma, els usuaris no necessitaran teclejar un terme de cerca en un
cercador o emplenar un camp de text d’un formulari.

El reconeixement de veu i la seva transcripció a text s’ha afegit en l’última versió del navegador Chrome

De moment, la funció s’ha afegit en l’última versió del navegador Chrome, la 11, i Google ha
creat un lloc web
on usuaris i desenvolupadors
poden experimentar amb aquesta tecnologia. Per utilitzar-la és necessari
accedir amb alguna de les últimes versions de Chrome. Si aprova aquesta especificació el consorci W3C, encarregat dels estàndards web, en el futur la resta de navegadors, com Firefox,
Opera o Internet Explorer, podrien implementar-la.

Per la seva banda, Apple ha
presentat una patent a Estats Units
per el
reconeixement de veu i control de la mateixa des dels seus aparells mòbils.
Aquesta tecnologia està orientada a moments en què la conversa no és
clara a causa d’incidències en la comunicació, falta de cobertura o un ambient sorollós. D’aquesta forma, el sistema es
encarregaria de convertir a text la veu de l’interlocutor en qualsevol
moment de la conversa i la transcripció es publicaria en la pantalla del dispositiu de l’altre usuari. Per respondre, aquest usuari podria escriure un missatge de text.

El polèmic cas de Spinvox

Img

En l’estiu de 2009, laBBC va denunciar que l’empresa britànica de reconeixement deveuper a telèfons mòbils Spinvoxutilitzava “call centers” situats principalment aSud-àfrica i Filipines per transcriure de forma manual els missatgesde veu dels usuaris del sistema a SMS, amb la consegüent pèrduade privadesa, en ser un humà l’encarregat de transcriure elmissatge. Spinvoxva al·legar que recorrien a “call centers” com a part del procésd’aprenentatge necessari en aquest tipus de tecnologies, ja que aquestaempresa també utilitzava un sistema informàtic per transcriureels missatges de forma automatitzada, però en cas que el sistema noreconegués la veu de l’usuari, el missatge de veu s’enviava aun operador per a la seva transcripció manual.

El problema, segons la denúncia de laBBC, està que el sistema no funcionava massa bé i empleats d’aquests”call centers” convertien a text lamajoria dels missatges. A la fi de 2009, l’empresa, juntament ambel seu sistema de reconeixement de veu, es va vendre a Nuance,interessada en els algorismes de reconeixement de veu desenvolupatsper Spinvox.

RSS. Sigue informado

Et pot interessar:

Infografies | Fotografies | Investigacions