Ya está disponible en Internet el corpus lingüístico de la revista CONSUMER EROSKI

La herramienta muestra cómo se ha utilizado una palabra o expresión en la revista CONSUMER EROSKI en los cuatro idiomas en los que se ha editado esta publicación
Por mediatrader 21 de enero de 2010
Img eroskientrega2 noticia
Imagen: CONSUMER EROSKI

El corpus lingüístico de Consumer Eroski está disponible desde hoy en Internet y es fruto de la colaboración entre la Fundación Eroski, Ingeniería Lingüística Eleka y la Fundación Elhuyar para la ciencia y la tecnología. Esta herramienta permite realizar búsquedas de palabras que se muestran en su contexto real, tal y como se utilizaron en la revista Consumer Eroski, y traducidas al resto de idiomas de la revista. La interfaz se encuentra alojada en corpus.consumer.es y permite hacer búsquedas de palabras declinadas y sin declinar, combinando sustantivos con adjetivos y verbos y eligiendo los idiomas en los que se desea ver el resultado. Es, por tanto, una herramienta plurilingüe que puede servir como diccionario de uso de términos de consumo, además de ser útil para el trabajo de filólogos, linguistas, autores de diccionarios, investigadores y traductores.

El Director General de Eroski espera que sea útil a linguistas, especialistas y lectores, ya que en materia de consumo «nadie trata tantos temas como nosotros y nadie es más leído»

El corpus recoge todos los textos publicados en la revista Consumer Eroski en Internet desde 1998 y refleja, en palabras de Agustín Markaide, Director General de Eroski, el compromiso de esta empresa con la sociedad. «Somos los más leídos en materia de consumo en castellano, euskera, gallego y catalán», ha dicho, subrayando que ese saber se muestra ahora como corpus lingüístico «para provecho de toda la sociedad».

El trabajo de la Fundación Elhuyar y Eleka actualiza y completa la labor realizada hace varios años por el profesor Asier Alcázar de la Universidad de Missouri (Estados Unidos), que realizó el primer corpus tetralingüe de Consumer Eroski con ayuda de la Universidad de Vigo. El Director General de Eroski se ha mostrado orgulloso de poner a disposición de los lectores de Consumer Eroski esta herramienta, la primera de su ámbito que se ofrece en cuatro idiomas. El acto oficial de presentación ha tenido lugar en la sede de la Real Academia de la Lengua Vasca, cuyo presidente, Andrés Urrutia, ha destacado el lugar estratégico de los corpus en el estudio de la lengua y ha agradecido el compromiso de Eroski con la normalización lingüística.

Herramienta útil

Img
Imagen: CONSUMER EROSKI

La relevancia de los corpus lingüísticos en la labor de filólogos y estudiosos de la lengua es indiscutible. Así lo han constatado los expertos reunidos en el seminario «Importancia actual de los Corpus Lingüísticos» organizada en la sede de la Real Academia de la Lengua Vasca. El profesor de la Universidad de Vigo Xabier Gómez Guinovart, experto en corpus textuales y planificación lingüística, ha explicado que son la clave para hacer mejores diccionarios, crear traductores automáticos (como el de Google) o analizar la gramática y el uso del idioma. Ha destacado que, en algunos casos, incluso sirven en sí mismos como diccionarios. «No existe» ha dicho, «un diccionario catalán-gallego, por ejemplo, pero uno puede acceder al corpus de Consumer Eroski, hacer una consulta de un término en gallego y encontrar su equivalente en catalán».

Miriam Urkia, filóloga y miembro de número de la Real Academia de la Lengua Vasca, ha explicado que la realización de corpus lingüísticos ha cambiado la manera de trabajar de filólogos y lingüistas, ya que se han revelado como una herramienta excepcional para conocer el verdadero uso de la lengua. «Prácticamente todas las lenguas cuentan con un corpus de referencia» ha dicho, poniendo como ejemplo el Corpus de la Real Academia de la Lengua Española, que ha servido para actualizar el Diccionario de la RAE o el Bank of English, que recoge textos de medios de comunicación anglosajones y tiene, en este momento, más de 2,5 billones de palabras.