O corpus lingüístico de Consumer Eroski está dispoñible desde hoxe en Internet e é froito da colaboración entre a Fundación Eroski, Enxeñaría Lingüística Eleka e a Fundación Elhuyar para a ciencia e a tecnoloxía. Esta ferramenta permite realizar procuras de palabras que se mostran no seu contexto real, tal e como se utilizaron na revista Consumer Eroski, e traducidas ao resto de idiomas da revista. A interface atópase aloxada en corpus.consumer.es e permite facer procuras de palabras declinadas e sen declinar, combinando substantivos con adxectivos e verbos e elixindo os idiomas nos que se desexa ver o resultado. É, por tanto, unha ferramenta plurilingüe que pode servir como dicionario de uso de termos de consumo, ademais de ser útil para o traballo de filólogos, linguistas, autores de dicionarios, investigadores e tradutores.
O Director Xeral de Eroski espera que sexa útil a linguistas, especialistas e lectores, xa que en materia de consumo “ninguén trata tantos temas como nós e ninguén é máis lido”
O corpus recolle todos os textos publicados na revista Consumer Eroski en Internet desde 1998 e reflicte, en palabras de Agustín Markaide, Director Xeral de Eroski, o compromiso desta empresa coa sociedade. “Somos os máis lidos en materia de consumo en castelán, eúscaro, galego e catalán”, dixo, subliñando que ese saber se mostra agora como corpus lingüístico “para proveito de toda a sociedade”.
O traballo da Fundación Elhuyar e Eleka actualiza e completa o labor realizado hai varios anos polo profesor Asier Alcázar da Universidade de Missouri (Estados Unidos), que realizou o primeiro corpus tetralingüe de Consumer Eroski con axuda da Universidade de Vigo. O Director Xeral de Eroski mostrouse orgulloso de pór a disposición dos lectores de Consumer Eroski esta ferramenta, a primeira do seu ámbito que se ofrece en catro idiomas. O acto oficial de presentación tivo lugar na sede da Real Academia da Lingua Vasca, cuxo presidente, Andrés Urrutia, destacou o lugar estratéxico dos corpus no estudo da lingua e agradeceu o compromiso de Eroski coa normalización lingüística.
Ferramenta útil
A relevancia dos corpus lingüísticos no labor de filólogos e estudiosos da lingua é indiscutible. Así o constataron os expertos reunidos no seminario “Importancia actual dos Corpus Lingüísticos” organizada na sede da Real Academia da Lingua Vasca. O profesor da Universidade de Vigo Xabier Gómez Guinovart, experto en corpus textuais e planificación lingüística, explicou que son a clave para facer mellores dicionarios, crear tradutores automáticos (como o de Google) ou analizar a gramática e o uso do idioma. Destacou que, nalgúns casos, mesmo serven en si mesmos como dicionarios. “Non existe” dixo, “un dicionario catalán-galego, por exemplo, pero uno pode acceder ao corpus de Consumer Eroski, facer unha consulta dun termo en galego e atopar o seu equivalente en catalán”.
Miriam Urkia, filóloga e membro de número da Real Academia da Lingua Vasca, explicou que a realización de corpus lingüísticos cambiou a maneira de traballar de filólogos e lingüistas, xa que se revelaron como unha ferramenta excepcional para coñecer o verdadeiro uso da lingua. “Practicamente todas as linguas contan cun corpus de referencia” dixo, pondo como exemplo o Corpus da Real Academia da Lingua Española, que serviu para actualizar o Dicionario da RAE ou o Bank of English, que recolle textos de medios de comunicación anglosaxóns e ten, neste momento, máis de 2,5 billóns de palabras.