La Comisión Europea facilita la traducción asistida por ordenador y hace accesible al público sus bases de terminología

La recopilación de, aproximadamente, un millón de frases efectuada por la Comisión y la oferta de una traducción de calidad de las mismas en 22 de las 23 lenguas oficiales de la UE – entre las que se incluyen las de los nuevos Estados miembros – es la mayor jamás realizada en tantas lenguas y se halla ahora a disposición del público de forma gratuita. Este tipo de datos son muy buscados por quienes trabajan en el desarrollo de sistemas de traducción automática por ordenador en los que los programas de traducción «aprenden» a traducir correctamente y en contexto palabras y frases a partir de textos traducidos por profesionales. Dichos datos pueden contribuir asimismo al desarrollo de otras aplicaciones informáticas lingüísticas tales como los correctores gramaticales y ortográficos, los diccionarios en línea y los sistemas de clasificación de textos multilingües.

Por su parte, Janez PotoÄnik, Comisario Europeo de Investigación y Ciencia, ha manifestado que «esta recopilación única de datos lingüísticos contribuye a la creación de una nueva generación de programas informáticos para el tratamiento del lenguaje humano y ayuda a estimular la competitividad de la industria del lenguaje, una de las que está registrando un crecimiento más rápido en la Unión Europea».

Las instituciones de la UE poseen mayor cantidad de textos multilingües que ninguna otra organización debido a la exigencia de disponer de la legislación de la UE en las 23 lenguas oficiales. Sus servicios de traducción trabajan con 253 pares posibles de combinaciones lingüísticas y producen aproximadamente 1,5 millones de páginas traducidas al año.

Aunque en Internet pueden encontrarse numerosas traducciones de textos del francés o del inglés, dichos recursos escasean cuando se trata de lenguas tales como el letón o el rumano, y son prácticamente inexistentes en el caso de combinaciones de dos lenguas en relación con las cuales existen pocos recursos.

Así pues, la Comisión, gracias a la cooperación de sus traductores y expertos científicos, está publicando una vasta recopilación de frases procedentes de textos legales que cubren los ámbitos técnico, político y social, y están disponibles en 22 idiomas oficiales. En este fondo de traducción es posible encontrar frases con su equivalencia en todas las demás lenguas oficiales. Sólo las traducciones al gaélico no están aún disponibles. La publicación de estos datos lingüísticos constituye un buen ejemplo de la declarada política de la Comisión de reutilización de las fuentes de información y se produce tras la apertura al público de las bases de datos documentales y terminológicas Eur-Lex y IATE.

La Comisión posee una amplia experiencia en el desarrollo de aplicaciones de tratamiento de textos multilingües y se encuentra a la vanguardia del multilingüismo, ofreciendo nuevas páginas web de búsqueda de noticias abiertas al público, que cubren hasta 35 idiomas, a través de la aplicación denominada «European Media Monitoring». El Séptimo Programa Marco de investigación y desarrollo – en el campo temático de las tecnologías de la información y la comunicación – apoya la investigación en materia de traducción automática y otras tecnologías relacionadas con las lenguas.

más informaciones

descarga los tmx!

anotar / vermerken:
  • del.icio.us
  • Google Bookmarks
  • email
  • MisterWong
  • TwitThis
  • Facebook
  • PDF