Noticias
Guillermo Rojo
Al frente del Corpes XXI, Rojo coordina a un equipo en el que participan académicos de todo el mundo de habla hispana.
Corpus del Español del Siglo XXI tendrá 300 millones de formas en 2014
¡Comparte este contenido! Compartir en Facebook Compartir en X Compartir en WhatsApp Enviar por correo

La Real Academia Española (RAE) y el Banco de Santander renovaron este 8 de marzo el convenio de colaboración que mantienen desde 2007 y que permitirá la culminación del Corpus del Español del Siglo XXI (Corpes XXI) y el proceso de digitalización y actualización tecnológica del archivo académico.

Según el acuerdo suscrito por José Manuel Blecua, director de la RAE, y Emilio Botín, presidente de Banco Santander, y que se mantendrá hasta 2014, esta entidad bancaria aportará 700.000 euros para proyectos de la RAE, especialmente el Corpes XXI, cuyo objetivo final es reunir, en 2014, un total de 300 millones de formas y palabras de la lengua común de 450 millones de hispanohablantes.

Este corpus, que actualmente cuenta con cerca de 100 millones de formas, se elabora a partir de textos orales y escritos. El material proviene tanto de medios impresos —libros y prensa— como de contenidos publicados en Internet o emitidos en canales de información audiovisual, informa la RAE en una nota.

Los textos que sirven de base al Corpes XXI reflejan el español de todo el mundo a través de un 30% de formas procedentes de España y 70% restante de América.

El resultado de esta “ambiciosa recopilación” será “la creación de una gran base de datos que, unida a un potente programa de recuperación, permitirá consultar los ejemplos por países, fechas o temas”, se añade en la nota.

Coordinado por el académico español Guillermo Rojo, el Corpes XXI es una iniciativa de la RAE y de la Asociación de Academias de la Lengua Española (Asale), en la que trabajan, además del equipo central, ocho equipos externos a las academias.

Seis de esos equipos son de diferentes universidades españolas —Alcalá de Henares, Autónoma de Barcelona, León, Salamanca, Santiago de Compostela y Valencia—, la Academia Argentina de Letras y la Fundación Comillas.

El Corpes XXI supone la continuación del trabajo realizado con los corpus Corpus de Referencia del Español Actual (Crea) y Corpus Diacrónico del Español (Corde). Este último cuenta con cerca de 300 millones de formas desde los orígenes del idioma hasta 1974, y el Crea, con 155 millones de formas desde 1975 hasta 2004.

El convenio incluye también el apoyo económico para dotar al Archivo de la RAE de los medios tecnológicos necesarios para realizar sus funciones de difusión y conservación.

El proyecto contempla dos fases: la informatización de las fichas descriptivas y la digitalización de las series documentales de mayor valor testimonial e histórico.

Inicialmente, con motivo de la conmemoración de su tercer centenario, la RAE abordará el tratamiento de la documentación correspondiente al siglo XVIII, a la par que la descripción, indización y digitalización de los 62 libros manuscritos de actas de sesiones plenarias, en los que, desde su fundación en 1713, los distintos secretarios de la corporación han ido registrando escrupulosamente el acontecer académico.

Fuente: EFE