
La nueva versión del proyecto MarIA, el sistema de modelos de lengua creado en el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS), ya permite resumir textos existentes y crear nuevos textos a partir de titulares o de palabras, según anunció el jueves 11 de noviembre la Biblioteca Nacional de España (BNE).
Impulsado por el gobierno español desde su Secretaría de Estado de Digitalización e Inteligencia Artificial (Sedia) en el marco del Plan Nacional de Tecnologías del Lenguaje, MarIA es el primer sistema de inteligencia artificial masivo y experto en comprender y escribir en lengua española, y por su volumen y capacidades ha situado a ésta en el tercer puesto de los idiomas que disponen de modelos masivos de acceso abierto, después del inglés y el mandarín.
Se ha construido a partir del patrimonio documental digital de la BNE, que rastrea y archiva las webs elaboradas en español, y se ha entrenado con el superordenador MareNostrum 4 del BSC. Y se publica en abierto para que pueda ser aprovechado por desarrolladores de aplicaciones, compañías, grupos de investigación y la sociedad en general.
El entrenamiento de MarIA, sobre datos de la BNE, se ha basado en más de 135 mil millones de palabras (exactamente 135.733.450.668), que ocupan 570 gigabytes. El MareNostrum aporta una potencia de cálculo de 9,7 trillones de operaciones (969 exaflops). Un flop (operación de coma flotante) es la unidad de medida con que se expresa la capacidad de cálculo de un superordenador por segundo, y exa es el prefijo que expresa 1018, es decir, un trillón.
Modelos similares desarrollados anteriormente en inglés se utilizan para generar sugerencias de texto en aplicaciones de escritura, para resumir contratos o los complicados documentos que detallan las prestaciones de un producto, en función de lo que quiere saber cada usuario, o para buscar informaciones concretas dentro de grandes bases de datos de texto y relacionarlas con otras informaciones relevantes.
El objetivo de MarIA es aportar todas estas funcionalidades al español, lo que permitirá avanzar hacia el desarrollo de inteligencia artificial capaz de pensar en nuestro idioma, lo que multiplicará las oportunidades económicas para las empresas y la industria tecnológica española, según explicó la titular del Sedia, Carme Artigas.
Fuentes: BNE • Europa Press
- El español Félix Moyano recibió el Premio de Poesía Joven de RNE y Fundación Montemadrid - sábado 30 de septiembre de 2023
- La portuguesa Alice Vieira, Premio Iberoamericano SM de Literatura Infantil y Juvenil - sábado 30 de septiembre de 2023
- Mayte Gómez Molina gana el Miguel Hernández de poesía joven - sábado 30 de septiembre de 2023