Publica tu libro con Letralia y FBLibros Saltar al contenido

La RAE avanza en la segunda fase de su iniciativa de inteligencia artificial

viernes 15 de marzo de 2024
¡Comparte esto en tus redes sociales!
Santiago Muñoz Machado
Santiago Muñoz Machado, director de la RAE: “Esto no forma parte de la actividad tradicional de la Academia, pero esto es la tecnología. Y la tecnología no hay quien la pare”. Fotografía: RAE

La Real Academia Española (RAE) ya arrancó la segunda fase del Proyecto Leia (Lengua Española e Inteligencia Artificial) para la creación de herramientas, tecnologías y aplicaciones digitales que utilicen y proyecten nuestro idioma en el ámbito de la inteligencia artificial, según informó la institución en un encuentro con los medios el jueves 14 de marzo.

En esta nueva etapa del proyecto se trabaja en la creación de un observatorio de neologismos, tecnicismos, términos y variaciones del español, y de herramientas de verificación ortográfica, gramatical y léxica y de respuesta a consultas lingüísticas; la recopilación de material basado en la diversidad de las variedades geográficas del español; el análisis y la aplicación de la accesibilidad de las herramientas de inteligencia artificial; la mejora de herramientas de regulación de la lengua, y labores de digitalización de fondos propios de la RAE. Además, para apoyar las pruebas y el desarrollo de estas tareas, está prevista la realización de diversos retos, entre otras cuestiones.

“Hay gente que piensa que si no estamos metiéndonos en un terreno que no forma parte de la actividad ordinaria de la Academia. Y tienen razón. Esto no forma parte de la actividad tradicional de la Academia, pero esto es la tecnología. Y la tecnología no hay quien la pare”, aseguró el director de la RAE, Santiago Muñoz Machado.

Las aplicaciones resultantes de esta segunda fase de Leia, que cuenta con 5 millones de euros, estarán disponibles de manera gratuita en una plataforma a través de la página web de la RAE a mediados de 2025, con el objetivo de la “defensa, proyección y buen uso del español en el universo digital” y, especialmente, de la inteligencia artificial, según indicó la académica y experta en la materia Asunción Gómez-Pérez.

A través de colaboraciones con empresas tecnológicas a nivel nacional e internacional, así como del apoyo gubernamental, Leia trabaja para garantizar que los sistemas y aplicaciones digitales utilicen el español de manera correcta. Además, con la reciente aprobación del RD 632/2022, se otorga una subvención de cinco millones de euros a la RAE por parte de la Secretaría de Estado de Digitalización e Inteligencia Artificial (SEDIA), como parte del Plan de Recuperación, Transformación y Resiliencia. Estas iniciativas buscan fortalecer el papel del español en la era digital y aprovechar la inteligencia artificial para promover su buen uso entre los usuarios.

El observatorio de neologismos, términos y variaciones del español en el que trabaja Leia en esta segunda fase será una herramienta capaz de detectar automáticamente, en el universo digital y a partir de un buen número de fuentes (obras académicas, corpus, prensa, redes sociales…), palabras y expresiones que por distintos motivos no están registradas en el Diccionario de la lengua española (DLE) u otras obras académicas, así como nuevos usos de palabras. Estos términos serán principalmente neologismos, derivados, tecnicismos, regionalismos y extranjerismos.

Esta herramienta permitirá a los equipos lingüísticos de la RAE observar diariamente palabras que puede ser conveniente estudiar. Luego la plataforma mostrará públicamente una selección de esas palabras en observación con información sobre su uso.

El observatorio ofrecerá tanto datos sobre términos de uso actual como sobre nuevos significados de palabras que ya contaban con un amplio recorrido en nuestra lengua. Estos comentarios siempre serán provisionales, ya que al no estar incluidos en las obras académicas podrán verse modificados en el futuro.

Por otra parte, se creará un verificador lingüístico en abierto que se alojará, asimismo, en la página de Leia, accesible desde la web de la RAE, y que permitirá a los usuarios introducir un texto para comprobar si es correcto desde un punto de vista ortográfico, gramatical y léxico.

El verificador hará sugerencias de cambio que expliquen el problema detectado y envíen al lugar donde se trata la cuestión, dentro de las obras de la RAE. Para el perfeccionamiento durante la creación de este recurso, que estará interconectado con los otros desarrollos de la plataforma, el trabajo interno se complementará con encuentros (como hackathons) para poner a prueba el funcionamiento de la herramienta y fomentar su conocimiento entre el público especializado o con inquietudes por la aplicación de las nuevas tecnologías en la lengua.

Otra parte del proyecto es la creación de una herramienta para dar respuesta a las dudas lingüísticas de los hispanohablantes. Se podrá introducir una consulta en un buscador y el sistema seleccionará la respuesta de entre los cientos de miles almacenadas en la plataforma. En caso de que el sistema aún no tenga una respuesta exacta para la pregunta planteada, el usuario podrá enviarla a través de un cuestionario y recibirá la contestación personalizada de los lingüistas de la RAE.

Otra línea del proyecto Leia es la recopilación de material de las distintas variedades geográficas del español (especialmente léxico y oral). Para hacer esta radiografía de la diversidad de nuestra lengua, se creará una sección interactiva en la que los hispanohablantes puedan aportar información en relación con imágenes, textos u otros elementos que se les muestren.

La participación ciudadana será clave en este apartado del proyecto, en el que, por ejemplo, los usuarios podrán ver una imagen y describirla con su propia voz, u observar un objeto e indicar cómo lo llaman en su lugar de procedencia. Con estas grabaciones, se pretende crear un corpus oral que permita entrenar a los sistemas o aplicaciones en los distintos acentos para que puedan reconocerlos con facilidad.

A fin de garantizar que la consulta de sus resultados sea accesible para todos, Leia implementará medidas de accesibilidad que se aplicarán a sus espacios digitales públicos.

También se trabaja en la mejora de herramientas tecnológicas de la RAE que se emplean en las labores de regulación de la lengua, con el fin de optimizarlas para la mejor difusión y aplicación de sus contenidos, y en la continuación de la digitalización de parte de los fondos y obras de la Academia.

Por último, se pretende organizar retos (hackathons y datathons) en los que se plantee una cuestión relacionada con el proyecto a un gran número de participantes y se pidan posibles opciones, entre otros aspectos. La idea principal es compartir los resultados y avances con la comunidad investigadora y universitaria, y que su talento sea partícipe de Leia.

Junto a estos servicios, también se pondrán a disposición pública, de manera abierta en los formatos adecuados, y siempre que sea posible, los materiales generados para la creación de este proyecto (como códigos fuente, datos o corpus de entrenamiento). De esta manera, las infraestructuras lingüísticas y los materiales desarrollados gracias a esta vertiente del proyecto contribuirán a impulsar la industria de las Tecnologías del Lenguaje en español.

Las tareas explicadas anteriormente se han dividido en distintos paquetes de trabajo. Para su ejecución, la RAE cuenta con su personal interno, así como con la participación de empresas externas subcontratadas en los términos establecidos por el real decreto. Hasta el momento, estas compañías son Fujitsu, con tecnología de Amazon Web Services (AWS), para los paquetes correspondientes al observatorio, verificador, diversidad y accesibilidad, y VASS, para la elaboración de la herramienta de consultas y respuestas.

Fuentes: Europa PressRAE
Letralia

¡Comparte esto en tus redes sociales!
correcciondetextos.org: el mejor servicio de corrección de textos y corrección de estilo al mejor precio