HP y CVC crearán buscador panhispánico
La sección española de la empresa de tecnología Hewlett
Packard anunció el 10 de diciembre de 2003 la creación del Buscador
General Panhispánico, que realizará conjuntamente con el Instituto
Cervantes para el Centro Virtual
Cervantes. HP Española dona la tecnología y la experiencia necesarias para
soportar una gran base documental diseñada por el Instituto Cervantes que
permitirá, mediante búsquedas inteligentes, localizar información cultural de
calidad publicada en Internet relacionada con la lengua española.
Gestionada por el personal del Instituto Cervantes y patrocinada por Telefónica,
esta fuente de información de la cultura hispana estará disponible para su
consulta por parte del público general del Centro Virtual Cervantes en un
futuro cercano.
Para facilitar la ordenación y catalogación de esta información, se
desarrollará un potente robot capaz de rastrear en Internet y seleccionar los
documentos más relevantes de la cultura y de la lengua española, un sistema
para indexar automáticamente los resultados obtenidos y mantener actualizada la
información y otro para gestionar la clasificación de los contenidos.
Además, como tecnología lingüística de valor añadido, se desarrollarán
herramientas para agilizar las búsquedas con filtros semánticos, así como
para revisar la morfosintaxis de textos en español y evaluar la calidad del
lenguaje en los documentos localizados.
La información proporcionada por el Buscador Panhispánico será accesible
por el gran público, permitiéndose la definición de una jerarquía de
perfiles para proteger información privada. La consulta de datos admitirá
varias categorías de búsqueda —búsqueda exacta, búsqueda patronal y
búsqueda basada en redes semánticas— y una serie de funcionalidades
adicionales facilitadas por un sistema de gestión documental.
La información catalogada procedente de Internet estará sometida a un
proceso constante de actualización y revisión para evitar la presentación de
contenidos obsoletos. Además, mediante un sistema de control de versiones, se
podrá acceder a datos que, en su día, estuvieron publicados en la red y luego
fueron retirados.
Los principales módulos a desarrollar son un "metabuscador" o
localizador potente de enlaces, que recopilará información relevante
incluyendo un sumario de contenidos basado en la propia consulta, que podrá
archivarse por el usuario o por tema de catalogación; y una herramienta de
catalogación, que facilita las consultas mediante fichas catalográficas, que
permite agrupar la información en colecciones y categorías que, según el
perfil del usuario, podrá ser copiada, movida, eliminada o dada de alta en el
sistema al servicio del gran público.
También habrá un robot para descargar y actualizar las páginas de cada
enlace; y un buscador para atender las consultas de los usuarios del portal que
permitirá recuperar información previamente catalogada en el sistema.
Para configurar la infraestructura tecnológica del proyecto del Centro
Virtual Cervantes, HP ha donado potentes equipos y servicios de soporte. Entre
el hardware aportado por HP, destaca un servidor HP Integrity con
procesadores Itanium, capaz de ejecutar cuatro sistemas operativos: Windows,
Linux, Unix y VMS.
Más noticias en esta edición: |
|