Details

Elaboración de un tesauro de información de actualidad y conversión en red semántica para su empleo en un sistema de recuperación periodístico.

by Castillo Blasco, Lourdes

Abstract (Summary)
RESUMEN Las experiencias iniciales con el motor de búsqueda e indización automática RetrievalWare en un centro de documentación de información de actualidad, demostraron que las asociaciones semánticas establecidas en el diccionario del sistema no ofrecían un rendimiento totalmente satisfactorio para este tipo de centros. La razón principal es la naturaleza de la red incorporada, elaborada a partir de un diccionario enciclopédico general. Por ello este trabajo plantea la posibilidad de adaptar un tesauro tradicional a las estructuras de diccionarios de este sistema y comparar el efecto de la utilización de un lenguaje controlado (tesauro) y una red semántica basada en unitérminos del lenguaje natural sobre una misma colección documental (base de datos Prensa) y sobre un sistema de recuperación basado en un motor de recuperación y de indización automática (RetrievalWare). Para conseguir este objetivo general ha sido necesario llevar a cabo la creación de un vocabulario controlado, un tesauro de información de actualidad; la conversión de las relaciones paradigmáticas de este tesauro en relaciones cuantitativas, de las que se emplean en redes semánticas, comprobar su funcionamiento y realizar una valoración paralela del rendimiento en la recuperación del tesauro construido y convertido en red semántica y de la red semántica prediseñada por los distribuidores de RetrievalWare. El plan de trabajo y la metodología correspondiente se ha dividido en tres fases, atendiendo a los objetivos planteados. La primera fase ha consistido en la selección y registro de términos. Las fuentes empleadas para la extracción de los términos han tenido en cuenta tanto el criterio de autoridad literaria como el criterio de autoridad del usuario. En la segunda fase se ha elaborado el tesauro con los términos seleccionados utilizando la base de datos relacional Access y en la última fase se han exportado, también mediante Access, los términos del tesauro a un informe compatible con la estructura de la red semántica de RetrievalWare. Para la comprobación automática de errores se han utilizado programas de gestión automática de tesauros. Posteriormente se han realizado pruebas del funcionamiento del nuevo tesauro incorporado como red y además se ha comparado su rendimiento con el diccionario establecido por el sistema. El estudio del rendimiento emplea a usuarios reales que expresan sus solicitudes de información y, posteriormente, juzgan la relevancia de los resultados obtenidos en los procesos de búsqueda, permitiendo el cálculo de exhaustividad y precisión de cada sistema.
Bibliographical Information:

Advisor:De la Cueva Martín, Alejandro

School:Universitat de València

School Location:Spain

Source Type:Master's Thesis

Keywords:història de la ciència i documentació

ISBN:

Date of Publication:09/25/2006

© 2009 OpenThesis.org. All Rights Reserved.