Arquitectura de bases de datos para buscadores web

¿Qué es recuperación de la información?

La recuperación de datos, en el contexto de un sistema IR, consiste principalmente en la determinación de qué documentos de una colección contienen las palabras claves de una pregunta de usuario, para satisfacer la necesidad de información del usuario.

Los datos se pueden estructurar en tablas, árboles, etc. para recuperar exactamente lo que se quiere. El texto no tiene estructura clara y no es fácil crearla.

Un ejemplo de Recuperación de información sería, la web

ejemplo

Dos grandes etapas para abordar el problema:

  • Elegir un modelo que permita calcular la relevancia de un documento frente a una consulta.
  • Diseñar algoritmos y estructuras de datos que lo implementen eficientemente (Índices).

Objetivos

Poder entender la descripción de un Sistema de RI (SRI).
Conocer los conceptos necesarios para implementar un SRI.
Comprender los principales aspectos de un SRI sobre la Web.

Temas

Para facilitar el seguimiento de los contenidos, esta sección está estructurada en varias subsecciones: Arriba

Bibliografía


  • Modern Information Retrieval. R. Baeza-Yates y B. Ribeiro-Neto. Addison-Wesley, 1999.
  • Managing Gigabytes. Witten, A. Moffat y T. Bell. Van Nostrand Reinhold, 2da edición, 1999.
Arriba    

Raquel Esteban Navazo

Alumna de Ingeniería en Informática , en la Universidad Carlos IIIde Madrid