background preloader

Information Retrieval

Facebook Twitter

Book. Www.dcs.gla.ac.uk/Keith/Preface.html. A book by C. J. van RIJSBERGEN B.Sc., Dip. NAAC, Ph.D., M.B.C.S., F.I.E.E., C.Eng., F.R.S.E. Information Retrieval Group, University of Glasgow PREFACE TO THE SECOND EDITION (London: Butterworths, 1979) The major change in the second edition of this book is the addition of a new chapter on probabilistic retrieval.

PREFACE TO THE FIRST EDITION (London: Butterworths, 1975) The material of this book is aimed at advanced undergraduate information (or computer) science students, postgraduate library science students, and research workers in the field of IR. I had to face the problem of balancing clarity of exposition with density of references. Normally one is encouraged to cite only works that have been published in some readily accessible form, such as a book or periodical. I should like to acknowledge my considerable debt to many people and institutions that have helped me. C.J.v.R. Preface 1. 2. 3. 4. 5. 6. 7. 8. Bibliography The book is also available in Adobe Acrobat format Preface 1. 2. 3. 4. Modelos de Recuperacion y organizacion de la informacion- Modelos de recuperacion. Www.cs.cmu.edu/~jgc/publication/MMR_DiversityBased_Reranking_SIGIR_1998.pdf.

Diseño de un motor de recuperación de la información para uso experimental y educativo. Diseño de un motor de recuperación de la información para uso experimental y educativo [versió catalana] Carlos G. FiguerolaFacultad de Documentación Universidad de Salamancafigue@gugu.usal.esJosé Luis Alonso BerrocalFacultad de Documentación Universidad de Salamancaberrocal@gugu.usal.esÁngel Francisco Zazo RodríguezFacultad de Documentación Universidad de Salamancaafzazo@gugu.usal.es Resumen Se describe el diseño y funcionamiento de un motor de recuperación de información, basado en el modelo vectorial y cuya finalidad es servir de base de experimentación en tareas de investigación, así como de recurso para la docencia.

No obstante, el motor resulta completamente operacional, y puede ser utilizado en entornos documentales. Ilustración 7. Eprints.rclis.org/13963/1/zazo2002recuperacion.pdf. Diseño de un motor de recuperación de la información para uso experimental y educativo. MODELOS DE RECUPERACION DE INFORMACION - Modelo de Espacio Vectorial. Modelo de Espacio Vectorial En el modelo de espacio vectorial, los documentos y las búsquedas se interpretan como vectores de términos. Representando cada término en el vector con un peso w dentro de ese documento. La función de similaridad entre el documento y una búsqueda será el coseno del ángulo entre los vectores que los representan. Basándonos en esta representación la función de similaridad dará valores entre 1 (d = q) y 0 (cuando d y q no compartan términos. La funcionalidad de este modelo estriba en la elección correcta de los pesos de cada termino.

Para que la recuperación de información sea efectiva, tendremos que elegir unos pesos mayores para las palabras que tengan más relevancia en el documento (Palabras que aparecieran en búsquedas anteriores, por ejemplo). Para modelizar este comportamiento, los documentos se pueden utilizar modelizando los documentos en Clusters. Un modelo para el reparto de pesos típico sería tf-idf, donde el peso w sería wd,t = tfd,t x idft.