Bienvenida sobre DokuPedia, wiki universitario. Se les invita a crear una cuenta y a contribuir, añadiendo un nuevo artículo o modificando éste. Los lectores y contribuidores no deben olvidar consultar las advertencias jurídicas.
Hay actualmente 41 artículos en construcción permanente...
Google Custom Search

Recuperación de información en las bibliotecas digitales

De DokuPedia

Portada > Tecnologías de la información y la comunicación > Automatización de unidades y servicios de información

[editar] Concepto:

El termino “recuperación de información” se emplea desde hace más de 50 años y describe el proceso de búsqueda y recuperación de información almacenada en un sistema, de acuerdo a unos criterios fijados, de manera que ésta sea la más relevante y pertinente.

Los modelos de búsqueda han variado en el tiempo y podemos clasificarlos en tres grandes grupos:

  1. Modelos booleanos: simples, basados en la teoría de conjuntos del algebra de Boole. Combina palabras clave y operadores. Su mayor inconveniente es que no permite la parcialidad, y los documentos son relevantes o no relevantes.
  2. Modelos vectoriales: permite ponderar, asignar pesos, a los términos de indización y a las consultas. Permite coincidencias parciales y ranking por relevancia.
  3. Modelos probabilísticos: recupera documentos cuya posibilidad de ser relevantes supere la de ser irrelevantes.

Del mismo modo, el concepto de biblioteca ha ido cambiando y surge con fuerza la “Biblioteca Digital”. Esta nueva biblioteca del siglo XXI, la definen los bibliotecarios de la Fenwick Library of George Mason University como:

Un concepto de servicio más que un lugar, como una organización de información que hace uso de las nuevas tecnologías con el fin de alcanzar la misión y los objetivos para los que se ha creado (Hurt, C.S., 1992)

Las bibliotecas digitales ofrecen cada día un mayor número de servicios, disponen de información en distintos soportes y son el puente entre el usuario y los documentos que pueden estar en cualquier punto de la red. Relacionan el espacio documental, los objetos de información, el espacio conceptual, el contexto y los conocimientos requeridos para interpretar los documentos electrónicos. Junto al tradicional OPAC, pueden ofrecer acceso a resúmenes de revistas o a texto completo de artículos, a obras digitalizadas y a bases de datos.

La recuperación de información de forma sencilla y desde el punto de vista del usuario se hace cada día más necesaria. Acceso, búsqueda, recuperación, browsing y navegación son los fines fundamentales del modelo de la biblioteca digital.

Se impone el diseño de sistemas integrados que abarquen los procesos de tratamiento y análisis documental, los interfaces con el usuario y los protocolos de accesos y de intercambio de datos.

Otro aspecto importante a tener en cuenta es la normalización en el tratamiento, descripción y catalogación de la información, que permitirá una recuperación más relevante y un intercambio de datos entre diferentes bibliotecas digitales, permitiendo ahorros en los procesos, además de conseguir aumentar el grado de satisfacción del usuario.

Dentro de la normalización coexisten diferentes propuestas, todas ellas complementarias. El control del vocabulario, mediante los Tesauros como herramienta para la doble función de normalización-recuperación, especializados por áreas del conocimiento, con sus descriptores y relaciones jerárquicas y de asociación entre los términos; tratamiento de metadatos ("datos sobre los datos que contienen los documentos”), con la iniciativa Dublín Core al frente, cuyo objetivo es la normalización de la información de descripción de un documento electrónico; protocolos de transferencia como el Z39.50; utilización del lenguaje natural; metabuscadores en el entorno de la bibliotecas digitales que permitan la búsqueda en los diferentes sistemas y bases de datos y agentes inteligentes.

Con el fin de acabar con el caos de la diferentes propuestas de metadatos, el W3C (World Wide Web Consortium) propuso la RDF (resource description framework), norma cuyo fin es facilitar el intercambio de información entre varios sistemas de metadatos,facilitando la integración entre diversas colecciones.


[editar] Recursos relacionados:

Opac, control de vocabulario, tesauros y metadatos:

  • Segunda edición del libro de Frederick Wilfrid Lancaster, Vocabulary control for information retrieval, traducido al español, publicado en 2002, por la Universitat de Valencia. [1]
  • El Tesauro de Ciencias de la Documentación de la Universidad de León [2]
Ejemplo de un tesauro, concebido como instrumento normalizador e inductor para el doble proceso de indización-recuperación de los contenidos científicos de la Documentación.
Se compone de cuatro índices: jerárquico, alfabético, permutado KWOC e índice inglés-español.
Acceso a la iniciativa Dublin Core, conocer objetivos, avances y situación actual. Profundiza en la utilización y normalización de metadatos para recuperación de documentos electrónicos.
  • RODRIGUEZ MEDEZ, E.Mª. RDF: UN MODELO DE METADATOS FLEXIBLE PARA LAS BIBLIOTECAS DIGITALES DEL PRÓXIMO MILENIO [5]
Resource Description Framework(RDF), modelo de metadatos basado en XML, línea de investigación de formatos flexibles para la estructuración de información en biblitecas digitales.
  • Tavieso Rodríguez, C. Evaluación de los catálogos en línea (OPAC) de las bibliotecas universitarias[6]pautas :El estudio tiene por objeto emplear un instrumento de valoración, que diseñaron basándose en las propuestas de la IFLA (1998 y 2003) para la correcta presentación de los registros bibliográficos en las pantallas de los catálogos, y comprobar en que medida se ajustan los OPACS de la bilbiotecas universitarias españolas a estas pautas internacionales.
  • Agentes inteligentes en la búsqueda y recuperación de la información [7]
IR, buscadores y agentes inteligentes.
  • ARCHUBY, G. et al. Interface de recuperación para catálogos en línea con salidas ordenadas por probable relevancia. Ci. Inf., set./dic. 2000, vol.29, no.3, p.05-13. ISSN 0100-1965. [8]
Desarrollo realizado de un interface basado en el concepto de similaridad con el fin de generar resultados ordenados por posible relevancia.
  • MORA MARCOS, M.C. Diversos modos de acceso a catalogos en linea a traves de internet, 1999 [9]
Describe las tres formas de acceso a los OPAC e iniciativas existentes.

Modelos de búsqueda y estudios comparativos

  • Modelo probabilístico del "Centre for Interactive Systems Research Department of Information Science- City University (Londres)" [10]
Detalles de su modelo de búsqueda probabilístico de recuperación de información y su extensión a nuevas áreas como las multimedia.
  • Center for Intelligent Information Retreival[11]
El objetivo de este centro es el desarrollo de herramientas que proporcionen el acceso y recuperación de diferente tipología de documentación en bases de datos.
  • MARTÍNEZ COMECHE, J.A. Los modelos clásicos de Recuperación de información y su vigencia. [12]
  • Modelos alternativos de búsqueda de información [13]
  • Recuperación de información en Internet [14]
El trabajo contrasta documentos y sistemas tradicionales de recuperación con los de Internet, describe 4 sistemas de acceso.
  • MARIN MILANES, F. Repensando la figura del usuario de la información. ACIMED. [online]. sep.-oct. 2006, vol.14, no.5 [citado 05 Junio 2007] [15]
Trata la figura del usuario como centro de un sistema de información
Herramientas personales