OAI-PMH

estándar de interoperabilidad de metadatos

Open Archive Initiative-Protocol for Metadata Harvesting (OAI-PMH) está financiado por National Science Foundation, y tiene como misión desarrollar y promover estándares de interoperabilidad para facilitar la difusión eficiente de contenidos en Internet.

OAI-PMH

Se centra en la transmisión de metadatos sobre cualquier material en soporte electrónico. Es requisito que los metadatos puedan ser codificados en el modelo Dublin Core sin calificaciones, aunque, paralelamente a ello, se puede usar cualquier esquema de metadatos.[1]

Tiene su origen en la Convención de Santa Fe de 1999[2]​ y su primera versión se hizo pública en enero de 2001.

Historia

editar

Alrededor del año 1990 empezaron a surgir los primeros archivos, también llamados repositorios de documentos electrónicos. Se pretendía conseguir una comunicación activa de los resultados de las investigaciones, siendo conocidos estos documentos como EPrints. Los primeros repositorios que aparecieron eran temáticos. En 1991, Paul Ginsparg creó ArXiv.org especializado en física, más tarde generaron RePec dedicado íntegramente a la economía, de forma seguida CogPrints en materia de psicología, NCSTRL en informática y NDLTD en tesis.[3]

Los días 21 y 22 de octubre de 1999 se organizó la Convención de Santa Fe (Nuevo México, EUA) con la intención de llegar a un consenso en materia de interoperabilidad de archivos EPrints,[3]​ consiguiendo aumentar el impacto en la sociedad científica. Con este acuerdo, era viable intercambiar registros y, a su vez, realizar búsquedas en una misma materia o disciplina. En la reunión acudieron especialistas de bibliotecas digitales y representantes de los principales y más importantes repositorios (anteriormente mencionados).

Con la intención de encontrar nuevos modelos de comunicación científica, transformar los archivos en interoperables y construir servicios que recuperen información de distintos repositorios, se concretó la creación de un protocolo bautizado como OAI-PMH (Open Archives Initiative – Protocol for Metadata Harvesting).

Si es cierto que ya existía un protocolo llamado Z39.50, en este caso, era mucho más complejo y ofrecía otro tipo de servicios, como el control de sesiones. Además, Z39.50 daba ciertos problemas en los servicios de búsqueda a través de servidores autónomos. Las razones principales fueron: interpretaciones difusas, problemas de escalabilidad, dependencia de la disponibilidad de los servidores y rendimiento.

En los primeros años de OAI-PMH, el protocolo se basó en el prototipo UPS, modelo RePec, servicio SODA, protocolo Dienst y el trabajo del grupo Santa Fe. A partir del año 2000, se empezó a hacer diferentes reconsideraciones, el interés por este nuevo protocolo fue en aumento, hasta tal punto, que la iniciativa iba más allá de las comunidades EPrints.[2]

La Digital Library Federation y la Coalition of Networked Information, de Estados Unidos, ofrecieron soporte de su organización para el desarrollo de la iniciativa. Se crearon dos comités, uno de gestión y otro técnico, encargados de la coordinación del programa.

En 2001 y en fase experimental, llega OAI-PMH versión 1.0 con la introducción de los elementos del estándar Dublin Core no cualificado (metadatos descriptivos). Es lo mínimo para la interoperabilidad de los metadatos.

En junio de 2002 y arreglados los problemas de definición y funcionalidad, se lanzó la versión 2.0. El protocolo ya estable, tiene por objeto “el intercambio recurrente de metadatos de recursos entre distintos sistemas”. Se estuvo trabajando en el proyecto SOAP (Simple Object Access Protocol) hasta la versión 1.2. El grupo de trabajo se cerró en 2009.

Características

editar

El Protocolo OAI-PMH presenta las siguientes características:[4]

  1. Su funcionamiento se basa en una arquitectura cliente-servidor en la que un servicio recolector de metadatos pide información a un proveedor de datos.
  2. Las peticiones se expresan en HTTP, utilizando únicamente los métodos GET o POST.
  3. Todas las respuestas deben ser documentos XML bien formados codificados en UTF-8.
  4. Fechas y tiempo se codifican mediante la ISO 8601 y se expresan en UTC.
  5. Soporta la difusión de registros en diversos formatos de metadatos.
  6. Tiene control de flujo.
  7. Cuando hay un error o una excepción los repositorios deben indicarlos distinguiéndolos de los códigos de estado HTTP por incluir uno o más elementos de error en la respuesta.

Protocolo de peticiones

editar

El servicio recolector puede realizar 6 peticiones distintas:[4]

  1. GetRecord, para obtener un registro determinado.
  2. Identify, para obtener información sobre el servidor.
  3. ListIdentifiers, para obtener encabezamientos.
  4. ListRecords, para obtener registros completos.
  5. ListSets, para obtener registros pertenecientes a una clase determinada creada por el servidor.
  6. ListMetadataFormats, para obtener la lista de los formatos bibliográficos usados por el servidor.

Servicios recolectores

editar

Los servicios recolectores recogen metadatos generados por los proveedores de datos y los utilizan como base para dar servicios de valor añadido. Son servicios recolectores registrados en la web de OAI-PMH:[5]

Servicio Implementador
ARA Aggregator of Croatian Repositories and Archives SRCE - University of Zagreb University Computing Centre
BASE: Bielefeld Academic Search Engine Bielefeld University Library
Callima infoball
Cross Archive Search Services for Indian Repositories (CASSIR) National Centre for Science Information (NCSI), Indian Institute of Science, Bangalore
citebaseSearch Southampton University
Clio-i Service Provider of Science Documents Liber Laboratory, UFPE, Brasil
colLib colLib
CYCLADES European Research Consortium for Informatics and Mathematics (ERCIM)
digitAlexandria digitAlexandria
Directory and OAI Harvester Ministerio de Cultura de España
DL-Harvest University of Arizona
DP9 Old Dominion University
GAVO data center searchable VO Registry Zentrum für Astronomie, Universität Heidelberg and the German Astrophysical Virtual Observatory
GEO-LEO Lower Saxony State and University Library Göttingen (SUB) and the University Library "Georgius Agricola" of the Technische Universitt Bergakademie Freiberg (UBF)
Harvester@UABT: Harvester of University of Tlemcen Algeria University of Tlemcen, Algeria
iCite iCite
MeIND Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen
METALIS AEPIC Project
NCSTRL Old Dominion University

University of Virginia

Virginia Tech

NORA Norwegian Open Research Archive
OAIster University of Michigan Libraries Digital Library Production Service
OASIC CCSD
Openarchives.eu Horizons Unlimited srl (Bolonia, Italia)
Perseus Perseus
PIONEER Digital Libraries Federation Poznan Supercomputing and Networking Center
Public Knowledge Harvester U. of British Columbia
PLEIADI: Portale per la Letteratura scientifica Elettronica Italiana su Archivi aperti e Depositi Istituzionali The CASPUR and CILEA cosortia
Repository Explorer Virginia Tech
SAIL-Eprints CNR - Area della Ricerca di Bologna
ScientificCommons ScientificCommons
Scirus Scirus
Sheet Music Consortium UCLA
SuUB Bremen State and University Library Bremen
TORII International School for Advanced Studies, Trieste, Italia
Université Numérique Ingénierie et Technologie UNIT is an association supported by the French Ministry for Education and Research

Proveedores de datos

editar

En la actualidad, hay 3275 proveedores de datos[6]​ registrados en la página web de OAI-PMH. En la siguiente tabla se muestran algunos ejemplos:

Nombre del repositorio Identificador OAI
E-Prints Complutense www.ucm.es
This is the University Digital Archive of the University of Groningen, The Netherlands. ub.rug.nl
"CiteSeerX Scientific Literature Digital Library and Search Engine" CiteSeerX.psu
"Fondo Xavier Clavigero, S.J." de la Biblioteca "Dr Jorge Villalobos Padilla, S.J." del Iteso (enlace roto disponible en Internet Archive; véase el historial, la primera versión y la última). fcx.iteso.mx
11th Joint Symposium on Neural Computation jsnc.library.caltech.edu
14-18 en 14x9 : l'album de cartes postales de Simon Jeanjean jeanjean.unilim.fr
i2 Innovación e Investigación en Arquitectura y Territorio i2.ua.es
A Celebration of Women Writers celebration
A+BE Architecture and the Built Environment ojs.ojs-lib.tudelft.nl
A-plus -
ABACUS. Repositorio de Producción Científica -
ABC Journal of Advanced Research journals.abc.us.org
Aberdeen University Research Archive -
Abertay Research Collections -
Academic Archive On-line DiVA.org
Academic Commons commons.library.stonybrook.edu
Academic Journals -

Implementación en España

editar

La instauración del protocolo OAI-PMH en España ha sido escaso en su desarrollo, en consecuencia, ha existido y sigue encontrándose poca difusión de publicaciones españolas[7]​ de investigación científica en las comunidades internacionales.

Este protocolo se da en su mayoría en las bibliotecas universitarias donde casi el 50% de las publicaciones son artículos de revistas o comunicaciones a congresos. De forma muy desapercibida se encuentran las bibliotecas públicas que apenas disponen de repositorios. Algunos de los recolectores españoles o con colaboración española que utilizan el protocolo OAI-PMH son:

  • Recolecta: Es una plataforma que recoge todos los repositorios científicos nacionales de acceso abierto y cuyo fin es facilitar servicios a los investigadores.
  • Hispana: Recolector de contenidos de bases de datos de colecciones digitales. Destacan los repositorios institucionales, las bibliotecas digitales de las comunidades autónomas y los contenidos de la Red Digital de Colecciones de Museos de España.
  • Rebiun: La Red de Bibliotecas Universitarias Españolas da la posibilidad de consultar los fondos de 74 bibliotecas universitarias y de investigación españolas.
  • Dialnet: Es un depósito de materiales bibliográficos digitales. Es un portal de difusión de producción científica principalmente hispánica.
  • Americanae: La Agencia Española de Cooperación Internacional para el Desarrollo (AECID) junto con el Centro de Documentación de Canarias y América (CEDOCAM[8]​) desarrolla el programa Americanae, un programa que busca recopilar el patrimonio cultural americano conservado en instituciones culturales (archivos, bibliotecas y museos).
  • Europeana: Es una biblioteca digital europea de acceso abierto, un portal de patrimonio cultural europeo cuya colección está formada por una gran variedad de documentos de 45 idiomas.

Referencias

editar
  1. Lagoze, Carl (14 de junio de 2002). «Open Archives Initiative - Protocol for Metadata Harvesting - v.2.0». www.openarchives.org. Consultado el 17 de octubre de 2020. 
  2. a b Herbert Van de Sompel. «The Santa Fe Convention of the Open Archives Initiative» (en inglés). Consultado el 20 de diciembre de 2016. 
  3. a b Barrueco, José Manuel e Imma Subirats Coll (2 de marzo de 2003). «Open archives initiative. Protocol for metadata harvesting (OAI-PMH): descripción, funciones y aplicaciones de un protocolo». El profesional de la Información. Archivado desde el original el 21 de octubre de 2016. Consultado el 20 de diciembre de 2016. 
  4. a b Cornell University Library (8 de enero de 2015). «The Open Archives Initiative Protocol for Metadata Harvesting». 
  5. Cornell University Library. «Registered service providers». Cornell: Cornell University Library. Consultado el 20 de diciembre de 2016. 
  6. Cornell University Library. «OAI-PMH Registered Data Providers». Cornell: Cornell University Library. Consultado el 20 de diciembre de 2016. 
  7. Peset, Fernanda y Antonia Ferrer (8 de diciembre de 2008). «Implantación de la Open Archives Initiative en España» [Studying the state of implantation of OAI-PMH in Spain]. Valencia: Instituto de Diseño y Fabricación, Universidad Politécnica de Valencia. Consultado el 18 de diciembre de 2016. 
  8. Museo de Tenerife. «El CEDOCAM se suma a Americanae. Sistema de difusión y recolección de colecciones americanistas». Consultado el 20 de diciembre de 2016. 

Bibliografía

editar

Enlaces externos

editar