O que é o Protocolo OAI-PMH, para que serve e como usar no OJS

DOI: 10.58976/978-65-982699-1-3.13

O OJS é o principal software para gerenciamento de periódicos científicos e uma de suas características mais importantes para a interoperabilidade de seus metadados entre sistemas é a utilização do protocolo OAI-PMH.

O protocolo OAI-PMH - Open Archives Initiative Protocol for Metadata Harvesting - (Protocolo de Coleta de Dados da Iniciativa de Arquivos Abertos) é um mecanismo desenvolvido pela Open Archives Initiative para coleta de metadados de repositórios.

Neste artigo irei abordar algumas informações a respeito deste protocolo para melhor entendimento e aplicação dele para o OJS e como habilitá-lo para que seu periódico permita a extração de metadados através deste protocolo.


Sumário do artigo


O que é a Open Archives Initiative?

A Open Archives Initiative desenvolve e promove padrões de interoperabilidade que visam facilitar a disseminação eficiente de conteúdo. A OAI tem suas raízes nos movimentos de acesso aberto e repositório institucional e surge com o objetivo de melhorar o acesso aos arquivos de repositórios acadêmicos como meio de aumentar a disponibilidade da comunicação científica. Com o tempo, o trabalho da OAI se expandiu para promover amplo acesso a recursos digitais para eScholarship, eLearning e eScience[1].

Como funciona o protocolo OAI-PMH?

Como apresentado no início deste artigo, o Open Archives Initiative Protocol for Metadata Harvesting - OAI-PMH - fornece uma estrutura de interoperabilidade independente com base na coleta de metadados em repositórios acadêmicos. Existem duas classes de participantes na estrutura do OAI-PMH:

  • Os provedores de dados, sistemas que suportam o OAI-PMH como meio de expor metadados (OJS e outros repositórios); e
  • Os provedores de serviços, sistemas que usam os metadados coletados por meio do OAI-PMH como base para a criação de serviços de valor agregado.

O OAI-PMH irá estruturar as informações de metadados coletadas através de um arquivo XML. Caberá ao provedor de dados o armazenamento e disponibilização dos dados do repositório e ao provedor de serviços a coleta dos metadados, conforme a política de coleta.

Desta forma, o protocolo OAI-PMH é composto por[2]:

  1. Metadados - a informação a ser coletada;
  2. Formatos dos registros – a estrutura da informação a ser coletada (em XML);
  3. Repositórios - os locais onde a informação a ser coletada estará disponível
  4. Identificadores - expressões que permitem identificar, de forma única, cada registro no repositório;
  5. Política de coleta - definição lógica para estabelecer o que será coletado, por exemplo, por data ou por tipo de informação;
  6. Instruções (verbs / verbos) - tipos de solicitação - São 6 verbos utilizados para a realização de solicitações: GetRecord, Identify, ListIdentifier, ListMetadataFormats, ListRecords, ListSets. Cada um desses verbos representa um tipo de solicitação[3]:
    • GetRecord - Este verbo é usado para recuperar um registro de metadados individual de um repositório;
    • Identify - Este verbo é usado para recuperar informações sobre um repositório. Algumas das informações retornadas são obrigatórias como parte do OAI-PMH. Os repositórios também podem empregar o verbo Identificar para retornar informações descritivas adicionais;
    • ListIdentifiers - Este verbo é uma forma abreviada de ListRecords, recuperando apenas cabeçalhos em vez de registros. Argumentos opcionais permitem a coleta seletiva de cabeçalhos com base na associação do conjunto e/ou datastamp;
    • ListMetadataFormats - Este verbo é usado para recuperar os formatos de metadados disponíveis de um repositório;
    • ListRecords - Este verbo é usado para coletar registros de um repositório. Argumentos opcionais permitem a coleta seletiva de registros com base na associação do conjunto e/ou no registro de data;
    • ListSets - Este verbo é usado para recuperar a estrutura do conjunto de um repositório, útil para coleta seletiva.

No site do OAI há uma lista de ferramentas desenvolvidas que funcionam como provedores de serviço[4] ou coletores de dados. Se você deseja se aprofundar em como coletar dados através do OAI-PMH, vale a pena conferir este link e a documentação do OAI-PMH.

A utilização do OAI-PMH no Open Journal System

Além de ser um sistema que realiza todo o gerenciamento do fluxo editorial de um periódico científico, o OJS funciona também como um repositório, portanto, como um provedor de dados. Ele disponibiliza todo o acervo de publicações de uma revista através do protocolo HTTP, utilizado por usuários humanos na navegação pela internet, e também através do protocolo OAI-PMH, específico para comunicação entre sistemas.

Todos os dados fornecidos através dos formulários da submissão - título, resumo, autores, referências, palavras-chave, etc - são recuperáveis através deste protocolo. A utilização do OAI-PMH no OJS permite que seu conteúdo seja indexado por diferentes mecanismos de pesquisa e indexação, desde as bases acadêmicas - como o Google Scholar - a buscadores comerciais (Google, Bing, etc).

Por padrão, o arquivo de configuração do OJS (config.inc.php) já vem com o parâmetro deste protocolo habilitado. Você pode testá-lo digitando o endereço de um periódico no seu OJS no navegador, acrescentando /oai, desta maneira: https://enderecodoseuOJS.com.br/index.php/[caminho_do_periodico]/oai.

Veja este exemplo de um periódico demo no site do Publick Knowledge Project:

https://demo.publicknowledgeproject.org/ojs3/demo/index.php/demojournal/oai

Estando o OAI-PMH habilitado, o link acima carregará uma página como esta:

Página de exibição do OAI do OJS Demo do PKP.Página de exibição do OAI do OJS Demo do PKP.

Como configurar o OAI-PMH no OJS

Por padrão, o protocolo OAI-PMH já vem ativado no arquivo de configuração do OJS (próximo ao fim do arquivo config.inc.php). As definições padrão são:

;;;;;;;;;;;;;;;;
; OAI Settings ;
;;;;;;;;;;;;;;;;
[oai]
; Enable OAI front-end to the site
oai = On
; OAI Repository identifier
repository_id = ojs.pkp.sfu.ca
; Maximum number of records per request to serve via OAI
oai_max_records = 100

Repare que o valor padrão do parâmetro oai é On, indicando que a configuração está ativa. Para que o protocolo funcione adequadamente, você deverá alterar o valor dos parâmetros repository_id e oai_max_records[5]:

  • repository_id = OJS.dominio_da_revista.com.br (ex.: OJS.periodicoeletronico.com.br)
  • oai_max_records = 20 (redução do número de requisições máximas para respostas mais rápidas)

Além das configurações acima realizadas no arquivo config.inc.php, a autorização para que os provedores de serviços (coletores) possam acessar os metadados pode ser modificada através da interface do OJS, no menu Configurações > Distribuição > Acesso.

Recurso de ativação do protocolo OAI-PMH no OJS.Recurso de ativação do protocolo OAI-PMH no OJS.

Validação do OAI-PMH de seu OJS

A Open Archives Initiative disponibiliza uma ferramenta para validação do seu protocolo OAI-PMH, que é válida para verificar se há algum problema com as suas configurações.

Para validar seu protocolo, você deverá utilizar a URL OAI do seu OJS, conforme exemplo acima (https://enderecodoseuOJS.com.br/index.php/[caminho_do_periodico]/oai) nas seguintes ferramentas:

OAI-PMH Data Provider Validation and Registration

Validação e registro do provedor de dados OAI-PMH.Validação e registro do provedor de dados OAI-PMH.

Ferramenta de validação desenvolvida e disponibilizada pela própria OAI:

Utilizando o endereço OAI-PMH do OJS demo do PKP, podemos apresentar a tela de verificação positiva desta ferramenta de validação:

Tela de validação bem sucedida na ferramenta de validação e registro do provedor de dados OAI-PMH.Tela de validação bem sucedida na ferramenta de validação e registro do provedor de dados OAI-PMH.

Open Archives Initiative - Repository Explorer (CLARIN-PL)

Procedimento para validação na ferramenta Open Archives Initiative - Repository Explorer (CLARIN-PL).Procedimento para validação na ferramenta Open Archives Initiative - Repository Explorer (CLARIN-PL).

Ferramenta de validação desenvolvida pela CLARIN-PL, uma organização Pan-Europeia de infraestrutura científica. Esta ferramenta oferece uma validação mais completa.

Cadastro do seu OJS como provedor de dados (repositório) na base do OAI

Depois que você tem o seu protocolo OAI-PMH devidamente configurado e validado, você pode cadastrar o seu endereço OAI como provedor de dados na base de Provedores de Dados Registrados OAI-PMH (OAI-PMH Registered Data Providers).

Para cadastrar o seu OJS, basta acessar a mesma URL da ferramenta de validação da OAI e marcar a opção “Register this site (or update existing registration)”.

Formulário para registro do periódico na base de Provedores de Dados Registrados OAI-PMH.Formulário para registro do periódico na base de Provedores de Dados Registrados OAI-PMH.

O cadastro do seu OJS nesta base de provedores de dados (repositórios) permitirá que os metadados dos periódicos existentes no seu OJS e que possuam a opção de configuração habilitada (Configurações > Distribuição > Acesso) sejam consultados e indexados por outras bases de dados e indexadoras, os provedores de serviço (coletores). O OAI disponibiliza uma lista de serviços que utilizam o protocolo OAI-PMH para coleta de metadados.

Conclusão

A utilização do protocolo OAI-PMH é uma importante atividade para a divulgação e alcance do seu periódico. Este protocolo é utilizado por grandes bases e indexadores, como OneSearch ID, BASE, WorldCat, Google Scholar, Crossref, DOAJ, etc[5].

Espero que este artigo tenha te ajudado a compreender melhor este recurso nativo do OJS e a como utilizá-lo da maneira adequada.

Referências

  1. https://www.openarchives.org/
  2. https://www.maxwell.vrac.puc-rio.br/6936/6936_2.PDF
  3. http://www.openarchives.org/OAI/openarchivesprotocol.html#GetRecord
  4. https://www.openarchives.org/pmh/tools/
  5. https://openjournaltheme.com/how-to-setup-oai-and-check-oai-on-ojs
Atualizado em Sexta, 12 Julho 2024 09:18
Eugênio Telles

Eugênio Telles

Eugênio Telles é publicitário pós-graduado em Marketing Digital pela ESPM-RJ, fundador e diretor executivo da GeniusDesign e consultor OJS há mais de 10 anos.

Somos uma editora especializada em OJS e periódicos científicos

O Blog Periódico Eletrônico é mantido pela GeniusDesign, uma editora especializada em Open Journal System, dedicada a oferecer soluções tecnológicas, operacionais e editoriais para periódicos científicos.

Fiocruz
Revista Abralin
Sesi Sp Editora
Cadlin
Farmanguinhos
Associação Brasileira de Criminalística

Blog Periódico Eletrônico

Peletron - Periódico Eletrônico

CNPJ: 27.339.106/0001-70