Para que serve a marcação XML-JATS e qual a sua importância para a minha revista?

DOI: 10.58976/978-65-982699-1-3.12

O XML-JATS é um dos principais formatos de arquivo utilizados por grandes bases para indexar artigos científicos. Bases como SciELO, PubMed e Redalyc exigem o texto completo dos artigos no formato XML, além de uma série de outros requisitos obrigatórios. Mas por que este formato é tão importante? Como ele funciona e quais as vantagens de sua utilização? São essas perguntas que busco responder neste artigo com a intenção de contribuir para o entendimento e adoção deste importante formato.

Navegue por este post:


O que é o XML?

O XML - Xtensible Markup Language - é uma linguagem de marcação recomendada pela W3C, principal organização mundial de padronização de tecnologias da internet, para descrever e estruturar diversos tipos de dados. O XML permite a estruturação de dados semânticos que podem ser facilmente interpretados por humanos e máquinas, além de servir como base para diversas outras linguagens de programação e marcação.

Veja o seguinte exemplo de código XML com dados estruturados:

<?xml version="1.0" encoding="UTF-8"?>
<receita nome="pão" tempo_de_preparo="5 minutos" tempo_de_cozimento="1 hora">
<titulo>Pão simples</titulo>
<ingredientes>
<ingrediente quantidade="3" unidade="xícaras">Farinha de Trigo</ingrediente>
<ingrediente quantidade="7" unidade="gramas">Fermento</ingrediente>
<ingrediente quantidade="1.5" unidade="xícaras" estado="morna">Água</ingrediente>
<ingrediente quantidade="1" unidade="colheres de chá">Sal</ingrediente>
</ingredientes>
<instrucoes>
<passo>Misture todos os ingredientes, e dissolva bem.</passo>
<passo>Cubra com um pano e deixe por uma hora em um local morno.</passo>
<passo>Misture novamente, coloque numa bandeja e asse num forno.</passo>
</instrucoes>
</receita>

O código acima pode ser facilmente interpretado por qualquer pessoa sem conhecimento no XML. A forma como sua sintaxe é estruturada, com grupos e subgrupos de dados, e a semântica de suas tags, que podem ser criadas livremente respeitando o padrão de abertura e fechamento <ingrediente></ingrediente>, tornam essa linguagem extremamente versátil e auto-documentado, onde o próprio formato descreve sua estrutura, seus campos e seus valores.

O que é o JATS?

Como é possível perceber, a versatilidade do XML permite a definição de diversos tipos de padrão para a estruturação de dados semânticos. O JATS - Journal Article Tag Suite - é, como a própria sigla sugere, é um conjunto de tags para artigos científicos em formato XML para descrever a literatura científica publicada online.

O padrão foi desenvolvido em 2003 pela NISO, National Information Standards Organization, dos Estados Unidos, e popularizado pela PubMed Central, da NLM, National Library of Medicine, que adotou o formato como padrão para arquivamento e intercâmbio de periódicos científicos de acesso aberto. Mais tarde, outras bases relevantes como a SciELO e a Redalyc também adotaram o formato.

O JATS fornece um conjunto de elementos e atributos XML para descrever o conteúdo textual e gráfico de artigos científicos. Permite descrições do conteúdo completo ou apenas os metadados do cabeçalho do artigo, além de permitir o uso a outros tipos de conteúdo não relacionados à pesquisa, como cartas, editoriais e resenhas de livros e produtos.

Estrutura XML-JATS

Vamos retomar o exemplo dado acima:

<?xml version="1.0" encoding="UTF-8"?>
<receita nome="pão" tempo_de_preparo="5 minutos" tempo_de_cozimento="1 hora">
<titulo>Pão simples</titulo>
<ingredientes>
<ingrediente quantidade="3" unidade="xícaras">Farinha de Trigo</ingrediente>
<ingrediente quantidade="7" unidade="gramas">Fermento</ingrediente>
<ingrediente quantidade="1.5" unidade="xícaras" estado="morna">Água</ingrediente>
<ingrediente quantidade="1" unidade="colheres de chá">Sal</ingrediente>
</ingredientes>
<instrucoes>
<passo>Misture todos os ingredientes, e dissolva bem.</passo>
<passo>Cubra com um pano e deixe por uma hora em um local morno.</passo>
<passo>Misture novamente, coloque numa bandeja e asse num forno.</passo>
</instrucoes>
</receita>

Perceba que a primeira linha define o tipo de documento.

A segunda linha abre o primeiro grupo de dados, representado pela tag <receita>. Todo o conteúdo que está contido na receita é semanticamente marcado e, ao final do documento, a tag receita é fechada com a sua correspondente </receita>.

Dentro de <receita></receita> há outras informações marcadas. O <titulo></titulo> e os grupos <ingredientes></ingredientes> e <instrucoes></instrucoes>, cada qual com os seus respectivos subgrupos. Digamos que esse padrão seja adotado por grandes portais de receitas, chamados de “base de dados de receitas”. O estabelecimento de um padrão de marcação de receitas permitirá que diversos sites de receitas e chefs independentes enviem suas receitas dentro do padrão estabelecido para que sejam facilmente importadas e indexadas na base com todas as informações da receita devidamente identificadas (“tagueadas”).

A lógica é a mesma para os artigos científicos. O padrão desenvolvido pela NISO e difundido pelo PubMed levou em consideração o padrão geral de informações contidas em artigos científicos para se estruturar o conjunto de tags que identificaria cada um dos elementos de um artigo. A definição de um conjunto de tags para artigos científicos em formato XML permite que diversas informações presentes em artigos científicos sejam processadas com a devida identificação entre diferentes sistemas.

Assim como no exemplo da receita, a estrutura base do XML-JATS apresenta os seguintes grupos:

Front Matter <front> … </front>

Dentro do grupo <front></front> estarão subgrupos de informações de:

  • <journal-meta></journal-meta> metadados do periódico: título, editora e identificadores (ISSN, DOI, etc);
  • <article-meta><article-meta> metadados do artigo: título, abstract, autor(es), categoria, histórico, páginas, identificadores, etc.

Body Matter <body> … </body>

O grupo <body></body> conterá o texto do artigo, onde serão identificados:

  • Parágrafos;
  • Seções;
  • Figuras e gráficos;
  • Tabelas (XHTML e CALS);
  • Equações;
  • Citações.

Back Matter <back> … </back>

Neste último grupo estarão contempladas informações auxiliares ao texto principal, como:

  • Agradecimentos;
  • Glossários;
  • Apêndices;
  • Referências bibliográficas

Principais benefícios do XML-JATS

Os exemplos dados acima já dão uma dimensão dos benefícios proporcionados pela adoção de um padrão de marcação por periódicos científicos e bases indexadoras. Podemos ressaltar ainda:

  • Marcação auto-descritiva;
  • Possui vasta documentação para o uso correto das tags e atributos;
  • Permite armazenamento e transporte de dados do texto completo e dos metadados do artigo em bases indexadoras;
  • Gerar formatos derivados para outros suportes, como PDF, HTML, ePub, etc;
  • Interoperabilidade entre sistemas: Lattes, CrossRef, SciELO, Web of Science, etc;
  • Automação de validações.

Devo utilizar o JATS em minha revista?

Apesar de apresentar ganhos e benefícios, a utilização do JATS como formato de publicação pode não ser uma solução para qualquer revista. Cabe à equipe avaliar se este é um formato realmente necessário para os objetivos da revista.

Se a sua revista tem como meta buscar a indexação em bases como SciELO, PubMed e Redalyc, então o JATS será um pré-requisito para sua candidatura.

Adotar o padrão por si só, não significa que sua revista será indexada em uma dessas bases. É importante ter em mente que os periódicos são reconhecidos e indexados quando publicam pesquisas de qualidade, praticam boas práticas editoriais e adotam recomendações internacionais para publicação científica. Vale ressaltar ainda que cada base de dados poderá ter suas particularidades nos requisitos para aprovação de periódicos candidatos.

Cadastre-se em nosso informativo para ficar por dentro dos textos que publicamos em nosso blog.

Favor habilitar seu javascript para enviar este formulário


Agora que você já conhece um pouco mais sobre o JATS, os benefícios que ele oferece e a quais objetivos ele atende, você já pode considerar se este é um formato que sua revista precisa investir. Se a resposta for sim e você precisar de uma equipe qualificada para produzir os formatos XML-JATS de seus artigos, não deixa de solicitar um orçamento à GeniusDesign!

Atualizado em Sexta, 12 Julho 2024 09:18
Eugênio Telles

Eugênio Telles

Eugênio Telles é publicitário pós-graduado em Marketing Digital pela ESPM-RJ, fundador e diretor executivo da GeniusDesign e consultor OJS há mais de 10 anos.

Somos uma editora especializada em OJS e periódicos científicos

O Blog Periódico Eletrônico é mantido pela GeniusDesign, uma editora especializada em Open Journal System, dedicada a oferecer soluções tecnológicas, operacionais e editoriais para periódicos científicos.

Fiocruz
Revista Abralin
Sesi Sp Editora
Cadlin
Farmanguinhos
Associação Brasileira de Criminalística
Blog Periódico Eletrônico

Peletron - Periódico Eletrônico

CNPJ: 27.339.106/0001-70