Diretor do PKP fala sobre a importância do XML-JATS para a publicação científica

O JATS XML (Journal Article Tag Suite) é um dos padrões mais importantes no mundo da publicação acadêmica, sendo essencial para a acessibilidade, preservação e troca de informações entre diversas plataformas e sistemas. No entanto, para muitos, os detalhes técnicos do XML-JATS podem parecer complexos e intimidantes (veja também esse post que já publicamos aqui no blog sobre o assunto). Para desmistificar esse assunto, Alec Smecher, Diretor Associado de Desenvolvimento do Public Knowledge Project (PKP), concedeu entrevista ao site do PKP para explicar de maneira clara e acessível o que é o XML-JATS e como ele transforma a comunicação acadêmica.

Alec Smecher é uma figura central no desenvolvimento de ferramentas que suportam a publicação acadêmica em acesso aberto, como o Open Journal Systems (OJS) e o Open Monograph Press (OMP). Com sua vasta experiência, Alec oferece uma perspectiva única sobre como o XML-JATS facilita o trabalho de editores, autores e instituições acadêmicas ao redor do mundo. Nesta entrevista, ele compartilha insights valiosos sobre as funcionalidades e os benefícios do XML-JATS, tornando o conceito compreensível mesmo para aqueles que não são especialistas técnicos, além de antecipar uma novidade para XML-JATS integrada ao OJS, que será lançada na versão 3.5.

Confira abaixo a tradução (livre) da entrevista realizada pela Famira Racy, especialista em comunicação da PKP, publicada em 30 de abril de 2024 no Boletim Informativo da Comunidade do PKP.


Leia também: Para que serve a marcação XML-JATS e qual a sua importância para a minha revista?


Para começar, em termos simples, o que é XML?

Em publicações acadêmicas, quando as pessoas falam sobre XML, elas quase sempre estão falando sobre JATS XML. XML é um assunto muito maior, então falarei apenas sobre JATS. (TEI é outra forma de XML que é usada em comunicação acadêmica, e há toneladas de tipos de XML usados ​​em outros campos também.)

JATS (Journal Article Tag Set) é um vocabulário que pode ser usado para escrever um artigo de periódico de uma forma que seja legível por máquina. Quando você escreve um artigo em um processador de texto, por convenção o título é maior e colocado no topo da primeira página, o que é claramente um título para um leitor humano. Computadores não funcionam dessa forma, no entanto, e para eles, identificar o título em um documento de processador de texto é difícil. 

Escrever um artigo no formato JATS deixa tudo claro – não apenas para o título, mas para resumos, identificação do autor, figuras e legendas, partes de citações e assim por diante. Há centenas de peças que compõem um artigo acadêmico, cada uma com suas próprias convenções, e o JATS pode deixar tudo isso claro.

Em outras palavras, os processadores de texto produzem formatos de layout (eles descrevem a aparência de uma página sem entender o que há nela), e o JATS é um formato semântico (ele descreve a informação sem especificar como ela aparece na página).

Como o JATS XML é usado em publicações acadêmicas?

Uma vez que um artigo acadêmico esteja em um formato legível por máquina como JATS, você pode fazer todos os tipos de coisas automatizadas com ele. As possibilidades mais importantes para a maioria dos editores são indexar artigos em índices acadêmicos e transformar os artigos em HTML ou PDF sem muito trabalho manual.

Artigos em JATS também são muito bons para arquivamento de longo prazo; é fácil para computadores trabalharem com grandes coleções, e há muito pouca sobrecarga no formato comparado a algo como .docx ou .pdf. Entender o que os artigos são daqui a mil anos será relativamente fácil comparado a um PDF.

Um artigo no ecossistema acadêmico precisa interagir com muitos serviços, e cada interação tem expectativas sobre que tipo de dados são trocados e em que formato eles estão. Muitos desses serviços ou padrões (como NISO MECA e PubMed Central) esperam artigos em JATS diretamente; para outros, transformar artigos JATS em um formato que eles possam usar é uma tarefa familiar.

Por exemplo, no Canadá, PKP e Érudit juntos formaram a Coalition Publica , que indexa, apoia e distribui pesquisas canadenses em instituições por todo o país. A troca de dados no formato JATS permite que seus vários sistemas trabalhem juntos de forma distribuída.

Quais são algumas preocupações comuns sobre JATS XML em publicações acadêmicas?

O JATS oferece muitas promessas – e é um padrão excelente – mas há boas razões pelas quais os editores não o adotaram universalmente.

O maior desafio é o custo (humano ou financeiro) de produzi-lo. A maioria dos autores escreve usando processadores de texto, e a conversão desses formatos para JATS geralmente é feita com muito esforço humano, pois cada parte do documento precisa ser identificada e separada de suas partes vizinhas. O padrão JATS é extremamente granular, e produzir um documento JATS de qualidade requer experiência e tempo.

Existem sistemas especializados e auxiliados por IA para ajudar a produzir JATS, e empreendimentos comerciais que cuidarão da conversão em nome de periódicos que não têm recursos próprios, mas ainda é muito mais caro produzir do que um PDF, e isso provavelmente não mudará tão cedo.

Outro desafio é que a riqueza do vocabulário JATS significa que frequentemente há várias maneiras de codificar a mesma informação com níveis variados de detalhes. Isso reflete a rica variedade de metadados na publicação acadêmica em vez de qualquer falha no JATS, mas significa que as ferramentas para trabalhar com JATS têm que considerar muitas formas diferentes para a mesma informação. 

Muitos grupos e ferramentas que trabalham com JATS decidiram se limitar a um subconjunto de JATS, e provavelmente não há uma única ferramenta que aceite todos os seus formatos. Isso pode ser frustrante para usuários que querem apenas fazer um trabalho e ter um documento JATS em mãos.

Finalmente, há muitos equívocos sobre JATS. Muitas vezes, promete-se aos editores que muitos problemas desaparecerão se eles adotarem JATS, mas isso esconde muitos detalhes debaixo do tapete. Por exemplo, um pipeline de publicação usando JATS pode substituir um fluxo de trabalho de editoração eletrônica trabalhoso usado para produzir artigos em formato HTML e PDF – mas, em seu lugar, eles precisarão de modelos, que têm seus próprios requisitos e expertise.

Acredito que ainda há uma falta de ferramentas JATS boas, de propósito geral, livres/de código aberto, particularmente para editar documentos, e que elas surgirão e se fortalecerão com o tempo. Mas JATS não é novo, e é interessante que elas tenham sido tão lentas para amadurecer. Tenho certeza de que a complexidade do JATS é a culpada, e será interessante ver se isso é simplesmente uma barreira muito grande para editores com recursos limitados.

Como a Comunidade PKP e a Equipe de Desenvolvimento trabalham juntas no JATS XML para OJS, OMP e OPS?

O PKP lançou ou contribuiu para muitos projetos relacionados ao JATS ao longo dos anos, incluindo ferramentas para transformar documentos de processadores de texto em JATS (docxConverter, Grobid, Lemon8, OTS), ferramentas ou plugins para edição de documentos JATS (Texture, Libero Editor) e vários plugins para apresentar documentos JATS aos leitores (JATSParserPlugin, Lens Galley). 

Todos esses são projetos de código aberto e se beneficiaram da administração da comunidade. Muitos periódicos baseados em OJS conseguiram juntar fluxos de trabalho JATS de produção, apesar da confusa variedade de ferramentas disponíveis e sua cobertura incompleta do padrão JATS.

Historicamente, nossos planos para JATS têm se centrado na integração de uma boa ferramenta de edição que não especialistas podem usar para trabalhar com documentos JATS. Infelizmente, várias delas fracassaram antes de atingir a prontidão para produção, e o PKP não prevê o surgimento de uma boa ferramenta de código aberto gratuita em um futuro próximo. Portanto, estamos buscando outras maneiras de avançar nos fluxos de trabalho JATS, com a ajuda de nossos comitês XML e técnicos, Coalition Publica e parceiros próximos como Érudit .

Quais são alguns marcos a serem esperados neste trabalho do JATS XML?

Um dos nossos desenvolvedores, Dimitris , adicionou recentemente um recurso ao OJS que será essencial para o nosso trabalho com XML nos próximos anos: um lar para documentos JATS, onde qualquer pessoa que queira interagir com documentos JATS pode encontrá-los. O OJS pode gerar um documento JATS limitado sob demanda para aqueles que não os têm, ou pode armazenar um que foi produzido em outro lugar. Isso será lançado com o OJS 3.5 e tenho certeza de que se tornará um daqueles recursos que ficamos chocados por termos que viver sem.

Também revitalizamos recentemente o grupo de trabalho XML em torno de algumas ideias novas – aguarde mais delas em breve! Esperamos poder reduzir nossa dependência de uma ferramenta de edição JATS, ao mesmo tempo em que simplificamos o pipeline de produção e aumentamos as oportunidades de trabalhar com ferramentas existentes prontas para produção.

Captura de tela da nova área JATS no fluxo de trabalho de envio, a ser lançada na versão 3.5.0

Alec, há mais alguma coisa que você gostaria de comunicar ao nosso público?

Embora possa parecer frustrante trabalhar com JATS na prática, é um padrão excelente e cada parte dele reflete um trabalho bem pensado. É um dos raros padrões que funciona globalmente e considera o multilinguismo desde o início, por exemplo. Sempre que temos uma pergunta no PKP sobre como um pedaço de metadados deve funcionar, o padrão JATS é geralmente a primeira coisa que consulto. 

Embora tenha sido difícil para editores com recursos limitados adotar, e haja um aspecto excludente nisso, o JATS forçou os acadêmicos a considerar do que os documentos acadêmicos são feitos, como os produzimos por meio de processos como revisão por pares e como os descrevemos. Nesse sentido, o JATS é uma tremenda peça de metaciência. Ele está frequentemente no centro do ecossistema de publicação acadêmica pressionando por melhorias.

Obrigado, Alec, por tornar o JATS XML compreensível no mundo da publicação acadêmica!

Fonte: https://pkp.sfu.ca/2024/04/30/jats-xml-scholarly-publishing-interview-alec-smecher/


Quer implementar XML-JATS na sua revista? Entre em contato com a GeniusDesign e solicite uma cotação.

Cadastre-se em nosso informativo para ficar por dentro dos textos que publicamos em nosso blog.

Favor habilitar seu javascript para enviar este formulário

Atualizado em Terça, 23 Julho 2024 08:13
Eugênio Telles

Eugênio Telles

Eugênio Telles é publicitário pós-graduado em Marketing Digital pela ESPM-RJ, fundador e diretor executivo da GeniusDesign e consultor OJS há mais de 10 anos.

Somos uma editora especializada em OJS e periódicos científicos

O Blog Periódico Eletrônico é mantido pela GeniusDesign, uma editora especializada em Open Journal System, dedicada a oferecer soluções tecnológicas, operacionais e editoriais para periódicos científicos.

Fiocruz
Revista Abralin
Sesi Sp Editora
Cadlin
Farmanguinhos
Associação Brasileira de Criminalística
Blog Periódico Eletrônico

Peletron - Periódico Eletrônico

CNPJ: 27.339.106/0001-70