Princípios para citar dados científicos

2016-10-12
As referências bibliográficas a trabalhos publicados são uma prática comum e obrigatória na literatura científica desde tempos imemoriais. Cada disciplina tem definida suas normas de registro, e existem dezenas de estilos editoriais de apresentação tais como Vancouver, ISO 690, APA, Turabian, MLA, etc.

Entretanto, nos últimos anos, graças à globalização da publicação de periódicos científicos eletrônicos e às possibilidades de comunicação e intercâmbio de informações que permite a Internet, começou a se discutir a necessidade e importância de registrar e citar também as fontes de dados (datasets) que sustentam os trabalhos acadêmicos. Para que a pesquisa cumpra com uma das premissas fundamentais de uma ciência sã e robusta é necessário que os resultados de uma comunicação científica sejam reprodutíveis, o que torna necessário e conveniente que os dados da pesquisa sejam objetos citáveis e acessíveis.

A boa prática da ciência deve assumir que os dados formam parte de um ecossistema e que devem ser acessíveis e reutilizáveis. Em outras palavras, os trabalhos científicos além de registrar as fontes bibliográficas, deveriam proporcionar também acesso aos dados originais que sustentam a pesquisa.

Já em 2007, Micah Altman e Gary King fizeram uma proposta advertindo sobre a necessidade de chegar a este objetivo em um artigo publicado na D-lib Magazine1, iniciando um processo que prontamente foi tomado pelo International Council for Science: Committee on Data for Science and Technology (CODATA/ICSU), que aprovou esta iniciativa em sua 27ª Assembleia Geral na Cidade do Cabo, na África do Sul, em 20102. A declaração indicava vários aspectos importantes que requeriam a atenção da comunidade científica internacional, entre os quais destacamos:

  • Independente dos diferentes formatos em que se registre a atividade científica (bases de dados simples, hierárquicas, relacionais, XML, etc.), deve-se garantir a interoperabilidade e facilitar a reutilização dos dados.
  • A necessidade de obter padrões nos formatos de citação dos dados-fonte.
  • Criar normas para o registro dos metadados que descrevem os conjuntos de dados (datasets).
  • Devido ao fato que os datasets são essencialmente dinâmicos (diferentemente dos documentos) é necessário garantir que a prática de citação incorpore as versões dos dados, quer dizer, deve poder-se manter o histórico de modificações e incorporações ao conjunto de dados original.
  • As diferentes disciplinas científicas requerem diferente granularidade dos objetos digitais que registram-se como dados-fonte.
  • Informar os papéis que cumprem as diferentes partes interessadas, quer dizer, as equipes de pesquisa, as agências de fomento, as universidades, etc.
  • Para garantir a utilidade e persistência ao longo do tempo, os custos de acesso e manutenção devem ser acessíveis a todas as partes.
  • Preservar os mecanismos de proteção intelectual, seja sob Creative Commons assim como as leis tradicionais de copyright.

A declaração oficial de 2010 foi logo enriquecida em vários trabalhos que serviram como base para a recentemente aprovada Joint Declaration of Data Citation Principles (DC1)3, pelo grupo de trabalho internacional FORCE11, constituído por uma comunidade de pesquisadores, bibliotecários, arquivistas, editores e agências de fomento de pesquisa científica, interessados no futuro da comunicação científica e a e-academia.

Esta declaração já foi assinada por mais de 80 das principais editoras científicas, universidades e instituições do mundo, entre as quais destacamos Elsevier, PLoS, ORCID, Nature Publishing Group, Association of Research Libraries, BioMed Central, CrossRef, etc.

Os objetivos da iniciativa são conseguir que, uma vez que se estabeleça a cultura de citação dos dados fontes, comecem a ser evidentes os benefícios, entre os quais ressaltamos:

  • A infraestrutura editorial deve assegurar que as referências eletrônicas aos dados se mantenham no futuro e possam ser reutilizadas.
  • Os serviços de publicação eletrônica deverão construir controles para que diminua o perigo que pesquisadores “roubem” dados alheios (plágio de dados).
  • O impacto tanto dos datasets como o dos criadores destes dados poderá ser medido.
  • Os pesquisadores poderão obter reconhecimento profissional da mesma maneira que obtêm pelas publicações tradicionais.

Manter os dados de forma citável é uma responsabilidade que deverá ser assumida seja pelo editor científico, ou pelo distribuidor, ou pelos repositórios institucionais ou arquivos nos quais a pesquisa foi produzida. Nesse contexto, deve-se levar em conta os seguintes fatores:

  • Os datasets deverão ser registrados com suficientes metadados que expliquem o conjunto de dados e deverão também permanecer acessíveis.
  • Recomenda-se uma estratégia de identificador permanente do tipo DOI.

Os oito princípios diretivos aprovados na recente declaração DC1 cobrem os propósitos, funções e atributos das citações, e reconhecem a necessidade de criar práticas que sejam compreensíveis tanto aos humanos como às máquinas.

Estes princípios são: (1) Importância; (2) Crédito e atribuição; (3) Evidência; (4) Identificação única; (5) Acesso; (6) Persistência; (7) Especificidade e Verificabilidade; (8) Interoperabilidade e Flexibilidade.

É possível vê-los em detalhes no site do FORCE113.

Conclusão

Como foi dito anteriormente neste post, os benefícios da citação de dados de pesquisa à comunidade científica incluem:

  • Incorporar ao paradigma da ciência o conceito de que os dados de pesquisa são uma contribuição legitimamente citável
  • Os resultados poderão ser verificados por terceiros, facilitarão a replicação dos experimentos e serão reutilizados para estudos futuros.
  • Poderão ser avaliadas métricas de uso e créditos poderão ser gerados da mesma maneira que se faz com as publicações convencionais.

Está nos planos do SciELO adotar os Princípios de Citação de Dados no futuro como parte do processo de gestão dos resultados de pesquisa.

Se sua instituição deseja apoiar esta iniciativa, você pode registrar-se em: http://www.force11.org/datacitation/endorsements

Há uma apresentação muito didática e completa no Slideshare que recomendamos: Joint Declaration of Data Citation Principles (Overview)4

Notas

1 ALTMAN, M. A Proposed Standard for the Scholarly Citation of Quantitative Data. D-Lib Magazine. 2007, vol. 13, nº 3-4. ISSN 1082-9873. Available from: http://www.dlib.org/dlib/march07/altman/03altman.html

2 Data Citation Standards and Practices: The need for robust data citation capabilities. CODATA/ICSU. 2010. Available from: http://www.codata.org/task-groups/data-citation-standards-and-practices

3 Joint Declaration of Data Citation Principles. FORCE11. 2014. Available from: http://www.force11.org/datacitation

4 The Data Citation Synthesis Group. “Joint data citation principles slide set v2”. In: Joint Declaration of Data Citation Principles (Overview). 17 slides. Available from: http://www.slideshare.net/force11/joint-data-citation-principles-slide-set-v2

Referências

BALL, A., DUKE, M. Data Citation and Linking. DCC Briefing Papers. Edinburgh: Digital Curation Centre, 2012. Available from: http://www.dcc.ac.uk/resources/briefing-papers/introduction-curation/data-citation-and-linking

CODATA/ITSCI Task Force on Data Citation. Out of cite, out of mind: The Current State of Practice, Policy and Technology for Data Citation. Data Science Journal. 2013, vol. 12, nº 1-75. DOI: 10.2481/dsj.OSOM13-043. Available from: http://www.jstage.jst.go.jp/article/dsj/12/0/12_OSOM13-043/_pdf

Data citation endorsements. FORCE11. 2014. [viewed September 20th 2014] Available from: https://www.force11.org/datacitation/endorsements

Links externos

CODATA/ICSU – <http://www.codata.org>

FORCE11 – <https://www.force11.org>

 

spinakSobre Ernesto Spinak

Colaborador do SciELO, engenheiro de Sistemas e licenciado em Biblioteconomia, com diploma de Estudos Avançados pela Universitat Oberta de Catalunya e Mestre em “Sociedad de la Información” pela Universidad Oberta de Catalunya, Barcelona – Espanha. Atualmente tem uma empresa de consultoria que atende a 14 instituições do governo e universidades do Uruguai com projetos de informação.

 

Como citar este post [ISO 690/2010]:

SPINAK, E. Princípios para citar dados científicos. SciELO em Perspectiva. [viewed 03 October 2016]. Available from: http://blog.scielo.org/blog/2015/01/15/principios-para-citar-dados-cientificos/