Princípios FAIR: critérios de qualidade para dados de pesquisa

2021-02-22

Fonte: Princípios FAIR : critérios de qualidade para dados de pesquisa – A publicação científica (hypotheses.org)

A qualidade dos conjuntos de dados de pesquisa é muito importante e precisa definir os critérios para avaliar a qualidade dos conjuntos de dados. Uma boa gestão de dados é também essencial para facilitar descobertas, inovação e reutilização para uma comunidade, depois o processo de publicação [9] .

A primeira iniciativa foi o DSA (Data Seal of Approval) [1] para repositórios em 2010-2011 que avalia os repositórios de dados. Desde o final de 2016 o grupo FORCE 11 definiu os princípios FAIR [2]. O acronimo significa : Findable, Accessible, Interoperable e Reusable ou seja em português : Achável, Acessível, Interoperavel, Reutilizável.

O FAIR é um conjunto minimal de princípios orientadores e praticas aceitadas pela comunidade para que os produtores e os usuários, humanos ou computadores poderão usar mais facilmente os dados e citar eles corretamente. Os princípios FAIR são ligados aos princípios de citações de dados definidos na Joint Declaration Data Citation Principles (JDDCP) do Force 11 [3].

Os princípios  recomendados pelo FAIR são os seguintes [2].

Achável

1. Para ser localizado qualquer objeto de dados deve ser identificável unicamente e persistentemente
1.1. O mesmo objeto de dados deve ser “re-findable” em qualquer ponto no tempo, portanto, os objetos de dados deve ser persistente, com ênfase em seus metadados,  ver também a [Joint Declaration Data Citation Principles JDDCP pontos 4 e  6]
1.2. Um objeto de dados deve incluir no mínimo metadados básicos acionáveis para uma máquina que permite que ele seja distinguido de outros objetos de dados [ver  JDDCP ponto 5]
1.3. Identificadores para qualquer conceito usado em objetos de dados devem ser, portanto, único e persistente [JDDCP pontos 4 e  6].

Acessível

2. Os dados são acessíveis na medida em que podem ser sempre obtidos por máquinas e seres humanos
2.1 Mediante autorização adequada [6]
2.2 Através de um protocolo bem definido [ver  JDDCP ponto 5]
2.3 Assim, máquinas e seres humanos serão capazes de julgar a acessibilidade atual de cada objeto de dados.

Interoperável

3. Os objetos de dados podem ser interoperáveis somente se :
3.1. (Meta) Os dados são processáveis pela máquina
3.2. (Meta) Os formatos de dados utilizam vocabulários compartilhados e/ ou ontologias
3.3  (Meta) Os dados dentro do objeto de dados devem ser tanto sintaxicamente interpretados (parseable) como semanticamente acessíveis para máquina.

Reutilizável

4. Para que os Objetos de dados sejam reutilizáveis, os critérios adicionais são:
4.1 Os objetos de dados devem ser compatíveis com princípios 1-3
4.2  (Meta) Os dados devem ser suficientemente bem descritos e ricos que podem ser automaticamente (ou com o mínimo de esforço humano) ligados ou integrados, comparado com o que é comparável, com outras fontes de dados [JDDCP pontos 7,  8]
4.3 Objetos de dados publicados devem se referir as fontes deles  com metadados ricos e proveniência para permitir a citação adequada [JDDCP  pontos 1-3).

Os principios FAIR poderão ser aplicados no DMP (Data Management Plan ou plano de gestão de dados). O programa Horizon 2020 [5, pagina 7] publicou instruções para incluir os princípios reitores FAIR dentro do padrão (template) DMP sobre a forma de perguntas para o responsável da redação do DMP. Eles também são utilizados para repositórios para melhorar as descrições dos conjuntos de dados (ver o site da Uniprot [9], um repositório de sequências de proteínas) ou para editores que querem que os autores colocam os dados ligados as publicações dentro de repositórios de dados [4].

4TU.Centre for Research Data e o TU Delft Research Data Services iniciam uma reflexão sobre esses princípios e estudam 37 repositórios e mostram que poucos estão seguindo os princípios de FAIR [7,8]. Por exemplo  49% dos repositórios não atribuem o identificador único (DOI, HANDLE, URN) aos conjuntos de dados.

Os resultados mostram que alguns princípios FAIR são fáceis para avaliar e outros são mais imprecisos e servem mais para abrir reflexão do que  ser realmente objetivos. Por exemplo o que pode ser definido como metadados ricos ? Ou definir que os metadados estão seguindo as normas da disciplina pertinente [8] ?

 

Fontes