Вы находитесь на странице: 1из 42

Workshop:

Práticas de curadoria de dados de


pesquisa em instituições
científicas

LAURA REZENDE: lauravil.rr@gmail.com


SONIA CRUZ-RIASCOS: sonia.cruzriascos@gmail.com
DANIELA FRANCESCUTTI: francescutti69@gmail.com
Apresentação
• Moderadoras do Workshop
• Participantes do Workshop
Roteiro
1. Apresentação e Sensibilização
• Quiz dinâmico de interação ao tema;
2. Curadoria de Dados de Pesquisa
3. Plano de Gestão de Dados de Pesquisa
• Atividade prática
4. Base de Dados de Pesquisa/Repositório de Dados de Pesquisa
5. Considerações finais
1. Apresentação e Sensibilização
QUIZ
• Acessar o site: www.menti.com
• Utilizar o código indicado
• Responder as questões
• Resultados do grupo
2. Curadoria de Dados de Pesquisa
Científica - aspectos essenciais:
- Open Science – Ciência Aberta
- Dados científicos
- Ciclo de vida dos dados científicos
- Curadoria digital de dados científicos
Open Science – Ciência Aberta
Open Science (OS) - conceito

• A ciência aberta é compreendida como um conceito amplo


• Prática da ciência que viabiliza a colaboração e a
contribuição.

• Neste contexto, dados de pesquisa, notas de laboratório e


outros processos de pesquisa estão disponíveis
gratuitamente, permitindo a reutilização, redistribuição e
reprodução da pesquisa, seus dados e métodos utilizados.
Open Science (OS) – objetivo e
características
• O objetivo é tornar a pesquisa mais aberta à participação, revisão,
contestação, melhoria e (re)uso para o benefício de todos.
• Abrange maior rigor, responsabilidade e reprodutibilidade para as
pesquisas;
• Baseia-se nos princípios de inclusão, equidade e
compartilhamento;
• Propõe modificações na forma como a pesquisa é feita, quem está
envolvido e como é valorizado.
Open Science (OS) - escopo
• Engloba uma variedade de práticas, geralmente incluindo: acesso
aberto às publicações, dados abertos de pesquisa, software livre,
ferramentas de código aberto, fluxos abertos de trabalho, ciência
cidadã, Recursos Educacionais Abertos (REA) e métodos alternativos
para avaliação de pesquisa, incluindo revisão aberta, dentre outros.
Open Science (OS) – impactos e
desafios
• Potenciais mudanças estruturais na prática acadêmica, cuja
cultura tradicional pode muitas vezes lidar com níveis
hierárquicos e postura conservadora;

• Resistência dos pesquisadores, inclusive daqueles simpatizantes


ao Movimento de Acesso Aberto e à Ciência Aberta;
Open Science (OS) – impactos e
desafios
• Observa-se que os mecanismos de incentivo existentes ainda não
refletem essa nova cultura de abertura e colaboração;

• Necessidade de trabalho de convencimento, enfatizando:


• Relevância da adoção das práticas;
• Importância dos trabalhos colaborativos para obtenção de
melhores resultados;
• Benefícios éticos, sociais e acadêmicos para todos os envolvidos.
Dados Científicos
Dados científicos
• Material registrado em algum meio (digital ou analógico),
que surge durante uma investigação científica, comumente
aceito na comunidade científica como necessário para
validar os resultados desta pesquisa;
• Informações ou observações que estão associadas a um
projeto científico em particular;
Dados científicos

“registros factuais usados como fonte primária para a


pesquisa científica e que são comumente aceitos pelos
pesquisadores como necessários para validar os resultados
do trabalho científico”(OECDE, 2007,p.13).
Dados científicos - classificação
SEGUNDO A SUA ORIGEM:
1) DADOS OBSERVACIONAIS
Obtidos por meio de observações diretas, associadas a lugares e tempo
específicos; natureza instantânea; importância crítica (registros históricos); não
podem ser coletados uma segunda vez; devem ser submetidos a processos de
curadoria que os preserve para sempre.

Ex: erupção de determinado vulcão numa data específica; levantamento das


atitudes de uma comunidade; os dados observacionais.
Dados científicos- classificação
SEGUNDO A SUA ORIGEM:
2) DADOS COMPUTACIONAIS
Resultados da execução de modelos computacionais ou simulações;
Preservação por longo prazo pode não ser necessária; dados podem ser
replicados ao longo do tempo; replicar o modelo ou a simulação no futuro
pode exigir descrição das dependências de hardware, software e outras, além
de dados de entrada. Algumas vezes é mais conveniente preservar somente os
dados de saída.

Ex: No domínio da física; criação de ambientes virtuais culturais ou


educacionais.
Dados científicos - classificação
SEGUNDO A SUA ORIGEM:
3) DADOS EXPERIMENTAIS
Provenientes de situações controladas em bancadas de laboratórios;
experimentos que podem ser precisamente reproduzidos; não necessitam ser
armazenados indefinidamente; nem sempre é possível reproduzir precisamente
todas as condições experimentais; custos de reprodução do experimento podem
ser proibitivos”

Ex: medidas de uma reação química (GREEN; MACDONALD; RICE,2009)


Dados científicos - classificação

SEGUNDO A SUA NATUREZA:


números, imagens, vídeos ou áudio, software, algoritmos, equações,
animações ou modelos e simulações.
Dados científicos - classificação
SEGUNDO A FASE DA PESQUISA:
1) DADOS BRUTOS, CRUS ou PRELIMINARES (RAW DATA)
São dados originados dos instrumentos científicos.
2) DADOS DERIVADOS
São resultados do processamento ou combinação de dados brutos ou de outros
dados.
3) DADOS CANÔNICOS ou DADOS REFERENCIAIS
São coleções de dados consolidados e arquivados geralmente em grandes centros
de dados, por exemplo, sequência genética, estrutura química, etc.
Dados abertos de pesquisa
científica
• Podem ser acessados, reutilizados, remixados e redistribuídos
livremente, para fins de pesquisa científica, ensino, dentre outras;
• Não possuem restrições de reutilização ou redistribuição e são
devidamente licenciados;
• O compartilhamento de dados expõe a pesquisa científica à
inspeção, formando a base para a sua verificação e reprodutibilidade
abrindo caminhos para uma colaboração mais ampla.

NOSSO FOCO
Ciclo de Vida dos Dados
Científicos
Ciclo de vida dos dados
científicos (Modelos)
• Os dados e as coleções de dados de pesquisa possuem um tempo de vida maior
que os projetos que os criaram;
• Pesquisadores, professores, estudantes e outros profissionais podem continuar a
trabalhar com esses dados ao final dos projetos investigativos;
• Novos projetos de pesquisa podem analisar ou adicionar outros elementos a
esses dados;
• Os dados são reutilizados por outros pesquisadores, reiniciando um novo ciclo;
• Existem vários modelos de ciclo de vida de dados científicos;
• Apresentam particularidades e objetivos determinados, muitas vezes orientados
para domínios de conhecimentos específicos;

Importância: modelos oferecem uma estrutura que representa as muitas


operações que precisarão ser realizadas sobre os registros de dados durante a sua
vida, garantido que eles possam ter a sua usabilidade otimizada e estendida.
Ciclo de vida dos dados
científicos (Modelos)
• DIGITAL CURATION CENTRE (DCC) - CURATION LIFECYCLE MODEL
http://www.dcc.ac.uk/resources/curation-lifecycle-model
• DATAONE DATA LIFECYCLE
http://escholarship.org/uc/item/7tf5q7n3#page-1
• DDI COMBINED LIFECYCLE MODEL
http://www.ddialliance.org/Specification/DDI-Lifecycle/
• UK DATA ARCHIVE DATA LIFECYCLE
http://www.data-archive.ac.uk/create-manage/life-cycle
Ciclo de vida dos dados
científicos (Modelos)

UK DATA ARCHIVE DATA LIFECYCLE

• https://www.youtube.com/watch?time_continue=1&v=-
wjFMMQD3UA
Ciclo de vida dos dados
científicos (Modelos)
• Um pesquisador ou uma equipe de pesquisadores está normalmente
engajada em todos os aspectos do ciclo de vida dos dados, no papel
de criador e também como usuário dos dados.

• Entretanto,
alguns projetos podem usar apenas parte do ciclo de
vida, não seguindo de forma linear o caminho delineado pelo
modelo.
Curadoria Digital
Curadoria digital - definições
• Curadoria digital envolve manutenção, preservação e atribuição
de valor a dados digitais de pesquisa científica durante todo o seu
ciclo de vida. O gerenciamento efetivo de dados de pesquisa
durante todo o seu ciclo diminui os riscos de obsolescência e
desvalorização da pesquisa ao longo do tempo (DCC, 2014).

• O principal objetivo do conceito de curadoria digital dos dados de


pesquisa se configura na necessidade de preservar não somente
os dados, mas também sua capacidade de transmitir
conhecimentos para uso futuro por parte de seus interessados
(SAYÃO e SALES, 2012).

• Curadoria digital se relaciona com o modo de tornar dados


disponível em formato digital para acesso futuro. A ideia é tornar
estes dados acessíveis, interpretáveis, reutilizáveis e confiáveis
(NEUROTH; STRATHMANN; OBWALD; LUDWIG, 2013).
Curadoria digital - consensos
• Conceito que surgiu depois da preservação digital;
• Pode ser entendida com o Gerenciamento de Dados de Pesquisa (RDM –
Research Data Management);
• Relação estreita com informação científica que tradicionalmente se preocupa
mais com o uso e reutilização imediata do que com a preservação como um
conceito abstrato (longo prazo);
• Uma vez que a preservação digital se refere às atividades de gerenciamento
necessárias para garantir acesso continuado a materiais digitais pelo tempo
que for necessário conclui-se que:
Não existe curadoria sem preservação digital !
Curadoria digital de dados
científicos – principais pontos
• Estende-se para além do controle de repositórios
que arquivam recursos informacionais;
• Envolve a atenção do criador de conteúdos e dos
usuários futuros;
• Relaciona-se com todo o ciclo de vida de materiais
digitais.
Curadoria digital de dados
científicos
- Vídeo: A Data Management Horror
Story
Plano de Gestão de Dados
Plano de Gestão de Dados (PGD)
• Descreve o ciclo de vida de gestão dos dados que serão
coletados, processados ou gerados por um projeto de
pesquisa científica;

• Consiste em um documento formal (ou carta de intenções)


que estabelece o compromisso de tratamento dos dados
durante todo o desenvolvimento do projeto, e também após
a sua conclusão;

• Descreve as metodologias e padrões utilizados;


Plano de Gestão de Dados (PGD)

• Descreve as condições de compartilhamento e/ou abertura


de dados para o reuso, bem como a forma de curadoria e
preservação;

• Espelha uma situação dinâmica, não se trata de um


documento fixo, ao contrário, ele se desenvolve e ganha
mais precisão e solidez durante o tempo de vida do projeto.
Por que criar um Plano de
Gestão de Dados (PGD)?
• Ajustar o projeto de pesquisa científica às políticas mandatárias
da instituição e/ou dos órgãos de fomento à pesquisa;
• Assegurar a integridade da pesquisa científica e o seu potencial de
replicação;
• Assegurar que os dados e demais registros de pesquisa sejam
acurados, completos, autênticos e confiáveis;
• Aumentar a sua eficiência como pesquisador;
Por que criar um Plano de
Gestão de Dados (PGD)?
• Permitir que os dados sejam compreensíveis agora e no futuro –
se os dados são bem documentados antes e durante a formação
da coleção, eles serão mais facilmente entendidos e reutilizados;
• Economizar tempo e recursos a longo prazo;
• Aumentar a segurança dos dados e minimizar os riscos de perda;
• Evitar a duplicação de esforços na (re)coleta ou (re)geração dos
dados, possibilitando que outros pesquisadores se beneficiem dos
seus dados e os interprete em outros contextos e com novas
visões;
Por que criar um Plano de
Gestão de Dados (PGD)?
• Aumentar a visibilidade da pesquisa – se os dados foram planejados para estar
organizados e arquivados, eles poderão ser identificados, recuperados e citados,
aumentando a visibilidade da pesquisa e o prestígio do pesquisador;

• Tornar mais fácil a preservação e o arquivamento – ajustando antecipadamente


a geração de dados tomando como referência as práticas, formatos e demais
padrões mais adequados ao arquivamento e à preservação de longo prazo, torna
a gestão de dados mais fácil e menos onerosa; além do mais, tornam os dados
mais aderentes aos requisitos dos repositórios e centros de dados.
Como criar um Plano de Gestão
de Dados (PGD)?
• O PGD pode ser criado por meio de padrões e templates definidos
pela sua instituição ou por agências de financiamento que
patrocinam os projetos de pesquisa científica;

• Ferramentas on-line que auxiliam na elaboração do PGD.


3. Plano de Gestão de Dados de Pesquisa
Atividade prática:
• Criação de um Plano de Gestão de Dados de Pesquisa
4. Base de Dados de Pesquisa/Repositório
- Dryad
- Zenodo
- Dataverse
5. Considerações finais
• Diferentes abordagens são consideradas;
• Cada instituição/caso deve ser tratado considerando suas
particularidades;
• Variação entre as áreas do conhecimento;
• Importância das etapas que antecedem a implementação de
práticas de curadoria.
Referências
GREEN, Ann; MACDONALD, Stuart; RICE, Robin. Policy-making for research data in Repositories: a guide. May
2009. Disponível em: < https://www.coar-repositories.org/files/guide.pdf >. Acesso em: set. 2018.
NEUROTH, Heike et al. Digital curation of research data. Experiences of a Baseline Study in Germany,(Glückstadt,
2013), 2013.
OECD. OECD Principles and Guidelines for Access to Research Data from Public Funding. 2007. Disponível em: <
http://www.oecd.org/sti/sci-tech/38500813.pdf >. Acesso em: set. 2018.
SAYÃO, Luis Fernando; SALES, Luana Farias. Curadoria digital: um novo patamar para preservação de dados digitais de
pesquisa. Inf. & Soc.: Est., João Pessoa, v.22, n.3, p.179-191, set./ dez. 2012. Disponível em: <
http://www.ies.ufpb.br/ojs2/index.php/ies/ article/view/12224>. Acesso em: 20 dez. 2013.
UNIVERSITY OF EDINBURGH. Defining Research Data. https://www.ed.ac.uk/information-services/research-
support/research-data-service/sharing-preserving-data/data-repository/definitions

Вам также может понравиться