SlideShare uma empresa Scribd logo
GESTÃO DE
DADOS CIENTÍFICOS
O PAPEL DAS
BIBLIOTECAS
Pedro Príncipe
Serviços de Documentação
da Universidade do Minho
Projeto OpenAIREplus
pedroprincipe@sdum.uminho.pt
O mote para o workshop…
 Necessidade de compreender o papel que as
bibliotecas e serviços de informação e
documentação têm hoje que desempenhar no
domínio dos dados científicos produzidos pelas
instituições de investigação.
 Traçar uma visão geral dos principais campos de
compreensão e intervenção dos profissionais
envolvidos na gestão de informação científica e
académica.
PROGRAMA
1. Dados científicos: conceitos e tipologias
2. Gestão de dados científicos: relevância e desenvolvimentos
3. Ciclo de vida dos dados científicos e etapas na gestão
4. Recomendações da LIBER sobre o papel das
bibliotecas na gestão de dados
5. Políticas institucionais para a gestão dos dados
6. Planeamento da gestão de dados científicos
7. Recursos, iniciativas e boas práticas
DADOS CIENTÍFICOS:
CONCEITOS E TIPOLOGIAS
1
O que são dados científicos…
http://epicgraphic.com/data-cake
Todo o tipo de registos produzidas no
decurso da investigação.
DADOS CIENTÍFICOS
• Definição da OCDE:
• “registos factuais usados como fontes primárias na
investigação científica, e que são geralmente aceites
na comunidade científica como necessários para
validar os resultados de investigação”.
DADOS CIENTÍFICOS
• Podem assumir várias formas (texto, números,
imagens fixas, imagens em movimento, etc.) e
• dimensões, desde registos de observações individuais ou
ensaios de pequenos laboratórios que não ultrapassarão
algumas centenas de kilobytes, até aos dados produzidos pelo
Large Hadron Collider (LHC) do CERN, que pode gerar várias
dezenas de petabytes por dia.
“Os repositórios de dados científicos: estado da arte” – http://repositorium.sdum.uminho.pt/handle/1822/10830
DADOS CIENTÍFICOS
Analógicos ou digitais
Livros de laboratório ou software
Criados na forma digital ('born digital')
Ou convertidos para a forma digital (‘digitised’)
DADOS CIENTÍFICOS
• Produzidos ou utilizados no contexto de investigação científica:
• recolhidos ou criados para efeito de
processamento científico, como os dados atmosféricos usados
para previsão meteorológica, ou os dados recolhidos de sensores para
monitorizar o estado de um edifício.
• obtidos como resultados do processamento
automático de objetos (por exemplo, uma coleção de imagens
processada para obter os respetivos histogramas de cor, que constituem
assim novos dados).
• dados que não são produzidos para investigação
mas que acabam por ser objeto dela, como as
contribuições que os utilizadores de uma rede social fazem na forma de
textos, fotografias ou outros objetos e que acabam por ser utilizados para
estudos sociológicos.
Tipos de dados científicos
Instrument measurements
Experimental observations
Still images, video and audio
Text documents, spreadsheets, databases
Quantitative data (e.g. household survey data)
Survey results & interview transcripts
Simulation data, models & software
Slides, artefacts, specimens, samples
Sketches, diaries, lab notebooks…
DADOS CIENTÍFICOS
• Para se constituírem como verdadeiramente úteis, os dados
científicos devem possuir estrutura e organização.
• Os conjuntos de dados (“datasets”) são uma das unidades
essenciais.
• Os conjuntos de dados são coleções de informações ou factos
relacionados entre si e registados num formato comum.
• Por exemplo, os resultados de um estudo de opinião por entrevista
numa investigação sociológica constituem um conjunto de dados,
composto pelos registos individuais das entrevistas.
“Os repositórios de dados científicos: estado da arte” – http://repositorium.sdum.uminho.pt/handle/1822/10830
Dados científicos
Dados científicos
GESTÃO DE DADOS CIENTÍFICOS:
RELEVÂNCIA E
DESENVOLVIMENTOS
2
RELEVÂNCIA DO TEMA
+ relevante o entendimento da necessidade de gerir o acesso e
a utilização dos dados produzidos ou recolhidos no âmbito das
atividades de investigação, garantindo a sua preservação.
European Bioinformatics Institute (EBI)
RELEVÂNCIA DO TEMA
• Cresce a sensibilidade dos investigadores para os
efeitos da verdadeira explosão na produção de dados
científicos:
• crescimento global das atividades de investigação
• consequência dos novos métodos e instrumentos de
pesquisa e registo que originam cada vez maiores volumes
de dados.
• Onde o trabalho de investigação é baseado na análise de
dados recolhidos de forma distribuída parece ter sido mais
precoce e mais profundo.
RELEVÂNCIA DO TEMA
• Os organismos que produzem e financiam
ciência têm manifestado nestes últimos anos redobrada
atenção à necessidade de assegurar meios e mecanismos para
a gestão dos dados científicos.
Relevância do tema
http://royalsociety.org/policy/projects/science-public-enterprise/report
Relevância do tema
“To make progress in
science, we need to be
open and share…
sharing data, and having
the forum to openly use
and build on what is
shared, are essential to
science. They fuel the
progress and practice of
scientific discovery. ”
Neelie Kroes, Rome, 11 April 2012
Relevância do tema
http://ec.europa.eu/information_society/newsroom/cf/document.cfm?action=display&doc_id=707
RELEVÂNCIA DO TEMA
RELEVÂNCIA DO TEMA
• Multiplicam-se as iniciativas de Open Access, Open Data.
• Panton Principles for Open Data in Science: http://pantonprinciples.org
“Entendemos por dados abertos, em ciência, aqueles que estão
livremente disponíveis na Internet pública permitindo a qualquer
utilizador baixar, copiar, analisar, reprocessar, usá-los com um
software ou utilizá-los para qualquer outra finalidade sem
barreiras financeiras, legais, técnicas ou outras além do acesso à
Internet. Para este fim, os dados relacionados com ciência
publicada devem ser explicitamente colocados em domínio
público.“
Algumas leituras e recursos de
referência• OCDE
• OECD. Declaration on Access to Research Data From Public Funding, Paris, 2004.
http://www.oecd.org/document/15/0,3343,en_2649_34487_25998799_1_1_1_1,00.html
• OECD Principles and Guidelines for Access to Research Data from Public Funding. Paris, 2007.
http://www.oecd.org/dataoecd/9/61/38500813.pdf
• Várias iniciativas dos Conselhos de Investigação do Reino Unido
• RCUK. (2011). Common Principles on Data Policy -
http://www.rcuk.ac.uk/research/Pages/DataPolicy.aspx
• Jones, Sarah. (2011). Summary of UK research funders’ expectations for the content of data
management and sharing plans http://www.dcc.ac.uk/
• Iniciativas no Contexto da União Europeia produzidas pela Comissão Europeia no
âmbito da Agenda Digital Europeia e ERA
• CE (2012): Communication on a reinforced European Research Area partnership for excellence and
growth
• Communication Towards better access to scientific information
• Recommendation on access to and preservation of scientific information
• EUA com iniciativas da National Science Foundation - http://www.nsf.gov
CICLO DE VIDA DOS DADOS
CIENTÍFICOS E ETAPAS NA
GESTÃO
3
O que está envolvido na gestão de
dados científicos:
•Planeamento e gestão de dados
•Criação de dados
•Documentar os dados
•Acesso e utilização dos dados
•Armazenamento e backups
•Partilha dos dados
•Preservação dos dados
Digital Curation Centre
Curadoria
• Curadoria de dados é a atividade de gestão e utilização de
dados desde o momento da sua criação para garantir o seu
armazenamento, a sua pesquisa e respetiva reutilização.
“the active management and appraisal
of data over the lifecycle of scholarly and
scientific interest”
Digital Curation Centre
Caracterização das atividades de pesquisa
Information discovery
Data acquisition
Data management Data analysis
Data sharingData processing
Study concept and design
Hypothesis generation
Data archiving
Results and conclusions
Seminars and conference presentations
Articles and reports
Undertaking experiments
O ciclo de vida dos dados e a sua
gestão:
Anthony Beitz, Monash University. OR 2012, Edinburgh
CollaborateConceive Design Experiment Publish ExposeAnalyseDesign ExposeCollaborateExperiment PublishAnalyseDesign
Gestão e
Planeamento
de dados
Repositórios disciplinares
Ou institucionais e
Revistas científicas
Plataforma de
Gestão de dados científicos
Ciclo de vida convencional
dos dados científicos
Scholarly publications:
conference papers and
journal articles
Raw data in research note-
books and live PC files
Research results
and conclusions
Data selection and
interpretation
Publication
activities
Research datasets abandoned on
local hard drives or CD-ROMs
Hypothesis formulation
and project design
Experimentation
and data creation
Research plan
Institutional
repositories
Ciclo de vida aumentado
dos dados científicos
Scholarly publications:
conference papers and
journal articles
Raw data in research note-
books and live PC files
Research results
and conclusions
Hypothesis formulation
and project design
Experimentation
and data creation
Data selection
and interpretation
Publication
activities
Research plan
Institutional
repositories
Papers and
datasets
Local
filestore
Private and
sharable
Open data on Web
Gestão
Disseminação
Preservação
Debate entre os participantes…
• Razões para os investigadores se
preocuparem com a gestão dos dados…
• Razões para as instituições se preocuparem
com a gestão dos dados…
As bibliotecas neste processo
• Apoiar e aconselhar estudantes, investigadores,
grupos de investigação sobre os meios e formas mais
adequadas para preparar os dados para o seu
armazenamento, a pesquisa e a reutilização.
Algumas leituras e recursos de referência
• Knowledge-Exchange (2011),
"A Surfboard for Riding the Wave Towards a four country action programme on re
• Ball, A and Duke, M (2011) How to Cite Datasets and Link to Publications.
Digital Curation Centre http://www.dcc.ac.uk/webfm_send/525
• Green, T (2009), “We Need Publishing Standards for Datasets and Data
Tables”, OECD Publishing White Paper,OECD Publishing.doi:
10.1787/603233448430 http://dx.doi.org/10.1787/603233448430
• MaRDI-Gross project DMP Planning for Big Science Projects (2012).
http://arxiv.org/abs/1208.3754v1
• Digital Curation Centre – http://www.dcc.ac.uk
• International Journal of Digital Curation - http://www.ijdc.net/
• Data Science Journal - http://www.jstage.jst.go.jp/browse/dsj
• Open Knowledge Foundation: http://okfn.org/
• OpenAIRE: http://www.openaire.eu
Ofinia em Gestão de dados científicos: o papel das bibliotecas
RECOMENDAÇÕES DA LIBER
SOBRE O PAPEL DAS
BIBLIOTECAS
4
Recomendações para as Bibliotecas
1. Apoio na gestão dos dados
científicos
• Offer research data management support,
including data management plans for grant
applications, intellectual property rights advice
and information materials. Assist faculty with
data management plans and the integration of
data management into the curriculum.
Importância do plano de GDC
http://youtu.be/1stLmJUO81A
Objectives and Disclaimers
• Looking through the eyes of a researcher
• Mensagens simples elucidando sobre – o que é que
nós como serviço de informação – esperamos dos
investigadores.
• Usando ferramentas
• Pragmaticas em termos de funcionalidades
• thank you, in advance, for helping us improving
the tools
OAI8, June 2013
2. Desenvolvimento de serviços e
metadados
• Engage in the development of metadata and
data standards and provide metadata services
for research data.
Ofinia em Gestão de dados científicos: o papel das bibliotecas
Digital Curation Centre
http://www.dcc.ac.uk/resources/metadata-standards
Gestão de Dados Científicos
• Um dos primeiros requisitos é que os conjuntos de dados
sejam acompanhados de informação que descreva a
sua origem (tempo ou espaço, métodos e instrumentos
de recolha), âmbito, autoria, propriedade e condições
de reutilização, ou seja, de metadados.
• Em paralelo com a interoperabilidade tecnológica, a
existência de metadados adequados e normalizados é
um requisito essencial para o acesso e reutilização dos
dados científicos.
DOCUMENTAÇÃO E METADADOS
• Repositórios de dados científicos e a normalização dos
metadados.
• Difícil uniformizar a descrição entre domínios ceintíficos.
• A descrição dos conjuntos de dados ainda se pode considerar
muito pouco desenvolvida.
• Ao nível do conjunto têm sido adoptados modelos genéricos
como o do Dublin Core, já muito utilizado nos repositórios
institucionais.
• Projecto DataShare (Edimburgo, Oxford e Southampton)
Necessidade dos metadados
Public
Research
Community
Project
Researcher
Metadata may not be required
if you are working alone on
your own computer, but
become crucial when data are
shared online.
Metadata help to place your
dataset in a broader context,
allowing those outside your
institution, discipline, or
research environment to
understand how to interpret
your data.
3. Desenvolvimento de competências
• Create Data Librarian posts and develop
professional staff skills for data librarianship.
http://www.sheffield.ac.uk/is/research/projects/rdmrose
Ofinia em Gestão de dados científicos: o papel das bibliotecas
4. Políticas institucionais de gestão dos
dados
• Actively participate in institutional research
data policy development, including resource
plans. Encourage and adopt open data policies
where appropriate in the research data life
cycle.
Políticas institucionais de GDC
http://youtu.be/V8IIdfBAr_0
5. Trabalhar em articulação com os
parceiros para fomentar
infraestruturas
• Liaise and partner with researchers, research
groups, data archives and data centers to
foster an interoperable infrastructure for data
access, discovery and data sharing.
6. Disponibilizar serviços de curadoria
no ciclo de vida dos dados científicos
• Support the lifecycle for research data by
providing services for storage, discovery and
permanent access.
https://dmponline.dcc.ac.uk
www.dcc.ac.uk/resources/how-guides/develop-data-plan
7. Citação dos dados e links e
identificadores permanentes
• Promote research data citation by applying
persistent identifiers to research data.
Ofinia em Gestão de dados científicos: o papel das bibliotecas
8. Repositórios de dados
• Provide an institutional Data Catalogue or
Data Repository, depending on available
infrastructure.
Ofinia em Gestão de dados científicos: o papel das bibliotecas
9. Envolva-se e pratique a gestão de
dados científicos
• Get involved in subject specific data
management practice.
10. Oferecer ou mediar serviços de
armazenamento
• Offer or mediate secure storage for dynamic
and static research data in co-operation with
institutional IT units and/or seek exploitation of
appropriate cloud services.
Exemplos
University of Edinburgh policy
http://www.ed.ac.uk/is/research-data-policy
Research data guidance
http://www.ed.ac.uk/is/data-management
MANTRA online training
http://datalib.edina.ac.uk/mantra/
Edinburgh University Data Library
http://www.ed.ac.uk/is/data-library
PLANEAMENTO DA
GESTÃO DE DADOS
CIENTÍFICOS
5
PLANEAMENTO DA GDC
• Principais questões no planeamento da gestão de dados
científicos:
• Tipos de dados, formatos, normas e métodos de recolha
• Questões legais e éticas, de propriedade intelectual
• Acesso, Partilha e reutilização dos dados
• Gestão e armazenamento de curto prazo
• Depósito (arquivo) e preservação a longo prazo
Gestão de Dados Científicos
• As condições em que os dados recolhidos ou
produzidos numa investigação podem, ou não, ser
acedidos e reutilizados por outros investigadores, para
além do contexto em que foram gerados, são questões
importantes.
• A forma como são cuidados (curadoria de dados) e as
condições legais associadas ao seu acesso e partilha
constituem os dois elementos determinantes do futuro
dos diversos conjuntos de dados científicos.
• É preciso garantir que os dados são registados,
mantidos e preservados de forma adequada.
“Os repositórios de dados científicos: estado da arte” – http://repositorium.sdum.uminho.pt/handle/1822/10830
http://www.miidi.org/dmp
Report:
Elementos do planeamento da gestão
de dados científicos
Monash University's
Research Data Management Strategy and Strategic Plan 2012-2015
Monash University's
Research Data Management Strategy and Strategic Plan 2012-2015
Importância de documentar os dados
http://youtu.be/7IN_SD5B43U
POLÍTICAS INSTITUCIONAIS
PARA A GESTÃO DOS DADOS
6
Institucional
http://www.youtube.com/watch?
v=BkRuH9UUWh0&feature=share&list=PL8_n9EkZ_xHxYMMeLIV5v40ww87
kEKn0E
Bons exemplos
• http://monash.edu/library/researchdata/about/strategy/
• Monash University's Research Data Management Strategy and
Strategic Plan 2012-2015 [pdf 196kB] was publicly released on
13 April 2012.
Requisitos dos financiadores
(1) Data
contained and
explained within
the article
(2) Further data
explanations in
any kind of
supplementary
files to articles
(3) Data
referenced from
the article and
held in data
centers and
repositories(4) Data
publications,
describing
available datasets
(5) Data in
drawers and on
disks at the
institute
The Data Publication
Pyramid
Mais rEFERÊNCIAS
•Australia National University's Information Literacy Program DPM Template is a formatted template
for any discipline.
•The Australian National Data Service created Data Management Planning, a document that lists the
questions that should be answered in a data management plan.
•The Digital Curation Centre created its Data Management Plan Content Checklist as "a
comprehensive list of the details that researchers may be asked to include in such plans.”
•The Finnish Social Science Data Archive's Data Management Planning Website lists questions that
should be answered in a data management plan. It is aimed at social science researchers in particular.
•Geoscience Australia's Guide to Preparation of Data Management Plans.
•MIT Libraries' Data Management Webpage provides a list of questions that should be answered in
data management plan.
•The National Science Board's Long-Lived Digital Data Collections Enabling Research and Education in
the 21st Century is one of the foundational documents in the US' current push for data sharing. It
gives broad guidelines for what should be included.
•The National Science Foundation Directorate for Engineering's Data Management for NSF
Engineering Directorate Proposals and Awards is the first document to directly address the coming
NSF requirement
•The Queensland University of Technology QUT Data Management Checklist is a highly structured,
populable template.
•The UK Rural Economy and Land Use Programme's Data Management Plan is a form that must be
filled out by RELU award holders at the outset of their projects.
•The University of Melbourne's Research Data Management Plan Template is a te,plate aimed at
university researchers.
RECURSOS, INICIATIVAS
E BOAS PRÁTICAS
7
Papel da biblioteca – na prática…
National Science Foundation
http://youtu.be/Lc82pxxRkMo
Observações finais (na prática)
http://www.pangaea.de
Observações finais (na prática)
Observações finais (na prática)

Mais conteúdo relacionado

PPT
Conferencia primeira luso_brasileira_acesso_aberto-u_minho_2010_11_26
PPTX
USO DE BASES DE DADOS PARA UM SERVIÇO AVANÇADO EM INFORMAÇÃO CIENTÍFICA E TEC...
PPTX
Gestão de Dados Científicos: desafios e estratégias nas Instituições #ConfOA2015
PDF
Dados de pesquisa: compartilhamento e publicação
PDF
Workshop APDIS sobre Gestão de Dados Científicos
PPTX
Luciene Delazari - Os periódicos brasileiros frente aos desafios da Ciência A...
PPTX
Springer nature e a importância dos dados de pesquisa
PPT
Gestão de dados científicos: o papel das bibliotecas
Conferencia primeira luso_brasileira_acesso_aberto-u_minho_2010_11_26
USO DE BASES DE DADOS PARA UM SERVIÇO AVANÇADO EM INFORMAÇÃO CIENTÍFICA E TEC...
Gestão de Dados Científicos: desafios e estratégias nas Instituições #ConfOA2015
Dados de pesquisa: compartilhamento e publicação
Workshop APDIS sobre Gestão de Dados Científicos
Luciene Delazari - Os periódicos brasileiros frente aos desafios da Ciência A...
Springer nature e a importância dos dados de pesquisa
Gestão de dados científicos: o papel das bibliotecas

Destaque (20)

PDF
Poster - Webinars BAD: novas formas de transferência de saberes dos profissio...
PPTX
OpenAIRE e OpenAIREplus - apresentação dos projetos no Colabora2013
PPTX
Apresentação nº comemorativo dos Cadernos BAD e Publicações Online da BAD
PPTX
Infraestrutura Open Access para a investigação na Europa: o que pode o OpenAI...
PPTX
RDM librarians Skills & Competencies: roles & training (SPARC & COAR Member W...
PPTX
Acesso Aberto como prática padrão de disseminação da investigação na Europa -...
PPTX
Estudo Prospectivo sobre a implementação do DOI em Portugal - Jornadas FCCN 2016
PPTX
Tecnologias emergentes e web social: oportunidades nas bibliotecas públicas
PPTX
CRIS 2014 - OpenAIRE Guidelines: supporting interoperability for Literature R...
PPTX
Apresentação das Atas dos Encontros dos Arquivos Municipais (versão online) -...
PPTX
From the RepositóriUM to the European Open Access Infrastructure
PDF
OpenAIRE – from a Repository Network to a European wide Research Information ...
PDF
Poster - OpenAIRE Guidelines for Data Archive, Literature Repository and CRI...
PDF
Poster DC-2013 minute madness - OpenAIRE Guidelines for Data Archive, Litera...
PDF
Poster apresentado na ConfOA 2014 - Plano de intervenção dos Serviços de Docu...
PDF
OpenAIRE - Infraestrutura de Acesso Aberto para a Investigação na Europa (XII...
PPTX
Debate sobre Bibliotecas Universitárias na Conferência "Advocacy for Libraries"
PPTX
Tendências nas Bibliotecas, infraestruturas de informação e comunicação cient...
PPTX
Webinar - ZENODO: compartir datos de investigación en Europa
PPTX
Sistemas de informação Open Source: reflexões críticas e casos de uso
Poster - Webinars BAD: novas formas de transferência de saberes dos profissio...
OpenAIRE e OpenAIREplus - apresentação dos projetos no Colabora2013
Apresentação nº comemorativo dos Cadernos BAD e Publicações Online da BAD
Infraestrutura Open Access para a investigação na Europa: o que pode o OpenAI...
RDM librarians Skills & Competencies: roles & training (SPARC & COAR Member W...
Acesso Aberto como prática padrão de disseminação da investigação na Europa -...
Estudo Prospectivo sobre a implementação do DOI em Portugal - Jornadas FCCN 2016
Tecnologias emergentes e web social: oportunidades nas bibliotecas públicas
CRIS 2014 - OpenAIRE Guidelines: supporting interoperability for Literature R...
Apresentação das Atas dos Encontros dos Arquivos Municipais (versão online) -...
From the RepositóriUM to the European Open Access Infrastructure
OpenAIRE – from a Repository Network to a European wide Research Information ...
Poster - OpenAIRE Guidelines for Data Archive, Literature Repository and CRI...
Poster DC-2013 minute madness - OpenAIRE Guidelines for Data Archive, Litera...
Poster apresentado na ConfOA 2014 - Plano de intervenção dos Serviços de Docu...
OpenAIRE - Infraestrutura de Acesso Aberto para a Investigação na Europa (XII...
Debate sobre Bibliotecas Universitárias na Conferência "Advocacy for Libraries"
Tendências nas Bibliotecas, infraestruturas de informação e comunicação cient...
Webinar - ZENODO: compartir datos de investigación en Europa
Sistemas de informação Open Source: reflexões críticas e casos de uso
Anúncio

Semelhante a Ofinia em Gestão de dados científicos: o papel das bibliotecas (20)

PDF
Oficina 4 - Gestao de dados cientificos: o papel das bibliotecas
PPTX
Gestão de dados para periódicos científicos
PDF
Ciência Aberta na prática - processos e políticas, serviços e ferramentas
PDF
ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...
PPTX
Situação e tendências da gestão de dados de investigação
PDF
Gestão de Dados de Pesquisa e o Papel dos Bibliotecários
PDF
Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...
PDF
Apresentacao fea gestao de dados agosto 2019
PPTX
Gestão de Dados Científicos nas Instituições - workshop #ConfOA2015
PDF
Dados de pesquisa (infraestrutura para publicação, compartilhamento e preserv...
PPTX
Gestão de Dados de Investigação - Os desafios dos novos profissionais de info...
PDF
Dados abertos de pesquisa: contribuição para um modelo de gestão para o país
PDF
Gestão de dados de pesquisa
PDF
Marcondes - Curadoria de dados de Pesquisa, Semana do Bibliotecário ECI-UFMG ...
PDF
Gestão de dados de pesquisa em tempos de pandemia e as bibliotecas
PPTX
A Influência das Revistas Científicas de Acesso Aberto para o Depósito e Publ...
PDF
Preservação e curadoria de dados cientificos
PDF
Preservação e Curadoria de Dados Científicos
PDF
Erebd suenia bigdata
PPTX
Serviços para suporte à gestão de dados científicos na UMINHO: plano de inter...
Oficina 4 - Gestao de dados cientificos: o papel das bibliotecas
Gestão de dados para periódicos científicos
Ciência Aberta na prática - processos e políticas, serviços e ferramentas
ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...
Situação e tendências da gestão de dados de investigação
Gestão de Dados de Pesquisa e o Papel dos Bibliotecários
Dados Abertos e os Serviços para a Gestão de Dados de Investigação - Workshop...
Apresentacao fea gestao de dados agosto 2019
Gestão de Dados Científicos nas Instituições - workshop #ConfOA2015
Dados de pesquisa (infraestrutura para publicação, compartilhamento e preserv...
Gestão de Dados de Investigação - Os desafios dos novos profissionais de info...
Dados abertos de pesquisa: contribuição para um modelo de gestão para o país
Gestão de dados de pesquisa
Marcondes - Curadoria de dados de Pesquisa, Semana do Bibliotecário ECI-UFMG ...
Gestão de dados de pesquisa em tempos de pandemia e as bibliotecas
A Influência das Revistas Científicas de Acesso Aberto para o Depósito e Publ...
Preservação e curadoria de dados cientificos
Preservação e Curadoria de Dados Científicos
Erebd suenia bigdata
Serviços para suporte à gestão de dados científicos na UMINHO: plano de inter...
Anúncio

Último (20)

PPTX
AULA METodologia MODIFIC PART 1 MSC.pptx
PDF
Historia-da-Psicologia-Rumos-e-percursos.pdf
PPT
Domínios Morfoclimáticos.................................
PDF
[Slides] A Literatura no ENEM 2017 (1).pdf
PPTX
Fronteiras e soberania..........................pptx
DOC
PPP 2024 (2) (2) feito EM REELABORAÇÃO MORENA ( ABRIL 2024).doc
PPT
AS VANGUARDAS EUROPEIAS NA LITERATURA E N
PDF
E-BOOK-Inovacao-em-Ciencia-e-Tecnologia-de-Alimentos.pdf
PPTX
REVISA-GOIAS-6o-ANO-LP-3o-BIMESTRE-PPT.pptx
PDF
edital-de-chamamento-publico-no-3-2025.pdf
PPSX
A epistemologia de Wilheim G Leibniz.ppsx
PDF
Atividades sobre o livro Letras de Carvão
PDF
morfologia5.pdfllllllllllllllllllllllllllll
PPTX
Aula 01 introdução a Psicologia Escolar.pptx
PPT
YY2015MM3DD6HH12MM42SS3-Organiza__o do Estado ILP.ppt
PDF
Fiqh da adoração (islamismo)
PDF
Urbanização no Brasil LEVANDO EM CONTA CONCEITOS
PDF
Pecados desdenhados por muita gente (islamismo)
PDF
EXPRESSÕES IDIOMÁTICAS - LÍNGUA PORTUGUESA
PPTX
INTRODUÇÃO AO ESTUDO DA ANATOMIA HUMANA [Salvo automaticamente].pptx
AULA METodologia MODIFIC PART 1 MSC.pptx
Historia-da-Psicologia-Rumos-e-percursos.pdf
Domínios Morfoclimáticos.................................
[Slides] A Literatura no ENEM 2017 (1).pdf
Fronteiras e soberania..........................pptx
PPP 2024 (2) (2) feito EM REELABORAÇÃO MORENA ( ABRIL 2024).doc
AS VANGUARDAS EUROPEIAS NA LITERATURA E N
E-BOOK-Inovacao-em-Ciencia-e-Tecnologia-de-Alimentos.pdf
REVISA-GOIAS-6o-ANO-LP-3o-BIMESTRE-PPT.pptx
edital-de-chamamento-publico-no-3-2025.pdf
A epistemologia de Wilheim G Leibniz.ppsx
Atividades sobre o livro Letras de Carvão
morfologia5.pdfllllllllllllllllllllllllllll
Aula 01 introdução a Psicologia Escolar.pptx
YY2015MM3DD6HH12MM42SS3-Organiza__o do Estado ILP.ppt
Fiqh da adoração (islamismo)
Urbanização no Brasil LEVANDO EM CONTA CONCEITOS
Pecados desdenhados por muita gente (islamismo)
EXPRESSÕES IDIOMÁTICAS - LÍNGUA PORTUGUESA
INTRODUÇÃO AO ESTUDO DA ANATOMIA HUMANA [Salvo automaticamente].pptx

Ofinia em Gestão de dados científicos: o papel das bibliotecas

  • 1. GESTÃO DE DADOS CIENTÍFICOS O PAPEL DAS BIBLIOTECAS Pedro Príncipe Serviços de Documentação da Universidade do Minho Projeto OpenAIREplus pedroprincipe@sdum.uminho.pt
  • 2. O mote para o workshop…  Necessidade de compreender o papel que as bibliotecas e serviços de informação e documentação têm hoje que desempenhar no domínio dos dados científicos produzidos pelas instituições de investigação.  Traçar uma visão geral dos principais campos de compreensão e intervenção dos profissionais envolvidos na gestão de informação científica e académica.
  • 3. PROGRAMA 1. Dados científicos: conceitos e tipologias 2. Gestão de dados científicos: relevância e desenvolvimentos 3. Ciclo de vida dos dados científicos e etapas na gestão 4. Recomendações da LIBER sobre o papel das bibliotecas na gestão de dados 5. Políticas institucionais para a gestão dos dados 6. Planeamento da gestão de dados científicos 7. Recursos, iniciativas e boas práticas
  • 5. O que são dados científicos… http://epicgraphic.com/data-cake
  • 6. Todo o tipo de registos produzidas no decurso da investigação.
  • 7. DADOS CIENTÍFICOS • Definição da OCDE: • “registos factuais usados como fontes primárias na investigação científica, e que são geralmente aceites na comunidade científica como necessários para validar os resultados de investigação”.
  • 8. DADOS CIENTÍFICOS • Podem assumir várias formas (texto, números, imagens fixas, imagens em movimento, etc.) e • dimensões, desde registos de observações individuais ou ensaios de pequenos laboratórios que não ultrapassarão algumas centenas de kilobytes, até aos dados produzidos pelo Large Hadron Collider (LHC) do CERN, que pode gerar várias dezenas de petabytes por dia. “Os repositórios de dados científicos: estado da arte” – http://repositorium.sdum.uminho.pt/handle/1822/10830
  • 9. DADOS CIENTÍFICOS Analógicos ou digitais Livros de laboratório ou software Criados na forma digital ('born digital') Ou convertidos para a forma digital (‘digitised’)
  • 10. DADOS CIENTÍFICOS • Produzidos ou utilizados no contexto de investigação científica: • recolhidos ou criados para efeito de processamento científico, como os dados atmosféricos usados para previsão meteorológica, ou os dados recolhidos de sensores para monitorizar o estado de um edifício. • obtidos como resultados do processamento automático de objetos (por exemplo, uma coleção de imagens processada para obter os respetivos histogramas de cor, que constituem assim novos dados). • dados que não são produzidos para investigação mas que acabam por ser objeto dela, como as contribuições que os utilizadores de uma rede social fazem na forma de textos, fotografias ou outros objetos e que acabam por ser utilizados para estudos sociológicos.
  • 11. Tipos de dados científicos Instrument measurements Experimental observations Still images, video and audio Text documents, spreadsheets, databases Quantitative data (e.g. household survey data) Survey results & interview transcripts Simulation data, models & software Slides, artefacts, specimens, samples Sketches, diaries, lab notebooks…
  • 12. DADOS CIENTÍFICOS • Para se constituírem como verdadeiramente úteis, os dados científicos devem possuir estrutura e organização. • Os conjuntos de dados (“datasets”) são uma das unidades essenciais. • Os conjuntos de dados são coleções de informações ou factos relacionados entre si e registados num formato comum. • Por exemplo, os resultados de um estudo de opinião por entrevista numa investigação sociológica constituem um conjunto de dados, composto pelos registos individuais das entrevistas. “Os repositórios de dados científicos: estado da arte” – http://repositorium.sdum.uminho.pt/handle/1822/10830
  • 15. GESTÃO DE DADOS CIENTÍFICOS: RELEVÂNCIA E DESENVOLVIMENTOS 2
  • 16. RELEVÂNCIA DO TEMA + relevante o entendimento da necessidade de gerir o acesso e a utilização dos dados produzidos ou recolhidos no âmbito das atividades de investigação, garantindo a sua preservação. European Bioinformatics Institute (EBI)
  • 17. RELEVÂNCIA DO TEMA • Cresce a sensibilidade dos investigadores para os efeitos da verdadeira explosão na produção de dados científicos: • crescimento global das atividades de investigação • consequência dos novos métodos e instrumentos de pesquisa e registo que originam cada vez maiores volumes de dados. • Onde o trabalho de investigação é baseado na análise de dados recolhidos de forma distribuída parece ter sido mais precoce e mais profundo.
  • 18. RELEVÂNCIA DO TEMA • Os organismos que produzem e financiam ciência têm manifestado nestes últimos anos redobrada atenção à necessidade de assegurar meios e mecanismos para a gestão dos dados científicos.
  • 20. Relevância do tema “To make progress in science, we need to be open and share… sharing data, and having the forum to openly use and build on what is shared, are essential to science. They fuel the progress and practice of scientific discovery. ” Neelie Kroes, Rome, 11 April 2012
  • 23. RELEVÂNCIA DO TEMA • Multiplicam-se as iniciativas de Open Access, Open Data. • Panton Principles for Open Data in Science: http://pantonprinciples.org “Entendemos por dados abertos, em ciência, aqueles que estão livremente disponíveis na Internet pública permitindo a qualquer utilizador baixar, copiar, analisar, reprocessar, usá-los com um software ou utilizá-los para qualquer outra finalidade sem barreiras financeiras, legais, técnicas ou outras além do acesso à Internet. Para este fim, os dados relacionados com ciência publicada devem ser explicitamente colocados em domínio público.“
  • 24. Algumas leituras e recursos de referência• OCDE • OECD. Declaration on Access to Research Data From Public Funding, Paris, 2004. http://www.oecd.org/document/15/0,3343,en_2649_34487_25998799_1_1_1_1,00.html • OECD Principles and Guidelines for Access to Research Data from Public Funding. Paris, 2007. http://www.oecd.org/dataoecd/9/61/38500813.pdf • Várias iniciativas dos Conselhos de Investigação do Reino Unido • RCUK. (2011). Common Principles on Data Policy - http://www.rcuk.ac.uk/research/Pages/DataPolicy.aspx • Jones, Sarah. (2011). Summary of UK research funders’ expectations for the content of data management and sharing plans http://www.dcc.ac.uk/ • Iniciativas no Contexto da União Europeia produzidas pela Comissão Europeia no âmbito da Agenda Digital Europeia e ERA • CE (2012): Communication on a reinforced European Research Area partnership for excellence and growth • Communication Towards better access to scientific information • Recommendation on access to and preservation of scientific information • EUA com iniciativas da National Science Foundation - http://www.nsf.gov
  • 25. CICLO DE VIDA DOS DADOS CIENTÍFICOS E ETAPAS NA GESTÃO 3
  • 26. O que está envolvido na gestão de dados científicos: •Planeamento e gestão de dados •Criação de dados •Documentar os dados •Acesso e utilização dos dados •Armazenamento e backups •Partilha dos dados •Preservação dos dados
  • 28. Curadoria • Curadoria de dados é a atividade de gestão e utilização de dados desde o momento da sua criação para garantir o seu armazenamento, a sua pesquisa e respetiva reutilização. “the active management and appraisal of data over the lifecycle of scholarly and scientific interest” Digital Curation Centre
  • 29. Caracterização das atividades de pesquisa Information discovery Data acquisition Data management Data analysis Data sharingData processing Study concept and design Hypothesis generation Data archiving Results and conclusions Seminars and conference presentations Articles and reports Undertaking experiments
  • 30. O ciclo de vida dos dados e a sua gestão: Anthony Beitz, Monash University. OR 2012, Edinburgh CollaborateConceive Design Experiment Publish ExposeAnalyseDesign ExposeCollaborateExperiment PublishAnalyseDesign Gestão e Planeamento de dados Repositórios disciplinares Ou institucionais e Revistas científicas Plataforma de Gestão de dados científicos
  • 31. Ciclo de vida convencional dos dados científicos Scholarly publications: conference papers and journal articles Raw data in research note- books and live PC files Research results and conclusions Data selection and interpretation Publication activities Research datasets abandoned on local hard drives or CD-ROMs Hypothesis formulation and project design Experimentation and data creation Research plan Institutional repositories
  • 32. Ciclo de vida aumentado dos dados científicos Scholarly publications: conference papers and journal articles Raw data in research note- books and live PC files Research results and conclusions Hypothesis formulation and project design Experimentation and data creation Data selection and interpretation Publication activities Research plan Institutional repositories Papers and datasets Local filestore Private and sharable Open data on Web Gestão Disseminação Preservação
  • 33. Debate entre os participantes… • Razões para os investigadores se preocuparem com a gestão dos dados… • Razões para as instituições se preocuparem com a gestão dos dados…
  • 34. As bibliotecas neste processo • Apoiar e aconselhar estudantes, investigadores, grupos de investigação sobre os meios e formas mais adequadas para preparar os dados para o seu armazenamento, a pesquisa e a reutilização.
  • 35. Algumas leituras e recursos de referência • Knowledge-Exchange (2011), "A Surfboard for Riding the Wave Towards a four country action programme on re • Ball, A and Duke, M (2011) How to Cite Datasets and Link to Publications. Digital Curation Centre http://www.dcc.ac.uk/webfm_send/525 • Green, T (2009), “We Need Publishing Standards for Datasets and Data Tables”, OECD Publishing White Paper,OECD Publishing.doi: 10.1787/603233448430 http://dx.doi.org/10.1787/603233448430 • MaRDI-Gross project DMP Planning for Big Science Projects (2012). http://arxiv.org/abs/1208.3754v1 • Digital Curation Centre – http://www.dcc.ac.uk • International Journal of Digital Curation - http://www.ijdc.net/ • Data Science Journal - http://www.jstage.jst.go.jp/browse/dsj • Open Knowledge Foundation: http://okfn.org/ • OpenAIRE: http://www.openaire.eu
  • 37. RECOMENDAÇÕES DA LIBER SOBRE O PAPEL DAS BIBLIOTECAS 4
  • 38. Recomendações para as Bibliotecas
  • 39. 1. Apoio na gestão dos dados científicos • Offer research data management support, including data management plans for grant applications, intellectual property rights advice and information materials. Assist faculty with data management plans and the integration of data management into the curriculum.
  • 40. Importância do plano de GDC http://youtu.be/1stLmJUO81A
  • 41. Objectives and Disclaimers • Looking through the eyes of a researcher • Mensagens simples elucidando sobre – o que é que nós como serviço de informação – esperamos dos investigadores. • Usando ferramentas • Pragmaticas em termos de funcionalidades • thank you, in advance, for helping us improving the tools OAI8, June 2013
  • 42. 2. Desenvolvimento de serviços e metadados • Engage in the development of metadata and data standards and provide metadata services for research data.
  • 45. Gestão de Dados Científicos • Um dos primeiros requisitos é que os conjuntos de dados sejam acompanhados de informação que descreva a sua origem (tempo ou espaço, métodos e instrumentos de recolha), âmbito, autoria, propriedade e condições de reutilização, ou seja, de metadados. • Em paralelo com a interoperabilidade tecnológica, a existência de metadados adequados e normalizados é um requisito essencial para o acesso e reutilização dos dados científicos.
  • 46. DOCUMENTAÇÃO E METADADOS • Repositórios de dados científicos e a normalização dos metadados. • Difícil uniformizar a descrição entre domínios ceintíficos. • A descrição dos conjuntos de dados ainda se pode considerar muito pouco desenvolvida. • Ao nível do conjunto têm sido adoptados modelos genéricos como o do Dublin Core, já muito utilizado nos repositórios institucionais. • Projecto DataShare (Edimburgo, Oxford e Southampton)
  • 47. Necessidade dos metadados Public Research Community Project Researcher Metadata may not be required if you are working alone on your own computer, but become crucial when data are shared online. Metadata help to place your dataset in a broader context, allowing those outside your institution, discipline, or research environment to understand how to interpret your data.
  • 48. 3. Desenvolvimento de competências • Create Data Librarian posts and develop professional staff skills for data librarianship.
  • 51. 4. Políticas institucionais de gestão dos dados • Actively participate in institutional research data policy development, including resource plans. Encourage and adopt open data policies where appropriate in the research data life cycle.
  • 52. Políticas institucionais de GDC http://youtu.be/V8IIdfBAr_0
  • 53. 5. Trabalhar em articulação com os parceiros para fomentar infraestruturas • Liaise and partner with researchers, research groups, data archives and data centers to foster an interoperable infrastructure for data access, discovery and data sharing.
  • 54. 6. Disponibilizar serviços de curadoria no ciclo de vida dos dados científicos • Support the lifecycle for research data by providing services for storage, discovery and permanent access.
  • 56. 7. Citação dos dados e links e identificadores permanentes • Promote research data citation by applying persistent identifiers to research data.
  • 58. 8. Repositórios de dados • Provide an institutional Data Catalogue or Data Repository, depending on available infrastructure.
  • 60. 9. Envolva-se e pratique a gestão de dados científicos • Get involved in subject specific data management practice.
  • 61. 10. Oferecer ou mediar serviços de armazenamento • Offer or mediate secure storage for dynamic and static research data in co-operation with institutional IT units and/or seek exploitation of appropriate cloud services.
  • 62. Exemplos University of Edinburgh policy http://www.ed.ac.uk/is/research-data-policy Research data guidance http://www.ed.ac.uk/is/data-management MANTRA online training http://datalib.edina.ac.uk/mantra/ Edinburgh University Data Library http://www.ed.ac.uk/is/data-library
  • 63. PLANEAMENTO DA GESTÃO DE DADOS CIENTÍFICOS 5
  • 64. PLANEAMENTO DA GDC • Principais questões no planeamento da gestão de dados científicos: • Tipos de dados, formatos, normas e métodos de recolha • Questões legais e éticas, de propriedade intelectual • Acesso, Partilha e reutilização dos dados • Gestão e armazenamento de curto prazo • Depósito (arquivo) e preservação a longo prazo
  • 65. Gestão de Dados Científicos • As condições em que os dados recolhidos ou produzidos numa investigação podem, ou não, ser acedidos e reutilizados por outros investigadores, para além do contexto em que foram gerados, são questões importantes. • A forma como são cuidados (curadoria de dados) e as condições legais associadas ao seu acesso e partilha constituem os dois elementos determinantes do futuro dos diversos conjuntos de dados científicos. • É preciso garantir que os dados são registados, mantidos e preservados de forma adequada. “Os repositórios de dados científicos: estado da arte” – http://repositorium.sdum.uminho.pt/handle/1822/10830
  • 68. Elementos do planeamento da gestão de dados científicos
  • 69. Monash University's Research Data Management Strategy and Strategic Plan 2012-2015
  • 70. Monash University's Research Data Management Strategy and Strategic Plan 2012-2015
  • 71. Importância de documentar os dados http://youtu.be/7IN_SD5B43U
  • 72. POLÍTICAS INSTITUCIONAIS PARA A GESTÃO DOS DADOS 6
  • 74. Bons exemplos • http://monash.edu/library/researchdata/about/strategy/ • Monash University's Research Data Management Strategy and Strategic Plan 2012-2015 [pdf 196kB] was publicly released on 13 April 2012.
  • 76. (1) Data contained and explained within the article (2) Further data explanations in any kind of supplementary files to articles (3) Data referenced from the article and held in data centers and repositories(4) Data publications, describing available datasets (5) Data in drawers and on disks at the institute The Data Publication Pyramid
  • 77. Mais rEFERÊNCIAS •Australia National University's Information Literacy Program DPM Template is a formatted template for any discipline. •The Australian National Data Service created Data Management Planning, a document that lists the questions that should be answered in a data management plan. •The Digital Curation Centre created its Data Management Plan Content Checklist as "a comprehensive list of the details that researchers may be asked to include in such plans.” •The Finnish Social Science Data Archive's Data Management Planning Website lists questions that should be answered in a data management plan. It is aimed at social science researchers in particular. •Geoscience Australia's Guide to Preparation of Data Management Plans. •MIT Libraries' Data Management Webpage provides a list of questions that should be answered in data management plan. •The National Science Board's Long-Lived Digital Data Collections Enabling Research and Education in the 21st Century is one of the foundational documents in the US' current push for data sharing. It gives broad guidelines for what should be included. •The National Science Foundation Directorate for Engineering's Data Management for NSF Engineering Directorate Proposals and Awards is the first document to directly address the coming NSF requirement •The Queensland University of Technology QUT Data Management Checklist is a highly structured, populable template. •The UK Rural Economy and Land Use Programme's Data Management Plan is a form that must be filled out by RELU award holders at the outset of their projects. •The University of Melbourne's Research Data Management Plan Template is a te,plate aimed at university researchers.
  • 79. Papel da biblioteca – na prática… National Science Foundation http://youtu.be/Lc82pxxRkMo
  • 80. Observações finais (na prática) http://www.pangaea.de

Notas do Editor

  • #51: Reminder slide to mention handouts and openly licensed MANTRA course © The University of Edinburgh
  • #63: © The University of Edinburgh