SlideShare una empresa de Scribd logo
Fernando Ariel López
CAICYT – CONICET
@fernando__lopez
Workshop de Datos Científicos
Big Data: Volumen, Velocidad, Variedad y Veracidad
Minería de Datos, Descubrimiento de Conocimiento, Inteligencia de Negocios
(Data Mining, Knowledge Discovery, Business Intelligence)
Workshop de datos científicos. Introducción
Ciencia Abierta = Open Science
1) Metodologías Abiertas / Open Methodology (Métodos, procesos,
documentos relevantes, etc.)
2) Software y Hardware Libres / Soft and Hard open
3) Datos Abiertos / Open Data (libres para reutilizar)
4) Acceso Abierto / Open Access (libre y gratuito)
5) Revisión por pares Abierto / Open Peer Review (transparencia en los
criterios de evaluación y calidad)
6) Recursos Educativos Abiertos / Open Educational Resources (MOOC
y REA)
Principios de la
CIENCIA ABIERTA
→ hechos, observaciones o experiencias (basado argumento, teoría o prueba)
→ pueden ser numéricos, descriptivos o visuales.
→ pueden ser en estado bruto o analizado,
→ pueden ser experimentales u observacionales.
→ pueden ser abiertos o cerrados
¿Qué son los datos de investigación?¿Qué son los datos de investigación?
Los datos incluyen:
- cuadernos de laboratorio o de campo,
- datos de investigación primaria (en papel o digital),
- cuestionarios,
- fotografías, audio y videos
- desarrollo de modelos
Las colecciones datos para la investigación pueden incluir:
- diapositivas, diseños, muestras.
Procedencia de los datos:
cómo, cuándo, donde se recogió y con qué (por ejemplo, instrumentos).
¿Qué son los datos de investigación?¿Qué son los datos de investigación?
● Es una colección de datos reunidos durante la ejecución de un
proyecto de investigación.
● Son objetos digitales compuestos y heterogéneos.
● Constituye la base de la investigación y va asociado a una publicación
científica (resultado de la investigación).
● Se almacena y gestiona en Repositorios Interoperables conforme a
estándares internacionales.
Es el objeto específico de
trabajo, control, organización,
descripción y preservación de
datos científicos
DATASET
Workshop de datos científicos. Introducción
ACTORES
IMPLICADOS
- Investigadores [productores de datos]
- Agencias de Financiamiento
- Universidades y Centros de Investigación
- Gestores de datos:
¬ Repositorios Institucionales (corto plazo)
¬ Centro de Datos (mediano-largo plazo)
- Usuarios (otros investigadores, ciudadanos, etc.)Sociedad Civil (ONG) + Empresas
Antecedentes: Políticas en las
Agencias de Financiamiento
● Estados Unidos: NSF (National Science Foundation), NIH (National
Institutes of Health), NASA y NODC (National Oceanographic Data Center).
● Europa: Horizon2020
● Reino Unido: AHRC, BBSRC, Cancer Research UK, EPSRC,
ESRC, MRC, NERC, STFC, WellcomeTrust.
● Australia: ARC
● Regional: OCDE
● Argentina:
– Iniciativas Nacionales de Datos
http://sistemasnacionales.mincyt.gob.ar/
– Ley Nacional 26.899. Datos primarios en 5 años
disponibles. Excepciones
Líneas de Trabajo
● Plan de Gestión de Datos / Data Management Plan (DMP)
● e-Infraestructuras
DATOS
PLAN DE GESTIÓN DE DATOS [DMP]
Es un documento que describe el tratamiento que van a
recibir los datos de investigación generados o recopilados en
el transcurso de un proyecto de investigación.
CAICYT- CONICET (Argentina)
Propuesta: Plan de Gestión de Datos Científicos
Análisis de las actuales Políticas y Requisitos
de importantes Agencias de Financiamiento:
● DCC (UK)
● Horizon2020 (UE)
● NSF (EEUU)
● ARC (AU)
e-Infraestructura
● Repositorio Interoperable de Datos
– Datos Públicos Argentina (CKAN, OKF),
– Zenodo (Invenio, CERN)
– DRYAD, PLICSS, LAGOS (DSpace, MIT & HP),
– Harvard DATAVERSE (Eprints)
● Plataforma de Trabajo para Investigadores
– OSF, HubZero, MyExperiment.org, etc.
● Cluster de Almacenamiento y/o Procesamiento
Los investigadores pueden ser reacios a compartir sus datos
públicamente debido a los costos individuales reales y/o percibidos.
Mayor resistencia: Cambio Cultural
BENEFICIOS #DatosAbiertos
● Ayuda a verificar los resultados.
● Evitar la fabricación y falsificación de datos.
● Diferentes interpretaciones o enfoques
aplicados a datos existentes contribuyen a los
avances científicos.
● Optimización en el uso de recursos.
● Preservación a largo plazo bien gestionada,
permite mantener la integridad de los datos.
TenopirC, Allard S, Douglass K, AydinogluAU, et al. (2011) Data Sharing by Scientists: Practices and
Perceptions. PLoSONE 6(6): e21101. doi:10.1371/journal.pone.0021101
http://www.plosone.org/article/info:doi/10.1371/journal.pone.0021101
Debemos desarrollar Políticas y Acciones
para Gestionar los Datos Científicos:
● Políticas a nivel de agencias de financiación e institucionales.
Definición de roles/responsabilidades de los distintos actores.
● Recursos financieros a largo plazo ya que los datos son
acumulativos y se preservan.
● Recursos humanos especializados (para generación de datos,
normalización, explotación y preservación).
● Infraestructuras coordinadas para garantizar su
interoperabilidad. Entre los requisitos de las infraestructuras
destacar: preservación, acceso, data curation, data processing,
distribución.
¿y los Investigadores?
● Colaborar con su formación
● Proveer una infraestructura de trabajo (framework):
– Almacenamiento de datos
– Curación, Procesamiento, Explotación, Visualización de
datos.
● Contar con Repositorios / Centros de Datos:
– Identificadores únicos (Autor, Datos, etc.)
– Estadísticas de impacto (uso, descarga, citación, etc.)
– Preservación Digital
Ciclo de Vida de los Datos
ABIERTO
Muchas Gracias
Fernando Ariel López
CAICYT – CONICET
@fernando__lopez
Definición de METADATOS
● "datos sobre los datos"
● son datos altamente estructurados que
describen información, describen el contenido,
la calidad, la condición y otras características
de los datos.
● En los metadatos se describe varios atributos
de los objetos de información para otorgarles:
significado, contexto y organización
METADATOS
● Selección de Esquemas http://www.dcc.ac.uk/resources/metadata-standards
Ejemplo de Esquemas de
Metadatos de ECONOMÍA
DDI - Data Documentation Initiative
An international standard for describing data from the social,
behavioral, and economic sciences. Expressed in XML, the DDI
metadata specification supports the entire research data life cycle.
SDMX - Statistical Data and Metadata Exchange
A set of common technical and statistical standards and guidelines to
be used for the efficient exchange and sharing of statistical data and
metadata.
Esquema de metadatos DDI
● Documentación http://www.ddialliance.org/Specification/
● Vocabulario controlado asociado http://www.ddialliance.org/Specification/DDI-CV/
● Extensiones, Herramientas (editores, etc) y Casos de uso
Ejemplos:
● Yale University (EEUU) http://isps.yale.edu/research#.Vl04knYvfIV
● European Center Bank. Statistical Data Warehouse
Portal (humanos) http://sdw.ecb.europa.eu/home.do
Web service (maquinas) https://sdw-wsrest.ecb.europa.eu/
● Paneldata.org (Alemania) https://paneldata.org/topics

Más contenido relacionado

PDF
Mirando al futuro, del acceso abierto a datos abiertos de investigación
PDF
Gestión de Datos Científicos
PPT
Gestión de datos de investigación
PDF
Bibliotecari@s en la ‪Big Data‬
PDF
Taller de búsqueda de información en Educación (IICE - UBA)
PDF
Gestión de datos de investigación, primeros pasos en argentina
PDF
El bibliotecario de datos
PDF
Estado de situación del acceso abierto en Argentina: gestión de datos cient...
Mirando al futuro, del acceso abierto a datos abiertos de investigación
Gestión de Datos Científicos
Gestión de datos de investigación
Bibliotecari@s en la ‪Big Data‬
Taller de búsqueda de información en Educación (IICE - UBA)
Gestión de datos de investigación, primeros pasos en argentina
El bibliotecario de datos
Estado de situación del acceso abierto en Argentina: gestión de datos cient...

La actualidad más candente (20)

PDF
Plan de gestión de datos científicos, una propuesta argentina
PDF
Acuerdo internacional "Open Data in a Big Data World"
PDF
Primeros para implementar un plan de gestión de datos
PDF
Gestion de Datos de Investigacion
PDF
Open Data in the world of Science” by Dr. Claudio Gutiérrez
PDF
TALLER LEARN SOBRE DATOS DE INVESTIGACIÓN IMPLEMENTACIÓN DE POLÍTICAS Y ESTRA...
PDF
Open Data in a Big World by Fernando Ariel López
PDF
Conicyt Y Mandato OECD by Patricia Muñoz, CONICYT (Chile)
PDF
Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...
PDF
El acceso abierto en Latinoamerica
PPTX
Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...
PDF
Introducción a la Gestión de Datos de Investigación
PPTX
Interop metadata tony
PPTX
Aleix peset hoja de ruta 5 oct
PPTX
Mare d seminario-rmelero
PPT
Abadal 2016-pre-evento-iodc
PPTX
Presentacion barcelona 3.rafael.antonia.v2
PDF
Datos Abiertos de Investigacion - Caso Mexico
PPTX
Red Maredata - Universidad de Alicante - EDAUA16
PPT
Ley peruana de Repositorios Digitales
Plan de gestión de datos científicos, una propuesta argentina
Acuerdo internacional "Open Data in a Big Data World"
Primeros para implementar un plan de gestión de datos
Gestion de Datos de Investigacion
Open Data in the world of Science” by Dr. Claudio Gutiérrez
TALLER LEARN SOBRE DATOS DE INVESTIGACIÓN IMPLEMENTACIÓN DE POLÍTICAS Y ESTRA...
Open Data in a Big World by Fernando Ariel López
Conicyt Y Mandato OECD by Patricia Muñoz, CONICYT (Chile)
Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...
El acceso abierto en Latinoamerica
Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...
Introducción a la Gestión de Datos de Investigación
Interop metadata tony
Aleix peset hoja de ruta 5 oct
Mare d seminario-rmelero
Abadal 2016-pre-evento-iodc
Presentacion barcelona 3.rafael.antonia.v2
Datos Abiertos de Investigacion - Caso Mexico
Red Maredata - Universidad de Alicante - EDAUA16
Ley peruana de Repositorios Digitales
Publicidad

Destacado (14)

PPTX
Social Selling Breakfast - Sydney
PDF
Dibujo tecnico ejercicios
PDF
Termoquímica
PDF
YARATICILIK VE KÜLTÜREL BAĞLAMDA MİMARİ TASARIM SÜRECİ
DOCX
Farias yulitzi 1b.doc
PPTX
RECIARIA nuevo mapa de redes de bibliotecas
DOCX
Desarrollos en plancha imagenes
DOCX
PDF
A child's life
PDF
Dünya ve Türkiye Ekonomisindeki Gelişmeler Kasım 2015
PDF
Five Forces Impacting Marketing
PDF
информац. письмо жайтапова а.а
PDF
What should students learn for the 21st century? A Four-Dimensional Education
Social Selling Breakfast - Sydney
Dibujo tecnico ejercicios
Termoquímica
YARATICILIK VE KÜLTÜREL BAĞLAMDA MİMARİ TASARIM SÜRECİ
Farias yulitzi 1b.doc
RECIARIA nuevo mapa de redes de bibliotecas
Desarrollos en plancha imagenes
A child's life
Dünya ve Türkiye Ekonomisindeki Gelişmeler Kasım 2015
Five Forces Impacting Marketing
информац. письмо жайтапова а.а
What should students learn for the 21st century? A Four-Dimensional Education
Publicidad

Similar a Workshop de datos científicos. Introducción (20)

PPT
Datos de investigación: reflexiones sobre su acceso abierto
PDF
Cómo crear tu Plan de Gestión de Datos de Investigación (PGDI)
PDF
Introducción a la Gestión de Datos de Investigación
PPTX
La gestión de datos de investigación en el horizonte de las bibliotecas unive...
ODP
#Aprender3C - Repositorio de datos primarios
PDF
El Plan Datos como Herramienta para la Ciencia Abierta
PDF
Cómo crear tu plan de gestión de datos de investigación
PDF
Gestión de Datos de Investigación. Guía de Recursos
PPTX
La difusión de datos de investigación: principales iniciativas
PDF
Ciencia abierta y gestión de datos de investigación
PPTX
Datos abiertos en un mundo de grandes datos (Acuerdo ICSU-IAP-ISSC-TWAS)
PPTX
Datos Abiertos en un Mundo de Grandes Datos (Acuerdo ICSU-IAP-ISSC-TWAS)
PPT
M3.Curso Apoyo Investigación Bibliotecas. Compartir datos (data sharing) en c...
PDF
Gestión de Datos de Investigación
PPTX
Ciencia Abierta & Gestión de datos de investigación
PDF
Facilitar la gestión, visibilidad y reutilización de los datos de investigaci...
PDF
Acceso abierto a los datos de investigación definición políticas y actores
PPTX
Gestión de datos abiertos búsqueda, recolección, tratamiento y visualización ...
PDF
Ciencia Abierta y Gestión de Datos de Investigación (RDM)
PDF
Taller de datos - Data Toolbox #OSR6 #14wkRebiun
Datos de investigación: reflexiones sobre su acceso abierto
Cómo crear tu Plan de Gestión de Datos de Investigación (PGDI)
Introducción a la Gestión de Datos de Investigación
La gestión de datos de investigación en el horizonte de las bibliotecas unive...
#Aprender3C - Repositorio de datos primarios
El Plan Datos como Herramienta para la Ciencia Abierta
Cómo crear tu plan de gestión de datos de investigación
Gestión de Datos de Investigación. Guía de Recursos
La difusión de datos de investigación: principales iniciativas
Ciencia abierta y gestión de datos de investigación
Datos abiertos en un mundo de grandes datos (Acuerdo ICSU-IAP-ISSC-TWAS)
Datos Abiertos en un Mundo de Grandes Datos (Acuerdo ICSU-IAP-ISSC-TWAS)
M3.Curso Apoyo Investigación Bibliotecas. Compartir datos (data sharing) en c...
Gestión de Datos de Investigación
Ciencia Abierta & Gestión de datos de investigación
Facilitar la gestión, visibilidad y reutilización de los datos de investigaci...
Acceso abierto a los datos de investigación definición políticas y actores
Gestión de datos abiertos búsqueda, recolección, tratamiento y visualización ...
Ciencia Abierta y Gestión de Datos de Investigación (RDM)
Taller de datos - Data Toolbox #OSR6 #14wkRebiun

Más de Fernando-Ariel Lopez (16)

PDF
BiblioFest 2023 - Alfabetización Informacional para la participación ciudad...
PDF
Lopez, Fernando Ariel (2022). La apertura de la ciencia, como vía para el des...
PPTX
Manifiesto Bibliotecario por la Ciencia Abierta. JBDU 2019
PDF
Del Acceso Abierto a la Ciencia Abierta en la Argentina
PDF
Introducción a la Ciencia Abierta
PDF
Introducción a la Ciencia Abierta (Fernando Ariel Lopez - IFLA LAC 26/11/2018)
PDF
Crowdsourcing para bibliotecas: experiencias de trabajo colaborativo abierto
PDF
Taller ¿cómo hacer un proyecto de ALFIN?
PDF
Bibliotecas + Tecnología = Visibilidad
PDF
La red. Voces en el Fénix, no. 40. Internet: pasado, presente y futuro. Refle...
PDF
Matrix. Voces en el Fénix, no. 39. Internet: pasado, presente y futuro. Refle...
PDF
El poder de las personas: crowdsourcing
PDF
Acceso Abierto a la producción científica #FoCoLibre
PDF
Repositorio 13: el IFTS N° 13 y el Acceso Abierto. Fernando Neubaum (IFTS N° 13)
PDF
El camino verde hacia el Acceso Abierto: el caso del Repositorio Digital Inst...
PDF
El camino dorado hacia el acceso abierto: las revistas científicas. Danisa Do...
BiblioFest 2023 - Alfabetización Informacional para la participación ciudad...
Lopez, Fernando Ariel (2022). La apertura de la ciencia, como vía para el des...
Manifiesto Bibliotecario por la Ciencia Abierta. JBDU 2019
Del Acceso Abierto a la Ciencia Abierta en la Argentina
Introducción a la Ciencia Abierta
Introducción a la Ciencia Abierta (Fernando Ariel Lopez - IFLA LAC 26/11/2018)
Crowdsourcing para bibliotecas: experiencias de trabajo colaborativo abierto
Taller ¿cómo hacer un proyecto de ALFIN?
Bibliotecas + Tecnología = Visibilidad
La red. Voces en el Fénix, no. 40. Internet: pasado, presente y futuro. Refle...
Matrix. Voces en el Fénix, no. 39. Internet: pasado, presente y futuro. Refle...
El poder de las personas: crowdsourcing
Acceso Abierto a la producción científica #FoCoLibre
Repositorio 13: el IFTS N° 13 y el Acceso Abierto. Fernando Neubaum (IFTS N° 13)
El camino verde hacia el Acceso Abierto: el caso del Repositorio Digital Inst...
El camino dorado hacia el acceso abierto: las revistas científicas. Danisa Do...

Último (20)

DOCX
PROYECTO DE APRENDIZAJE para la semana de fiestas patrias
PDF
Escuelas Desarmando una mirada subjetiva a la educación
PDF
Gasista de unidades unifuncionales - pagina 23 en adelante.pdf
PDF
Fundamentos_Educacion_a_Distancia_ABC.pdf
DOCX
UNIDAD DE APRENDIZAJE 5 AGOSTO tradiciones
PDF
La Evaluacion Formativa en Nuevos Escenarios de Aprendizaje UGEL03 Ccesa007.pdf
PDF
Unidad de Aprendizaje 5 de Matematica 1ro Secundaria Ccesa007.pdf
PDF
ciencias-1.pdf libro cuarto basico niños
DOCX
V UNIDAD - SEGUNDO GRADO. del mes de agosto
PDF
Tomo 1 de biologia gratis ultra plusenmas
PDF
PFB-MANUAL-PRUEBA-FUNCIONES-BASICAS-pdf.pdf
DOCX
PLANES DE área ciencias naturales y aplicadas
PDF
DI, TEA, TDAH.pdf guía se secuencias didacticas
PDF
COMPLETO__PROYECTO_VIVAN LOS NIÑOS Y SUS DERECHOS_EDUCADORASSOS.pdf
PDF
Habitos de Ricos - Juan Diego Gomez Ccesa007.pdf
PDF
Integrando la Inteligencia Artificial Generativa (IAG) en el Aula
PDF
Didactica de la Investigacion Educativa SUE Ccesa007.pdf
PDF
Salvese Quien Pueda - Andres Oppenheimer Ccesa007.pdf
PDF
Unidad de Aprendizaje 5 de Educacion para el Trabajo EPT Ccesa007.pdf
PDF
Guia de Tesis y Proyectos de Investigacion FS4 Ccesa007.pdf
PROYECTO DE APRENDIZAJE para la semana de fiestas patrias
Escuelas Desarmando una mirada subjetiva a la educación
Gasista de unidades unifuncionales - pagina 23 en adelante.pdf
Fundamentos_Educacion_a_Distancia_ABC.pdf
UNIDAD DE APRENDIZAJE 5 AGOSTO tradiciones
La Evaluacion Formativa en Nuevos Escenarios de Aprendizaje UGEL03 Ccesa007.pdf
Unidad de Aprendizaje 5 de Matematica 1ro Secundaria Ccesa007.pdf
ciencias-1.pdf libro cuarto basico niños
V UNIDAD - SEGUNDO GRADO. del mes de agosto
Tomo 1 de biologia gratis ultra plusenmas
PFB-MANUAL-PRUEBA-FUNCIONES-BASICAS-pdf.pdf
PLANES DE área ciencias naturales y aplicadas
DI, TEA, TDAH.pdf guía se secuencias didacticas
COMPLETO__PROYECTO_VIVAN LOS NIÑOS Y SUS DERECHOS_EDUCADORASSOS.pdf
Habitos de Ricos - Juan Diego Gomez Ccesa007.pdf
Integrando la Inteligencia Artificial Generativa (IAG) en el Aula
Didactica de la Investigacion Educativa SUE Ccesa007.pdf
Salvese Quien Pueda - Andres Oppenheimer Ccesa007.pdf
Unidad de Aprendizaje 5 de Educacion para el Trabajo EPT Ccesa007.pdf
Guia de Tesis y Proyectos de Investigacion FS4 Ccesa007.pdf

Workshop de datos científicos. Introducción

  • 1. Fernando Ariel López CAICYT – CONICET @fernando__lopez Workshop de Datos Científicos
  • 2. Big Data: Volumen, Velocidad, Variedad y Veracidad Minería de Datos, Descubrimiento de Conocimiento, Inteligencia de Negocios (Data Mining, Knowledge Discovery, Business Intelligence)
  • 4. Ciencia Abierta = Open Science
  • 5. 1) Metodologías Abiertas / Open Methodology (Métodos, procesos, documentos relevantes, etc.) 2) Software y Hardware Libres / Soft and Hard open 3) Datos Abiertos / Open Data (libres para reutilizar) 4) Acceso Abierto / Open Access (libre y gratuito) 5) Revisión por pares Abierto / Open Peer Review (transparencia en los criterios de evaluación y calidad) 6) Recursos Educativos Abiertos / Open Educational Resources (MOOC y REA) Principios de la CIENCIA ABIERTA
  • 6. → hechos, observaciones o experiencias (basado argumento, teoría o prueba) → pueden ser numéricos, descriptivos o visuales. → pueden ser en estado bruto o analizado, → pueden ser experimentales u observacionales. → pueden ser abiertos o cerrados ¿Qué son los datos de investigación?¿Qué son los datos de investigación?
  • 7. Los datos incluyen: - cuadernos de laboratorio o de campo, - datos de investigación primaria (en papel o digital), - cuestionarios, - fotografías, audio y videos - desarrollo de modelos Las colecciones datos para la investigación pueden incluir: - diapositivas, diseños, muestras. Procedencia de los datos: cómo, cuándo, donde se recogió y con qué (por ejemplo, instrumentos). ¿Qué son los datos de investigación?¿Qué son los datos de investigación?
  • 8. ● Es una colección de datos reunidos durante la ejecución de un proyecto de investigación. ● Son objetos digitales compuestos y heterogéneos. ● Constituye la base de la investigación y va asociado a una publicación científica (resultado de la investigación). ● Se almacena y gestiona en Repositorios Interoperables conforme a estándares internacionales. Es el objeto específico de trabajo, control, organización, descripción y preservación de datos científicos DATASET
  • 10. ACTORES IMPLICADOS - Investigadores [productores de datos] - Agencias de Financiamiento - Universidades y Centros de Investigación - Gestores de datos: ¬ Repositorios Institucionales (corto plazo) ¬ Centro de Datos (mediano-largo plazo) - Usuarios (otros investigadores, ciudadanos, etc.)Sociedad Civil (ONG) + Empresas
  • 11. Antecedentes: Políticas en las Agencias de Financiamiento ● Estados Unidos: NSF (National Science Foundation), NIH (National Institutes of Health), NASA y NODC (National Oceanographic Data Center). ● Europa: Horizon2020 ● Reino Unido: AHRC, BBSRC, Cancer Research UK, EPSRC, ESRC, MRC, NERC, STFC, WellcomeTrust. ● Australia: ARC ● Regional: OCDE ● Argentina: – Iniciativas Nacionales de Datos http://sistemasnacionales.mincyt.gob.ar/ – Ley Nacional 26.899. Datos primarios en 5 años disponibles. Excepciones
  • 12. Líneas de Trabajo ● Plan de Gestión de Datos / Data Management Plan (DMP) ● e-Infraestructuras
  • 13. DATOS PLAN DE GESTIÓN DE DATOS [DMP] Es un documento que describe el tratamiento que van a recibir los datos de investigación generados o recopilados en el transcurso de un proyecto de investigación.
  • 14. CAICYT- CONICET (Argentina) Propuesta: Plan de Gestión de Datos Científicos Análisis de las actuales Políticas y Requisitos de importantes Agencias de Financiamiento: ● DCC (UK) ● Horizon2020 (UE) ● NSF (EEUU) ● ARC (AU)
  • 15. e-Infraestructura ● Repositorio Interoperable de Datos – Datos Públicos Argentina (CKAN, OKF), – Zenodo (Invenio, CERN) – DRYAD, PLICSS, LAGOS (DSpace, MIT & HP), – Harvard DATAVERSE (Eprints) ● Plataforma de Trabajo para Investigadores – OSF, HubZero, MyExperiment.org, etc. ● Cluster de Almacenamiento y/o Procesamiento
  • 16. Los investigadores pueden ser reacios a compartir sus datos públicamente debido a los costos individuales reales y/o percibidos. Mayor resistencia: Cambio Cultural
  • 17. BENEFICIOS #DatosAbiertos ● Ayuda a verificar los resultados. ● Evitar la fabricación y falsificación de datos. ● Diferentes interpretaciones o enfoques aplicados a datos existentes contribuyen a los avances científicos. ● Optimización en el uso de recursos. ● Preservación a largo plazo bien gestionada, permite mantener la integridad de los datos. TenopirC, Allard S, Douglass K, AydinogluAU, et al. (2011) Data Sharing by Scientists: Practices and Perceptions. PLoSONE 6(6): e21101. doi:10.1371/journal.pone.0021101 http://www.plosone.org/article/info:doi/10.1371/journal.pone.0021101
  • 18. Debemos desarrollar Políticas y Acciones para Gestionar los Datos Científicos: ● Políticas a nivel de agencias de financiación e institucionales. Definición de roles/responsabilidades de los distintos actores. ● Recursos financieros a largo plazo ya que los datos son acumulativos y se preservan. ● Recursos humanos especializados (para generación de datos, normalización, explotación y preservación). ● Infraestructuras coordinadas para garantizar su interoperabilidad. Entre los requisitos de las infraestructuras destacar: preservación, acceso, data curation, data processing, distribución.
  • 19. ¿y los Investigadores? ● Colaborar con su formación ● Proveer una infraestructura de trabajo (framework): – Almacenamiento de datos – Curación, Procesamiento, Explotación, Visualización de datos. ● Contar con Repositorios / Centros de Datos: – Identificadores únicos (Autor, Datos, etc.) – Estadísticas de impacto (uso, descarga, citación, etc.) – Preservación Digital
  • 20. Ciclo de Vida de los Datos ABIERTO
  • 21. Muchas Gracias Fernando Ariel López CAICYT – CONICET @fernando__lopez
  • 22. Definición de METADATOS ● "datos sobre los datos" ● son datos altamente estructurados que describen información, describen el contenido, la calidad, la condición y otras características de los datos. ● En los metadatos se describe varios atributos de los objetos de información para otorgarles: significado, contexto y organización
  • 23. METADATOS ● Selección de Esquemas http://www.dcc.ac.uk/resources/metadata-standards
  • 24. Ejemplo de Esquemas de Metadatos de ECONOMÍA DDI - Data Documentation Initiative An international standard for describing data from the social, behavioral, and economic sciences. Expressed in XML, the DDI metadata specification supports the entire research data life cycle. SDMX - Statistical Data and Metadata Exchange A set of common technical and statistical standards and guidelines to be used for the efficient exchange and sharing of statistical data and metadata.
  • 25. Esquema de metadatos DDI ● Documentación http://www.ddialliance.org/Specification/ ● Vocabulario controlado asociado http://www.ddialliance.org/Specification/DDI-CV/ ● Extensiones, Herramientas (editores, etc) y Casos de uso Ejemplos: ● Yale University (EEUU) http://isps.yale.edu/research#.Vl04knYvfIV ● European Center Bank. Statistical Data Warehouse Portal (humanos) http://sdw.ecb.europa.eu/home.do Web service (maquinas) https://sdw-wsrest.ecb.europa.eu/ ● Paneldata.org (Alemania) https://paneldata.org/topics