SlideShare una empresa de Scribd logo
El Big Data como fenómeno y 
herramienta para el e‐research en 
CSyH Digitales

Imagen de Web Design Hot. Fuente
http://www.freepik.com

Dra. María Sánchez González
Profesora Asociada e investigadora Periodismo UMA/
Técnico Innovación UNIA/ Miembro de @GRINUGR
m.sanchezgonzalez@uma.es/ @cibermarikiya

Congreso Latina de Comunicación Social. La Laguna,
Tenerife. 5 de diciembre de 2013. Mesa de debate
“Ciencias sociales y humanidades digitales (…)”
Introducción: evolución de los datos en el ecosistema digital

Los datos han existido siempre…
•Huella digital de entidades e individuos (búsquedas, navegación en red…).
•Las empresas del sector de la Economía digital buscan convertir datos en
valor: desarrollo de sistemas de búsqueda personalizados;
recomendaciones… en los últimos años. Sin ellas empresas como Google o
Facebook no existirían de la misma manera hoy (Mayer-Schönberger, OII).
•Todos basados en el mismo principio, el almacenamiento y la utilización de
datos masivos, y en tecnologías y estándares propios de la web semántica
(término acuñado por Berners-Lee hace dos décadas).

Fuente de imagen: Victor V. Varela
http://www.pinterest.com/pin/1095642
03404688024/
… Pero hoy vivimos en “the Age of Big
data”. Factores clave
Crecimiento exponencial de datos: superan la capacidad de
procesamiento de los sistemas convencionales (Strata Conference, O’Reilly).
“Three converging ‘perfect storms’”: computing, data y convergence
(Big, Data, Big Analytics, Minelli et al, 2013): crecimiento anual del volumen de datos
generados online de un 40%.

“Squared web” o web2 (participación + sistemas de inteligencia artificial):
-Buena parte de los datos procede de usuarios conectados redes sociales a través de diversos
dispositivos, incluyendo los móviles.
-A más participación, más sensores alimentando aplicaciones en tiempo real.

Datos enlazados e interdependientes:
Linked data: tecnologías que promueven la interconexión de datos y
facilitan su acceso y recuperación.
Los datos dejan de ser dependientes o independientes para convertirse en
interdependientes
Posibilidad de tratamiento masivo de datos
“Big Data Analytics” como nueva forma de tratamiento y
análisis de datos ante esta complejidad (Calero, 2013).

Fuente: FICO. En http://bit.ly/1842rsk

Nuevas vías para la investigación (técnicas y herramientas) y
fenómeno poco explorado en CSyH Digitales.
open data, o-gov y transparencia,
movimientos impulsores del big data
Open data: los datos públicos en abierto (la nube pública) como base.
- Iniciativas que, desarrolladas bien por instituciones públicas (gobierno
abierto), bien por colectivos de activistas, suponen, así, una oportunidad para
la apropiación ciudadana del big data y el desarrollo de disciplinas como el
periodismo de datos.
- Las propias empresas de Economía Digital aprovechan esta apertura de
datos y fomentan su utilización: Google Data Public.

¿Big-Linked-Open Data?
Empieza a ser posible disponer de un ecosistema digital compuesto por
grandes bases de datos interconectados y abiertos de acceso público.
Planteamiento de estudio
Análisis panorámico, exploratorio y cualitativo en torno al
fenómeno big data y a sus posibles aplicaciones (e
implicaciones) para el e-research en CSyHD

Objetivos específicos
•
•

•
•
•

Acotar la significación, conforme al contexto actual y diferenciándolo de otros
relacionados con el auge de los datos en red, el término big data.
Identificar colectivos relacionados con la difusión y el análisis del fenómeno del big
data, así como los nuevos perfiles profesionales y de investigadores que, como el
llamado científico de datos, comienzan a demandarse.
Explorar sobre incidencia del Big Data en la llamada Ciencia de los Datos y su
función en la Nueva Ciencia de Redes.
Describir técnicas de procesado y representación de datos masivos en red, como el
llamado visual analythics, que facilitan la labor de investigadores.
Detectar y analizar tendencias y casos significativos de uso del big data en los
principales campos de conocimiento de las Ciencias Sociales y Humanidades.

Metodología
Fuentes bibliográficas y fuentes hemerográficas online
Localización, análisis y taxonomía de iniciativas relevantes sobre big data
(función del big data y aplicación; disponibilidad de resultados/herramientas en red y
potencial replicabilidad; destinatarios; promotores…).
Desarrollo

Big data: concepción y auge en el
contexto actual
Primeras definiciones, aluden a datos masivos:
“Data that exceeds the processing capacity of conventional database
systems” (Dumbill, 2012)

Pero no sólo referido por tanto a datos masivos o
macrodatos, sino también a su tratamiento
“Combinación entre algoritmos, tecnologías y estrategias, capaces de
capturar y analizar grandes volúmenes de datos provenientes de
múltiples fuentes heterogéneas a una alta velocidad, de forma
económica y a tiempo real” (Paniagua, 2013)

Objetivo: convertir datos en conocimiento
Las 4 dimensiones o V’s del big data según IBM

Fuente: IBM. What is big data? En http://www.ibm.com/big-data/us/en/

La quinta V= Visualización
Importancia de la representación visual, comprensible, de los datos (Tascón, 2013)
Soluciones basadas en big data
En empresas del sector de la Economía Digital. El caso de Google: El
gráfico del conocimiento (2012)/ Google Flu y Google Dengue Trends/ Hadoop/
Google Big Query…
En otros sectores: medicina, banca, comunicación, educación…
Y adopción por parte de propias empresas

Doble funcionalidad:
•Consultas/ bases de datos. Permiten acceder a grandes cantidades de
información, en distintos formatos y en tiempo real; manejarlos, filtrarlos…
•Visualizaciones de datos. E integran sistemas de visualización para mostrar
estos datos o, incluso, crear visualizaciones personalizadas y publicarlas...

Ciencia de los Datos como híbrido entre informática
tradicional, matemáticas y arte.
Implicaciones del big data para el
e-research: nuevas Ciencias y Técnicas
La Ciencia de los Datos y su transformación con Big Data:
Análisis más certeros y profundos, “transformar grandes volúmenes de datos en
inteligencia” (Paniagua, 2013).
Dos grandes utilidades:
1. Seguimiento de información en tiempo real.
2. Análisis de tendencias y prospectiva.

Visual analythics como técnica de visualización y
análisis de grandes cantidades de datos
Ciencia del razonamiento analítico facilitada por interfaces visuales
interactivas” (Thomas y Cook, 2005)
Proliferación de utilidades online que extraen información de cuestiones
complejas y la representan visualmente, facilitando su comprensión para su
estudio o toma de decisiones: grafos; información geoposicionada o espaciotemporal…
Sinergia entre Big Data y la Nueva Ciencia de las Redes
Análisis experimental y estudio de su naturaleza, nodos… de forma más ágil,
gracias a la proliferación de data sets para el modelado de datos y la simulación
y de tecnologías de visualización automática e inteligente de estas redes, online.
Big data y análisis de redes en la investigación aplicada
•
•

•
•

Precedir, prevenir y personalizar (ej. Sanidad).
Monitorizar a tiempo real la reputación digital de una entidad o la visibilidad de determinados
mensajes en redes y comunidades virtuales, detectar temas que interesan al público o líderes de
opinión, analizar preferencias o hábitos de consumo… (comunicación y marketing digital)
Identificar y seguir en tiempo real de patrones anómalos de seguimiento en red (ej.
Ciberterrorismo).
…

Ejemplo: Esteban Moro (UC3M): estudio sobre la influencia del comportamiento de usuarios en difusión
de la información y viralidad a través de redes sociales (matemáticas). Fuente:
http://www.uc3m.es/portal/page/portal/actualidad_cientifica/noticias/claves_difusion_informacion
Consecuentemente…
Demanda de nuevos perfiles profesionales:
científicos de datos o data scientifics; expertos en big data…

Capacitación para el big data:
primeras iniciativas por universidades y otras entidades, orientadas a
capacitación técnica: ¿qué ocurre con científicos de CSyH?

Iniciativas y colectivos centrados en su análisis,
divulgación y promoción:
- O’Reilly y sus Conferencias Strata, iniciadas en 2011 en California.
- En el caso español, Asociación Española de Linked Data (AELID)/
Grupo Macrodatos/ programas en fundaciones de grandes empresas
(Telefónica, BBVA…)

Exploración en torno al fenómeno desde la Academia
Informes, análisis técnicos o reflexiones sobre iniciativas determinadas…
Desde perspectiva de “Predictive Analytics”/ “Intelligence Business”.
Casos significativos de centros/organismos de investigación adscritos a
universidades.
…
El caso del Oxford Internet Institute (Universidad de
Oxford) en CSyHD
Big data como objeto de estudio…
“Accessing and Using Big Data to Advance Social Science Knowledge” (Meyer)
http://www.oii.ox.ac.uk/research/projects/?id=98

…O como herramienta para la
investigación académica:
construcción de aplicaciones web
basadas en big data y visualización
de datos
NameGevDev, an online application for
Facebook that allows “capture, analyse,
and visualise your Facebook network”
(Hogan)
http://apps.facebook.com/namegendev/
Y ofrece online recursos para el análisis de datos o sistemas
interactivos de visualización, fruto del trabajo de investigadores
“The InteractiveVis project” (http://blogs.oii.ox.ac.uk/vis/?page_id=25), on
interactive visualization in the University of Oxford, and funded by JISC (2012).
Ejemplos, demos y noticias en este blog: http://blogs.oii.ox.ac.uk/vis/

Fuente: Twitter Network of @OIIOxford via
Oxford Internet Institute
El valor del big data para el e-research en CSyH.

Posibles aplicaciones, objetos de estudio y
radiografía de casos
Estudios macroscópicos: macrodemografías, macroanálisis de
contenidos… (no posibles de otra forma. Importante considerar el contexto y
esencial función de investigadores como intérpretes en análisis cualitativos).
Exploraciones sobre la marca digital e influencia de personas o entidades
en redes sociales (aplicaciones online basadas en visual analythics, como
Klout. Escasamente personalizables, y muchas de pago).
Análisis de percepciones, clima
social u opinión pública mediante
sistemas de escucha activa online
Herramientas que proporcionan
rankings y sistemas de escucha
activa online, claves en seguimiento
de campañas electorales y potencial
de anticipación/control de votos.
Ej: elecciones de USA de 2012.

Fuente de imagen: http://enteratech.com.mx/2012/11/08/el-papeldel-big-data-en-las-us-elections-2012/
Investigación sobre audiencias sociales (macroanálisis de perfiles y
preferencias…. Alternativa/complemento a audiometrías clásicas para consumos
transmediáticos).
Estudios antropológicos y sociológicos con big data: comprender el
comportamiento humano (Ej: “The Human Face of Big data”, proyecto
colaborativo basado en aportaciones de usuarios sobre vida cotidiana. Ver
http://www.thehumanfaceofbigdata.com/).
Estudios geolocalizados y
mapeados sobre usuarios en redes
sociales para analizar posibles
correlaciones (Ej. “Hedonometer
project” de Universidad de Vermont,
análisis de niveles de felicidad de
forma geolocalizada y correlación con
otros factores: salud, fechas… Ver:
http://hedonometer.org/about.html)
Fuente de imagen: http://onehappybird.com/2013/02/18/where-is-thehappiest-city-in-the-usa/
Herramienta para la investigación sobre e-learning y enseñanzaaprendizaje en red (sistemas métricos sobre PLEs de Knewton y Junyo;
nuevas posibilidades de macroetnografías digitales ante MOOCs…)
Herramienta para la estrategia y prospectiva: modelos predictivos
basados en big data en CSyHD:
-Ej: estudios de Preis y
Mota, Universidad de
Boston, en revista Nature,
que correlacionan PIB de
países con búsquedas en
Google sobre
presente/pasado; alertas
tempranas sobre términos
financieros…
-Limitaciones del big data
en prospectiva: ruido
estadístico.

Fuente de imagen:
http://www.nature.com/srep/2012/120405/srep00350/full/srep00350.html#results
Discusión y conclusiones:
oportunidades y retos del big
data en CSyHD
Incidencia sobre e-research en CSyH:
-Transformación en el modo de investigar online y
nuevas posibilidades: técnicas de análisis inteligente
de datos masivos sobre diversos fenómenos; sistemas
de visualización en red (fuentes/herramientas para
presentar resultados…).
-Demanda de nuevos roles expertos en big data y de
competencias de investigadores (análisis de datos).
- Necesidad de equipos multidisciplinares y de la
colaboración entre áreas: expertos en big data en
CSyH y científicos sociales que den contexto e
interpreten datos cuantitativos de otras áreas.
Fuente de imagen: FICO, en http://bit.ly/1b8bruB
Limitaciones actuales del big data:
-Barreras culturales “to data-driven change” y retraso y temores en adoptar las
correspondientes tecnologías (“laggards and luddites”) por parte de
determinadas entidades (Croll, 2013)
-Solvencia de datos y riesgo de manipulación: ¿cómo comprobar fuentes y
filtrar datos?
-Escasa fiabilidad o validez de los resultados de determinadas
investigaciones: “antropología de datos” (Croll, 2013), esencial (ej. Haití).
-…

El “small data” como alternativa o complemento:
- Pequeños datasets que pueden ser almacenados y procesados a través de
un simple ordenador personal.
- Instrumento de visualización y empoderamiento colectivo del big data/ última
fase de los procesos asociados a éste (los grandes volúmenes de datos se
traducen en aplicaciones concretas asociadas a determinados objetivos).
En cualquier caso, ambos modelos, small y big data, no son
excluyentes, y su combinación abre nuevas posibilidades

al e-research.
Muchas gracias
Dra. María Sánchez González
Exposición para el Congreso Latina de
Comunicación Social. La Laguna, Tenerife. 5 de
diciembre de 2013. Mesa de debate “Ciencias
sociales y humanidades digitales (…)”

*Aportación enmarcada en Proyecto de Investigación “Ciencias
Sociales y Humanidades Digitales: casos, gestión y modelos de
negocio” (Campus de Excelencia Internacional BioTic Granada,
convocatoria 2013).

*Próximamente disponible en monográfico CAC.
Mis coordenadas online
Blog personal (marca, espacio centralizador):
www.cibermarikiya.com
Algunos de mis canales en la web social:
http://www.twitter.com/cibermarikiya
http:// www.facebook.com/cibermarikiya
http://es.linkedin.com/in/cibermarikiya
http://unia.academia.edu/mariaSanchez
http://www.diigo.com/user/cibermarikiya
http://pinterest.com/cibermarikiya/…
http://paper.li/cibermarikiya/
http://storify.com/cibermarikiya
http://www.slideshare.net/cibermarikiya
http://prezi.com/user/cibermarikiya/
http://issuu.com/cibermarikiya

Más contenido relacionado

PPT
Red Temática en TIC. Evento de arranque
PPT
Lasaña de DATA en sopa a la OPEN
PDF
Eva mendez servicios-de-informacion-socialesysemanticos-web30
PDF
Conociendo big data
PPT
Datos de investigación: reflexiones sobre su acceso abierto
PDF
Categorización de usuarios de Twitter
DOCX
Cuadros comparativos de los derivados de las TICs y la Sociedad de la Informa...
PPTX
eBooks recurso para potenciar la investigación científica multidisciplinaria
Red Temática en TIC. Evento de arranque
Lasaña de DATA en sopa a la OPEN
Eva mendez servicios-de-informacion-socialesysemanticos-web30
Conociendo big data
Datos de investigación: reflexiones sobre su acceso abierto
Categorización de usuarios de Twitter
Cuadros comparativos de los derivados de las TICs y la Sociedad de la Informa...
eBooks recurso para potenciar la investigación científica multidisciplinaria

Similar a El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales (20)

PDF
Open Data, Big Data y auge del Periodismo de Datos online. Sistemas de repres...
PDF
Cloud computing y big data
PDF
Tema1
PPTX
Aplicaciones Difusas: Evolución de las Bases de Datos
PDF
Minería de Datos: Conceptos y Tendencias
DOCX
Cloud computing y big data
PPTX
La geografía y la estadística. dos necesidades para entender big data
PDF
REDALAC-Exposición LUDWIG VALVERDE.pdf
PPT
Introduccion a la bigdata y su impacto en la sociedad
PPT
Introduccion a la bigdata y su impacto en la sociedad
PDF
¡Actúa! Potencial de los datos abiertos y retos para su (re)utilización (#Nov...
PDF
Big Data Analytics: Oportunidades, Retos y Tendencias
PPTX
Fundamentos.pptx
PDF
DESCRIPCION DEL PROFESIONAL Ingeniero_De_Datos.pdf
PDF
Conceptos en Ciencia de Datos
PDF
Unidad 3. Learning Analitycs, Social Media Analitycs, Bigdata, Web 3.0, Web U...
PDF
"Educación y datos masivos (Big Data)" - Fernando Santamaria
PDF
Educación y datos masivos (Big Data)
PDF
"Educación y datos masivos (Big Data)" - Fernando Santamaria
PDF
Conociendo el bigdata por Camargo y Joyanes
Open Data, Big Data y auge del Periodismo de Datos online. Sistemas de repres...
Cloud computing y big data
Tema1
Aplicaciones Difusas: Evolución de las Bases de Datos
Minería de Datos: Conceptos y Tendencias
Cloud computing y big data
La geografía y la estadística. dos necesidades para entender big data
REDALAC-Exposición LUDWIG VALVERDE.pdf
Introduccion a la bigdata y su impacto en la sociedad
Introduccion a la bigdata y su impacto en la sociedad
¡Actúa! Potencial de los datos abiertos y retos para su (re)utilización (#Nov...
Big Data Analytics: Oportunidades, Retos y Tendencias
Fundamentos.pptx
DESCRIPCION DEL PROFESIONAL Ingeniero_De_Datos.pdf
Conceptos en Ciencia de Datos
Unidad 3. Learning Analitycs, Social Media Analitycs, Bigdata, Web 3.0, Web U...
"Educación y datos masivos (Big Data)" - Fernando Santamaria
Educación y datos masivos (Big Data)
"Educación y datos masivos (Big Data)" - Fernando Santamaria
Conociendo el bigdata por Camargo y Joyanes
Publicidad

Más de María Sánchez González (@cibermarikiya) (20)

PDF
Innovación educativa para empoderar al alumnado en red: algunas ideas (Ponenc...
PDF
Competencias docentes ante la enseñanza en red y la IA: desafíos y “poderes” ...
PDF
Aprender-IA: Recursos online gratuitos para estar al tanto y familiarizarse c...
PPTX
Artificial Intelligence, one more weapon in the fight against disinformation:...
PDF
Innovar y humanizar la enseñanza-aprendizaje tiempos de IA: decálogo de ideas...
PPTX
INNOVACIONES Y ROLES DE LOS FACT-CHECKERS HISPANOS DE REFERENCIA
PDF
Activar las competencias SOFT digitales para el futuro profesional de nuestro...
PDF
Diseñar infografías educativas o actividades basadas en información visual......
PDF
Periodismo emprendedor sobre verificación... (Comunicación Congreso SEP 2021)
PDF
Taller sobre elevator pitch para Club de Inspiring Girls Málaga
PDF
Seminario virtual "Claves para el diseño e impartición de MOOCs y derivados" ...
PDF
Aprendizaje abierto en red. Tendencias, casos de éxito y claves para desarrol...
PDF
Infografía y visualización de datos para enseñanza-aprendizaje y difusión de ...
PDF
Estrategias y herramientas de evaluación no presencial en Ciencias de la Comu...
PDF
Planificación de asignaturas semipresenciales: aspectos clave, ideas, herrami...
PDF
Seminario virtual "Vídeos y podcasts para humanizar la experiencia de estudia...
PDF
Diseño e impartición de asignaturas universitarias en red ante la COVID-19
PDF
Recursos y experiencias para la innovación docente (jornadas #periodismoUMA f...
PDF
Ideas para acortar distancias, innovar y colaborar en red
PDF
Actividades educativas por webconferencia: planificar y comunicar ante la cám...
Innovación educativa para empoderar al alumnado en red: algunas ideas (Ponenc...
Competencias docentes ante la enseñanza en red y la IA: desafíos y “poderes” ...
Aprender-IA: Recursos online gratuitos para estar al tanto y familiarizarse c...
Artificial Intelligence, one more weapon in the fight against disinformation:...
Innovar y humanizar la enseñanza-aprendizaje tiempos de IA: decálogo de ideas...
INNOVACIONES Y ROLES DE LOS FACT-CHECKERS HISPANOS DE REFERENCIA
Activar las competencias SOFT digitales para el futuro profesional de nuestro...
Diseñar infografías educativas o actividades basadas en información visual......
Periodismo emprendedor sobre verificación... (Comunicación Congreso SEP 2021)
Taller sobre elevator pitch para Club de Inspiring Girls Málaga
Seminario virtual "Claves para el diseño e impartición de MOOCs y derivados" ...
Aprendizaje abierto en red. Tendencias, casos de éxito y claves para desarrol...
Infografía y visualización de datos para enseñanza-aprendizaje y difusión de ...
Estrategias y herramientas de evaluación no presencial en Ciencias de la Comu...
Planificación de asignaturas semipresenciales: aspectos clave, ideas, herrami...
Seminario virtual "Vídeos y podcasts para humanizar la experiencia de estudia...
Diseño e impartición de asignaturas universitarias en red ante la COVID-19
Recursos y experiencias para la innovación docente (jornadas #periodismoUMA f...
Ideas para acortar distancias, innovar y colaborar en red
Actividades educativas por webconferencia: planificar y comunicar ante la cám...
Publicidad

Último (20)

DOCX
PLAN DE CASTELLANO 2021 actualizado a la normativa
DOCX
UNIDAD DE APRENDIZAJE 5 AGOSTO tradiciones
PDF
CONFERENCIA-Deep Research en el aula universitaria-UPeU-EduTech360.pdf
PDF
COMPLETO__PROYECTO_VIVAN LOS NIÑOS Y SUS DERECHOS_EDUCADORASSOS.pdf
PDF
Romper el Circulo de la Creatividad - Colleen Hoover Ccesa007.pdf
PDF
Unidad de Aprendizaje 5 de Matematica 1ro Secundaria Ccesa007.pdf
PDF
Guia de Tesis y Proyectos de Investigacion FS4 Ccesa007.pdf
PDF
Escuelas Desarmando una mirada subjetiva a la educación
PDF
TOMO II - LITERATURA.pd plusenmas ultras
PPTX
caso clínico iam clinica y semiología l3.pptx
PPTX
AGENTES PATÓGENOS Y LAS PRINCIPAL ENFERMEAD.pptx
PDF
Cronograma de clases de Práctica Profesional 2 2025 UDE.pdf
PDF
Crear o Morir - Andres Oppenheimer Ccesa007.pdf
PDF
Tomo 1 de biologia gratis ultra plusenmas
PDF
Gasista de unidades unifuncionales - pagina 23 en adelante.pdf
PDF
TRAUMA_Y_RECUPERACION consecuencias de la violencia JUDITH HERMAN
PDF
IDH_Guatemala_2.pdfnjjjkeioooe ,l dkdldp ekooe
PDF
Punto Critico - Brian Tracy Ccesa007.pdf
PDF
Fundamentos_Educacion_a_Distancia_ABC.pdf
PDF
La Evaluacion Formativa en Nuevos Escenarios de Aprendizaje UGEL03 Ccesa007.pdf
PLAN DE CASTELLANO 2021 actualizado a la normativa
UNIDAD DE APRENDIZAJE 5 AGOSTO tradiciones
CONFERENCIA-Deep Research en el aula universitaria-UPeU-EduTech360.pdf
COMPLETO__PROYECTO_VIVAN LOS NIÑOS Y SUS DERECHOS_EDUCADORASSOS.pdf
Romper el Circulo de la Creatividad - Colleen Hoover Ccesa007.pdf
Unidad de Aprendizaje 5 de Matematica 1ro Secundaria Ccesa007.pdf
Guia de Tesis y Proyectos de Investigacion FS4 Ccesa007.pdf
Escuelas Desarmando una mirada subjetiva a la educación
TOMO II - LITERATURA.pd plusenmas ultras
caso clínico iam clinica y semiología l3.pptx
AGENTES PATÓGENOS Y LAS PRINCIPAL ENFERMEAD.pptx
Cronograma de clases de Práctica Profesional 2 2025 UDE.pdf
Crear o Morir - Andres Oppenheimer Ccesa007.pdf
Tomo 1 de biologia gratis ultra plusenmas
Gasista de unidades unifuncionales - pagina 23 en adelante.pdf
TRAUMA_Y_RECUPERACION consecuencias de la violencia JUDITH HERMAN
IDH_Guatemala_2.pdfnjjjkeioooe ,l dkdldp ekooe
Punto Critico - Brian Tracy Ccesa007.pdf
Fundamentos_Educacion_a_Distancia_ABC.pdf
La Evaluacion Formativa en Nuevos Escenarios de Aprendizaje UGEL03 Ccesa007.pdf

El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales

  • 1. El Big Data como fenómeno y  herramienta para el e‐research en  CSyH Digitales Imagen de Web Design Hot. Fuente http://www.freepik.com Dra. María Sánchez González Profesora Asociada e investigadora Periodismo UMA/ Técnico Innovación UNIA/ Miembro de @GRINUGR m.sanchezgonzalez@uma.es/ @cibermarikiya Congreso Latina de Comunicación Social. La Laguna, Tenerife. 5 de diciembre de 2013. Mesa de debate “Ciencias sociales y humanidades digitales (…)”
  • 2. Introducción: evolución de los datos en el ecosistema digital Los datos han existido siempre… •Huella digital de entidades e individuos (búsquedas, navegación en red…). •Las empresas del sector de la Economía digital buscan convertir datos en valor: desarrollo de sistemas de búsqueda personalizados; recomendaciones… en los últimos años. Sin ellas empresas como Google o Facebook no existirían de la misma manera hoy (Mayer-Schönberger, OII). •Todos basados en el mismo principio, el almacenamiento y la utilización de datos masivos, y en tecnologías y estándares propios de la web semántica (término acuñado por Berners-Lee hace dos décadas). Fuente de imagen: Victor V. Varela http://www.pinterest.com/pin/1095642 03404688024/
  • 3. … Pero hoy vivimos en “the Age of Big data”. Factores clave Crecimiento exponencial de datos: superan la capacidad de procesamiento de los sistemas convencionales (Strata Conference, O’Reilly). “Three converging ‘perfect storms’”: computing, data y convergence (Big, Data, Big Analytics, Minelli et al, 2013): crecimiento anual del volumen de datos generados online de un 40%. “Squared web” o web2 (participación + sistemas de inteligencia artificial): -Buena parte de los datos procede de usuarios conectados redes sociales a través de diversos dispositivos, incluyendo los móviles. -A más participación, más sensores alimentando aplicaciones en tiempo real. Datos enlazados e interdependientes: Linked data: tecnologías que promueven la interconexión de datos y facilitan su acceso y recuperación. Los datos dejan de ser dependientes o independientes para convertirse en interdependientes Posibilidad de tratamiento masivo de datos
  • 4. “Big Data Analytics” como nueva forma de tratamiento y análisis de datos ante esta complejidad (Calero, 2013). Fuente: FICO. En http://bit.ly/1842rsk Nuevas vías para la investigación (técnicas y herramientas) y fenómeno poco explorado en CSyH Digitales.
  • 5. open data, o-gov y transparencia, movimientos impulsores del big data Open data: los datos públicos en abierto (la nube pública) como base. - Iniciativas que, desarrolladas bien por instituciones públicas (gobierno abierto), bien por colectivos de activistas, suponen, así, una oportunidad para la apropiación ciudadana del big data y el desarrollo de disciplinas como el periodismo de datos. - Las propias empresas de Economía Digital aprovechan esta apertura de datos y fomentan su utilización: Google Data Public. ¿Big-Linked-Open Data? Empieza a ser posible disponer de un ecosistema digital compuesto por grandes bases de datos interconectados y abiertos de acceso público.
  • 6. Planteamiento de estudio Análisis panorámico, exploratorio y cualitativo en torno al fenómeno big data y a sus posibles aplicaciones (e implicaciones) para el e-research en CSyHD Objetivos específicos • • • • • Acotar la significación, conforme al contexto actual y diferenciándolo de otros relacionados con el auge de los datos en red, el término big data. Identificar colectivos relacionados con la difusión y el análisis del fenómeno del big data, así como los nuevos perfiles profesionales y de investigadores que, como el llamado científico de datos, comienzan a demandarse. Explorar sobre incidencia del Big Data en la llamada Ciencia de los Datos y su función en la Nueva Ciencia de Redes. Describir técnicas de procesado y representación de datos masivos en red, como el llamado visual analythics, que facilitan la labor de investigadores. Detectar y analizar tendencias y casos significativos de uso del big data en los principales campos de conocimiento de las Ciencias Sociales y Humanidades. Metodología Fuentes bibliográficas y fuentes hemerográficas online Localización, análisis y taxonomía de iniciativas relevantes sobre big data (función del big data y aplicación; disponibilidad de resultados/herramientas en red y potencial replicabilidad; destinatarios; promotores…).
  • 7. Desarrollo Big data: concepción y auge en el contexto actual Primeras definiciones, aluden a datos masivos: “Data that exceeds the processing capacity of conventional database systems” (Dumbill, 2012) Pero no sólo referido por tanto a datos masivos o macrodatos, sino también a su tratamiento “Combinación entre algoritmos, tecnologías y estrategias, capaces de capturar y analizar grandes volúmenes de datos provenientes de múltiples fuentes heterogéneas a una alta velocidad, de forma económica y a tiempo real” (Paniagua, 2013) Objetivo: convertir datos en conocimiento
  • 8. Las 4 dimensiones o V’s del big data según IBM Fuente: IBM. What is big data? En http://www.ibm.com/big-data/us/en/ La quinta V= Visualización Importancia de la representación visual, comprensible, de los datos (Tascón, 2013)
  • 9. Soluciones basadas en big data En empresas del sector de la Economía Digital. El caso de Google: El gráfico del conocimiento (2012)/ Google Flu y Google Dengue Trends/ Hadoop/ Google Big Query… En otros sectores: medicina, banca, comunicación, educación… Y adopción por parte de propias empresas Doble funcionalidad: •Consultas/ bases de datos. Permiten acceder a grandes cantidades de información, en distintos formatos y en tiempo real; manejarlos, filtrarlos… •Visualizaciones de datos. E integran sistemas de visualización para mostrar estos datos o, incluso, crear visualizaciones personalizadas y publicarlas... Ciencia de los Datos como híbrido entre informática tradicional, matemáticas y arte.
  • 10. Implicaciones del big data para el e-research: nuevas Ciencias y Técnicas La Ciencia de los Datos y su transformación con Big Data: Análisis más certeros y profundos, “transformar grandes volúmenes de datos en inteligencia” (Paniagua, 2013). Dos grandes utilidades: 1. Seguimiento de información en tiempo real. 2. Análisis de tendencias y prospectiva. Visual analythics como técnica de visualización y análisis de grandes cantidades de datos Ciencia del razonamiento analítico facilitada por interfaces visuales interactivas” (Thomas y Cook, 2005) Proliferación de utilidades online que extraen información de cuestiones complejas y la representan visualmente, facilitando su comprensión para su estudio o toma de decisiones: grafos; información geoposicionada o espaciotemporal…
  • 11. Sinergia entre Big Data y la Nueva Ciencia de las Redes Análisis experimental y estudio de su naturaleza, nodos… de forma más ágil, gracias a la proliferación de data sets para el modelado de datos y la simulación y de tecnologías de visualización automática e inteligente de estas redes, online. Big data y análisis de redes en la investigación aplicada • • • • Precedir, prevenir y personalizar (ej. Sanidad). Monitorizar a tiempo real la reputación digital de una entidad o la visibilidad de determinados mensajes en redes y comunidades virtuales, detectar temas que interesan al público o líderes de opinión, analizar preferencias o hábitos de consumo… (comunicación y marketing digital) Identificar y seguir en tiempo real de patrones anómalos de seguimiento en red (ej. Ciberterrorismo). … Ejemplo: Esteban Moro (UC3M): estudio sobre la influencia del comportamiento de usuarios en difusión de la información y viralidad a través de redes sociales (matemáticas). Fuente: http://www.uc3m.es/portal/page/portal/actualidad_cientifica/noticias/claves_difusion_informacion
  • 12. Consecuentemente… Demanda de nuevos perfiles profesionales: científicos de datos o data scientifics; expertos en big data… Capacitación para el big data: primeras iniciativas por universidades y otras entidades, orientadas a capacitación técnica: ¿qué ocurre con científicos de CSyH? Iniciativas y colectivos centrados en su análisis, divulgación y promoción: - O’Reilly y sus Conferencias Strata, iniciadas en 2011 en California. - En el caso español, Asociación Española de Linked Data (AELID)/ Grupo Macrodatos/ programas en fundaciones de grandes empresas (Telefónica, BBVA…) Exploración en torno al fenómeno desde la Academia Informes, análisis técnicos o reflexiones sobre iniciativas determinadas… Desde perspectiva de “Predictive Analytics”/ “Intelligence Business”. Casos significativos de centros/organismos de investigación adscritos a universidades. …
  • 13. El caso del Oxford Internet Institute (Universidad de Oxford) en CSyHD Big data como objeto de estudio… “Accessing and Using Big Data to Advance Social Science Knowledge” (Meyer) http://www.oii.ox.ac.uk/research/projects/?id=98 …O como herramienta para la investigación académica: construcción de aplicaciones web basadas en big data y visualización de datos NameGevDev, an online application for Facebook that allows “capture, analyse, and visualise your Facebook network” (Hogan) http://apps.facebook.com/namegendev/
  • 14. Y ofrece online recursos para el análisis de datos o sistemas interactivos de visualización, fruto del trabajo de investigadores “The InteractiveVis project” (http://blogs.oii.ox.ac.uk/vis/?page_id=25), on interactive visualization in the University of Oxford, and funded by JISC (2012). Ejemplos, demos y noticias en este blog: http://blogs.oii.ox.ac.uk/vis/ Fuente: Twitter Network of @OIIOxford via Oxford Internet Institute
  • 15. El valor del big data para el e-research en CSyH. Posibles aplicaciones, objetos de estudio y radiografía de casos Estudios macroscópicos: macrodemografías, macroanálisis de contenidos… (no posibles de otra forma. Importante considerar el contexto y esencial función de investigadores como intérpretes en análisis cualitativos). Exploraciones sobre la marca digital e influencia de personas o entidades en redes sociales (aplicaciones online basadas en visual analythics, como Klout. Escasamente personalizables, y muchas de pago). Análisis de percepciones, clima social u opinión pública mediante sistemas de escucha activa online Herramientas que proporcionan rankings y sistemas de escucha activa online, claves en seguimiento de campañas electorales y potencial de anticipación/control de votos. Ej: elecciones de USA de 2012. Fuente de imagen: http://enteratech.com.mx/2012/11/08/el-papeldel-big-data-en-las-us-elections-2012/
  • 16. Investigación sobre audiencias sociales (macroanálisis de perfiles y preferencias…. Alternativa/complemento a audiometrías clásicas para consumos transmediáticos). Estudios antropológicos y sociológicos con big data: comprender el comportamiento humano (Ej: “The Human Face of Big data”, proyecto colaborativo basado en aportaciones de usuarios sobre vida cotidiana. Ver http://www.thehumanfaceofbigdata.com/). Estudios geolocalizados y mapeados sobre usuarios en redes sociales para analizar posibles correlaciones (Ej. “Hedonometer project” de Universidad de Vermont, análisis de niveles de felicidad de forma geolocalizada y correlación con otros factores: salud, fechas… Ver: http://hedonometer.org/about.html) Fuente de imagen: http://onehappybird.com/2013/02/18/where-is-thehappiest-city-in-the-usa/
  • 17. Herramienta para la investigación sobre e-learning y enseñanzaaprendizaje en red (sistemas métricos sobre PLEs de Knewton y Junyo; nuevas posibilidades de macroetnografías digitales ante MOOCs…) Herramienta para la estrategia y prospectiva: modelos predictivos basados en big data en CSyHD: -Ej: estudios de Preis y Mota, Universidad de Boston, en revista Nature, que correlacionan PIB de países con búsquedas en Google sobre presente/pasado; alertas tempranas sobre términos financieros… -Limitaciones del big data en prospectiva: ruido estadístico. Fuente de imagen: http://www.nature.com/srep/2012/120405/srep00350/full/srep00350.html#results
  • 18. Discusión y conclusiones: oportunidades y retos del big data en CSyHD Incidencia sobre e-research en CSyH: -Transformación en el modo de investigar online y nuevas posibilidades: técnicas de análisis inteligente de datos masivos sobre diversos fenómenos; sistemas de visualización en red (fuentes/herramientas para presentar resultados…). -Demanda de nuevos roles expertos en big data y de competencias de investigadores (análisis de datos). - Necesidad de equipos multidisciplinares y de la colaboración entre áreas: expertos en big data en CSyH y científicos sociales que den contexto e interpreten datos cuantitativos de otras áreas. Fuente de imagen: FICO, en http://bit.ly/1b8bruB
  • 19. Limitaciones actuales del big data: -Barreras culturales “to data-driven change” y retraso y temores en adoptar las correspondientes tecnologías (“laggards and luddites”) por parte de determinadas entidades (Croll, 2013) -Solvencia de datos y riesgo de manipulación: ¿cómo comprobar fuentes y filtrar datos? -Escasa fiabilidad o validez de los resultados de determinadas investigaciones: “antropología de datos” (Croll, 2013), esencial (ej. Haití). -… El “small data” como alternativa o complemento: - Pequeños datasets que pueden ser almacenados y procesados a través de un simple ordenador personal. - Instrumento de visualización y empoderamiento colectivo del big data/ última fase de los procesos asociados a éste (los grandes volúmenes de datos se traducen en aplicaciones concretas asociadas a determinados objetivos). En cualquier caso, ambos modelos, small y big data, no son excluyentes, y su combinación abre nuevas posibilidades al e-research.
  • 20. Muchas gracias Dra. María Sánchez González Exposición para el Congreso Latina de Comunicación Social. La Laguna, Tenerife. 5 de diciembre de 2013. Mesa de debate “Ciencias sociales y humanidades digitales (…)” *Aportación enmarcada en Proyecto de Investigación “Ciencias Sociales y Humanidades Digitales: casos, gestión y modelos de negocio” (Campus de Excelencia Internacional BioTic Granada, convocatoria 2013). *Próximamente disponible en monográfico CAC.
  • 21. Mis coordenadas online Blog personal (marca, espacio centralizador): www.cibermarikiya.com Algunos de mis canales en la web social: http://www.twitter.com/cibermarikiya http:// www.facebook.com/cibermarikiya http://es.linkedin.com/in/cibermarikiya http://unia.academia.edu/mariaSanchez http://www.diigo.com/user/cibermarikiya http://pinterest.com/cibermarikiya/… http://paper.li/cibermarikiya/ http://storify.com/cibermarikiya http://www.slideshare.net/cibermarikiya http://prezi.com/user/cibermarikiya/ http://issuu.com/cibermarikiya