SlideShare una empresa de Scribd logo
análisis
aceprensa30 abril 2014 - n.º 34/14
La Biblioteca del Congreso de Es-
tados Unidos es la mayor del mun-
do. Contiene más de 120 millones
de documentos, en papel y en otros
soportes, acumulados a lo largo de
214 años de existencia. Sin embar-
go, todo eso suma menos de la mi-
lésima parte de la información que
Google procesa en un día, que viene
a ser unos 24 petabytes (24x1015).
Hoy tenemos big data (datos
masivos) porque se mide y se cuen-
ta casi todo: las transacciones co-
merciales internacionales, los viaje-
ros en el transporte público, el con-
sumo de electricidad a todas las ho-
ras del día, los datos meteorológi-
cos, los casos de sida y otras enfer-
medades infecciosas, los precios in-
dustriales y de venta al por menor,
nacimientos y defunciones...
También se registran nuestros
clics cuando usamos Internet, lo
que ponemos en las redes sociales,
las compras que hacemos con tarje-
ta. El teléfono móvil deja constancia
no solo de con quién hablamos o in-
tercambiamos mensajes, sino de
dónde estamos en cada momento.
Los Big Data recuerdan al Big
Brother. Con razón empezamos a
preocuparnos de lo mucho que se
puede saber de nosotros, y la facili-
dad con que se puede utilizar. Pero
no debemos caer tampoco en el
alarmismo de pensar que estamos
continuamente vigilados. Aunque
los datos masivos plantean proble-
mas para la privacidad, en primer lu-
gar son instrumentos útiles que nos
prestan servicios cotidianos, permi-
ten hacer cosas nuevas, crean opor-
tunidades de negocio, estimulan la
actividad económica.
Cálculo, no inteligencia
“Aunque nos hallamos aún en los al-
bores de la era de los datos masi-
vos, nos servimos de ellos a diario”,
se puede leer en un libro reciente,
Big data (1), que es una buena guía
para introducirse en el tema. Los fil-
tros contra el correo basura, los co-
rrectores ortográficos, la orientación
por GPS se basan en datos masi-
vos.
Ahora podemos usar cantida-
des ingentes de datos porque se ha
vuelto fácil y barato recopilarlos y
tratarlos. La rápida respuesta de los
buscadores de Internet revela la
gran capacidad de computación
que tienen las máquinas actuales.
Pero en el fenómeno big data lo pri-
mero y principal son los datos mis-
mos: muchísimos, y cuantos más,
mejor.
Precisamente la mayor cantidad
de datos es lo que permite hacer
cosas que no eran posibles con da-
tos escasos. La traducción automá-
tica es una vieja aspiración que has-
ta hace poco ha dado resultados
frustrantes. Los recientes avances
no tienen que ver con la inteligencia
artificial, sino con los datos masi-
vos. Fueron ingenieros de IBM quie-
nes a finales de los ochenta tuvieron
la idea: en vez de afinar las reglas
lingüísticas que usaba el ordenador,
se centraron en aumentar su léxico,
hasta introducir unos tres millones
de pares de frases en inglés y fran-
cés. Pero la mejora no fue espec-
tacular, y se abandonó el proyecto.
Hasta que llegó Google, que a
base de leer páginas web en todos
los idiomas y digitalizar más de 20
millones de libros distintos (ese era
un objetivo no declarado de Google
Utilidad y peligros de los datos masivos
Cómo tener Big Data
sin el Big Brother
Rafael Serrano
La recopilación y el análisis de grandes volúmenes de datos ya no es solo obra de un Estado policial, sino la
actividad continua de muchas empresas. Los llamados big data no sirven para todo, ni resuelven los males del
mundo, pero permiten nuevos servicios muy útiles, desde el simple corrector ortográfico al control de las epi-
demias de gripe. También suponen nuevos peligros para la libertad y la intimidad de las personas.
Libros), almacenó un billón de expre-
siones. Ahora el traductor de Google
es el mejor que existe, aunque aún
imperfecto y bastante deficiente para
la mayoría de los idiomas. No es más
listo; simplemente tiene tantas equi-
valencias, que puede calcular la fre-
cuencia con que una palabra o frase
se corresponde con otra mejor que
todos los rivales, y cada vez mejor,
pues sigue acumulando datos y per-
feccionando sus cálculos.
“El uso de datos masivos –dicen
los autores de Big data– no consiste
en ‘enseñar’ a un ordenador a ‘pen-
sar’ como un ser humano. Más bien
consiste en aplicar las matemáticas a
enormes cantidades de datos para
poder inferir probabilidades”.
Calidad a base de cantidad
Con big data, se logra calidad a base
de cantidad: elevada probabilidad de
acierto gracias al gran número de
datos que procesar para hallar corre-
laciones. Esto implica que no se aspi-
ra a explicar los hechos, sino solo a
predecirlos estadísticamente.
Cuando el informático Oren
Etzioni fundó en 2003 la empresa
Farecast, no pretendió entender las
razones por las que los precios de los
billetes de avión cambian continua-
mente, misterio demasiado alto para
una mente finita. Se limitó a idear un
sistema para procesar a gran veloci-
dad las tarifas (hasta 200.000 millo-
nes de registros en un año) a fin de
hallar pautas y correlaciones, y consi-
guió un modelo que predecía con
elevado grado de acierto si en deter-
minado momento el precio iba a subir
o a bajar. Farecast no es infalible, pe-
ro por término medio ahorra unos
cincuenta dólares por billete a sus
usuarios, y a Etzioni le reportó 110
millones cuando Microsoft le compró
el sistema, para integrarlo en su bus-
cador Bing.
Como la cantidad es decisiva, el
fenómeno de los datos masivos se
apoya en la facilidad para obtenerlos
de modo automático. Para averiguar
las preferencias de los consumidores
se puede hacer una encuesta, y en tal
caso, es decisivo que la muestra esté
bien hecha, o los resultados no serán
representativos. Pero si procesamos
millones de compras por Internet, la
muestra se aproxima al universo es-
tadístico y desaparece el peligro de
sesgo en la selección de casos. Los
datos se recopilan solos, sin necesi-
dad de despachar un equipo de en-
cuestadores, y en las condiciones
reales: mientras la gente hace lo que
hace todos los días.
Persiguiendo al virus
Así se puede explotar los datos cru-
zándolos, buscando implicaciones,
para averiguar cosas que los datos
no dicen directamente. Google recibe
más de 3.000 millones de consultas a
diario y las archiva todas. Eso es una
mina de la que se puede extraer in-
formaciones de casi cualquier asun-
to, como la propagación de la gripe.
Después de probar gran número
de modelos, los analistas de Google
encontraron los términos de búsque-
da que con mayor probabilidad se re-
lacionan con la aparición de la epide-
mia en una zona. En efecto, aunque
Google no sabe si cierta persona que
mete en el buscador unos términos
relacionados con la epidemia está
enferma, o ve que otros se han con-
tagiado, o solo busca por curiosidad
o por casualidad, puede estimar, con
alto grado de acierto y antes de que
puedan saberlo las autoridades sani-
tarias por sus propios medios, por
dónde se mueve el virus. Así la pre-
vención es más fácil y eficaz.
Pero no pensemos solo en nove-
dades espectaculares. La recopila-
ción continua de datos aumenta la
eficiencia en muchos campos que no
tienen nada de ciencia ficción. Un
ejemplo es el de UPS, que instaló en
sus vehículos de reparto localizado-
res por GPS, para registrar los itinera-
rios. A medida que fue acumulando
datos, los ordenadores pudieron tra-
tarlos para definir en cada caso la
ruta más rápida. Gracias a eso, en
2011 UPS se ahorró en total 48 millo-
nes de kilómetros y 11,3 millones de
litros de combustible.
Es importante advertir que el aná-
lisis de datos masivos funciona en el
orden de los grandes números o de la
media estadística, que para saber
cómo se propaga la gripe o por dónde
llevar los paquetes es suficiente.
Fascinación por los datos
Al considerar el cada vez mayor uso
de datos masivos, vienen a la memo-
ria los versos de T.S. Eliot en su obra
teatral The Rock (1934): “¿Dónde es-
tá la sabiduría que se nos ha ido en
El uso de datos masivos
no consiste en ‘enseñar’
a un ordenador a ‘pensar’
como un ser humano,
sino en aplicar las
matemáticas a enormes
cantidades de datos
para poder inferir
probabilidades
aceprensa 30 abril 2014
conocimiento? / ¿Dónde está el co-
nocimiento que se nos ha ido en in-
formación?”
Los autores de Big data previenen
contra la fascinación por los números.
En ella cayó, dicen, Google, que elegía
los nuevos empleados según un cál-
culo con datos de los C.V. de los aspi-
rantes. En EE.UU., algunas comisio-
nes penitenciarias deciden si dan o no
la libertad condicional en función de
un programa informático que, a base
de big data, estima la probabilidad de
que el reo reincida. Pero, señala el
libro, “las predicciones basadas en
datos masivos no están grabadas en
piedra: son solo resultados probables,
y eso significa que si queremos, pode-
mos cambiarlos”.
La compañía FICO emplea datos
masivos para calificar solicitudes de
crédito. A fuerza de alimentar sus
máquinas con datos, incluso algunos
que aparentemente no tienen que ver
con la solvencia de alguien –como
con qué clase de personas se rela-
ciona en las redes sociales–, logró
predecir con notable acierto si uno
sería capaz de devolver el préstamo
o no. Su director general llegó a de-
cir: “Sabemos lo que usted va a ha-
cer mañana”. Exageraba. Pero cierta-
mente, los datos masivos abren posi-
bilidades inquietantes.
El fenómeno de los datos
masivos se apoya en la
facilidad para obtenerlos
de modo automático
Target, una empresa de venta por catálogo, sabe que
cuando una pareja espera un hijo, cambian sus hábitos
de consumo: por ejemplo, les interesan menos los ar-
tículos de ocio y empiezan a buscar cosas para niños.
Por eso, Target elaboró un algoritmo para adivinar emba-
razos de sus clientes a partir de lo que miran en Internet.
En un caso famoso en la breve historia de los big data,
un hombre protestó cuando llegaron a su hija catálogos
de ropa de bebé, cunas y productos semejantes, y luego
tuvo que disculparse al comprobar que la chica estaba
embarazada y Target se había enterado antes que él.
¿He ahí Big Brother usando Big Data? Joaquín Fer-
nández, responsable de relaciones con los medios inter-
nacionales en Ferrovial, relató la anécdota en la Jornada
de Comunicación Siglo XXI, sobre los big data, celebra-
da el pasado 5 de abril en el Colegio Mayor Albayzín
(Granada). Y también advirtió que Target no siempre
acierta, y el error puede resultar embarazoso para la
compañía. Aunque los big data, añadió Fernández, po-
drían hacer que nuestra vida privada quedara bajo con-
trol, esa posibilidad está aún muy lejos. Nadie puede
captar y elaborar los ingentes datos que serían necesa-
rios para mantener vigilada a la población.
En efecto, la NSA de Estados Unidos es incapaz de
procesar los 1.700 millones de registros de comunica-
ciones electrónicas que amasa diariamente, según se
cree. Ahora bien, cuando quiere investigar a alguien,
puede escarbar en ese inmenso pajar para encontrar las
agujas que revelan con quién se ha puesto en contacto
el sospechoso.
Protecciones que ya no funcionan
Cuando usamos los medios digitales, no nos observa
nadie, pero dejamos huellas que se pueden rastrear. Los
datos masivos, advierten los autores de Big data, impli-
can mayores problemas para la protección de la privaci-
dad. No solo porque los hagan más grandes, por la ma-
yor cantidad de datos personales que se recopilan, sino
sobre todo porque crean problemas de otra naturaleza.
Hasta ahora, la protección de los datos personales
se basa en notificar a cada interesado y pedirle consen-
timiento, antes de obtenerlos, y en hacerlos anónimos
cuando se usan para otros fines o se ceden a terceros.
Esto ya no funciona en la era de los big data.
¿Sirve realmente para algo el aviso que es precep-
tivo en la Unión Europea sobre el uso de cookies? Nadie
se para a leer las normas al respecto en cada web que
visita, ni prohíbe las cookies, que en parte son necesa-
rias para que el sitio funcione a gusto del usuario. Al fi-
nal, la notificación es una mera formalidad, o peor aún:
una molesta ventana emergente que uno ha de cerrar
cada vez que entra en un sitio.
Además, anonimizar los datos se ha vuelto muy difí-
cil ahora que se capturan tantos datos y se puede com-
binarlos de muchas formas, como muestran dos ejem-
plos que aportan los autores de Big data. Para facilitar
estudios de mercado, AOL y NetFlix publicaron datos de
búsquedas y calificaciones de películas, respectivamen-
te, hechas por sus usuarios, después de sustituir la mar-
ca de cada uno por un número convencional. Pese a
ello, sendos periódicos demostraron que se podía iden-
tificar a gran parte de los usuarios: en el caso de AOL,
relacionando distintas búsquedas correspondientes a
una misma persona; en el de NetFlix, cruzando las califi-
caciones de películas alquiladas con las puestas en la
Internet Movie Database.
Nuevo modelo de privacidad
El panorama, pues, ha cambiado. “Antes sabíamos muy
bien lo que constituía información personal identificable
Nuestro rastro digital
aceprensa 30 abril 2014
Aceprensa • c/ Núñez de Balboa, 125, 6º A. 28006 Madrid (España)
Tfnos.: (+34)915158974 (Administración), (+34)915158975 (Redacción) Fax: (+34)915631243
E-mails: administracion@aceprensa.com (Administración), redaccion@aceprensa.com (Redacción), mas@aceprensa.com (Comercial)
Director: Ignacio Aréchaga • Redactor-Jefe: Rafael Serrano • Director general: Miguel A. Sánchez del Moral
Edita Fundación Casatejada • Imprime Centro Gráfico Alborada • Depósito Legal: M. 35.855-1984 • ISSN: 1135-6936
Se distribuye por suscripción. Se pueden adquirir los derechos de reproducción mediante acuerdo por escrito con Aceprensa (contacto: info@aceprensa.com)
–nombre, número de afiliación a
la Seguridad Social, registros fis-
cales, etc.– y, por ende, resultaba
relativamente sencilla de prote-
ger. Hoy en día, hasta los datos
más inocuos pueden revelar la
identidad de una persona si se
han recopilado en número sufi-
ciente”.
El consentimiento expreso ya
no es suficiente por otra razón: el
valor de los datos masivos reside también en los usos
secundarios, distintos de aquellos para los que origi-
nalmente se hace la recopilación. De hecho, “em-
presas de todo tipo amasan montones de informacio-
nes personales relacionadas con todos los aspectos
de nuestras vidas, las comparten con otras sin nues-
tro conocimiento... y las usan de maneras que difícil-
mente hubiéramos imaginado”, a veces para beneficio
nuestro también. El registro de nuestra actividad cuan-
do visitamos una web permite personalizarla, desta-
cando lo que a cada uno le gusta más y seleccionan-
do los anuncios según los intereses particulares.
Por eso, los autores de Big data proponen un
nuevo modelo de protección de la privacidad: pasar
del sistema basado en la autorización del titular de los
datos personales a otro basado en la responsabilidad
de quienes los explotan. Las entidades que los recopi-
lan podrían conservarlos más tiempo, aunque no inde-
finidamente, y tendrían permiso implícito amplio, para
usarlos de muchos modos. Pero ya no estarían cubier-
tas simplemente por la autorización genérica, y ten-
drían que responder de los usos que finalmente hicie-
ran.
Datos borrosos
En particular, los autores definen qué condiciones ha-
bría que exigir cuando los big data se emplean para
tomar decisiones que nos afectan personalmente, co-
mo la concesión de un crédito o el precio de un segu-
ro médico. La primera es transparencia: el algoritmo
por el que se llega al resultado a partir de los datos de-
bería ser público y (segunda) estar sujeto a certifica-
ción por parte de un analista in-
dependiente que corrobore la
exactitud y la imparcialidad del
cálculo. En tercer lugar, refutabili-
dad: el interesado tiene derecho a
contestar la decisión.
Otra protección es la que
los autores llaman “privacidad di-
ferencial”. Consiste en hacer bo-
rrosos los datos, para que una
consulta no dé resultados exac-
tos, y por tanto sea prácticamente imposible identifi-
car a las personas. Es lo que hace Facebook con la in-
formación que suministra a los anunciantes: les dice
solo un número aproximado de miembros con las ca-
racterísticas relevantes (por ejemplo, profesionales li-
berales menores de 30 años), para que no se pueda
descubrir a ninguno cruzando datos.
Vendo mis datos
El libro sugiere una idea para que recobremos el con-
trol de los datos que nos pertenecen, pero de una ma-
nera distinta al poder de otorgar o negar el consenti-
miento para reunirlos y usarlos, bastante debilitado.
Ahora que muchas empresas obtienen ganancias ex-
plotando datos personales, ¿no podríamos participar
de los beneficios? Hasta el presente, regalamos datos
mientras recorremos Internet o usamos dispositivos
móviles; ¿por qué no venderlos?
Naturalmente, un solo individuo no tiene fuerza
para negociar con los explotadores de datos, pues lo
que tiene valor es la acumulación de datos de muchas
personas. Pero se podrían constituir bolsas de datos,
que los vendieran a las empresas interesadas y com-
partieran el dinero con los cedentes. No parece tan
utópico: la venta de datos ya existe, pero si son perso-
nales, nadie paga a los titulares.
En cualquier caso, necesitamos encontrar un
equilibrio justo y razonable entre la facilidad para reu-
nir y explotar datos, y la protección de la libertad y la
intimidad de las personas. Hay que aprovechar los big
data y a la vez tener a raya al Big Brother. Aún no tene-
mos la fórmula adecuada. R.S.
Hoy en día, hasta los
datos más inocuos
pueden revelar la identi-
dad de una persona
si se han recopilado
en número suficiente
(1) Viktor Mayer-Schönberger y Kenneth Cukier, Big Data. La revolución de los datos masivos, Turner, Madrid (2013), 278 págs.,
22,90 € (papel) / 9,49 € (digital). T.o.: Big Data. A Revolution That Will Transform How We Live, Work, and Think. Traducción: Antonio
Iriarte.

Más contenido relacionado

PPSX
Medir es poder, recolección análisis y comunicación de datos
PPTX
LAS GRANDES PLATAFORMAS CONTRA LAS FAKE NEWS
PDF
Tsunami para fopea
PPTX
Inteligencia Artificial, Ciudades y Ciudadanía
PDF
Tópicos de Big Data - Introducción
PPTX
El uso del móvil en 2018
PPTX
Unidad 2 | Periodismo de datos y visualización de la información
PPTX
La GestióN Del Tiempo
Medir es poder, recolección análisis y comunicación de datos
LAS GRANDES PLATAFORMAS CONTRA LAS FAKE NEWS
Tsunami para fopea
Inteligencia Artificial, Ciudades y Ciudadanía
Tópicos de Big Data - Introducción
El uso del móvil en 2018
Unidad 2 | Periodismo de datos y visualización de la información
La GestióN Del Tiempo

Destacado (20)

PPTX
Gestiona tu tiempo
PDF
Gestión del tiempo y el trabajo.
PDF
Gestion del tiempo
PPS
11 REGLAS
PPTX
Administracion del tiempo
PPT
Gestión del tiempo directivo
PPTX
Países más y menos poblados
PPTX
proceso administrativo
PDF
La gestion del tiempo y metodologia GTD
PPTX
Proceso administrativo
PPT
Proceso administrativo julio 2011.
PPT
Taller Gestión del Tiempo - Oct 09
PPTX
Tema 1.1. unidad 1 administracion del tiempo
PPTX
Diferencias entre planificación y organización
PPT
Proceso administrativo (6 etapas)
 
PPTX
Etapas del proceso administrativo
PPT
Proceso administrativo enfermería
PPTX
PLANIFICACION Y ORGANIZACION
PPT
Proceso admnistrativo[1]
 
PPTX
Proceso administrativo de Enfermeria
Gestiona tu tiempo
Gestión del tiempo y el trabajo.
Gestion del tiempo
11 REGLAS
Administracion del tiempo
Gestión del tiempo directivo
Países más y menos poblados
proceso administrativo
La gestion del tiempo y metodologia GTD
Proceso administrativo
Proceso administrativo julio 2011.
Taller Gestión del Tiempo - Oct 09
Tema 1.1. unidad 1 administracion del tiempo
Diferencias entre planificación y organización
Proceso administrativo (6 etapas)
 
Etapas del proceso administrativo
Proceso administrativo enfermería
PLANIFICACION Y ORGANIZACION
Proceso admnistrativo[1]
 
Proceso administrativo de Enfermeria
Publicidad

Similar a Cómo tener Big Data y librarse del Big Brother (20)

PDF
Big data en el big bang del universo digital
PDF
El Horizonte de la Inteligencia Artificial IA1 Ccesa007.pdf
PDF
IA como cambiara el mundo y tu vida Pablo Rodriguez
PDF
Pablo Rodríguez - Inteligencia artificial. Cómo cambiará el mundo (y tu vi...
PDF
Profesión: Big Data
PDF
¿Qué es el Big Data?
DOC
La forma de las cosas que vendrán m1
DOCX
Internet de las cosas. Beneficios y riesgos de las nuevas tecnologías.
PDF
MMA Playbook Big Data - Version español
PDF
Internet Health Report 2019. Mozilla. Versión Corta
PPTX
Rodrigo García - Tex 2016 - The world is one big data problem
DOCX
Tarea 6 recursos didact raiza
PPTX
Conferencia: Big Data: ¿Beneficiosos o armas de destrucción matemática?
PPTX
El internet de las cosas
PPTX
Tics en bibliotecas
PDF
Las nuevas fronteras
PDF
Revista digital universitaria
PDF
Big Data en Beneficio del Ciudadano
PPTX
Clase especial
Big data en el big bang del universo digital
El Horizonte de la Inteligencia Artificial IA1 Ccesa007.pdf
IA como cambiara el mundo y tu vida Pablo Rodriguez
Pablo Rodríguez - Inteligencia artificial. Cómo cambiará el mundo (y tu vi...
Profesión: Big Data
¿Qué es el Big Data?
La forma de las cosas que vendrán m1
Internet de las cosas. Beneficios y riesgos de las nuevas tecnologías.
MMA Playbook Big Data - Version español
Internet Health Report 2019. Mozilla. Versión Corta
Rodrigo García - Tex 2016 - The world is one big data problem
Tarea 6 recursos didact raiza
Conferencia: Big Data: ¿Beneficiosos o armas de destrucción matemática?
El internet de las cosas
Tics en bibliotecas
Las nuevas fronteras
Revista digital universitaria
Big Data en Beneficio del Ciudadano
Clase especial
Publicidad

Más de Jornada de Comunicación Siglo XXI (12)

PDF
18 Jornada de Comunicación dossier Aceprensa
PDF
18 Jornada de Comunicación Siglo XXI
PDF
Informe unir sobre big data y periodismo de datos
DOC
Resumen de la XVI Jornada de comunicación
PPTX
Tu reputación online
PDF
Inmigración en positivo
PDF
Cómo multiplicar el tiempo
PPT
PDF
MEASURING CIVIC JOURNALISM’S PROGRESS
PPT
Formatos publicitarios en Internet
PDF
Decálogo de un plan de negocio viable para tu empresa para público2
PPTX
Teleprensa.es. Encuentra tu nicho de mercado
18 Jornada de Comunicación dossier Aceprensa
18 Jornada de Comunicación Siglo XXI
Informe unir sobre big data y periodismo de datos
Resumen de la XVI Jornada de comunicación
Tu reputación online
Inmigración en positivo
Cómo multiplicar el tiempo
MEASURING CIVIC JOURNALISM’S PROGRESS
Formatos publicitarios en Internet
Decálogo de un plan de negocio viable para tu empresa para público2
Teleprensa.es. Encuentra tu nicho de mercado

Último (9)

PPTX
Taller de produccion audiovisual y recopilacion historica comunitariaTaller 2...
PDF
X: estrategias de uso y construcción de marca personal para periodistas
PDF
LAS REDES SOCIALES COMO HERRAMIENTA EDUCATIVA
PPTX
tema redes sociales: presentación en diapositiva
DOCX
5° DPCC -ACTV.05-UNID.4 2025 (1).doooooooooooooocx
PPTX
Peligro de las redes sociales, ayuda prevenir los peligros en la redes social...
PPTX
Entrar en Edmodo era una plataforma o red social para estudiantes
PDF
Teorías de la Comunicacion- Luis Daniel Turizo .pdf.pdf
PDF
Futbol de mundo dhhdbdbdbdbdbdbdbbdbdbdbd
Taller de produccion audiovisual y recopilacion historica comunitariaTaller 2...
X: estrategias de uso y construcción de marca personal para periodistas
LAS REDES SOCIALES COMO HERRAMIENTA EDUCATIVA
tema redes sociales: presentación en diapositiva
5° DPCC -ACTV.05-UNID.4 2025 (1).doooooooooooooocx
Peligro de las redes sociales, ayuda prevenir los peligros en la redes social...
Entrar en Edmodo era una plataforma o red social para estudiantes
Teorías de la Comunicacion- Luis Daniel Turizo .pdf.pdf
Futbol de mundo dhhdbdbdbdbdbdbdbbdbdbdbd

Cómo tener Big Data y librarse del Big Brother

  • 1. análisis aceprensa30 abril 2014 - n.º 34/14 La Biblioteca del Congreso de Es- tados Unidos es la mayor del mun- do. Contiene más de 120 millones de documentos, en papel y en otros soportes, acumulados a lo largo de 214 años de existencia. Sin embar- go, todo eso suma menos de la mi- lésima parte de la información que Google procesa en un día, que viene a ser unos 24 petabytes (24x1015). Hoy tenemos big data (datos masivos) porque se mide y se cuen- ta casi todo: las transacciones co- merciales internacionales, los viaje- ros en el transporte público, el con- sumo de electricidad a todas las ho- ras del día, los datos meteorológi- cos, los casos de sida y otras enfer- medades infecciosas, los precios in- dustriales y de venta al por menor, nacimientos y defunciones... También se registran nuestros clics cuando usamos Internet, lo que ponemos en las redes sociales, las compras que hacemos con tarje- ta. El teléfono móvil deja constancia no solo de con quién hablamos o in- tercambiamos mensajes, sino de dónde estamos en cada momento. Los Big Data recuerdan al Big Brother. Con razón empezamos a preocuparnos de lo mucho que se puede saber de nosotros, y la facili- dad con que se puede utilizar. Pero no debemos caer tampoco en el alarmismo de pensar que estamos continuamente vigilados. Aunque los datos masivos plantean proble- mas para la privacidad, en primer lu- gar son instrumentos útiles que nos prestan servicios cotidianos, permi- ten hacer cosas nuevas, crean opor- tunidades de negocio, estimulan la actividad económica. Cálculo, no inteligencia “Aunque nos hallamos aún en los al- bores de la era de los datos masi- vos, nos servimos de ellos a diario”, se puede leer en un libro reciente, Big data (1), que es una buena guía para introducirse en el tema. Los fil- tros contra el correo basura, los co- rrectores ortográficos, la orientación por GPS se basan en datos masi- vos. Ahora podemos usar cantida- des ingentes de datos porque se ha vuelto fácil y barato recopilarlos y tratarlos. La rápida respuesta de los buscadores de Internet revela la gran capacidad de computación que tienen las máquinas actuales. Pero en el fenómeno big data lo pri- mero y principal son los datos mis- mos: muchísimos, y cuantos más, mejor. Precisamente la mayor cantidad de datos es lo que permite hacer cosas que no eran posibles con da- tos escasos. La traducción automá- tica es una vieja aspiración que has- ta hace poco ha dado resultados frustrantes. Los recientes avances no tienen que ver con la inteligencia artificial, sino con los datos masi- vos. Fueron ingenieros de IBM quie- nes a finales de los ochenta tuvieron la idea: en vez de afinar las reglas lingüísticas que usaba el ordenador, se centraron en aumentar su léxico, hasta introducir unos tres millones de pares de frases en inglés y fran- cés. Pero la mejora no fue espec- tacular, y se abandonó el proyecto. Hasta que llegó Google, que a base de leer páginas web en todos los idiomas y digitalizar más de 20 millones de libros distintos (ese era un objetivo no declarado de Google Utilidad y peligros de los datos masivos Cómo tener Big Data sin el Big Brother Rafael Serrano La recopilación y el análisis de grandes volúmenes de datos ya no es solo obra de un Estado policial, sino la actividad continua de muchas empresas. Los llamados big data no sirven para todo, ni resuelven los males del mundo, pero permiten nuevos servicios muy útiles, desde el simple corrector ortográfico al control de las epi- demias de gripe. También suponen nuevos peligros para la libertad y la intimidad de las personas.
  • 2. Libros), almacenó un billón de expre- siones. Ahora el traductor de Google es el mejor que existe, aunque aún imperfecto y bastante deficiente para la mayoría de los idiomas. No es más listo; simplemente tiene tantas equi- valencias, que puede calcular la fre- cuencia con que una palabra o frase se corresponde con otra mejor que todos los rivales, y cada vez mejor, pues sigue acumulando datos y per- feccionando sus cálculos. “El uso de datos masivos –dicen los autores de Big data– no consiste en ‘enseñar’ a un ordenador a ‘pen- sar’ como un ser humano. Más bien consiste en aplicar las matemáticas a enormes cantidades de datos para poder inferir probabilidades”. Calidad a base de cantidad Con big data, se logra calidad a base de cantidad: elevada probabilidad de acierto gracias al gran número de datos que procesar para hallar corre- laciones. Esto implica que no se aspi- ra a explicar los hechos, sino solo a predecirlos estadísticamente. Cuando el informático Oren Etzioni fundó en 2003 la empresa Farecast, no pretendió entender las razones por las que los precios de los billetes de avión cambian continua- mente, misterio demasiado alto para una mente finita. Se limitó a idear un sistema para procesar a gran veloci- dad las tarifas (hasta 200.000 millo- nes de registros en un año) a fin de hallar pautas y correlaciones, y consi- guió un modelo que predecía con elevado grado de acierto si en deter- minado momento el precio iba a subir o a bajar. Farecast no es infalible, pe- ro por término medio ahorra unos cincuenta dólares por billete a sus usuarios, y a Etzioni le reportó 110 millones cuando Microsoft le compró el sistema, para integrarlo en su bus- cador Bing. Como la cantidad es decisiva, el fenómeno de los datos masivos se apoya en la facilidad para obtenerlos de modo automático. Para averiguar las preferencias de los consumidores se puede hacer una encuesta, y en tal caso, es decisivo que la muestra esté bien hecha, o los resultados no serán representativos. Pero si procesamos millones de compras por Internet, la muestra se aproxima al universo es- tadístico y desaparece el peligro de sesgo en la selección de casos. Los datos se recopilan solos, sin necesi- dad de despachar un equipo de en- cuestadores, y en las condiciones reales: mientras la gente hace lo que hace todos los días. Persiguiendo al virus Así se puede explotar los datos cru- zándolos, buscando implicaciones, para averiguar cosas que los datos no dicen directamente. Google recibe más de 3.000 millones de consultas a diario y las archiva todas. Eso es una mina de la que se puede extraer in- formaciones de casi cualquier asun- to, como la propagación de la gripe. Después de probar gran número de modelos, los analistas de Google encontraron los términos de búsque- da que con mayor probabilidad se re- lacionan con la aparición de la epide- mia en una zona. En efecto, aunque Google no sabe si cierta persona que mete en el buscador unos términos relacionados con la epidemia está enferma, o ve que otros se han con- tagiado, o solo busca por curiosidad o por casualidad, puede estimar, con alto grado de acierto y antes de que puedan saberlo las autoridades sani- tarias por sus propios medios, por dónde se mueve el virus. Así la pre- vención es más fácil y eficaz. Pero no pensemos solo en nove- dades espectaculares. La recopila- ción continua de datos aumenta la eficiencia en muchos campos que no tienen nada de ciencia ficción. Un ejemplo es el de UPS, que instaló en sus vehículos de reparto localizado- res por GPS, para registrar los itinera- rios. A medida que fue acumulando datos, los ordenadores pudieron tra- tarlos para definir en cada caso la ruta más rápida. Gracias a eso, en 2011 UPS se ahorró en total 48 millo- nes de kilómetros y 11,3 millones de litros de combustible. Es importante advertir que el aná- lisis de datos masivos funciona en el orden de los grandes números o de la media estadística, que para saber cómo se propaga la gripe o por dónde llevar los paquetes es suficiente. Fascinación por los datos Al considerar el cada vez mayor uso de datos masivos, vienen a la memo- ria los versos de T.S. Eliot en su obra teatral The Rock (1934): “¿Dónde es- tá la sabiduría que se nos ha ido en El uso de datos masivos no consiste en ‘enseñar’ a un ordenador a ‘pensar’ como un ser humano, sino en aplicar las matemáticas a enormes cantidades de datos para poder inferir probabilidades
  • 3. aceprensa 30 abril 2014 conocimiento? / ¿Dónde está el co- nocimiento que se nos ha ido en in- formación?” Los autores de Big data previenen contra la fascinación por los números. En ella cayó, dicen, Google, que elegía los nuevos empleados según un cál- culo con datos de los C.V. de los aspi- rantes. En EE.UU., algunas comisio- nes penitenciarias deciden si dan o no la libertad condicional en función de un programa informático que, a base de big data, estima la probabilidad de que el reo reincida. Pero, señala el libro, “las predicciones basadas en datos masivos no están grabadas en piedra: son solo resultados probables, y eso significa que si queremos, pode- mos cambiarlos”. La compañía FICO emplea datos masivos para calificar solicitudes de crédito. A fuerza de alimentar sus máquinas con datos, incluso algunos que aparentemente no tienen que ver con la solvencia de alguien –como con qué clase de personas se rela- ciona en las redes sociales–, logró predecir con notable acierto si uno sería capaz de devolver el préstamo o no. Su director general llegó a de- cir: “Sabemos lo que usted va a ha- cer mañana”. Exageraba. Pero cierta- mente, los datos masivos abren posi- bilidades inquietantes. El fenómeno de los datos masivos se apoya en la facilidad para obtenerlos de modo automático Target, una empresa de venta por catálogo, sabe que cuando una pareja espera un hijo, cambian sus hábitos de consumo: por ejemplo, les interesan menos los ar- tículos de ocio y empiezan a buscar cosas para niños. Por eso, Target elaboró un algoritmo para adivinar emba- razos de sus clientes a partir de lo que miran en Internet. En un caso famoso en la breve historia de los big data, un hombre protestó cuando llegaron a su hija catálogos de ropa de bebé, cunas y productos semejantes, y luego tuvo que disculparse al comprobar que la chica estaba embarazada y Target se había enterado antes que él. ¿He ahí Big Brother usando Big Data? Joaquín Fer- nández, responsable de relaciones con los medios inter- nacionales en Ferrovial, relató la anécdota en la Jornada de Comunicación Siglo XXI, sobre los big data, celebra- da el pasado 5 de abril en el Colegio Mayor Albayzín (Granada). Y también advirtió que Target no siempre acierta, y el error puede resultar embarazoso para la compañía. Aunque los big data, añadió Fernández, po- drían hacer que nuestra vida privada quedara bajo con- trol, esa posibilidad está aún muy lejos. Nadie puede captar y elaborar los ingentes datos que serían necesa- rios para mantener vigilada a la población. En efecto, la NSA de Estados Unidos es incapaz de procesar los 1.700 millones de registros de comunica- ciones electrónicas que amasa diariamente, según se cree. Ahora bien, cuando quiere investigar a alguien, puede escarbar en ese inmenso pajar para encontrar las agujas que revelan con quién se ha puesto en contacto el sospechoso. Protecciones que ya no funcionan Cuando usamos los medios digitales, no nos observa nadie, pero dejamos huellas que se pueden rastrear. Los datos masivos, advierten los autores de Big data, impli- can mayores problemas para la protección de la privaci- dad. No solo porque los hagan más grandes, por la ma- yor cantidad de datos personales que se recopilan, sino sobre todo porque crean problemas de otra naturaleza. Hasta ahora, la protección de los datos personales se basa en notificar a cada interesado y pedirle consen- timiento, antes de obtenerlos, y en hacerlos anónimos cuando se usan para otros fines o se ceden a terceros. Esto ya no funciona en la era de los big data. ¿Sirve realmente para algo el aviso que es precep- tivo en la Unión Europea sobre el uso de cookies? Nadie se para a leer las normas al respecto en cada web que visita, ni prohíbe las cookies, que en parte son necesa- rias para que el sitio funcione a gusto del usuario. Al fi- nal, la notificación es una mera formalidad, o peor aún: una molesta ventana emergente que uno ha de cerrar cada vez que entra en un sitio. Además, anonimizar los datos se ha vuelto muy difí- cil ahora que se capturan tantos datos y se puede com- binarlos de muchas formas, como muestran dos ejem- plos que aportan los autores de Big data. Para facilitar estudios de mercado, AOL y NetFlix publicaron datos de búsquedas y calificaciones de películas, respectivamen- te, hechas por sus usuarios, después de sustituir la mar- ca de cada uno por un número convencional. Pese a ello, sendos periódicos demostraron que se podía iden- tificar a gran parte de los usuarios: en el caso de AOL, relacionando distintas búsquedas correspondientes a una misma persona; en el de NetFlix, cruzando las califi- caciones de películas alquiladas con las puestas en la Internet Movie Database. Nuevo modelo de privacidad El panorama, pues, ha cambiado. “Antes sabíamos muy bien lo que constituía información personal identificable Nuestro rastro digital
  • 4. aceprensa 30 abril 2014 Aceprensa • c/ Núñez de Balboa, 125, 6º A. 28006 Madrid (España) Tfnos.: (+34)915158974 (Administración), (+34)915158975 (Redacción) Fax: (+34)915631243 E-mails: administracion@aceprensa.com (Administración), redaccion@aceprensa.com (Redacción), mas@aceprensa.com (Comercial) Director: Ignacio Aréchaga • Redactor-Jefe: Rafael Serrano • Director general: Miguel A. Sánchez del Moral Edita Fundación Casatejada • Imprime Centro Gráfico Alborada • Depósito Legal: M. 35.855-1984 • ISSN: 1135-6936 Se distribuye por suscripción. Se pueden adquirir los derechos de reproducción mediante acuerdo por escrito con Aceprensa (contacto: info@aceprensa.com) –nombre, número de afiliación a la Seguridad Social, registros fis- cales, etc.– y, por ende, resultaba relativamente sencilla de prote- ger. Hoy en día, hasta los datos más inocuos pueden revelar la identidad de una persona si se han recopilado en número sufi- ciente”. El consentimiento expreso ya no es suficiente por otra razón: el valor de los datos masivos reside también en los usos secundarios, distintos de aquellos para los que origi- nalmente se hace la recopilación. De hecho, “em- presas de todo tipo amasan montones de informacio- nes personales relacionadas con todos los aspectos de nuestras vidas, las comparten con otras sin nues- tro conocimiento... y las usan de maneras que difícil- mente hubiéramos imaginado”, a veces para beneficio nuestro también. El registro de nuestra actividad cuan- do visitamos una web permite personalizarla, desta- cando lo que a cada uno le gusta más y seleccionan- do los anuncios según los intereses particulares. Por eso, los autores de Big data proponen un nuevo modelo de protección de la privacidad: pasar del sistema basado en la autorización del titular de los datos personales a otro basado en la responsabilidad de quienes los explotan. Las entidades que los recopi- lan podrían conservarlos más tiempo, aunque no inde- finidamente, y tendrían permiso implícito amplio, para usarlos de muchos modos. Pero ya no estarían cubier- tas simplemente por la autorización genérica, y ten- drían que responder de los usos que finalmente hicie- ran. Datos borrosos En particular, los autores definen qué condiciones ha- bría que exigir cuando los big data se emplean para tomar decisiones que nos afectan personalmente, co- mo la concesión de un crédito o el precio de un segu- ro médico. La primera es transparencia: el algoritmo por el que se llega al resultado a partir de los datos de- bería ser público y (segunda) estar sujeto a certifica- ción por parte de un analista in- dependiente que corrobore la exactitud y la imparcialidad del cálculo. En tercer lugar, refutabili- dad: el interesado tiene derecho a contestar la decisión. Otra protección es la que los autores llaman “privacidad di- ferencial”. Consiste en hacer bo- rrosos los datos, para que una consulta no dé resultados exac- tos, y por tanto sea prácticamente imposible identifi- car a las personas. Es lo que hace Facebook con la in- formación que suministra a los anunciantes: les dice solo un número aproximado de miembros con las ca- racterísticas relevantes (por ejemplo, profesionales li- berales menores de 30 años), para que no se pueda descubrir a ninguno cruzando datos. Vendo mis datos El libro sugiere una idea para que recobremos el con- trol de los datos que nos pertenecen, pero de una ma- nera distinta al poder de otorgar o negar el consenti- miento para reunirlos y usarlos, bastante debilitado. Ahora que muchas empresas obtienen ganancias ex- plotando datos personales, ¿no podríamos participar de los beneficios? Hasta el presente, regalamos datos mientras recorremos Internet o usamos dispositivos móviles; ¿por qué no venderlos? Naturalmente, un solo individuo no tiene fuerza para negociar con los explotadores de datos, pues lo que tiene valor es la acumulación de datos de muchas personas. Pero se podrían constituir bolsas de datos, que los vendieran a las empresas interesadas y com- partieran el dinero con los cedentes. No parece tan utópico: la venta de datos ya existe, pero si son perso- nales, nadie paga a los titulares. En cualquier caso, necesitamos encontrar un equilibrio justo y razonable entre la facilidad para reu- nir y explotar datos, y la protección de la libertad y la intimidad de las personas. Hay que aprovechar los big data y a la vez tener a raya al Big Brother. Aún no tene- mos la fórmula adecuada. R.S. Hoy en día, hasta los datos más inocuos pueden revelar la identi- dad de una persona si se han recopilado en número suficiente (1) Viktor Mayer-Schönberger y Kenneth Cukier, Big Data. La revolución de los datos masivos, Turner, Madrid (2013), 278 págs., 22,90 € (papel) / 9,49 € (digital). T.o.: Big Data. A Revolution That Will Transform How We Live, Work, and Think. Traducción: Antonio Iriarte.