SlideShare una empresa de Scribd logo
BIG DATA
Jhonatan Steven Cárdenas Ojeda
¿QUÉ ES “BIG DATA”?
Big data (en español, grandes datos o
grandes volúmenes de datos) es un
término evolutivo que describe
cualquier cantidad voluminosa de datos
estructurados, semiestructurados y no
estructurados que tienen el potencial
de ser extraídos para obtener
información.
CARACTERÍSTICAS
DE “BIG DATA”
1. VOLUMEN: Es la cantidad de datos generados y guardados, estos
determinan el potencial y veracidad del mismo.
2. VARIEDAD: Es el tipo y naturaleza de los datos, de este modo se
determina el apoyo que le da al usuario.
3. VELOCIDAD: Esta es la velocidad que se genera para cumplir las
exigencias de los datos.
4. VERACIDAD: Se define como la calidad de los datos, ya que de ésta
depende la variedad y los resultados de la información.
TIPOS DE “BIG DATA”
1. DATOS ESTRUCTURADOS: Son los datos que tienen bien definida su
longitud y su formato, como por ejemplo las bases de datos
relacionales y los almacenes de datos.
2. DATOS NO ESTRUCTURADOS: Son los datos que necesitan un
formato específico, como por ejemplo archivos pdf, documentos
multimedia, correos electrónicos o documentos de texto.
3. DATOS SEMIESTRUCTURADOS: Son datos que no se limitan a
campos determinados pero requieren marcadores para separar la
información, tales como hojas de cálculo, HTML, XML o JSON.
¿DE DÓNDE PROVIENEN TODOS ESTOS DATOS?
1. GENERADOS POR LAS PERSONAS: Enviar información en cualquier red
social o cualquier otra cosa que se registre en base de datos.
2. TRANSACCIONES DE DATOS: La facturación, las llamadas o las
transacciones entre cuentas.
3. MARKETING ELECTRONICO Y WED: Navegación por internet.
4. MÁQUINA A MÁQUINA: Tecnologías que comparten datos mediante
dispositivos. Comunicaciones inalámbricas.
5. BIOMÉTRICA: Datos que provienen de la seguridad, defensa y servicios de
inteligencia.
TRANSFORMACIÓN
Aquí entran en juego las
plataformas extraer, transformar y
cargar (ETL). Su propósito es extraer los
datos de las diferentes fuentes y sistemas,
para después hacer transformaciones
(conversiones de datos, limpieza de datos
sucios, cambios de formato…) y finalmente
cargar los datos en la base de datos
o almacén de datos especificada.
ALMACENAMIENTO NOSQL
Son sistemas que provienen de un almacenamiento más flexible y
concurrente y permitir de manipular grandes cantidades de
información mucho más rápido por lo cual no cumplen con el
esquema entidad – relación.
TIPOS DE DATOS NOQSL
1. ALMACENAMIENTO CLAVE – VALOR: Los datos se almacenan de tal forma que
se acceda con una palabra clave.
2. ALMACENAMIENTO DOCUMENTAL: Son datos semiestructurados que pasan a
llamarse documentos formateados en una misma base de datos que acepte.
3. ALMACENAMIENTO EN GRAFO: Relacionan grandes cantidades de datos que
pueden ser muy variables. Además se establece que la relación son los nodos y
las relaciones entre la información, los artistas.
4. ALMACENAMIENTO ORIENTADO A COLUMNAS: Se orienta a almacenar datos
con tendencia a escalar horizontalmente, por lo que permite guardar diferentes
atributos y objetos bajo la misma clave.
TÉCNICAS DE ANÁLISIS DE DATOS
1. ASOCIACIÓN: Permite encontrar relaciones entre diferentes variables.
2. MINERÍA DE DATOS: Tiene como objetivo encontrar comportamientos
predilectos.
3. AGRUPACIÓN: Metodología para encontrar relaciones entre resultados
y haces una evaluación preliminar de la estructura de los datos
analizados.
4. ANÁLISIS DE TEXTO: Extrae información de datos generados por
personas (mensajes de textos, búsquedas web… etc) de esta forma
moldea temas y asuntos o predecir palabras.
UTILIDAD
El objetivo es que ciudadanos y
empresas puedan reaprovechar
estos datos para generar valor
económico. Podrán construir
sobre ellos una nueva idea que
genere nuevos datos,
conocimientos o incluso la
creación de nuevos servicios que
reporten beneficios económicos y
o sociales.
BIG DATA - Jhonatan Cárdenas COL
VISUALIZACIÓN
En los macro datos se llega un paso
más allá, ya que es una plataforma
que permite visualizar la información
a través de los análisis llevados a
cabo sobre los datos que
disponemos. Ésta trata de llegar a un
público más concreto, y una utilidad
más acotada como un cuadro de
mando integral de una información.

Más contenido relacionado

PPTX
Sistemas de Información
PPTX
Presentacion Oliver II
DOCX
Diferencia entre dato e informacion
PPTX
Datos e informacion
PPT
Dato e Información
PDF
Trabajo computacion base de datos
PPSX
Dato e información
PPT
Luis lozano
Sistemas de Información
Presentacion Oliver II
Diferencia entre dato e informacion
Datos e informacion
Dato e Información
Trabajo computacion base de datos
Dato e información
Luis lozano

La actualidad más candente (18)

PDF
Apuntes de herramientas 1
PPTX
Apuntes de herramientas 1
PPTX
Apuntes de herramientas 1
PPTX
Tratamiento de la Informacion
DOCX
Operaciones básicas de un manejador de base de datos
PPT
Cómo desarrollar bienes y servicios públicos con datos
PPTX
Redes informáticas
DOCX
Bases de datos
DOC
Talle Nº1
PPTX
Derecho e informatica pc
PDF
BASES DE DATOS
PPTX
Profundiza unidad 1 Sistemas de Información Gerencial
PPT
Proyección de las bases de datos a futuro
PPTX
PPTX
Diseña y administra base de datos avanzada
PPT
Los Negocios En Las Ti Cs
PPT
Los Negocios En Las Ti Cs
Apuntes de herramientas 1
Apuntes de herramientas 1
Apuntes de herramientas 1
Tratamiento de la Informacion
Operaciones básicas de un manejador de base de datos
Cómo desarrollar bienes y servicios públicos con datos
Redes informáticas
Bases de datos
Talle Nº1
Derecho e informatica pc
BASES DE DATOS
Profundiza unidad 1 Sistemas de Información Gerencial
Proyección de las bases de datos a futuro
Diseña y administra base de datos avanzada
Los Negocios En Las Ti Cs
Los Negocios En Las Ti Cs
Publicidad

Similar a BIG DATA - Jhonatan Cárdenas COL (20)

PPTX
Datos en la era de la información
PPTX
Bases de datos
PPTX
Big data
PPTX
Big data-grupo-7
PPTX
Presentación de que es Big Data para principiantes
DOCX
Base de datos
PDF
Metadatos
PDF
Nataly stefania Velasquez Rico - big data
PPTX
Primera actividad 10% (presentación)-enmanuel morles.27.691.096
PDF
DESCRIPCION DEL PROFESIONAL Ingeniero_De_Datos.pdf
DOCX
Glosario base de datos
PPTX
Basedatos
DOCX
Taller 1 Y 3 Bases De Datos
PDF
Cómo el Big Data transforma los negocios modernos.pdf
PDF
U1 material didactico-introduccion a la administración de bd
DOC
DOCX
Guia base de datos
PPTX
Presentación de Base de Dato
PPTX
BIG DATA .
Datos en la era de la información
Bases de datos
Big data
Big data-grupo-7
Presentación de que es Big Data para principiantes
Base de datos
Metadatos
Nataly stefania Velasquez Rico - big data
Primera actividad 10% (presentación)-enmanuel morles.27.691.096
DESCRIPCION DEL PROFESIONAL Ingeniero_De_Datos.pdf
Glosario base de datos
Basedatos
Taller 1 Y 3 Bases De Datos
Cómo el Big Data transforma los negocios modernos.pdf
U1 material didactico-introduccion a la administración de bd
Guia base de datos
Presentación de Base de Dato
BIG DATA .
Publicidad

Último (20)

PPTX
CLAASIFICACIÓN DE LOS ROBOTS POR UTILIDAD
PPTX
la-historia-de-la-medicina Edna Silva.pptx
PPTX
Acronis Cyber Protect Cloud para Ciber Proteccion y Ciber Seguridad LATAM - A...
PPTX
El uso de las TIC en la vida cotidiana..
DOCX
TRABAJO GRUPAL (5) (1).docxjesjssjsjjskss
PPTX
Mecanismos-de-Propagacion de ondas electromagneticas
PDF
TRABAJO DE TECNOLOGIA.pdf...........................
PDF
Documental Beyond the Code (Dossier Presentación - 2.0)
PDF
informe_fichas1y2_corregido.docx (2) (1).pdf
PPTX
ANCASH-CRITERIOS DE EVALUACIÓN-FORMA-10-10 (2).pptx
DOCX
TRABAJO GRUPAL (5) (1).docxsjjsjsksksksksk
PDF
Instrucciones simples, respuestas poderosas. La fórmula del prompt perfecto.
PDF
CyberOps Associate - Cisco Networking Academy
PDF
Diapositiva proyecto de vida, materia catedra
PPTX
Presentación de Redes de Datos modelo osi
PPTX
Sesion 1 de microsoft power point - Clase 1
DOCX
TRABAJO GRUPAL (5) (1).docxsjsjskskksksksks
PDF
0007_PPT_DefinicionesDeDataMining_201_v1-0.pdf
PDF
Tips de Seguridad para evitar clonar sus claves del portal bancario.pdf
DOCX
TRABAJO GRUPAL (5) (1).docxjsjsjskskksksk
CLAASIFICACIÓN DE LOS ROBOTS POR UTILIDAD
la-historia-de-la-medicina Edna Silva.pptx
Acronis Cyber Protect Cloud para Ciber Proteccion y Ciber Seguridad LATAM - A...
El uso de las TIC en la vida cotidiana..
TRABAJO GRUPAL (5) (1).docxjesjssjsjjskss
Mecanismos-de-Propagacion de ondas electromagneticas
TRABAJO DE TECNOLOGIA.pdf...........................
Documental Beyond the Code (Dossier Presentación - 2.0)
informe_fichas1y2_corregido.docx (2) (1).pdf
ANCASH-CRITERIOS DE EVALUACIÓN-FORMA-10-10 (2).pptx
TRABAJO GRUPAL (5) (1).docxsjjsjsksksksksk
Instrucciones simples, respuestas poderosas. La fórmula del prompt perfecto.
CyberOps Associate - Cisco Networking Academy
Diapositiva proyecto de vida, materia catedra
Presentación de Redes de Datos modelo osi
Sesion 1 de microsoft power point - Clase 1
TRABAJO GRUPAL (5) (1).docxsjsjskskksksksks
0007_PPT_DefinicionesDeDataMining_201_v1-0.pdf
Tips de Seguridad para evitar clonar sus claves del portal bancario.pdf
TRABAJO GRUPAL (5) (1).docxjsjsjskskksksk

BIG DATA - Jhonatan Cárdenas COL

  • 1. BIG DATA Jhonatan Steven Cárdenas Ojeda
  • 2. ¿QUÉ ES “BIG DATA”? Big data (en español, grandes datos o grandes volúmenes de datos) es un término evolutivo que describe cualquier cantidad voluminosa de datos estructurados, semiestructurados y no estructurados que tienen el potencial de ser extraídos para obtener información.
  • 3. CARACTERÍSTICAS DE “BIG DATA” 1. VOLUMEN: Es la cantidad de datos generados y guardados, estos determinan el potencial y veracidad del mismo. 2. VARIEDAD: Es el tipo y naturaleza de los datos, de este modo se determina el apoyo que le da al usuario. 3. VELOCIDAD: Esta es la velocidad que se genera para cumplir las exigencias de los datos. 4. VERACIDAD: Se define como la calidad de los datos, ya que de ésta depende la variedad y los resultados de la información.
  • 4. TIPOS DE “BIG DATA” 1. DATOS ESTRUCTURADOS: Son los datos que tienen bien definida su longitud y su formato, como por ejemplo las bases de datos relacionales y los almacenes de datos. 2. DATOS NO ESTRUCTURADOS: Son los datos que necesitan un formato específico, como por ejemplo archivos pdf, documentos multimedia, correos electrónicos o documentos de texto. 3. DATOS SEMIESTRUCTURADOS: Son datos que no se limitan a campos determinados pero requieren marcadores para separar la información, tales como hojas de cálculo, HTML, XML o JSON.
  • 5. ¿DE DÓNDE PROVIENEN TODOS ESTOS DATOS? 1. GENERADOS POR LAS PERSONAS: Enviar información en cualquier red social o cualquier otra cosa que se registre en base de datos. 2. TRANSACCIONES DE DATOS: La facturación, las llamadas o las transacciones entre cuentas. 3. MARKETING ELECTRONICO Y WED: Navegación por internet. 4. MÁQUINA A MÁQUINA: Tecnologías que comparten datos mediante dispositivos. Comunicaciones inalámbricas. 5. BIOMÉTRICA: Datos que provienen de la seguridad, defensa y servicios de inteligencia.
  • 6. TRANSFORMACIÓN Aquí entran en juego las plataformas extraer, transformar y cargar (ETL). Su propósito es extraer los datos de las diferentes fuentes y sistemas, para después hacer transformaciones (conversiones de datos, limpieza de datos sucios, cambios de formato…) y finalmente cargar los datos en la base de datos o almacén de datos especificada.
  • 7. ALMACENAMIENTO NOSQL Son sistemas que provienen de un almacenamiento más flexible y concurrente y permitir de manipular grandes cantidades de información mucho más rápido por lo cual no cumplen con el esquema entidad – relación.
  • 8. TIPOS DE DATOS NOQSL 1. ALMACENAMIENTO CLAVE – VALOR: Los datos se almacenan de tal forma que se acceda con una palabra clave. 2. ALMACENAMIENTO DOCUMENTAL: Son datos semiestructurados que pasan a llamarse documentos formateados en una misma base de datos que acepte. 3. ALMACENAMIENTO EN GRAFO: Relacionan grandes cantidades de datos que pueden ser muy variables. Además se establece que la relación son los nodos y las relaciones entre la información, los artistas. 4. ALMACENAMIENTO ORIENTADO A COLUMNAS: Se orienta a almacenar datos con tendencia a escalar horizontalmente, por lo que permite guardar diferentes atributos y objetos bajo la misma clave.
  • 9. TÉCNICAS DE ANÁLISIS DE DATOS 1. ASOCIACIÓN: Permite encontrar relaciones entre diferentes variables. 2. MINERÍA DE DATOS: Tiene como objetivo encontrar comportamientos predilectos. 3. AGRUPACIÓN: Metodología para encontrar relaciones entre resultados y haces una evaluación preliminar de la estructura de los datos analizados. 4. ANÁLISIS DE TEXTO: Extrae información de datos generados por personas (mensajes de textos, búsquedas web… etc) de esta forma moldea temas y asuntos o predecir palabras.
  • 10. UTILIDAD El objetivo es que ciudadanos y empresas puedan reaprovechar estos datos para generar valor económico. Podrán construir sobre ellos una nueva idea que genere nuevos datos, conocimientos o incluso la creación de nuevos servicios que reporten beneficios económicos y o sociales.
  • 12. VISUALIZACIÓN En los macro datos se llega un paso más allá, ya que es una plataforma que permite visualizar la información a través de los análisis llevados a cabo sobre los datos que disponemos. Ésta trata de llegar a un público más concreto, y una utilidad más acotada como un cuadro de mando integral de una información.