SlideShare una empresa de Scribd logo
PROYECTO #3 TEXT MINING
INTEGRANTES
SILVIA
CARVAJAL
MENDEZ
BERTHY VARGAS
VILLARREAL
LUIS ENRIQUE
CESARY AÑEZ
XAVIER MARCELO
PANIAGUA
ALARCÓN
MODULO :
FUNDAMENTOS DE
MINERIA Y CIENCIAS
DE DATOS
GRUPO:2
DOCENTE: ING. DAVID E.
MENDOZA GUTIERREZ
La minería de textos busca extraer información útil e importante
de formatos de documentos heterogéneos, tales como páginas
web, correos electrónicos, medios sociales, artículos de revistas,
etc.
¿Que es la minería de textos?
La minería de textos tiene muchas aplicaciones. Por ejemplo, la
minería de textos puede ayudar a encontrar tecnologías nuevas e
innovadoras dentro de ciertos dominios. Es un método muy
eficiente para generar nueva información y conocimiento.
¿Por qué la necesitamos?
Estos son algunos ejemplos de uso en diferentes campos:
● Investigación
● Negocios
● Seguridad
● Uso Diario
● Salud
¿Que clase de gente hace minería
de textos?
Los motores de búsqueda como Google, recuperan todos los
documentos que contienen las palabras clave que has
especificado, pero no hay valor añadido a los datos.
¿Cual es la diferencia entre minería
de texto y google?
● Extracción de términos
● Extraccion de informacion
● Análisis Relacional
Técnicas de Text-Mining
¿Estamos recopilando todos nuestros datos?
● Datos estructurados
● Datos no estructurados
Fuentes de Text-Mining
Estos datos cargados de texto contienen información que ayudan
a las empresas a tomar decisiones basadas en datos. Pero,
debido a que provienen de humanos en lugar de datos
almacenados por campos en bases de datos o etiquetados en
documentos, habrá irregularidades en el contenido,
ambigüedades debido al idioma, entre otros.
¿Por qué son importantes los datos
no estructurados?
● Gestión de contenido
● Búsqueda semántica
● Cumplimiento regulatorio
● Recomendaciones de contenido
¿Cómo utilizan las empresas la
minería de textos?
● Costo y Velocidad
● Consistencia
● Escalabilidad
● Simplicidad
● Mejores Ideas
Beneficios del Text-Mining
¿Cómo funciona la minería de texto?
La extracción de textos puede dividirse en cinco pasos:
1. Recolección
2. Preprocesamiento
3. Limpieza de textos
4. Tokenización
5. Extraccion de caracteristicas
Ejemplo de Aplicación de Text Mining
Este ejemplo pretende servir de introduccion al analisis de texto(text mining)
con Python. Para ello, analizaremos las publicaciones que han hecho en twitter
diferentes personalidades con el objetivo de :
● Obtener número de tweets publicados por mes
● Top 10 de palabras por autor
● Top 15 palabras más características de cada autor

Más contenido relacionado

PPTX
Text mining
PPTX
Proyecto 1 - Big Data
PPTX
Proyecto 1 - Big data
PPTX
PPTX
Big data
PPTX
Big data
PDF
Big Data y el ERP en México
PDF
Big Data en Social Media
Text mining
Proyecto 1 - Big Data
Proyecto 1 - Big data
Big data
Big data
Big Data y el ERP en México
Big Data en Social Media

La actualidad más candente (10)

PPTX
Big data-grupo-7
PPTX
Big data de luis cipamocha 11 2
PPSX
Nuevas tecnologias power point pptx
PPTX
big data
PPTX
Big data y la inteligencia de negocios
PPS
Big data
PPTX
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
PPTX
Reglas de clasificacion
PPTX
Big data para principiantes
Big data-grupo-7
Big data de luis cipamocha 11 2
Nuevas tecnologias power point pptx
big data
Big data y la inteligencia de negocios
Big data
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
Reglas de clasificacion
Big data para principiantes
Publicidad

Similar a Text mining (20)

PPT
Mineria De Datos
PDF
Inducción Analítica de Datos con PYTON .pdf
PPTX
presentacion de achivos para empresas y colegios
PPTX
¿Qué es el big data y para que sirve en el mundo?
PDF
Conociendo el bigdata por Camargo y Joyanes
PPTX
Gestión de datos de investigación (gdi) (1)
PPTX
La gestión de datos de investigación en el horizonte de las bibliotecas de i...
PDF
Jorge luis rojas barnett
DOCX
Ensayo sobre data mining
PDF
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
PPTX
Minig text and audiovisual data
PPTX
Minig text and audiovisual data
PPTX
Minig text and audiovisual data
PPTX
Minig text and audiovisual data
PPTX
Minig text and audiovisual data
PDF
leccion-01dominando-el-big-data-fundamentos-y-aplicaciones-2023.pdf
DOCX
Ciencia de datos
PDF
Conociendo big data
PDF
Taller N°4 habilidades digitales - BIG-DATA
PDF
Herramientas de Vigilancia Tecnológica
Mineria De Datos
Inducción Analítica de Datos con PYTON .pdf
presentacion de achivos para empresas y colegios
¿Qué es el big data y para que sirve en el mundo?
Conociendo el bigdata por Camargo y Joyanes
Gestión de datos de investigación (gdi) (1)
La gestión de datos de investigación en el horizonte de las bibliotecas de i...
Jorge luis rojas barnett
Ensayo sobre data mining
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Minig text and audiovisual data
Minig text and audiovisual data
Minig text and audiovisual data
Minig text and audiovisual data
Minig text and audiovisual data
leccion-01dominando-el-big-data-fundamentos-y-aplicaciones-2023.pdf
Ciencia de datos
Conociendo big data
Taller N°4 habilidades digitales - BIG-DATA
Herramientas de Vigilancia Tecnológica
Publicidad

Último (20)

PPT
El-Gobierno-Electrónico-En-El-Estado-Bolivia
PPTX
historia_web de la creacion de un navegador_presentacion.pptx
PPTX
Mecanismos-de-Propagacion de ondas electromagneticas
PDF
Documental Beyond the Code (Dossier Presentación - 2.0)
PPTX
Power Point Nicolás Carrasco (disertación Roblox).pptx
PPTX
Propuesta BKP servidores con Acronis1.pptx
PDF
Instrucciones simples, respuestas poderosas. La fórmula del prompt perfecto.
PPTX
modulo seguimiento 1 para iniciantes del
PPTX
El uso de las TIC en la vida cotidiana..
PPTX
Acronis Cyber Protect Cloud para Ciber Proteccion y Ciber Seguridad LATAM - A...
PDF
CONTABILIDAD Y TRIBUTACION, EJERCICIO PRACTICO
PDF
programa-de-estudios-2011-guc3ada-para-el-maestro-secundarias-tecnicas-tecnol...
DOCX
TRABAJO GRUPAL (5) (1).docxjesjssjsjjskss
DOCX
TRABAJO GRUPAL (5) (1).docxjsjsjskskksksk
DOCX
TRABAJO GRUPAL (5) (1).docxsjsjskskksksksks
PDF
ADMINISTRACIÓN DE ARCHIVOS - TICS (SENA).pdf
PPTX
Curso de generación de energía mediante sistemas solares
DOCX
Guía 5. Test de orientación Vocacional 2.docx
PDF
Diapositiva proyecto de vida, materia catedra
PDF
Estrategia de Apoyo de Daylin Castaño (5).pdf
El-Gobierno-Electrónico-En-El-Estado-Bolivia
historia_web de la creacion de un navegador_presentacion.pptx
Mecanismos-de-Propagacion de ondas electromagneticas
Documental Beyond the Code (Dossier Presentación - 2.0)
Power Point Nicolás Carrasco (disertación Roblox).pptx
Propuesta BKP servidores con Acronis1.pptx
Instrucciones simples, respuestas poderosas. La fórmula del prompt perfecto.
modulo seguimiento 1 para iniciantes del
El uso de las TIC en la vida cotidiana..
Acronis Cyber Protect Cloud para Ciber Proteccion y Ciber Seguridad LATAM - A...
CONTABILIDAD Y TRIBUTACION, EJERCICIO PRACTICO
programa-de-estudios-2011-guc3ada-para-el-maestro-secundarias-tecnicas-tecnol...
TRABAJO GRUPAL (5) (1).docxjesjssjsjjskss
TRABAJO GRUPAL (5) (1).docxjsjsjskskksksk
TRABAJO GRUPAL (5) (1).docxsjsjskskksksksks
ADMINISTRACIÓN DE ARCHIVOS - TICS (SENA).pdf
Curso de generación de energía mediante sistemas solares
Guía 5. Test de orientación Vocacional 2.docx
Diapositiva proyecto de vida, materia catedra
Estrategia de Apoyo de Daylin Castaño (5).pdf

Text mining

  • 1. PROYECTO #3 TEXT MINING INTEGRANTES SILVIA CARVAJAL MENDEZ BERTHY VARGAS VILLARREAL LUIS ENRIQUE CESARY AÑEZ XAVIER MARCELO PANIAGUA ALARCÓN MODULO : FUNDAMENTOS DE MINERIA Y CIENCIAS DE DATOS GRUPO:2 DOCENTE: ING. DAVID E. MENDOZA GUTIERREZ
  • 2. La minería de textos busca extraer información útil e importante de formatos de documentos heterogéneos, tales como páginas web, correos electrónicos, medios sociales, artículos de revistas, etc. ¿Que es la minería de textos?
  • 3. La minería de textos tiene muchas aplicaciones. Por ejemplo, la minería de textos puede ayudar a encontrar tecnologías nuevas e innovadoras dentro de ciertos dominios. Es un método muy eficiente para generar nueva información y conocimiento. ¿Por qué la necesitamos?
  • 4. Estos son algunos ejemplos de uso en diferentes campos: ● Investigación ● Negocios ● Seguridad ● Uso Diario ● Salud ¿Que clase de gente hace minería de textos?
  • 5. Los motores de búsqueda como Google, recuperan todos los documentos que contienen las palabras clave que has especificado, pero no hay valor añadido a los datos. ¿Cual es la diferencia entre minería de texto y google?
  • 6. ● Extracción de términos ● Extraccion de informacion ● Análisis Relacional Técnicas de Text-Mining
  • 7. ¿Estamos recopilando todos nuestros datos? ● Datos estructurados ● Datos no estructurados Fuentes de Text-Mining
  • 8. Estos datos cargados de texto contienen información que ayudan a las empresas a tomar decisiones basadas en datos. Pero, debido a que provienen de humanos en lugar de datos almacenados por campos en bases de datos o etiquetados en documentos, habrá irregularidades en el contenido, ambigüedades debido al idioma, entre otros. ¿Por qué son importantes los datos no estructurados?
  • 9. ● Gestión de contenido ● Búsqueda semántica ● Cumplimiento regulatorio ● Recomendaciones de contenido ¿Cómo utilizan las empresas la minería de textos?
  • 10. ● Costo y Velocidad ● Consistencia ● Escalabilidad ● Simplicidad ● Mejores Ideas Beneficios del Text-Mining
  • 11. ¿Cómo funciona la minería de texto? La extracción de textos puede dividirse en cinco pasos: 1. Recolección 2. Preprocesamiento 3. Limpieza de textos 4. Tokenización 5. Extraccion de caracteristicas
  • 12. Ejemplo de Aplicación de Text Mining Este ejemplo pretende servir de introduccion al analisis de texto(text mining) con Python. Para ello, analizaremos las publicaciones que han hecho en twitter diferentes personalidades con el objetivo de : ● Obtener número de tweets publicados por mes ● Top 10 de palabras por autor ● Top 15 palabras más características de cada autor