SlideShare una empresa de Scribd logo
PROYECTO #3 TEXT MINING
INTEGRANTES
SILVIA
CARVAJAL
MENDEZ
BERTHY VARGAS
VILLARREAL
LUIS ENRIQUE
CESARY AÑEZ
XAVIER MARCELO
PANIAGUA
ALARCÓN
MODULO :
FUNDAMENTOS DE
MINERIA Y CIENCIAS
DE DATOS
GRUPO:2
DOCENTE: ING. DAVID E.
MENDOZA GUTIERREZ
La minería de textos busca extraer información útil e importante
de formatos de documentos heterogéneos, tales como páginas
web, correos electrónicos, medios sociales, artículos de revistas,
etc.
¿Que es la minería de textos?
La minería de textos tiene muchas aplicaciones. Por ejemplo, la
minería de textos puede ayudar a encontrar tecnologías nuevas e
innovadoras dentro de ciertos dominios. Es un método muy
eficiente para generar nueva información y conocimiento.
¿Por qué la necesitamos?
Estos son algunos ejemplos de uso en diferentes campos:
● Investigación
● Negocios
● Seguridad
● Uso Diario
● Salud
¿Que clase de gente hace minería
de textos?
Los motores de búsqueda como Google, recuperan todos los
documentos que contienen las palabras clave que has
especificado, pero no hay valor añadido a los datos.
¿Cual es la diferencia entre minería
de texto y google?
● Extracción de términos
● Extraccion de informacion
● Análisis Relacional
Técnicas de Text-Mining
¿Estamos recopilando todos nuestros datos?
● Datos estructurados
● Datos no estructurados
Fuentes de Text-Mining
Estos datos cargados de texto contienen información que ayudan
a las empresas a tomar decisiones basadas en datos. Pero,
debido a que provienen de humanos en lugar de datos
almacenados por campos en bases de datos o etiquetados en
documentos, habrá irregularidades en el contenido,
ambigüedades debido al idioma, entre otros.
¿Por qué son importantes los datos
no estructurados?
● Gestión de contenido
● Búsqueda semántica
● Cumplimiento regulatorio
● Recomendaciones de contenido
¿Cómo utilizan las empresas la
minería de textos?
● Costo y Velocidad
● Consistencia
● Escalabilidad
● Simplicidad
● Mejores Ideas
Beneficios del Text-Mining
¿Cómo funciona la minería de texto?
La extracción de textos puede dividirse en cinco pasos:
1. Recolección
2. Preprocesamiento
3. Limpieza de textos
4. Tokenización
5. Extraccion de caracteristicas
Ejemplo de Aplicación de Text Mining
Este ejemplo pretende servir de introduccion al analisis de texto(text mining)
con Python. Para ello, analizaremos las publicaciones que han hecho en twitter
diferentes personalidades con el objetivo de :
● Obtener número de tweets publicados por mes
● Top 10 de palabras por autor
● Top 15 palabras más características de cada autor

Más contenido relacionado

PPTX
Proyecto 1 - Big Data
PPTX
Proyecto 1 - Big data
PPTX
Text mining
PPTX
PPTX
Big data
PPTX
Big data
PDF
Big Data y el ERP en México
PDF
Big Data en Social Media
Proyecto 1 - Big Data
Proyecto 1 - Big data
Text mining
Big data
Big data
Big Data y el ERP en México
Big Data en Social Media

La actualidad más candente (10)

PPTX
Big data-grupo-7
PPTX
Big data de luis cipamocha 11 2
PPSX
Nuevas tecnologias power point pptx
PPTX
big data
PPTX
Big data y la inteligencia de negocios
PPS
Big data
PPTX
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
PPTX
Big data para principiantes
PPTX
Reglas de clasificacion
Big data-grupo-7
Big data de luis cipamocha 11 2
Nuevas tecnologias power point pptx
big data
Big data y la inteligencia de negocios
Big data
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
Big data para principiantes
Reglas de clasificacion
Publicidad

Similar a Text mining (13)

PPTX
Minería de Texto (Text mining)
PPTX
Minería y visualización de texto
DOCX
Text mining
PPT
I summit utpl-conferencia
PPTX
Minig text and audiovisual data
PPTX
Minig text and audiovisual data
PPTX
Minig text and audiovisual data
PPTX
Minig text and audiovisual data
PPTX
Minig text and audiovisual data
PPTX
Text Mining con R en PowerBI - Global Spanish
PPTX
DOCX
Ensayo sobre data mining
PPTX
SQL Saturday Costa Rica BI - Text mining con r en power bi
Minería de Texto (Text mining)
Minería y visualización de texto
Text mining
I summit utpl-conferencia
Minig text and audiovisual data
Minig text and audiovisual data
Minig text and audiovisual data
Minig text and audiovisual data
Minig text and audiovisual data
Text Mining con R en PowerBI - Global Spanish
Ensayo sobre data mining
SQL Saturday Costa Rica BI - Text mining con r en power bi
Publicidad

Último (20)

PDF
Educación Artística y Desarrollo Humano - Howard Gardner Ccesa007.pdf
PDF
Híper Mega Repaso Histológico Bloque 3.pdf
PDF
Conecta con la Motivacion - Brian Tracy Ccesa007.pdf
PDF
ciencias-1.pdf libro cuarto basico niños
PPTX
caso clínico iam clinica y semiología l3.pptx
PDF
Punto Critico - Brian Tracy Ccesa007.pdf
PDF
Teologia-Sistematica-Por-Lewis-Sperry-Chafer_060044.pdf
PDF
Atencion prenatal. Ginecologia y obsetricia
PDF
biología es un libro sobre casi todo el tema de biología
PPTX
Presentación de la Cetoacidosis diabetica.pptx
PDF
ACERTIJO Súper Círculo y la clave contra el Malvado Señor de las Formas. Por ...
PDF
el - LIBRO-PACTO-EDUCATIVO-GLOBAL-OIEC.pdf
PDF
Fundamentos_Educacion_a_Distancia_ABC.pdf
DOCX
V UNIDAD - PRIMER GRADO. del mes de agosto
PDF
Escuela de Negocios - Robert kiyosaki Ccesa007.pdf
PDF
Unidad de Aprendizaje 5 de Matematica 1ro Secundaria Ccesa007.pdf
DOCX
V UNIDAD - SEGUNDO GRADO. del mes de agosto
PDF
1. Intrdoduccion y criterios de seleccion de Farm 2024.pdf
PDF
CIRSOC-201-2024_Proyecto de Reglamento Argentino de Estructuras de Hormigón
PDF
Metodologías Activas con herramientas IAG
Educación Artística y Desarrollo Humano - Howard Gardner Ccesa007.pdf
Híper Mega Repaso Histológico Bloque 3.pdf
Conecta con la Motivacion - Brian Tracy Ccesa007.pdf
ciencias-1.pdf libro cuarto basico niños
caso clínico iam clinica y semiología l3.pptx
Punto Critico - Brian Tracy Ccesa007.pdf
Teologia-Sistematica-Por-Lewis-Sperry-Chafer_060044.pdf
Atencion prenatal. Ginecologia y obsetricia
biología es un libro sobre casi todo el tema de biología
Presentación de la Cetoacidosis diabetica.pptx
ACERTIJO Súper Círculo y la clave contra el Malvado Señor de las Formas. Por ...
el - LIBRO-PACTO-EDUCATIVO-GLOBAL-OIEC.pdf
Fundamentos_Educacion_a_Distancia_ABC.pdf
V UNIDAD - PRIMER GRADO. del mes de agosto
Escuela de Negocios - Robert kiyosaki Ccesa007.pdf
Unidad de Aprendizaje 5 de Matematica 1ro Secundaria Ccesa007.pdf
V UNIDAD - SEGUNDO GRADO. del mes de agosto
1. Intrdoduccion y criterios de seleccion de Farm 2024.pdf
CIRSOC-201-2024_Proyecto de Reglamento Argentino de Estructuras de Hormigón
Metodologías Activas con herramientas IAG

Text mining

  • 1. PROYECTO #3 TEXT MINING INTEGRANTES SILVIA CARVAJAL MENDEZ BERTHY VARGAS VILLARREAL LUIS ENRIQUE CESARY AÑEZ XAVIER MARCELO PANIAGUA ALARCÓN MODULO : FUNDAMENTOS DE MINERIA Y CIENCIAS DE DATOS GRUPO:2 DOCENTE: ING. DAVID E. MENDOZA GUTIERREZ
  • 2. La minería de textos busca extraer información útil e importante de formatos de documentos heterogéneos, tales como páginas web, correos electrónicos, medios sociales, artículos de revistas, etc. ¿Que es la minería de textos?
  • 3. La minería de textos tiene muchas aplicaciones. Por ejemplo, la minería de textos puede ayudar a encontrar tecnologías nuevas e innovadoras dentro de ciertos dominios. Es un método muy eficiente para generar nueva información y conocimiento. ¿Por qué la necesitamos?
  • 4. Estos son algunos ejemplos de uso en diferentes campos: ● Investigación ● Negocios ● Seguridad ● Uso Diario ● Salud ¿Que clase de gente hace minería de textos?
  • 5. Los motores de búsqueda como Google, recuperan todos los documentos que contienen las palabras clave que has especificado, pero no hay valor añadido a los datos. ¿Cual es la diferencia entre minería de texto y google?
  • 6. ● Extracción de términos ● Extraccion de informacion ● Análisis Relacional Técnicas de Text-Mining
  • 7. ¿Estamos recopilando todos nuestros datos? ● Datos estructurados ● Datos no estructurados Fuentes de Text-Mining
  • 8. Estos datos cargados de texto contienen información que ayudan a las empresas a tomar decisiones basadas en datos. Pero, debido a que provienen de humanos en lugar de datos almacenados por campos en bases de datos o etiquetados en documentos, habrá irregularidades en el contenido, ambigüedades debido al idioma, entre otros. ¿Por qué son importantes los datos no estructurados?
  • 9. ● Gestión de contenido ● Búsqueda semántica ● Cumplimiento regulatorio ● Recomendaciones de contenido ¿Cómo utilizan las empresas la minería de textos?
  • 10. ● Costo y Velocidad ● Consistencia ● Escalabilidad ● Simplicidad ● Mejores Ideas Beneficios del Text-Mining
  • 11. ¿Cómo funciona la minería de texto? La extracción de textos puede dividirse en cinco pasos: 1. Recolección 2. Preprocesamiento 3. Limpieza de textos 4. Tokenización 5. Extraccion de caracteristicas
  • 12. Ejemplo de Aplicación de Text Mining Este ejemplo pretende servir de introduccion al analisis de texto(text mining) con Python. Para ello, analizaremos las publicaciones que han hecho en twitter diferentes personalidades con el objetivo de : ● Obtener número de tweets publicados por mes ● Top 10 de palabras por autor ● Top 15 palabras más características de cada autor