PROYECTO #3 TEXT MINING
INTEGRANTES
SILVIA
CARVAJAL
MENDEZ
BERTHY VARGAS
VILLARREAL
LUIS ENRIQUE
CESARY AÑEZ
XAVIER MARCELO
PANIAGUA
ALARCÓN
MODULO :
FUNDAMENTOS DE
MINERIA Y CIENCIAS
DE DATOS
GRUPO:2
DOCENTE: ING. DAVID E.
MENDOZA GUTIERREZ
La minería de textos busca extraer información útil e importante
de formatos de documentos heterogéneos, tales como páginas
web, correos electrónicos, medios sociales, artículos de revistas,
etc.
¿Que es la minería de textos?
La minería de textos tiene muchas aplicaciones. Por ejemplo, la
minería de textos puede ayudar a encontrar tecnologías nuevas e
innovadoras dentro de ciertos dominios. Es un método muy
eficiente para generar nueva información y conocimiento.
¿Por qué la necesitamos?
Estos son algunos ejemplos de uso en diferentes campos:
● Investigación
● Negocios
● Seguridad
● Uso Diario
● Salud
¿Que clase de gente hace minería
de textos?
Los motores de búsqueda como Google, recuperan todos los
documentos que contienen las palabras clave que has
especificado, pero no hay valor añadido a los datos.
¿Cual es la diferencia entre minería
de texto y google?
● Extracción de términos
● Extraccion de informacion
● Análisis Relacional
Técnicas de Text-Mining
¿Estamos recopilando todos nuestros datos?
● Datos estructurados
● Datos no estructurados
Fuentes de Text-Mining
Estos datos cargados de texto contienen información que ayudan
a las empresas a tomar decisiones basadas en datos. Pero,
debido a que provienen de humanos en lugar de datos
almacenados por campos en bases de datos o etiquetados en
documentos, habrá irregularidades en el contenido,
ambigüedades debido al idioma, entre otros.
¿Por qué son importantes los datos
no estructurados?
● Gestión de contenido
● Búsqueda semántica
● Cumplimiento regulatorio
● Recomendaciones de contenido
¿Cómo utilizan las empresas la
minería de textos?
● Costo y Velocidad
● Consistencia
● Escalabilidad
● Simplicidad
● Mejores Ideas
Beneficios del Text-Mining
¿Cómo funciona la minería de texto?
La extracción de textos puede dividirse en cinco pasos:
1. Recolección
2. Preprocesamiento
3. Limpieza de textos
4. Tokenización
5. Extraccion de caracteristicas
Ejemplo de Aplicación de Text Mining
Este ejemplo pretende servir de introduccion al analisis de texto(text mining)
con Python. Para ello, analizaremos las publicaciones que han hecho en twitter
diferentes personalidades con el objetivo de :
● Obtener número de tweets publicados por mes
● Top 10 de palabras por autor
● Top 15 palabras más características de cada autor

Más contenido relacionado

PPTX
Text mining
PPTX
Proyecto 1 - Big Data
PPTX
PPTX
Proyecto 1 - Big data
PPTX
Mineria de datos
PPTX
Mineria de datos
PPTX
Mineria de datos
PPTX
Mineria de datos
Text mining
Proyecto 1 - Big Data
Proyecto 1 - Big data
Mineria de datos
Mineria de datos
Mineria de datos
Mineria de datos

La actualidad más candente (11)

RTF
Base da datos
PPTX
Big data presentacion diapositiva
PPTX
Minería de Datos
PPTX
Aplicando mineria de datos - Latinoamerica
PPT
Mineria de datos
PDF
Breve Introducción al Big Data
PPTX
Mineria de datos
PPTX
Información e informática
DOCX
Que son el big data la ciencia de datos y el data mining
DOCX
Base de datos.docx
PPTX
Big data presentación
Base da datos
Big data presentacion diapositiva
Minería de Datos
Aplicando mineria de datos - Latinoamerica
Mineria de datos
Breve Introducción al Big Data
Mineria de datos
Información e informática
Que son el big data la ciencia de datos y el data mining
Base de datos.docx
Big data presentación
Publicidad

Similar a Text mining (13)

PPTX
Minería de Texto (Text mining)
PPTX
Minería y visualización de texto
DOCX
Text mining
PPT
I summit utpl-conferencia
PPTX
Minig text and audiovisual data
PPTX
Minig text and audiovisual data
PPTX
Minig text and audiovisual data
PPTX
Minig text and audiovisual data
PPTX
Minig text and audiovisual data
PPTX
Text Mining con R en PowerBI - Global Spanish
PPTX
DOCX
Ensayo sobre data mining
PPTX
SQL Saturday Costa Rica BI - Text mining con r en power bi
Minería de Texto (Text mining)
Minería y visualización de texto
Text mining
I summit utpl-conferencia
Minig text and audiovisual data
Minig text and audiovisual data
Minig text and audiovisual data
Minig text and audiovisual data
Minig text and audiovisual data
Text Mining con R en PowerBI - Global Spanish
Ensayo sobre data mining
SQL Saturday Costa Rica BI - Text mining con r en power bi
Publicidad

Último (20)

PPT
TANATOLOGÍA CLASE UNIVERSIDAD NACIONAL DE CAJAMARCA
PPTX
Caso Clinico de ANATOMÍA Y FRACTURA DE TOBILLO.pptx
PPTX
vasculitis, insuficiencia cardiaca.pptx.
PPTX
Formulación de Objetivos en Investigaciones Cuantitativas.pptx
PPTX
SX METABOLICO.pptx mkvmfskbvmkmvklsdfmvklklv
PPTX
SESIÓN 2 ALIMENTACION Y NUTRICION SALUDABLE JULY.pptx
PPT
articulolevosimendan-120215234603-phpapp02.ppt
PPT
articuloexenatide-120215235301-phpapp02.ppt
PPTX
Anatomia-Fisiologia-y-Patologia-de-los-OFA-material-de-apoyo-parte-3.pptx
PDF
BIOQ1054 Introduccion a la Fisiología vegetal (1).pdf
PPTX
Ciencia moderna. origen y características.
PDF
Tejido sanguíneo.pdf……………………………………………….
PDF
ATLAS DEL SITEMA NERVIOSO para el cu.pdf
PPTX
Clase de Educación sobre Salud Sexual.pptx
PDF
ENLACE QUÍMICO.pdf Enlaces iónicos, metálicos, covalentes. Uniones intermolec...
PPTX
Aborto exposicion.pptxdsaaaaaaaaaaaaaaaaaaaaaaaaaa
PDF
_APENDICITIS - CIRUGIA TUTO.pdf cirugía 1
PPTX
Cancer de endometrio y sus fisiopatologia
PDF
-3-IMPORTANCIA DE LAS PROTEINAS 02 ABRIL 2020 .pdf
PPTX
Propiedades fisicoquímicas y simulaciones de dinámica molecular de disolvente...
TANATOLOGÍA CLASE UNIVERSIDAD NACIONAL DE CAJAMARCA
Caso Clinico de ANATOMÍA Y FRACTURA DE TOBILLO.pptx
vasculitis, insuficiencia cardiaca.pptx.
Formulación de Objetivos en Investigaciones Cuantitativas.pptx
SX METABOLICO.pptx mkvmfskbvmkmvklsdfmvklklv
SESIÓN 2 ALIMENTACION Y NUTRICION SALUDABLE JULY.pptx
articulolevosimendan-120215234603-phpapp02.ppt
articuloexenatide-120215235301-phpapp02.ppt
Anatomia-Fisiologia-y-Patologia-de-los-OFA-material-de-apoyo-parte-3.pptx
BIOQ1054 Introduccion a la Fisiología vegetal (1).pdf
Ciencia moderna. origen y características.
Tejido sanguíneo.pdf……………………………………………….
ATLAS DEL SITEMA NERVIOSO para el cu.pdf
Clase de Educación sobre Salud Sexual.pptx
ENLACE QUÍMICO.pdf Enlaces iónicos, metálicos, covalentes. Uniones intermolec...
Aborto exposicion.pptxdsaaaaaaaaaaaaaaaaaaaaaaaaaa
_APENDICITIS - CIRUGIA TUTO.pdf cirugía 1
Cancer de endometrio y sus fisiopatologia
-3-IMPORTANCIA DE LAS PROTEINAS 02 ABRIL 2020 .pdf
Propiedades fisicoquímicas y simulaciones de dinámica molecular de disolvente...

Text mining

  • 1. PROYECTO #3 TEXT MINING INTEGRANTES SILVIA CARVAJAL MENDEZ BERTHY VARGAS VILLARREAL LUIS ENRIQUE CESARY AÑEZ XAVIER MARCELO PANIAGUA ALARCÓN MODULO : FUNDAMENTOS DE MINERIA Y CIENCIAS DE DATOS GRUPO:2 DOCENTE: ING. DAVID E. MENDOZA GUTIERREZ
  • 2. La minería de textos busca extraer información útil e importante de formatos de documentos heterogéneos, tales como páginas web, correos electrónicos, medios sociales, artículos de revistas, etc. ¿Que es la minería de textos?
  • 3. La minería de textos tiene muchas aplicaciones. Por ejemplo, la minería de textos puede ayudar a encontrar tecnologías nuevas e innovadoras dentro de ciertos dominios. Es un método muy eficiente para generar nueva información y conocimiento. ¿Por qué la necesitamos?
  • 4. Estos son algunos ejemplos de uso en diferentes campos: ● Investigación ● Negocios ● Seguridad ● Uso Diario ● Salud ¿Que clase de gente hace minería de textos?
  • 5. Los motores de búsqueda como Google, recuperan todos los documentos que contienen las palabras clave que has especificado, pero no hay valor añadido a los datos. ¿Cual es la diferencia entre minería de texto y google?
  • 6. ● Extracción de términos ● Extraccion de informacion ● Análisis Relacional Técnicas de Text-Mining
  • 7. ¿Estamos recopilando todos nuestros datos? ● Datos estructurados ● Datos no estructurados Fuentes de Text-Mining
  • 8. Estos datos cargados de texto contienen información que ayudan a las empresas a tomar decisiones basadas en datos. Pero, debido a que provienen de humanos en lugar de datos almacenados por campos en bases de datos o etiquetados en documentos, habrá irregularidades en el contenido, ambigüedades debido al idioma, entre otros. ¿Por qué son importantes los datos no estructurados?
  • 9. ● Gestión de contenido ● Búsqueda semántica ● Cumplimiento regulatorio ● Recomendaciones de contenido ¿Cómo utilizan las empresas la minería de textos?
  • 10. ● Costo y Velocidad ● Consistencia ● Escalabilidad ● Simplicidad ● Mejores Ideas Beneficios del Text-Mining
  • 11. ¿Cómo funciona la minería de texto? La extracción de textos puede dividirse en cinco pasos: 1. Recolección 2. Preprocesamiento 3. Limpieza de textos 4. Tokenización 5. Extraccion de caracteristicas
  • 12. Ejemplo de Aplicación de Text Mining Este ejemplo pretende servir de introduccion al analisis de texto(text mining) con Python. Para ello, analizaremos las publicaciones que han hecho en twitter diferentes personalidades con el objetivo de : ● Obtener número de tweets publicados por mes ● Top 10 de palabras por autor ● Top 15 palabras más características de cada autor