Por: Marvin Agila J .
Las técnicas de clasificación automática se pueden agrupar inicialmente como supervisadas o no supervisadas, aunque en esta sección nos enfocaremos en la segunda.   Conocida la diferencia entre ambas técnicas es más fácil introducirnos en la descripción de los  clasificadores , determinando a qué dominios se aplican en la actualidad, que parámetros lo configuran y que tipo son los más usados
Los Sistemas de Recuperación de Información asumen que el contenido de los documentos de la base de datos y las necesidades de información de cada usuario puede expresarse mediante un conjunto de términos índice, que serán utilizados para comparar los documentos almacenados con la consulta introducida por el usuario. La mayor dificultad de los Sistemas de Recuperación de la información es predecir qué documentos son los más relevantes.
Según las premisas que se adopten se producirán varios modelos de recuperación: Vectorial Booleano Probabilistico Basados en el Lenguaje Basados en Redes de Inferencia Basados en Lógica difusa Relevance Feedback
Modelo de recuperación Vectorial. En el modelo vectorial un documento se enmarca dentro de una colección que tiene unas determinadas características. Así pues, un documento puede considerarse formalmente como un vector que expresa la relación del documento con cada una de sus m características.
La recuperación se basa en obtener aquellos documentos que cumplan la función lógica expresada en la consulta realizada por el usuario. Para ello utiliza los operadores propios del álgebra de Boole (AND, OR y NOT) y ficheros de índices invertidos que contienen en sus entradas los documentos que contienen dicho término.
El modelo probabilístico parte de la presencia o ausencia de los términos de la consulta en los documentos de la colección. Por tanto se trata de un modelo binario. Utiliza índices de los términos descriptores con pesos definidos previamente. De esta manera se consigue que el sistema efectúe la recuperación incidiendo sobre todo en los mejores descriptores de entre los empleados por el usuario en la consulta, minimizando la importancia de los peores.
En la actualidad están en desarrollo modelos basados en el procesamiento del lenguaje natural, en los cuales una base de conocimientos intentaría interpretar documentos textuales y generar listas de descriptores de forma automática. Se trata de un método de mejora de las consultas. Consiste en reformular la consulta inicial introducida por el usuario en base a documentos que él mismo considere relevantes. De esta forma la consulta ofrece cada vez resultados más precisos y además se recalculan los pesos de los términos relevantes.
El principal defecto del modelo probabilístico es la necesidad de una estimación inicial de los pesos de los términos para estimar el grado de relevancia de un documento. En el modelo de lógica difusa los autores no asignan los grados de pertenencia de los documentos a los términos. Además, la aplicación de modelos borrosos es idónea para solucionar los problemas de incompletitud e imprecisión a la hora de indexar un documento..
El modelo de red de inferencia extiende los modelos probabilísticos basados en redes bayesianas. Se basa en una red en la que se distinguen dos subredes: Red de documentos: red fija de documentos para cada colección formada por dos tipos de nodos que representan los términos de los documentos y los documentos respectivamente. De un nodo de documento salen arcos hacia los nodos de los términos que han sido indexados. Red de consulta: red que se crea cuando el usuario consulta al sistema y contiene nodos de consulta y nodos de términos, de manera que de un nodo de término salen arcos hacia los nodos de consulta correspondientes.
La variable aleatoria de la consulta representa que la información requerida por la consulta ha sido satisfecha.
En esta sección de la diapositiva describiré en forma breve una de las líneas de investigación  que se están llevando acabo  en el Laboratorio  de Tecnología Emergentes sobre algoritmos evolutivos y su aplicabilidad en tareas de Minería de Datos. Los algoritmos evolutivos son meta heurísticas que emplean modelos computacionales del proceso evolutivo.  Existen una gran variedad que incluyen: Algoritmos Genéticos, Programación Evolutiva, Estrategias Evolutivas  y Programación Genética.
Los algoritmos genéticos y las redes neuronales artificiales, se han usado juntas para entrenar o ayudar en el entrenamiento de las redes para buscar los pesos de la red, para buscar los parámetros de aprendizaje apropiados, para reducir el tamaño del conjunto  de entrenamiento seleccionando las característica más pertinentes. En los algoritmos evolutivos hay 2 maneras de representar conjunto de reglas.  El enfoque de Michigan cada individuo en la población representa una regla de longitud fija , y la población entera representa el objetivo.
El otro enfoque es el de “Pittsburg” en donde cada individuo de tamaño variable representa un conjunto entero de reglas. Las 2 representaciones tienen sus méritos y sus inconvenientes y se han usado con éxito es sistemas clasificadores  que son sistemas basados en reglas que combinan esfuerzo de aprendizaje y algoritmos evolutivos. Otros enfoques se basan en programación genética  para generar prototipos en un problema de clasificación, con los cuales se puede determinar el origen de las muestras de un conjunto de datos, se codifica  con un multiarbol, es decir un conjunto de arboles, que representa el cromosoma.
Agrupar un conjunto de objetos definidos por variables, en clases donde en cada clase los elementos  posean características afines y sean más similares entre si que respecto a elementos pertenecientes a otra clase. Graficar grupos afines como es el caso de los dendogramas de las taxonomías. Clasificar, simplemente información abundante i compleja. Hallar el numero de clases adecuadas.
La clasificación conlleva dos pasos fundamentales:  Generación de un conjunto de clases y sus respuestas espectrales características (generalmente a partir de una muestra de pixeles) Adjudicación de todos los pixeles a alguna de las clases Suponiendo que los datos han pasado ya todo tipo de correcciones de tipo geométrico o atmosférico, existen dos métodos complementarios para afrontar el problema de la generación de clases, estos son válidos tanto en imágenes de satélite como en cualquier otro campo. Generalmente el proceso de clasificación conlleva las siguientes etapas:
Análisis de Componentes Principales para  resumir  la información contenida en las bandas e incluso eliminar alguna del análisis. Generación de clases y signaturas espectrales características. Clasificación no supervisada.  Se utilizan algoritmos matemáticos de clasificación automática. Clasificación propiamente dicha. Existen múltiples métodos: No estadísticos (mínima distancia, paralelepípedos) Estadísticos clásicos (máxima probabilidad) Algoritmos basados en inteligencia artificial (lógica borrosa, redes neuronales) Evaluación de la precisión de la clasificación
http://modelosrecuperacion.50webs.com/inferencia.htm http://ficcte.unimoron.edu.ar/wicc/Trabajos/I%20-%20asi/627-wicc_2006_AEs_DM.pdf http://72.14.205.104/search?q=cache:l8a142XMAVIJ:www.ica.luz.ve/~dfinol/webMEsta/06-Clasificacion%2520no%2520Supervisada.pdf+clasificacion+no+supervisada&hl=es&ct=clnk&cd=2&gl=ec http://www.um.es/geograf/sig/teledet/clasific.html

Más contenido relacionado

DOCX
Unidad 3 paradigmas de la ingeniería del software
PPTX
modelos de datos
PPTX
Objeto relacional bases datos 2
PPTX
Bases de Datos Semanticas
PPTX
Modelo de datos
PPT
Modelo de Objeto Semantico
 
PDF
Unidad II Modelo Conceptual
PPTX
Base de datos-objeto-relacional
Unidad 3 paradigmas de la ingeniería del software
modelos de datos
Objeto relacional bases datos 2
Bases de Datos Semanticas
Modelo de datos
Modelo de Objeto Semantico
 
Unidad II Modelo Conceptual
Base de datos-objeto-relacional

La actualidad más candente (19)

DOCX
Niveles de un sgbd
PPTX
Paradigmas de la ingeniería de softwaree
DOCX
Diseño+de..
DOCX
Trabajo%20 informatica%20arturo%20veras
PDF
Patrones de comportamiento iterator, strategy, command, observer y visitor
DOCX
Proyecto investigativo
PPT
Modelo de datos
DOCX
Concepto Para El Exmanen
PPT
Paradigmas
DOCX
Trabajo%20 informatica%20arturo%20veras
PDF
Clase 4 MER Extendido
PDF
Adoo martha hidalgo
PPTX
Metodologia estructurada
PPTX
modelo de datos
PPTX
Klasepalomino14
PPTX
Modelo de datos y Modelo de Identidad
PDF
Redes Bayesianas aplicadas a la Aprobación de un Módulo Universitario
PDF
Estructura de datos power point
Niveles de un sgbd
Paradigmas de la ingeniería de softwaree
Diseño+de..
Trabajo%20 informatica%20arturo%20veras
Patrones de comportamiento iterator, strategy, command, observer y visitor
Proyecto investigativo
Modelo de datos
Concepto Para El Exmanen
Paradigmas
Trabajo%20 informatica%20arturo%20veras
Clase 4 MER Extendido
Adoo martha hidalgo
Metodologia estructurada
modelo de datos
Klasepalomino14
Modelo de datos y Modelo de Identidad
Redes Bayesianas aplicadas a la Aprobación de un Módulo Universitario
Estructura de datos power point
Publicidad

Destacado (20)

PPS
Photos Anciennes Rr
PPT
Vendre au Québec: Comprendre l’inconscient collectif québécois
PPS
Peinture sur soi-dd
ODP
Comment briller?
PPTX
De la création à la valorisation des productions audiovisuelles : droit, méta...
DOCX
Història pendents 3r.
PPT
Mon espace annonceurs en 6 lecons
PPTX
Effisocial
PPT
Tremblement de terre en haïti stacey vero
PPSX
Derecho Animal
PDF
Twin Partners - Trendoftheweek3 - Mai09
PDF
Seconde session Etudier en juillet 7 astuces en juillet
PPTX
De New York à Roubaix, quelles sont les grandes tendances de demain?
PPTX
Présentation MINES 2juillet2012
PPTX
Lancement MA Consulting France
PPT
Affiliation: evolutions 2014_Salon EM2014
PPS
Arthus bertrand dom_for
DOC
Politique migratoire par NINA MARX
PPTX
ODP
Savez-vous vendre?
Photos Anciennes Rr
Vendre au Québec: Comprendre l’inconscient collectif québécois
Peinture sur soi-dd
Comment briller?
De la création à la valorisation des productions audiovisuelles : droit, méta...
Història pendents 3r.
Mon espace annonceurs en 6 lecons
Effisocial
Tremblement de terre en haïti stacey vero
Derecho Animal
Twin Partners - Trendoftheweek3 - Mai09
Seconde session Etudier en juillet 7 astuces en juillet
De New York à Roubaix, quelles sont les grandes tendances de demain?
Présentation MINES 2juillet2012
Lancement MA Consulting France
Affiliation: evolutions 2014_Salon EM2014
Arthus bertrand dom_for
Politique migratoire par NINA MARX
Savez-vous vendre?
Publicidad

Similar a Clasificacion Supervisada Y Algoritmos Evolutivos (20)

PDF
Paper de iaa
PDF
Algoritmos para aplicar data mining
PPTX
Trabajo colaborativo 3
PPSX
Trabajo colaborativo 3
PDF
Introduccion a Machine Learning
DOCX
Clasificación Automática de Documentos
PPTX
SISTEMAS EXPERTOS
PPTX
Modelos clásicos presentación
PPTX
Poggi analytics - ml - 1d
PPT
Sistemas Basados en el Conocimiento
PPTX
Primer intento de ppt para la clase de mineria
PPTX
Técnicas de minería de datos
PDF
Sistemas clasificadores
PDF
DOC
Proyecto Integrador
PPTX
Modelos clasicos de recuperacion
PDF
Datamining y Machine Learning para Ciencias Biológicas
DOC
Proyecto integrador 1 Corregido
Paper de iaa
Algoritmos para aplicar data mining
Trabajo colaborativo 3
Trabajo colaborativo 3
Introduccion a Machine Learning
Clasificación Automática de Documentos
SISTEMAS EXPERTOS
Modelos clásicos presentación
Poggi analytics - ml - 1d
Sistemas Basados en el Conocimiento
Primer intento de ppt para la clase de mineria
Técnicas de minería de datos
Sistemas clasificadores
Proyecto Integrador
Modelos clasicos de recuperacion
Datamining y Machine Learning para Ciencias Biológicas
Proyecto integrador 1 Corregido

Más de ALONSO UCHIHA (20)

DOCX
Hisotria de la escuela guayaquil
DOC
Instruccion formal sin armas
DOCX
DOCX
Registro y cacheo
DOC
El ráppel
PPTX
Dinapen
DOCX
Bill gates
PPTX
El punto y coma
PPTX
La vida de un policia
PPTX
Escuela guayaquil
PPTX
Dinapen
PPTX
Compañía de mantenimiento del orden
PPTX
Mantenimiento del orden
PPT
SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS ...
PPT
Pipelining And Superscalar Execution
PPT
Introduction To Parallel Computing
PPT
VolúMenes Y Capacidades.
PPT
Radiografias
PPT
Ramas Anteriores
PPT
Radiografias
Hisotria de la escuela guayaquil
Instruccion formal sin armas
Registro y cacheo
El ráppel
Dinapen
Bill gates
El punto y coma
La vida de un policia
Escuela guayaquil
Dinapen
Compañía de mantenimiento del orden
Mantenimiento del orden
SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS ...
Pipelining And Superscalar Execution
Introduction To Parallel Computing
VolúMenes Y Capacidades.
Radiografias
Ramas Anteriores
Radiografias

Clasificacion Supervisada Y Algoritmos Evolutivos

  • 2. Las técnicas de clasificación automática se pueden agrupar inicialmente como supervisadas o no supervisadas, aunque en esta sección nos enfocaremos en la segunda.   Conocida la diferencia entre ambas técnicas es más fácil introducirnos en la descripción de los clasificadores , determinando a qué dominios se aplican en la actualidad, que parámetros lo configuran y que tipo son los más usados
  • 3. Los Sistemas de Recuperación de Información asumen que el contenido de los documentos de la base de datos y las necesidades de información de cada usuario puede expresarse mediante un conjunto de términos índice, que serán utilizados para comparar los documentos almacenados con la consulta introducida por el usuario. La mayor dificultad de los Sistemas de Recuperación de la información es predecir qué documentos son los más relevantes.
  • 4. Según las premisas que se adopten se producirán varios modelos de recuperación: Vectorial Booleano Probabilistico Basados en el Lenguaje Basados en Redes de Inferencia Basados en Lógica difusa Relevance Feedback
  • 5. Modelo de recuperación Vectorial. En el modelo vectorial un documento se enmarca dentro de una colección que tiene unas determinadas características. Así pues, un documento puede considerarse formalmente como un vector que expresa la relación del documento con cada una de sus m características.
  • 6. La recuperación se basa en obtener aquellos documentos que cumplan la función lógica expresada en la consulta realizada por el usuario. Para ello utiliza los operadores propios del álgebra de Boole (AND, OR y NOT) y ficheros de índices invertidos que contienen en sus entradas los documentos que contienen dicho término.
  • 7. El modelo probabilístico parte de la presencia o ausencia de los términos de la consulta en los documentos de la colección. Por tanto se trata de un modelo binario. Utiliza índices de los términos descriptores con pesos definidos previamente. De esta manera se consigue que el sistema efectúe la recuperación incidiendo sobre todo en los mejores descriptores de entre los empleados por el usuario en la consulta, minimizando la importancia de los peores.
  • 8. En la actualidad están en desarrollo modelos basados en el procesamiento del lenguaje natural, en los cuales una base de conocimientos intentaría interpretar documentos textuales y generar listas de descriptores de forma automática. Se trata de un método de mejora de las consultas. Consiste en reformular la consulta inicial introducida por el usuario en base a documentos que él mismo considere relevantes. De esta forma la consulta ofrece cada vez resultados más precisos y además se recalculan los pesos de los términos relevantes.
  • 9. El principal defecto del modelo probabilístico es la necesidad de una estimación inicial de los pesos de los términos para estimar el grado de relevancia de un documento. En el modelo de lógica difusa los autores no asignan los grados de pertenencia de los documentos a los términos. Además, la aplicación de modelos borrosos es idónea para solucionar los problemas de incompletitud e imprecisión a la hora de indexar un documento..
  • 10. El modelo de red de inferencia extiende los modelos probabilísticos basados en redes bayesianas. Se basa en una red en la que se distinguen dos subredes: Red de documentos: red fija de documentos para cada colección formada por dos tipos de nodos que representan los términos de los documentos y los documentos respectivamente. De un nodo de documento salen arcos hacia los nodos de los términos que han sido indexados. Red de consulta: red que se crea cuando el usuario consulta al sistema y contiene nodos de consulta y nodos de términos, de manera que de un nodo de término salen arcos hacia los nodos de consulta correspondientes.
  • 11. La variable aleatoria de la consulta representa que la información requerida por la consulta ha sido satisfecha.
  • 12. En esta sección de la diapositiva describiré en forma breve una de las líneas de investigación que se están llevando acabo en el Laboratorio de Tecnología Emergentes sobre algoritmos evolutivos y su aplicabilidad en tareas de Minería de Datos. Los algoritmos evolutivos son meta heurísticas que emplean modelos computacionales del proceso evolutivo. Existen una gran variedad que incluyen: Algoritmos Genéticos, Programación Evolutiva, Estrategias Evolutivas y Programación Genética.
  • 13. Los algoritmos genéticos y las redes neuronales artificiales, se han usado juntas para entrenar o ayudar en el entrenamiento de las redes para buscar los pesos de la red, para buscar los parámetros de aprendizaje apropiados, para reducir el tamaño del conjunto de entrenamiento seleccionando las característica más pertinentes. En los algoritmos evolutivos hay 2 maneras de representar conjunto de reglas. El enfoque de Michigan cada individuo en la población representa una regla de longitud fija , y la población entera representa el objetivo.
  • 14. El otro enfoque es el de “Pittsburg” en donde cada individuo de tamaño variable representa un conjunto entero de reglas. Las 2 representaciones tienen sus méritos y sus inconvenientes y se han usado con éxito es sistemas clasificadores que son sistemas basados en reglas que combinan esfuerzo de aprendizaje y algoritmos evolutivos. Otros enfoques se basan en programación genética para generar prototipos en un problema de clasificación, con los cuales se puede determinar el origen de las muestras de un conjunto de datos, se codifica con un multiarbol, es decir un conjunto de arboles, que representa el cromosoma.
  • 15. Agrupar un conjunto de objetos definidos por variables, en clases donde en cada clase los elementos posean características afines y sean más similares entre si que respecto a elementos pertenecientes a otra clase. Graficar grupos afines como es el caso de los dendogramas de las taxonomías. Clasificar, simplemente información abundante i compleja. Hallar el numero de clases adecuadas.
  • 16. La clasificación conlleva dos pasos fundamentales: Generación de un conjunto de clases y sus respuestas espectrales características (generalmente a partir de una muestra de pixeles) Adjudicación de todos los pixeles a alguna de las clases Suponiendo que los datos han pasado ya todo tipo de correcciones de tipo geométrico o atmosférico, existen dos métodos complementarios para afrontar el problema de la generación de clases, estos son válidos tanto en imágenes de satélite como en cualquier otro campo. Generalmente el proceso de clasificación conlleva las siguientes etapas:
  • 17. Análisis de Componentes Principales para resumir la información contenida en las bandas e incluso eliminar alguna del análisis. Generación de clases y signaturas espectrales características. Clasificación no supervisada. Se utilizan algoritmos matemáticos de clasificación automática. Clasificación propiamente dicha. Existen múltiples métodos: No estadísticos (mínima distancia, paralelepípedos) Estadísticos clásicos (máxima probabilidad) Algoritmos basados en inteligencia artificial (lógica borrosa, redes neuronales) Evaluación de la precisión de la clasificación