SlideShare una empresa de Scribd logo
UNIDAD VI Redes de propagación hacia delante  y aprendizaje supervisado 6.3 RED de Retro-propagación 6.3.1  Modelo y Arquitectura de la Red. 6.3.2  Algoritmo  de Aprendizaje.
6.3 RED De Retro-propagación 6.3.1  Modelo Y Arquitectura De La Red
Multilayer Perceptron R – S 1  – S 2  – S 3   Network
Arquitectura general de una red de propagación hacia atrás
 
ARQUITECTURA DE LA RBP Esta red puede utilizarse para “Aproximar una función”.  Puede aproximar cualquier función con un numero finito de discontinuidades.
Introducción En 1986, Rumelhart, Hinton y Williams formalizaron un método para que una red neuronal  aprendiera  la relación que existe entre los patrones de entrada a la red y las salidas correspondientes, utilizando más niveles de neuronas que los que utilizó Rosenblatt para desarrollar el Perceptron.
Introducción La red Back-Propagation está basada en la generalización de la regla delta. Al igual que el Perceptron, ADALINE y MADALINE, la red Back-Propagation se caracteriza por tener una arquitectura en niveles y conexiones estrictamente hacia adelante entre las neuronas.  Utilizan aprendizaje supervisado.
¿En que consiste la RBP?  Consiste en un aprendizaje de un conjunto predefinido de pares de entradas-salidas dados como ejemplo, empleando un ciclo  propagación-adaptación  de dos fases.
FASES Primero .-  se aplica un patrón de entrada como estímulo para la primera capa de las neuronas de la red, se va propagando a través de todas las capas superiores hasta generar una salida. Después  se compara el resultado obtenido en las neuronas de salida con la salida que se desea obtener y se calcula un valor del error para cada neurona de salida.
FASES Segundo .- estos errores se transmiten hacia atrás, partiendo de la capa de salida, hacia todas las neuronas de la capa intermedia que contribuyan directamente a la salida, recibiendo el porcentaje de error aproximado a la participación de la neurona intermedia en la salida original.
La importancia de este algoritmo consiste en su capacidad de auto adaptar los pesos de las neuronas de las capas intermedias para aprender la  relación  que existe entre un conjunto de patrones dados como ejemplo y sus salidas correspondientes. Importancia
Ya entrenada la red se podrá aplicar esa misma relación ( terminado el entrenamiento ), a nuevos vectores de entrada con ruido o incompletos, dando una salida activa si la nueva entrada es parecida a las presentadas durante el aprendizaje. Generalización
Regla Delta Generalizada Es una extensión de la regla delta propuesta por Widrow (1960). Se usa en redes con capas intermedias con conexiones hacia delante y cuyas células tienen funciones de activación continuas.  Estas funciones continuas son no decrecientes y derivables (la función sigmoidal pertenece a este tipo de funciones).
Superficie de error El algoritmo utiliza una superficie de error asociada a la red, buscando el estado de mínimo error a través del camino descendente de la superficie del error.
Superficie de error
Estructura y aprendizaje Capa de entrada con n neuronas. Capa de salida con m neuronas. Al menos una capa oculta de neuronas. Cada neurona de una capa recibe entradas de todas las neuronas de la capa anterior y envía su salida a todas las neuronas de la capa posterior. No hay conexiones hacia atrás  ni laterales entre neuronas de la misma capa.
Control de la convergencia La velocidad de aprendizaje se controla mediante   . Normalmente, debe ser un número entre 0.05 y 0.25. Velocidad de convergencia El valor de    se aumenta a medida que disminuye el error. Añadir un momento (sumar una fracción del ajuste de peso anterior al ajuste actual).
Si una red deja de aprender: Realizar un cambio en el número de neuronas ocultas. Volver a empezar con un conjunto distinto de pesos.
BPN vs. PERCEPTRON La salida de BPN puede tomar valores entre 0 y 1; el perceptrón sólo toma 0 o 1. Perceptrón y BPN normalmente empiezan con un conjunto de pesos aleatorios. El método de la regla delta generalizada para ajustar pesos es el mismo que el de la regla delta utilizada en el perceptrón y ADALINE. BPN usa neuronas con función de activación continua.
MATLAB RED BACKPROPAGATION
MODELO DE UNA NEURONA SE PUEDEN CREAR Y SIMULAR CON: initff y  simuff. LAS FUNCIONES DE ENTRENAMIENTO SON: trainbp (normal), trainbpx (rápida), trainlm (más rapida, mucha memoria de PC).
FUNCION DE TRANSFERENCIA La función lonsig: La función logsig(n) genera salidas 0 y 1 para entradas a la red neuronal que van desde un valor negativo a positivo, infinito. También se pueden utilizar las funciones: tansig(n) y purelin(n).
Si la ultima capa de una RBP tiene neuronas con funciones sigmoides entonces las salidas de la red estarán limitadas a un rango pequeño. Pero si se utilizan funciones lineales,  entonces la salida de la red podrá tomar cualquier valor. FUNCION DE TRANSFERENCIA
DERIVADAS DE LAS F. T.´S En una RBP es importante el poder calcular las derivadas de cualquier función de transferencia utilizada. Las derivas de las funciones lonsig, tansig y purelin  son:  deltalog, deltatan y deltalin. Tansig(‘delta’) ans=deltatan
... La función “simuff “.- Simula una red feedforward. “ Simuff”  toma las entradas de la red, P;  los pesos, W; el umbral, b, y la función de transferencia para tres capas, y  regresa las salidas de cada capa. Por ejemplo para simular dos capas: [a1, a2]=simuff(p, W1, b1, ‘tansig’, W2, b2, purelin’)
... Para calcular las salidas de una red de una, dos y tres capas: a=simuff(p, W, b, ‘tansig’) [a1, a2]=simuff(p, W1,B1, ‘logsig’, W2, b2, ‘purelin’) [a1, a2, a3]=simuff(p, W1,B1, ‘tansig’, W2, b2, ‘logsig’, W3, b3, ‘purelin’) a2=simuff(p, W1, b1, ‘tansig’, W2, b2, ‘purelin’)
INICIALIZACIÓN Para crear una red de dos capas con ocho neuronas ocultas tansig y cuatro neuronas de salida purelin, se tiene: [W1,b1,W2,b2]=initff(P,8, ‘tansig’, 4 ‘purelin’) donde es importante que P contenga los limites mínimo y máximo de cada entrada para que así los mejores W y b sean calculados.
INICIALIZACIÓN [W1,b1,W2,b2]=initff(P,5,’tansig’); Por ejemplo, una red de una capa con cinco neuronas puede tener dos entradas, una de las cuales siempre tiene valores en el intervalo [-10,+10], y la otra en [0,5]. [W1,b1,W2,b2]=initff(P, [-10 10; 0 5], ‘tansig’);
INICIALIZACIÓN Initff .-  Puede automáticamente establecer el numero de neuronas en la capa de salida al número de columnas de la matriz objetivo  T. [W1,b1,W2,b2]=initff(P,8,’tansig’,T,’purelin’);
Regla de Aprendizaje  de la BP Utilizada para entrenar redes no lineales multicapa se usa para llevar a cabo: La Aproximación de funciones, La asociación de patrones, y La clasificación de patrones.
Regla de Aprendizaje  de la BP Las derivadas del error (llamadas vectores delta) son calculadas para la capa de salida de la red, y entonces propagadas hacia atrás a través de la red hasta que los vectores delta están disponibles para cada capa oculta. Los cuales son calculados con las funciones: deltalin, deltalog,  y deltatan.
Regla de Aprendizaje  de la BP deltalin(a,e)   regresa el vector delta para una capa de salida de neuronas lineales con un vector de salida  a   y un vector de errores  e . deltalin(a,d,W)   regresa el vector delta para una capa oculta de neuronas lineales, con un vector de salida a, presedido de una capa con un vector delta d  y una matriz de pesos W.
Regla de Aprendizaje  de la BP deltalog(a,e)   Regresa deltas para una capa de salida logsig. deltalog(a,d,W)   Regresa deltas para una capa de oculta logsig. deltatan(a,e)   Regresa deltas para una capa de salida tansig. deltatan(a,d,W)   Regresa deltas para una capa de oculta tansig.
Regla de Aprendizaje  de la BP El cambio realizado en los pesos y los umbrales son calculados por  learnbp . El cambio lo realiza utilizando el vector delta de la capa, y su vector de la capa de entrada  p , de acuerdo a la regla:
6.3 RED De Retro-propagación 6.3.2  Algoritmo  de Aprendizaje y  Entrenamiento
Funcionamiento del Algoritmo de Aprendizaje Inicialice los pesos de la red con valores pequeños aleatorios. Presentar un patrón de entrada y especificar la salida deseada. Calcule los valores de ajuste de las unidades de salida en base al error observado.
Funcionamiento del Algoritmo de Aprendizaje Empezando por el nivel de salida, repita lo siguiente por cada nivel de la red, hasta llegar al primero de los niveles ocultos: Propague los valores de ajuste de regreso al nivel anterior. Actualice los pesos que hay entre los dos niveles. El proceso se repite hasta que el error resulta aceptablemente pequeño para cada uno de los patrones aprendidos.
Funcionamiento del Algoritmo de  Entrenamiento El método es exactamente el mismo que el de la regla delta utilizada en el Perceptrón y ADALINE.
Algoritmo de retropropagación Primer Paso
Algoritmo de retropropagación Segundo Paso
Algoritmo de retropropagación Tercer  Paso
Suponer que se quiere utilizar una  RNA (1-2-1)para aproximar la función :
Entrenamiento Si  p  = 1  y  entonces:
Entrenamiento La salida de la primera capa es:
Entrenamiento Mientras que la salida para la segunda capa es   :   Y se calcula el  error de la red que será de:
Entrenamiento Etapa 2  retropopagación de la sensibilidad.  Se necesita derivar las funciones de transferencia de las capas de la Red:
Entrenamiento El punto de inicio se encuentra en la segunda etapa   :   La sensibilidad de la primera capa se calcula  al retropropagar la sensibilidad desde la segunda capa :
Entrenamiento La etapa final del algoritmo conlleva la  actualización de los pesos   :
Entrenamiento La etapa final del algoritmo conlleva la  actualización de los pesos y umbrales,  para la capa de salida:
Entrenamiento Y para las capas ocultas:
Entrenamiento Estos resultados completan la primera iteración del algoritmo de la retropropagación. Se continuará iterando hasta que la diferencia entre la respuesta de la red y la función objetivo alcance algún nivel aceptable.
Consideraciones sobre el algoritmo de aprendizaje   Este  algoritmo   encuentra un valor mínimo de error (local o global) mediante pasos descendentes (gradiente descendente). Cada punto de la superficie corresponde a un conjunto de valores de los pesos de la red.
Consideraciones sobre el algoritmo de aprendizaje   Con el gradiente descendente, siempre que se realiza un cambio en todos los pesos de la red, se asegura el descenso por la superficie del error hasta encontrar el valle más cercano, lo que puede hacer que el proceso de aprendizaje se detenga en un mínimo local de error.
Superficie de error
UNIDAD VI Redes de propagación hacia delante  y aprendizaje supervisado 6.4 Solución de problemas con MATLAB

Más contenido relacionado

PPT
Diseño de Redes Neuronales Multicapa y Entrenamiento
PPTX
Perceptrón Simple – Redes Neuronales con Aprendizaje Supervisado
PPT
REDES NEURONALES ADALINE
PPT
Algoritmo de Retropropagación
DOCX
Perceptrón simple y multicapa
PPT
REDES NEURONALES DE APRENDIZAJE NO SUPERVISADO HEBB
PPTX
Estándar ieee 802
PPTX
Tipos de listas en estructura de datos
Diseño de Redes Neuronales Multicapa y Entrenamiento
Perceptrón Simple – Redes Neuronales con Aprendizaje Supervisado
REDES NEURONALES ADALINE
Algoritmo de Retropropagación
Perceptrón simple y multicapa
REDES NEURONALES DE APRENDIZAJE NO SUPERVISADO HEBB
Estándar ieee 802
Tipos de listas en estructura de datos

La actualidad más candente (20)

PPS
Sistema de Comunicación. Redes de Telecomunicaciones
PPT
Red NEURONAL MADALINE
PPT
Introduccion redes neuronales artificiales
PPT
REDES NEURONALES Algoritmos de Aprendizaje
PPTX
Protocolos unix, net ware, microsoft y macintosh
PPT
Regla de aprendizaje del perceptrón simple
DOCX
Ejercicios resueltos de programacion
DOC
Ganancia, AtenuacióN Y Decibeles
PPT
Funciones de transferencia analógicas
PPTX
Tópicos Avanzados de Programación - Unidad 4 Acceso a datos
PPTX
Arboles - estructura de datos
PPT
Construccion , Diseño y Entrenamiento de Redes Neuronales Artificiales
PPTX
Redes neuronales artificiales supervisadas y no supervisadas
PPT
Codificación Convolucional, Decodificador de Viterbi y Turbo Código
PPT
Red NEURONAL de Hamming
PDF
Protocolo de enrutamiento
PPTX
Teoría de la información
PPTX
7. atenuacion, distorsion y ruido en la transmision
DOCX
Trabajo Monográfico de Medios de transmision
DOC
REDES NEURONALES De Hopfield
Sistema de Comunicación. Redes de Telecomunicaciones
Red NEURONAL MADALINE
Introduccion redes neuronales artificiales
REDES NEURONALES Algoritmos de Aprendizaje
Protocolos unix, net ware, microsoft y macintosh
Regla de aprendizaje del perceptrón simple
Ejercicios resueltos de programacion
Ganancia, AtenuacióN Y Decibeles
Funciones de transferencia analógicas
Tópicos Avanzados de Programación - Unidad 4 Acceso a datos
Arboles - estructura de datos
Construccion , Diseño y Entrenamiento de Redes Neuronales Artificiales
Redes neuronales artificiales supervisadas y no supervisadas
Codificación Convolucional, Decodificador de Viterbi y Turbo Código
Red NEURONAL de Hamming
Protocolo de enrutamiento
Teoría de la información
7. atenuacion, distorsion y ruido en la transmision
Trabajo Monográfico de Medios de transmision
REDES NEURONALES De Hopfield
Publicidad

Similar a RED NEURONAL Backpropagation (20)

PPT
RED De Retro-propagación Neuronal
PPT
Redes Neuronales
PPT
Redes neuronales artificiales
PPT
Perceptron parte 2
PDF
Utp 2015-2_ia_s6_adaline y backpropagation
PDF
Utp 2015-2_sirn_s6_adaline y backpropagation
PDF
Utp sirn_s6_adaline y backpropagation
PPT
backpropagation teoria como programar.ppt
PDF
Funciones de Activación Tansig y Logsig
PDF
Utp ia_2014-2_s6_backpropagation
PPTX
Inteligencia artificial avanzada
PPT
Redes neuronales
PPT
Redes neuronales
PPT
Redes neuronales
PPT
Redes neuronales
PPT
Redes neuronales
PPT
Redes neuronales
PPT
PPT
PPT
Redes Neuronales
RED De Retro-propagación Neuronal
Redes Neuronales
Redes neuronales artificiales
Perceptron parte 2
Utp 2015-2_ia_s6_adaline y backpropagation
Utp 2015-2_sirn_s6_adaline y backpropagation
Utp sirn_s6_adaline y backpropagation
backpropagation teoria como programar.ppt
Funciones de Activación Tansig y Logsig
Utp ia_2014-2_s6_backpropagation
Inteligencia artificial avanzada
Redes neuronales
Redes neuronales
Redes neuronales
Redes neuronales
Redes neuronales
Redes neuronales
Redes Neuronales
Publicidad

Más de ESCOM (20)

PDF
redes neuronales tipo Som
DOC
redes neuronales Som
PDF
redes neuronales Som Slides
PDF
red neuronal Som Net
PDF
Self Organinising neural networks
DOC
redes neuronales Kohonen
DOC
Teoria Resonancia Adaptativa
DOC
ejemplo red neuronal Art1
DOC
redes neuronales tipo Art3
DOC
Art2
DOC
Redes neuronales tipo Art
DOC
Neocognitron
PPT
Neocognitron
PPT
Neocognitron
PPT
Fukushima Cognitron
PPT
Counterpropagation NETWORK
PPT
Counterpropagation NETWORK
PPT
Counterpropagation
PPT
Teoría de Resonancia Adaptativa Art2 ARTMAP
PPT
Teoría de Resonancia Adaptativa ART1
redes neuronales tipo Som
redes neuronales Som
redes neuronales Som Slides
red neuronal Som Net
Self Organinising neural networks
redes neuronales Kohonen
Teoria Resonancia Adaptativa
ejemplo red neuronal Art1
redes neuronales tipo Art3
Art2
Redes neuronales tipo Art
Neocognitron
Neocognitron
Neocognitron
Fukushima Cognitron
Counterpropagation NETWORK
Counterpropagation NETWORK
Counterpropagation
Teoría de Resonancia Adaptativa Art2 ARTMAP
Teoría de Resonancia Adaptativa ART1

Último (20)

DOCX
Informe_practica pre Final.docxddadssasdddddddddddddddddddddddddddddddddddddddd
PDF
Crear o Morir - Andres Oppenheimer Ccesa007.pdf
PDF
Punto Critico - Brian Tracy Ccesa007.pdf
PDF
Tomo 1 de biologia gratis ultra plusenmas
PDF
Salvese Quien Pueda - Andres Oppenheimer Ccesa007.pdf
PDF
el - LIBRO-PACTO-EDUCATIVO-GLOBAL-OIEC.pdf
DOCX
V UNIDAD - SEGUNDO GRADO. del mes de agosto
PDF
Metodologías Activas con herramientas IAG
PDF
1. Intrdoduccion y criterios de seleccion de Farm 2024.pdf
PDF
DI, TEA, TDAH.pdf guía se secuencias didacticas
PDF
Fundamentos_Educacion_a_Distancia_ABC.pdf
DOCX
PROYECTO DE APRENDIZAJE para la semana de fiestas patrias
PDF
Escuela de Negocios - Robert kiyosaki Ccesa007.pdf
PDF
TRAUMA_Y_RECUPERACION consecuencias de la violencia JUDITH HERMAN
PDF
Didactica de la Investigacion Educativa SUE Ccesa007.pdf
PPTX
Presentación de la Cetoacidosis diabetica.pptx
PPTX
AGENTES PATÓGENOS Y LAS PRINCIPAL ENFERMEAD.pptx
PDF
IDH_Guatemala_2.pdfnjjjkeioooe ,l dkdldp ekooe
PDF
Educación Artística y Desarrollo Humano - Howard Gardner Ccesa007.pdf
PDF
CONFERENCIA-Deep Research en el aula universitaria-UPeU-EduTech360.pdf
Informe_practica pre Final.docxddadssasdddddddddddddddddddddddddddddddddddddddd
Crear o Morir - Andres Oppenheimer Ccesa007.pdf
Punto Critico - Brian Tracy Ccesa007.pdf
Tomo 1 de biologia gratis ultra plusenmas
Salvese Quien Pueda - Andres Oppenheimer Ccesa007.pdf
el - LIBRO-PACTO-EDUCATIVO-GLOBAL-OIEC.pdf
V UNIDAD - SEGUNDO GRADO. del mes de agosto
Metodologías Activas con herramientas IAG
1. Intrdoduccion y criterios de seleccion de Farm 2024.pdf
DI, TEA, TDAH.pdf guía se secuencias didacticas
Fundamentos_Educacion_a_Distancia_ABC.pdf
PROYECTO DE APRENDIZAJE para la semana de fiestas patrias
Escuela de Negocios - Robert kiyosaki Ccesa007.pdf
TRAUMA_Y_RECUPERACION consecuencias de la violencia JUDITH HERMAN
Didactica de la Investigacion Educativa SUE Ccesa007.pdf
Presentación de la Cetoacidosis diabetica.pptx
AGENTES PATÓGENOS Y LAS PRINCIPAL ENFERMEAD.pptx
IDH_Guatemala_2.pdfnjjjkeioooe ,l dkdldp ekooe
Educación Artística y Desarrollo Humano - Howard Gardner Ccesa007.pdf
CONFERENCIA-Deep Research en el aula universitaria-UPeU-EduTech360.pdf

RED NEURONAL Backpropagation

  • 1. UNIDAD VI Redes de propagación hacia delante y aprendizaje supervisado 6.3 RED de Retro-propagación 6.3.1 Modelo y Arquitectura de la Red. 6.3.2 Algoritmo de Aprendizaje.
  • 2. 6.3 RED De Retro-propagación 6.3.1 Modelo Y Arquitectura De La Red
  • 3. Multilayer Perceptron R – S 1 – S 2 – S 3 Network
  • 4. Arquitectura general de una red de propagación hacia atrás
  • 5.  
  • 6. ARQUITECTURA DE LA RBP Esta red puede utilizarse para “Aproximar una función”. Puede aproximar cualquier función con un numero finito de discontinuidades.
  • 7. Introducción En 1986, Rumelhart, Hinton y Williams formalizaron un método para que una red neuronal aprendiera la relación que existe entre los patrones de entrada a la red y las salidas correspondientes, utilizando más niveles de neuronas que los que utilizó Rosenblatt para desarrollar el Perceptron.
  • 8. Introducción La red Back-Propagation está basada en la generalización de la regla delta. Al igual que el Perceptron, ADALINE y MADALINE, la red Back-Propagation se caracteriza por tener una arquitectura en niveles y conexiones estrictamente hacia adelante entre las neuronas. Utilizan aprendizaje supervisado.
  • 9. ¿En que consiste la RBP? Consiste en un aprendizaje de un conjunto predefinido de pares de entradas-salidas dados como ejemplo, empleando un ciclo propagación-adaptación de dos fases.
  • 10. FASES Primero .- se aplica un patrón de entrada como estímulo para la primera capa de las neuronas de la red, se va propagando a través de todas las capas superiores hasta generar una salida. Después se compara el resultado obtenido en las neuronas de salida con la salida que se desea obtener y se calcula un valor del error para cada neurona de salida.
  • 11. FASES Segundo .- estos errores se transmiten hacia atrás, partiendo de la capa de salida, hacia todas las neuronas de la capa intermedia que contribuyan directamente a la salida, recibiendo el porcentaje de error aproximado a la participación de la neurona intermedia en la salida original.
  • 12. La importancia de este algoritmo consiste en su capacidad de auto adaptar los pesos de las neuronas de las capas intermedias para aprender la relación que existe entre un conjunto de patrones dados como ejemplo y sus salidas correspondientes. Importancia
  • 13. Ya entrenada la red se podrá aplicar esa misma relación ( terminado el entrenamiento ), a nuevos vectores de entrada con ruido o incompletos, dando una salida activa si la nueva entrada es parecida a las presentadas durante el aprendizaje. Generalización
  • 14. Regla Delta Generalizada Es una extensión de la regla delta propuesta por Widrow (1960). Se usa en redes con capas intermedias con conexiones hacia delante y cuyas células tienen funciones de activación continuas. Estas funciones continuas son no decrecientes y derivables (la función sigmoidal pertenece a este tipo de funciones).
  • 15. Superficie de error El algoritmo utiliza una superficie de error asociada a la red, buscando el estado de mínimo error a través del camino descendente de la superficie del error.
  • 17. Estructura y aprendizaje Capa de entrada con n neuronas. Capa de salida con m neuronas. Al menos una capa oculta de neuronas. Cada neurona de una capa recibe entradas de todas las neuronas de la capa anterior y envía su salida a todas las neuronas de la capa posterior. No hay conexiones hacia atrás ni laterales entre neuronas de la misma capa.
  • 18. Control de la convergencia La velocidad de aprendizaje se controla mediante  . Normalmente, debe ser un número entre 0.05 y 0.25. Velocidad de convergencia El valor de  se aumenta a medida que disminuye el error. Añadir un momento (sumar una fracción del ajuste de peso anterior al ajuste actual).
  • 19. Si una red deja de aprender: Realizar un cambio en el número de neuronas ocultas. Volver a empezar con un conjunto distinto de pesos.
  • 20. BPN vs. PERCEPTRON La salida de BPN puede tomar valores entre 0 y 1; el perceptrón sólo toma 0 o 1. Perceptrón y BPN normalmente empiezan con un conjunto de pesos aleatorios. El método de la regla delta generalizada para ajustar pesos es el mismo que el de la regla delta utilizada en el perceptrón y ADALINE. BPN usa neuronas con función de activación continua.
  • 22. MODELO DE UNA NEURONA SE PUEDEN CREAR Y SIMULAR CON: initff y simuff. LAS FUNCIONES DE ENTRENAMIENTO SON: trainbp (normal), trainbpx (rápida), trainlm (más rapida, mucha memoria de PC).
  • 23. FUNCION DE TRANSFERENCIA La función lonsig: La función logsig(n) genera salidas 0 y 1 para entradas a la red neuronal que van desde un valor negativo a positivo, infinito. También se pueden utilizar las funciones: tansig(n) y purelin(n).
  • 24. Si la ultima capa de una RBP tiene neuronas con funciones sigmoides entonces las salidas de la red estarán limitadas a un rango pequeño. Pero si se utilizan funciones lineales, entonces la salida de la red podrá tomar cualquier valor. FUNCION DE TRANSFERENCIA
  • 25. DERIVADAS DE LAS F. T.´S En una RBP es importante el poder calcular las derivadas de cualquier función de transferencia utilizada. Las derivas de las funciones lonsig, tansig y purelin son: deltalog, deltatan y deltalin. Tansig(‘delta’) ans=deltatan
  • 26. ... La función “simuff “.- Simula una red feedforward. “ Simuff” toma las entradas de la red, P; los pesos, W; el umbral, b, y la función de transferencia para tres capas, y regresa las salidas de cada capa. Por ejemplo para simular dos capas: [a1, a2]=simuff(p, W1, b1, ‘tansig’, W2, b2, purelin’)
  • 27. ... Para calcular las salidas de una red de una, dos y tres capas: a=simuff(p, W, b, ‘tansig’) [a1, a2]=simuff(p, W1,B1, ‘logsig’, W2, b2, ‘purelin’) [a1, a2, a3]=simuff(p, W1,B1, ‘tansig’, W2, b2, ‘logsig’, W3, b3, ‘purelin’) a2=simuff(p, W1, b1, ‘tansig’, W2, b2, ‘purelin’)
  • 28. INICIALIZACIÓN Para crear una red de dos capas con ocho neuronas ocultas tansig y cuatro neuronas de salida purelin, se tiene: [W1,b1,W2,b2]=initff(P,8, ‘tansig’, 4 ‘purelin’) donde es importante que P contenga los limites mínimo y máximo de cada entrada para que así los mejores W y b sean calculados.
  • 29. INICIALIZACIÓN [W1,b1,W2,b2]=initff(P,5,’tansig’); Por ejemplo, una red de una capa con cinco neuronas puede tener dos entradas, una de las cuales siempre tiene valores en el intervalo [-10,+10], y la otra en [0,5]. [W1,b1,W2,b2]=initff(P, [-10 10; 0 5], ‘tansig’);
  • 30. INICIALIZACIÓN Initff .- Puede automáticamente establecer el numero de neuronas en la capa de salida al número de columnas de la matriz objetivo T. [W1,b1,W2,b2]=initff(P,8,’tansig’,T,’purelin’);
  • 31. Regla de Aprendizaje de la BP Utilizada para entrenar redes no lineales multicapa se usa para llevar a cabo: La Aproximación de funciones, La asociación de patrones, y La clasificación de patrones.
  • 32. Regla de Aprendizaje de la BP Las derivadas del error (llamadas vectores delta) son calculadas para la capa de salida de la red, y entonces propagadas hacia atrás a través de la red hasta que los vectores delta están disponibles para cada capa oculta. Los cuales son calculados con las funciones: deltalin, deltalog, y deltatan.
  • 33. Regla de Aprendizaje de la BP deltalin(a,e) regresa el vector delta para una capa de salida de neuronas lineales con un vector de salida a y un vector de errores e . deltalin(a,d,W) regresa el vector delta para una capa oculta de neuronas lineales, con un vector de salida a, presedido de una capa con un vector delta d y una matriz de pesos W.
  • 34. Regla de Aprendizaje de la BP deltalog(a,e) Regresa deltas para una capa de salida logsig. deltalog(a,d,W) Regresa deltas para una capa de oculta logsig. deltatan(a,e) Regresa deltas para una capa de salida tansig. deltatan(a,d,W) Regresa deltas para una capa de oculta tansig.
  • 35. Regla de Aprendizaje de la BP El cambio realizado en los pesos y los umbrales son calculados por learnbp . El cambio lo realiza utilizando el vector delta de la capa, y su vector de la capa de entrada p , de acuerdo a la regla:
  • 36. 6.3 RED De Retro-propagación 6.3.2 Algoritmo de Aprendizaje y Entrenamiento
  • 37. Funcionamiento del Algoritmo de Aprendizaje Inicialice los pesos de la red con valores pequeños aleatorios. Presentar un patrón de entrada y especificar la salida deseada. Calcule los valores de ajuste de las unidades de salida en base al error observado.
  • 38. Funcionamiento del Algoritmo de Aprendizaje Empezando por el nivel de salida, repita lo siguiente por cada nivel de la red, hasta llegar al primero de los niveles ocultos: Propague los valores de ajuste de regreso al nivel anterior. Actualice los pesos que hay entre los dos niveles. El proceso se repite hasta que el error resulta aceptablemente pequeño para cada uno de los patrones aprendidos.
  • 39. Funcionamiento del Algoritmo de Entrenamiento El método es exactamente el mismo que el de la regla delta utilizada en el Perceptrón y ADALINE.
  • 43. Suponer que se quiere utilizar una RNA (1-2-1)para aproximar la función :
  • 44. Entrenamiento Si p = 1 y entonces:
  • 45. Entrenamiento La salida de la primera capa es:
  • 46. Entrenamiento Mientras que la salida para la segunda capa es : Y se calcula el error de la red que será de:
  • 47. Entrenamiento Etapa 2 retropopagación de la sensibilidad. Se necesita derivar las funciones de transferencia de las capas de la Red:
  • 48. Entrenamiento El punto de inicio se encuentra en la segunda etapa : La sensibilidad de la primera capa se calcula al retropropagar la sensibilidad desde la segunda capa :
  • 49. Entrenamiento La etapa final del algoritmo conlleva la actualización de los pesos :
  • 50. Entrenamiento La etapa final del algoritmo conlleva la actualización de los pesos y umbrales, para la capa de salida:
  • 51. Entrenamiento Y para las capas ocultas:
  • 52. Entrenamiento Estos resultados completan la primera iteración del algoritmo de la retropropagación. Se continuará iterando hasta que la diferencia entre la respuesta de la red y la función objetivo alcance algún nivel aceptable.
  • 53. Consideraciones sobre el algoritmo de aprendizaje Este algoritmo encuentra un valor mínimo de error (local o global) mediante pasos descendentes (gradiente descendente). Cada punto de la superficie corresponde a un conjunto de valores de los pesos de la red.
  • 54. Consideraciones sobre el algoritmo de aprendizaje Con el gradiente descendente, siempre que se realiza un cambio en todos los pesos de la red, se asegura el descenso por la superficie del error hasta encontrar el valle más cercano, lo que puede hacer que el proceso de aprendizaje se detenga en un mínimo local de error.
  • 56. UNIDAD VI Redes de propagación hacia delante y aprendizaje supervisado 6.4 Solución de problemas con MATLAB