SlideShare una empresa de Scribd logo
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Deep Learning: contexto, evolución y
aplicaciones
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Robots industriales (autómatas)
Deep Blue
versus
Kasparov
(1997) ELIZA: 1er
Bot Conversacional
(1966)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Machine learning
– Habilidad de las máquinas de adquirir conocimiento.
– ¿Conocimiento?
• Modelo que hay que definir (cada modelo tiene
un número de parámetros)
– ¿De quién o qué aprendo?
• Datos en crudo (raw data): bases de datos
• Representación de los datos (features)
• Objetivos (targets) o salida deseada.
– ¿Cómo aprendo?
• Algoritmos matemáticos de optimización.
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Modelos (metodologías)
Logistic regressionBoosting classifier
Neural networks
Nearest Neighbor
SVM
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Parámetros
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Bases de datos
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Representación de los datos: key issue
– La eficiencia en la representación de los datos es
fundamental para el aprendizaje máquina
• 1250 + 750 = 2000 o MCCL + DCCL = MM
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Representación de los datos: key issue
– No aprendemos datos en crudo → extraemos features
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Deep learning
– 1º Nueva forma de afrontar el problema de la representación
• Se aprenden características relevantes (features)
• Se aprenden representaciones complejas a partir de
representaciones más simples.
– 2º Si agrupamos en un grafo la relación de representaciones en capas
conectadas, el grafo es muy profundo (deep) con muchas capas:
muchos (pero muchos) parámetros.
– 3º Para poder aprender los valores de los muchos (pero muchos)
parámetros del modelo se necesitan muchos (muchos, muchos)
datos: big data.
– 4º Para poder entrenar estos mega modelos con cantidades ingentes
de datos se necesita un HW muy (pero muy) potente
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
El círculo virtuoso del Deep Learning
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
1998
LeNet
1998
Yann LeCUn
The gap
2012
AlexNet
Alex Krizhevsky
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
ILSVRC
– 1000 categorías
– 1.2M-14M imágenes de entrenamiento
– 150K imágenes de test
• 2017: top-5 error
2,25%
• Desde 2018 este
challenge ya no se
hace (se da por
resuelto)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Speech recognition
– Word Error Rate (%)
– Google Assistant < 5%
– Microsoft ~ 5%
– Human error 2-4%
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Neurona artificial
(ADALINE)
Ejemplo: 2 dimensiones
PERCEPTRON
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Entrenamiento
– Estimar los parámetros (pesos y offset) a partir de N datos
(entradas x y salida deseada d)
– Descenso del gradiente:
• Función de coste a minimizar: Error
• Los pesos se actualizan en un proceso iterativo de forma proporcional a (-)
la derivada del Error respecto de los pesos
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
El problema de la XOR
– Partimos de una red con una sola capa de neuronas: solo se
pueden resolver problemas separables linealmente.
– Hasta este momento (1969) no se sabe como entrenar redes con
más capas. Hasta 1986...
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
El problema de la XOR
– Backpropagation (1986): método para propagar el error desde
las capas de salida hasta la capa de entrada.
• Permite crear modelos con capas intermedias.
• Añadir capas implica añadir dimensionalidad al problema y capacidad de
discriminación del modelo discriminante.
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Backpropagation
– Aplicación recursiva de la regla de la cadena de la derivada
¡¡ Muy fácil de
implementar y de
paralelizar (GPUs) !!
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Redes Neuronales (Fully Connected FC)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Redes Neuronales CONVOLUCIONALES
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Capas CONVOLUCIONALES
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Capas CONVOLUCIONALES
1 filtro para cada salida
(filters) → pesos
La profundidad del filtro
depende de la profundidad de
la capa de entrada
A las salidas se les denominan
“features” o “feature map”
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Capas CONVOLUCIONALES
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Capas CONVOLUCIONALES: parámetros principales
– Tamaño del volumen de entrada (anterior): W x W x Cin
– Tamaño del filtro (receptive field): FxF
• La profundidad es la de la capa de entrada (anterior): Cin
• Total: F x F x Cin (pesos de la red!!)
– Stride o salto de pixel del filtro sobre el volumen de entrada: S
– Padding: puede ser necesario rellenar con ceros el borde del
volumen de entrada: P
– Tamaño del volumen de salida:
• El número de filtros Cout es un parámetro de diseño
• El ancho y alto vendrá dado por: (W-F+2P)/S + 1 (debe dar un entero!!)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Capas CONVOLUCIONALES
– Ejemplo de filtros (pesos) aprendidos
• 96 filtros de 11x11x3 de la primera capa de una red
• Los filtros se comparten para todas las neuronas de cada
“feature map” del bloque de salida.
96
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Capas CONVOLUCIONALES
Mismos pesos (“filtro i”), conectados a las
neuronas de la “feature i” de la siguiente capa”
Entre diferentes features hay diferentes filtros
(“filtro j” conectado a las neuronas de la
“feature j” de la siguiente capa)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Capas CONVOLUCIONALES
W1
W1
Cin
Cin
F
F
Cout
W2
W2
Capa convolucional: pesos
solo conectados a una parte
del tensor de entrada
(FxFxCin)
Pesos diferentes (Cout filtros)
Capa “fully connected”:
pesos conectados a todo el
tensor de entrada
(W2xW2xCout)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Capas POOLING
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Capas POOLING
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
14 millones de imágenes
1000 categorías (clasificación)
30 millones de imágenes
15 millones de regiones
600 categorías (clasificación + localización)
330K imágenes; 1.5M objetos;
250K personas con keypoints;
Segmentación de objetos+pose
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
LeNet (1998)
The gap
AlexNet (2010)
VGG (2013) GoogleLeNet - Inception (V1 2014 – V4 2016)
ResNet (2015)
SqueezeNet (2016); ENet (2016);
Xception (2017); MobileNet (2017);
DenseNet (2017); ShuffleNet (2017)
Reducción del número de parámetros,
número de operaciones, mejoras en la
arquitectura, etc., manteniendo la precisión
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
https://medium.com/@culurciello/analysis-of-deep-neural-networks-dcf398e71aae
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
https://medium.com/@culurciello/analysis-of-deep-neural-networks-dcf398e71aae
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
https://medium.com/@culurciello/analysis-of-deep-neural-networks-dcf398e71aae
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Aplicaciones (I)
– Síntesis de vídeo y audio
– Coloreado de imágenes
– Restauración de píxeles (CSI)
– Estimación pose de personas
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Aplicaciones (II)
– Descripción de fotos
– Traducción idiomática
– Síntesis de imágenes
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Aplicaciones (III)
– Videojuegos
DOOM
Atari Breakout
Google’s Deep
Mind
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Aplicaciones (IV)
– Vehículos autónomos
– Robótica
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Aplicaciones (V)
– Generación de voz, recomposición de sonidos,
composición de música, etc.
– Arte
INVETT Group at University of Alcalá
INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
Deep Learning: contexto, evolución y
aplicaciones
¡GRACIAS!

Más contenido relacionado

PDF
Introducción al Deep Learning
PDF
Conectores de fibra óptica y termoencogible
PDF
Diferentes tipos de arduino
PDF
Subneteo con vlsm ejercicios clases a,b,c
PDF
Calculo radioenlace
PPTX
6.6 Calculos de radioenlaces
PPTX
6.5 Tipos mas comunes de antenas
PDF
Neural networks and deep learning
Introducción al Deep Learning
Conectores de fibra óptica y termoencogible
Diferentes tipos de arduino
Subneteo con vlsm ejercicios clases a,b,c
Calculo radioenlace
6.6 Calculos de radioenlaces
6.5 Tipos mas comunes de antenas
Neural networks and deep learning

La actualidad más candente (20)

DOCX
Tipos de módems, estandares y protocolos
PPTX
Ultra wideband technology (UWB)
PPT
Recorrido de grafos 2da parte
PPTX
Ejercicio de subneteo vlsm y cidr
DOC
1. Clonacion De Equipos InformáTicos
PDF
Proyect cubos led 4x4x4 final
PPTX
PRESENTACIÓN FIBRA ÓPTICA
PPTX
11 comunicaciones opticas
PPTX
Método de transmisión de datos Infrarrojo
PDF
MANUAL DE APUNTAMIENTO DE ANTENA VSAT MARCA GILAT NO MIGRADA AL SATELITE A...
PDF
Large Scale Deep Learning with TensorFlow
PPTX
Grupo 4 metodos de multiplexacion
PPTX
Microprocesador
PPTX
Mesh network ‫‬
PPT
Diseño de Enlaces de Microondas
PDF
Femtocell Technologies By Vipin
PPTX
Control de flujo en Telecomunicaciones
PPTX
Problemas de desempeño en las redes de cómputo
PPT
Capacidad de un canal
Tipos de módems, estandares y protocolos
Ultra wideband technology (UWB)
Recorrido de grafos 2da parte
Ejercicio de subneteo vlsm y cidr
1. Clonacion De Equipos InformáTicos
Proyect cubos led 4x4x4 final
PRESENTACIÓN FIBRA ÓPTICA
11 comunicaciones opticas
Método de transmisión de datos Infrarrojo
MANUAL DE APUNTAMIENTO DE ANTENA VSAT MARCA GILAT NO MIGRADA AL SATELITE A...
Large Scale Deep Learning with TensorFlow
Grupo 4 metodos de multiplexacion
Microprocesador
Mesh network ‫‬
Diseño de Enlaces de Microondas
Femtocell Technologies By Vipin
Control de flujo en Telecomunicaciones
Problemas de desempeño en las redes de cómputo
Capacidad de un canal
Publicidad

Similar a Deep learning: contexto, evolución, aplicaciones (20)

PDF
2.+Deep+Learning.pdf
PPTX
Deep Learning Notes
DOCX
Aprendizaje automático profundo y sus aplicaciones
PDF
2023-TFG2_RedesNeuronalesAplicadas_F1
PPSX
Agente Reconedor de Señales de Transito
PPTX
CIITEC Fundamentos de Deep Learning.pptx
PDF
¿Qué es la inteligencia artificial o IA?
PDF
Tfm ignacio-arriola
PDF
Deep Learning + R by Gabriel Valverde
PDF
Intro a ANNs c/Keras
PPTX
Cómo vivir de la inteligencia artificial
PDF
CEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdf
PPTX
Lo que desarrolladores e IT deberían saber
PDF
Machine learning for business
DOCX
Colaborativo uno
PPTX
Redes neuronales
PDF
2024-T19-Redes_Neuronales_II.pdf
PPTX
Inteligencia Artificial From Zero to Hero
PDF
Que es la inteligencia artificial - articulo
PPTX
Presentacion inteligencia artificial tecnologica futurista azul y violeta.pptx
2.+Deep+Learning.pdf
Deep Learning Notes
Aprendizaje automático profundo y sus aplicaciones
2023-TFG2_RedesNeuronalesAplicadas_F1
Agente Reconedor de Señales de Transito
CIITEC Fundamentos de Deep Learning.pptx
¿Qué es la inteligencia artificial o IA?
Tfm ignacio-arriola
Deep Learning + R by Gabriel Valverde
Intro a ANNs c/Keras
Cómo vivir de la inteligencia artificial
CEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdf
Lo que desarrolladores e IT deberían saber
Machine learning for business
Colaborativo uno
Redes neuronales
2024-T19-Redes_Neuronales_II.pdf
Inteligencia Artificial From Zero to Hero
Que es la inteligencia artificial - articulo
Presentacion inteligencia artificial tecnologica futurista azul y violeta.pptx
Publicidad

Más de Facultad de Informática UCM (20)

PDF
¿Por qué debemos seguir trabajando en álgebra lineal?
PDF
TECNOPOLÍTICA Y ACTIVISMO DE DATOS: EL MAPEO COMO FORMA DE RESILIENCIA ANTE L...
PDF
DRAC: Designing RISC-V-based Accelerators for next generation Computers
PDF
uElectronics ongoing activities at ESA
PDF
Tendencias en el diseño de procesadores con arquitectura Arm
PDF
Formalizing Mathematics in Lean
PDF
Introduction to Quantum Computing and Quantum Service Oriented Computing
PPTX
Computer Design Concepts for Machine Learning
PDF
Inteligencia Artificial en la atención sanitaria del futuro
PDF
Design Automation Approaches for Real-Time Edge Computing for Science Applic...
PDF
Estrategias de navegación para robótica móvil de campo: caso de estudio proye...
PPTX
Fault-tolerance Quantum computation and Quantum Error Correction
PDF
Cómo construir un chatbot inteligente sin morir en el intento
PDF
Automatic generation of hardware memory architectures for HPC
PDF
Type and proof structures for concurrency
PDF
Hardware/software security contracts: Principled foundations for building sec...
PDF
Jose carlossancho slidesLa seguridad en el desarrollo de software implementad...
PDF
Do you trust your artificial intelligence system?
PDF
Redes neuronales y reinforcement learning. Aplicación en energía eólica.
PDF
Challenges and Opportunities for AI and Data analytics in Offshore wind
¿Por qué debemos seguir trabajando en álgebra lineal?
TECNOPOLÍTICA Y ACTIVISMO DE DATOS: EL MAPEO COMO FORMA DE RESILIENCIA ANTE L...
DRAC: Designing RISC-V-based Accelerators for next generation Computers
uElectronics ongoing activities at ESA
Tendencias en el diseño de procesadores con arquitectura Arm
Formalizing Mathematics in Lean
Introduction to Quantum Computing and Quantum Service Oriented Computing
Computer Design Concepts for Machine Learning
Inteligencia Artificial en la atención sanitaria del futuro
Design Automation Approaches for Real-Time Edge Computing for Science Applic...
Estrategias de navegación para robótica móvil de campo: caso de estudio proye...
Fault-tolerance Quantum computation and Quantum Error Correction
Cómo construir un chatbot inteligente sin morir en el intento
Automatic generation of hardware memory architectures for HPC
Type and proof structures for concurrency
Hardware/software security contracts: Principled foundations for building sec...
Jose carlossancho slidesLa seguridad en el desarrollo de software implementad...
Do you trust your artificial intelligence system?
Redes neuronales y reinforcement learning. Aplicación en energía eólica.
Challenges and Opportunities for AI and Data analytics in Offshore wind

Último (20)

PPTX
A8B08CED-D3D9-415C-B4A3-2A6CA6409A48.1.1Presentación Dirección 2022 unidade...
PPTX
Manual ISO9001_2015_IATF_16949_2016.pptx
PPTX
leyes de los gases Ideales. combustible refinación
PPT
357161027-seguridad-industrial-diapositivas-ppt.ppt
PDF
Curso Introductorio de Cristales Liquidos
PPTX
Electronica II, material basico de electronica II
PPTX
TECNOLOGIA EN CONSTRUCCION PUBLICO Y PRIVADA
PDF
Informe Comision Investigadora Final distribución electrica años 2024 y 2025
PPTX
376060032-Diapositivas-de-Ingenieria-ESTRUCTURAL.pptx
PDF
UD3 -Producción, distribución del aire MA.pdf
PDF
silabos de colegio privado para clases tema2
PPTX
CAPACITACIÓN DE USO ADECUADO DE EPP.pptx
PDF
Sugerencias Didacticas 2023_Diseño de Estructuras Metalicas_digital.pdf
PPTX
1 CONTAMINACION AMBIENTAL EN EL PLANETA.pptx
PPTX
DEBL Presentación PG 23.pptx [Autoguardado].pptx
PPTX
MARITIMO Y LESGILACION DEL MACO TRANSPORTE
PDF
ntc5951 Metodo de ensayo para determinar las propiedades de tension en plasti...
PPTX
Riesgo eléctrico 5 REGLAS DE ORO PARA TRABAJOS CON TENSION
PPTX
Curso Corto de PLANTA CONCENTRADORA FREEPORT
PDF
LIBRO UNIVERSITARIO SOFTWARE PARA INGENIERIA BN.pdf
A8B08CED-D3D9-415C-B4A3-2A6CA6409A48.1.1Presentación Dirección 2022 unidade...
Manual ISO9001_2015_IATF_16949_2016.pptx
leyes de los gases Ideales. combustible refinación
357161027-seguridad-industrial-diapositivas-ppt.ppt
Curso Introductorio de Cristales Liquidos
Electronica II, material basico de electronica II
TECNOLOGIA EN CONSTRUCCION PUBLICO Y PRIVADA
Informe Comision Investigadora Final distribución electrica años 2024 y 2025
376060032-Diapositivas-de-Ingenieria-ESTRUCTURAL.pptx
UD3 -Producción, distribución del aire MA.pdf
silabos de colegio privado para clases tema2
CAPACITACIÓN DE USO ADECUADO DE EPP.pptx
Sugerencias Didacticas 2023_Diseño de Estructuras Metalicas_digital.pdf
1 CONTAMINACION AMBIENTAL EN EL PLANETA.pptx
DEBL Presentación PG 23.pptx [Autoguardado].pptx
MARITIMO Y LESGILACION DEL MACO TRANSPORTE
ntc5951 Metodo de ensayo para determinar las propiedades de tension en plasti...
Riesgo eléctrico 5 REGLAS DE ORO PARA TRABAJOS CON TENSION
Curso Corto de PLANTA CONCENTRADORA FREEPORT
LIBRO UNIVERSITARIO SOFTWARE PARA INGENIERIA BN.pdf

Deep learning: contexto, evolución, aplicaciones

  • 1. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Deep Learning: contexto, evolución y aplicaciones
  • 2. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
  • 3. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
  • 4. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
  • 5. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Robots industriales (autómatas) Deep Blue versus Kasparov (1997) ELIZA: 1er Bot Conversacional (1966)
  • 6. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Machine learning – Habilidad de las máquinas de adquirir conocimiento. – ¿Conocimiento? • Modelo que hay que definir (cada modelo tiene un número de parámetros) – ¿De quién o qué aprendo? • Datos en crudo (raw data): bases de datos • Representación de los datos (features) • Objetivos (targets) o salida deseada. – ¿Cómo aprendo? • Algoritmos matemáticos de optimización.
  • 7. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Modelos (metodologías) Logistic regressionBoosting classifier Neural networks Nearest Neighbor SVM
  • 8. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Parámetros
  • 9. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Bases de datos
  • 10. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Representación de los datos: key issue – La eficiencia en la representación de los datos es fundamental para el aprendizaje máquina • 1250 + 750 = 2000 o MCCL + DCCL = MM
  • 11. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Representación de los datos: key issue – No aprendemos datos en crudo → extraemos features
  • 12. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Deep learning – 1º Nueva forma de afrontar el problema de la representación • Se aprenden características relevantes (features) • Se aprenden representaciones complejas a partir de representaciones más simples. – 2º Si agrupamos en un grafo la relación de representaciones en capas conectadas, el grafo es muy profundo (deep) con muchas capas: muchos (pero muchos) parámetros. – 3º Para poder aprender los valores de los muchos (pero muchos) parámetros del modelo se necesitan muchos (muchos, muchos) datos: big data. – 4º Para poder entrenar estos mega modelos con cantidades ingentes de datos se necesita un HW muy (pero muy) potente
  • 13. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) El círculo virtuoso del Deep Learning
  • 14. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) 1998 LeNet 1998 Yann LeCUn The gap 2012 AlexNet Alex Krizhevsky
  • 15. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) ILSVRC – 1000 categorías – 1.2M-14M imágenes de entrenamiento – 150K imágenes de test • 2017: top-5 error 2,25% • Desde 2018 este challenge ya no se hace (se da por resuelto)
  • 16. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Speech recognition – Word Error Rate (%) – Google Assistant < 5% – Microsoft ~ 5% – Human error 2-4%
  • 17. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
  • 18. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Neurona artificial (ADALINE) Ejemplo: 2 dimensiones PERCEPTRON
  • 19. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Entrenamiento – Estimar los parámetros (pesos y offset) a partir de N datos (entradas x y salida deseada d) – Descenso del gradiente: • Función de coste a minimizar: Error • Los pesos se actualizan en un proceso iterativo de forma proporcional a (-) la derivada del Error respecto de los pesos
  • 20. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) El problema de la XOR – Partimos de una red con una sola capa de neuronas: solo se pueden resolver problemas separables linealmente. – Hasta este momento (1969) no se sabe como entrenar redes con más capas. Hasta 1986...
  • 21. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) El problema de la XOR – Backpropagation (1986): método para propagar el error desde las capas de salida hasta la capa de entrada. • Permite crear modelos con capas intermedias. • Añadir capas implica añadir dimensionalidad al problema y capacidad de discriminación del modelo discriminante.
  • 22. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Backpropagation – Aplicación recursiva de la regla de la cadena de la derivada ¡¡ Muy fácil de implementar y de paralelizar (GPUs) !!
  • 23. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Redes Neuronales (Fully Connected FC)
  • 24. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Redes Neuronales CONVOLUCIONALES
  • 25. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Capas CONVOLUCIONALES
  • 26. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Capas CONVOLUCIONALES 1 filtro para cada salida (filters) → pesos La profundidad del filtro depende de la profundidad de la capa de entrada A las salidas se les denominan “features” o “feature map”
  • 27. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Capas CONVOLUCIONALES
  • 28. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Capas CONVOLUCIONALES: parámetros principales – Tamaño del volumen de entrada (anterior): W x W x Cin – Tamaño del filtro (receptive field): FxF • La profundidad es la de la capa de entrada (anterior): Cin • Total: F x F x Cin (pesos de la red!!) – Stride o salto de pixel del filtro sobre el volumen de entrada: S – Padding: puede ser necesario rellenar con ceros el borde del volumen de entrada: P – Tamaño del volumen de salida: • El número de filtros Cout es un parámetro de diseño • El ancho y alto vendrá dado por: (W-F+2P)/S + 1 (debe dar un entero!!)
  • 29. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Capas CONVOLUCIONALES – Ejemplo de filtros (pesos) aprendidos • 96 filtros de 11x11x3 de la primera capa de una red • Los filtros se comparten para todas las neuronas de cada “feature map” del bloque de salida. 96
  • 30. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Capas CONVOLUCIONALES Mismos pesos (“filtro i”), conectados a las neuronas de la “feature i” de la siguiente capa” Entre diferentes features hay diferentes filtros (“filtro j” conectado a las neuronas de la “feature j” de la siguiente capa)
  • 31. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Capas CONVOLUCIONALES W1 W1 Cin Cin F F Cout W2 W2 Capa convolucional: pesos solo conectados a una parte del tensor de entrada (FxFxCin) Pesos diferentes (Cout filtros) Capa “fully connected”: pesos conectados a todo el tensor de entrada (W2xW2xCout)
  • 32. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Capas POOLING
  • 33. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Capas POOLING
  • 34. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
  • 35. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
  • 36. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
  • 37. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
  • 38. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) 14 millones de imágenes 1000 categorías (clasificación) 30 millones de imágenes 15 millones de regiones 600 categorías (clasificación + localización) 330K imágenes; 1.5M objetos; 250K personas con keypoints; Segmentación de objetos+pose
  • 39. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
  • 40. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
  • 41. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) LeNet (1998) The gap AlexNet (2010) VGG (2013) GoogleLeNet - Inception (V1 2014 – V4 2016) ResNet (2015) SqueezeNet (2016); ENet (2016); Xception (2017); MobileNet (2017); DenseNet (2017); ShuffleNet (2017) Reducción del número de parámetros, número de operaciones, mejoras en la arquitectura, etc., manteniendo la precisión
  • 42. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) https://medium.com/@culurciello/analysis-of-deep-neural-networks-dcf398e71aae
  • 43. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) https://medium.com/@culurciello/analysis-of-deep-neural-networks-dcf398e71aae
  • 44. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) https://medium.com/@culurciello/analysis-of-deep-neural-networks-dcf398e71aae
  • 45. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
  • 46. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
  • 47. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es)
  • 48. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Aplicaciones (I) – Síntesis de vídeo y audio – Coloreado de imágenes – Restauración de píxeles (CSI) – Estimación pose de personas
  • 49. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Aplicaciones (II) – Descripción de fotos – Traducción idiomática – Síntesis de imágenes
  • 50. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Aplicaciones (III) – Videojuegos DOOM Atari Breakout Google’s Deep Mind
  • 51. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Aplicaciones (IV) – Vehículos autónomos – Robótica
  • 52. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Aplicaciones (V) – Generación de voz, recomposición de sonidos, composición de música, etc. – Arte
  • 53. INVETT Group at University of Alcalá INVETT – Intelligent Vehicles and Traffic Technologies David Fernández Llorca (david.fernandezl@uah.es) Deep Learning: contexto, evolución y aplicaciones ¡GRACIAS!