SlideShare una empresa de Scribd logo
UNIVERSIDAD POLITECNICA SALESIANA




                                      VISION ARTIFICIAL
                                           Oscar David Sari Villa
                             UNIVERSIDAD POLITÉCNICA SALESIANA
                           Carrera de Ingeniería Electrónica Y Telecomunicaciones
                                             osari@est.ups.edu.ec

                                                              este diagrama se explica desde arriba hacia abajo,
  Resumen—En este documento se presenta un                    en esta se dice que existen tres perfiles de usuario:
informe de las diversas formas de visión artificial,          Básico, intermedio y avanzado [5].
sus diferentes usos y aplicaciones, como por
ejemplo la visión artificial aplicada a la detección
de transeúntes para que de esta manera con poco
personal humano se pueda realizar un trabajo
amplio que originalmente requeriría muchas
personas.

PALABRAS CLAVES: Procesamiento de
imágenes, seguimiento visual, conteo de personas,
detección de flujo vehicular.

I. INTRODUCCIÓN
El proceso general que realizaremos es la de
detectar el movimiento ya sea de personas u otro
objeto mediante el uso de aparatos electrónicos o
software como por ejemplo el Display IMG,
TeamSoftware, Irmotion, Goratech Ireport. De esta
manera facilitaremos el trabajo de las personas ya
estas no tendrán que estar todo el tiempo tras las
cámaras de vigilancia.
                                                              FIG. 1 ESTRUCTURA DEL SOFTWARE
Sea cual sea el mecanismo o software que vayamos
a utilizar debe poseer la capacidad de detectar,
analizar e informar sobre cualquier evento que                III. ESTRUCTURA DEL CAMPO VISUAL
suceda en área determinada [1] [2] [3].                       Esto hace referencia a la imagen plana que refleja
Los sistemas de visión artificial deben tener la gran         una escena generalmente tridimensional, para esto
capacidad de detectar objetos tal y cual como lo              se han usado sensores foveales los cuales presentan
hacen los seres humanos, mediante la detección de             un perfil de resolución variable a lo largo del campo
objetos estos deben tomar decisiones pero esto ya se          de visión. Al realizar esto permite que la percepción
vincula con la inteligencia artificial que en este caso       y al ambiente visual en el que estamos trabajando
                                                              sean coordinados y que se dé una mejor interacción,
no hablares mucho de ello [4].
                                                              gracias a esto podremos recibir las imágenes más
II. ESTRUCTURA DEL SOFTWARE                                   detalladas pero sin perder de vista el campo visual
                                                              en que estamos [6].
En la siguiente figura (Fig. 1) se indica la estructura
implementada en el software de visión artificial,


                                                          1
UNIVERSIDAD POLITECNICA SALESIANA


De la misma manera podemos aplicar esto para               También presentamos una propuesta para el
detectar el densidad de peatonal en tiempo real, de        reconocimiento invariante de objetos que está
esta manera podremos detectar aumenta densidad de          basada en el uso de formas cónicas dentro de la base
personas en ciertas horas del día y sin la necesidad       más simple de conocimiento, esto se puede
de que alguna persona este sentado todo el día             representar mediante un vector que se llama
enfrente de una cámara de vigilancia para realizar         [CDF&POSE] [9].
todo esto se presenta el siguiente diagrama de
bloque detallando cada una de las etapas [8]:              Generación del vector descriptivo [CDF&POSE]:

                                                           Cuando la información ya ha sido procesada se
                                                           conforma el vector descriptivo que en realidad es la
                                                           entrada a la red neuronal.




                                                           Di es la distancia al centro del perímetro.
                                                           Xc, Yc, son las coordenadas del centroide.
                                                           Φ es el ángulo de orientación.
                                                           Z es la altura del objeto.
                                                           ID es un numero codificado relacionado a la
                                                           geometría de los componentes [9].

                                                              1. Detección de movimiento invariante a la luz:




IV. DETECCION           DE      OBJETOS         EN
MIVIMIENTO
Cunado un objeto está en movimiento estos
producen cambios de intensidad debido a los
reflejos producidos por la luz, eso significa que si
analizamos dos imágenes sucesivamente esto
producirán cambios de intensidad tanto en objetos
móviles como estáticos [8][9].


                                                       2
UNIVERSIDAD POLITECNICA SALESIANA




   3. Clasificación



                                                           VI. IMPLEMENTACION Y RESULTADOS

                                                           Para la implementación de la visión artificial se
                                                           utilizó una PC con un procesador Intel Pentium IV
                                                           de 2.8 GHz y 512 MB de memoria RAM en un
                                                           sistema operativo de Windows XP. La aplicación se
                                                           la realizo en la plataforma de LabVIEW 8.0 de
V. EXTRACCION DE CARACTERISITICAS                          National Instruments.
Y CLASIFICACION                                            La siguiente imagen se la capto con una cámara
                                                           Web convencional o sea común y corriente la
                                                           cámara estaba a 3.5m del suelo en una posición
Descriptores de Fourier
                                                           acimutal, captando una área de 9 metros cuadrados
                                                           [8].
Mediante esta descripción se trata de extraer
imágenes a partir de imágenes bizarras utilizando
un análisis de conectividad, para esto primero se
utilizan detectores de bordes. Los descriptores de
Fourier se caracterizan por ser invariantes a
transformación es geométricas y tolerantes al ruido
[10]. Cuando se trata de una superficie cerrada la
serie de Fourier se la puede representar con una
adecuada parametrizacion

z(k) = [Xk,Yk], k=1.2……N              (1)
z(k) = Xk + jYk                       (2)

la transformada discreta de Fourier de a(n)=z(k) es:
                                                           Se realizaron varias pruebas para una mejor
                                                           verificación de resultados con diferentes
                                                           velocidades de muestreo 7.5, 15, 30 pies, pero
                                                           lastimosamente no se pudo hacer pruebas en tiempo

                                                       3
UNIVERSIDAD POLITECNICA SALESIANA


                                                                 Arrebola, F., Urdiales, C., Camacho, P. y
                                                            Sandoval, F.,
                                                            (1998) “Vision system based on shifted fovea
real debido al software que se utilizó. Para la


                                                            multirresolution retinotopologies”, Proc. of the
distancia de 15 y 30 pies se obtuvieron resultados
estadísticamente equivalentes por lo daba igual los

                                                            25th
datos a 15 pies que los datos a 30 pies.

                                                            Annual Conf. IEEE Ind. Electronics Soc., , pp.
Las pruebas se realizaron en ambientes estáticos en

                                                            1357-
donde no haya más movimiento que la que produce

                                                            1361, Aachen-Alemania.
el objeto que estamos analizando, esto es un gran

                                                               A. Bandera, C. Urdiales, J.L. Herreros y F.
problema ya que en un ambiente real van a existir

                                                            Sandoval
muchos objetos en movimiento y tratar de analizar

                                                            Dpto.     Tecnología      Electrónica,    E.T.S.I.
uno en específico nos resultara muy difícil [8].

                                                            Telecomunicación
                                                                   Universidad de Málaga, Campus de
VII. CONCLUCIONES

                                                                   Teatinos, 29071 Málaga, España
                                                                Scientia et Technica Año XIII, No 35, Agosto
Con toda la información que presentamos

                                                            de 2007. Universidad Tecnológica de Pereira.
anteriormente tratamos de demostrar la importancia

                                                            ISSN 0122-1701
que tiene la visión artificial que es una parte que
abarca la inteligencia artificial, pero de igual

                                                               Mario Peña Cabrera1, Ismael López Juárez2,
manera no deja de ser importante ya que gracias a

                                                            H. Gómez N1., R. Osorio C.1, Oleg Sergiyenko3
la visión artificial podemos crear mecanismos que

                                                            1 Instituto de Investigaciones en Matemáticas
realicen trabajo no por el simple hecho de recibir

                                                            Aplicadas y en Sistemas (IIMAS-UNAM)
órdenes si no que son capaces de visualizar su

                                                            Circuito Escolar, Cd. Universitaria, D.F. CP
objetivo, tomar decisiones y ejecutarlas.

                                                            4100,México.
En este artículo también se trata de explicar un poco

                                                            mario@leibniz.iimas.unam.mx
más sobre los proyectos que involucran la visión

                                                            2 CINVESTAV, Saltillo , Coahuila, México.
artificial, como por ejemplo aplicada en la detección

                                                            3 Engineering Institute, Autonomous University
de peatones.

                                                            of Baja California, Mexicali, Baja California,
Pero todo esto solo es un trabajo de investigación ya

                                                            México.
que todo lo realizado es simplemente una


                                                                E. G, V. F. Batlle. A. A: Oliver y L. S.
recopilación de información o experimentos que ya


                                                            “Descriptores de Fourier para identificacin y
fueron realizados.


                                                            posicionamiento de objetos en entornos 3D”. In
      Hughett. P, ”A programable command
                                                            Proc. 2004 XXV Jornadas de Automatica Cuidad
VIII. REFERENCIAS

interpreter to automate image
                                                            Real. España, pp 8-10.
processing of infrared thermography”,SPIE Vol
1467, Thermosense XIII,1991.
     Ballard, D. y Brown, C. (1982) Computer
Vision, Prentice
      Hughett. P, ”A programmable command
interpreter to automate image
processing of infrared thermography”,SPIE Vol
1467, Thermosense
XIII,1991.
     Tombropolous,R.Z., J.R. Adler et al. (1999),
»Carabeamer : A treatment planner for a robotic
radiosirurgical system with general kinematics »,
Medical Image Analysis 3(3) : 237,264.
     Hern´an Ben´ıtez,Humberto Loaiza,Bladimir
Vacca,Javier Acevedo
                                                        4

Más contenido relacionado

DOCX
Proyecto. vision artificial
PPTX
Vision artificial
PDF
PPTX
Visión artificial
PDF
Visión artificial
PDF
Realidad Artificial
PPT
Tema vision artificial
PDF
Visión artificial
Proyecto. vision artificial
Vision artificial
Visión artificial
Visión artificial
Realidad Artificial
Tema vision artificial
Visión artificial

Destacado (20)

PDF
Edital ancine 2012
ODP
O trânsito, a família e a escola
PDF
Restricciones cataluña 2014
PDF
Institutogamaliel.com perdição e salvação estão atreladas aos caminhos e não ...
PDF
Jn 23 04
DOCX
"SAN ALEJO, CAPSULA EN EL TIEMPO BOGOTANA" POR LUISA FERNANDA LOPEZ NIVIA RUB...
PPT
Gomes da Costa - Cruzeiro
DOCX
16052012
PDF
Proposta de governo sýýo bento do trairi 2013
PPTX
Anagrama
PPTX
Ana lucia urrea
PDF
O novo testamento é historicamente confiável
PDF
Institutogamaliel.com curso de pastor
PPTX
Eng. alimentos
ODP
Presentación1 nadal
PPTX
Set of slides 1 - Ourilândia
PDF
DOCX
Vocabulario rete fuente
DOCX
Simulado 14_Direito Previdenciário
PDF
Lista trabalho e energia
Edital ancine 2012
O trânsito, a família e a escola
Restricciones cataluña 2014
Institutogamaliel.com perdição e salvação estão atreladas aos caminhos e não ...
Jn 23 04
"SAN ALEJO, CAPSULA EN EL TIEMPO BOGOTANA" POR LUISA FERNANDA LOPEZ NIVIA RUB...
Gomes da Costa - Cruzeiro
16052012
Proposta de governo sýýo bento do trairi 2013
Anagrama
Ana lucia urrea
O novo testamento é historicamente confiável
Institutogamaliel.com curso de pastor
Eng. alimentos
Presentación1 nadal
Set of slides 1 - Ourilândia
Vocabulario rete fuente
Simulado 14_Direito Previdenciário
Lista trabalho e energia
Publicidad

Similar a Vision artificial (20)

DOC
MRU ASISTIDO POR PC - FENCYT 2004 - PROF. RONALD ESTELA
PPTX
Escuchando al astro Rey
PDF
ESCÁNER 3D, UNA NUEVA FORMA TECNOLÓGICA PARA FIJAR Y RECREAR LA ESCENA DEL DE...
PDF
PDF
Arquitectura rv
PDF
Inteligencia Artificial en los Robots Detección de Obstáculos
PDF
Rastreador ocular (Uea 2016)
PPT
Desarrollo De Un Guante Háptico 12 02 10
PPTX
Sistemas de Realidad Virtual
PDF
U8 realidad virtual
DOCX
Universidad nacional del altiplano sistemas dig
DOCX
Practica 7
PPTX
Tecnologías de la información y comunicación creadas en el año 2013
PPTX
Tecnologías de la información y comunicación creadas en el año 2013
DOCX
Practia 7 word andres mendez
PDF
Radiología Digital en Odontología
DOCX
C:\fakepath\realidad virtual
DOCX
C:\fakepath\realidad virtual
DOCX
C:\fakepath\realidad virtual
PDF
Teleoperación Háptica de Brazo Manipulador
MRU ASISTIDO POR PC - FENCYT 2004 - PROF. RONALD ESTELA
Escuchando al astro Rey
ESCÁNER 3D, UNA NUEVA FORMA TECNOLÓGICA PARA FIJAR Y RECREAR LA ESCENA DEL DE...
Arquitectura rv
Inteligencia Artificial en los Robots Detección de Obstáculos
Rastreador ocular (Uea 2016)
Desarrollo De Un Guante Háptico 12 02 10
Sistemas de Realidad Virtual
U8 realidad virtual
Universidad nacional del altiplano sistemas dig
Practica 7
Tecnologías de la información y comunicación creadas en el año 2013
Tecnologías de la información y comunicación creadas en el año 2013
Practia 7 word andres mendez
Radiología Digital en Odontología
C:\fakepath\realidad virtual
C:\fakepath\realidad virtual
C:\fakepath\realidad virtual
Teleoperación Háptica de Brazo Manipulador
Publicidad

Vision artificial

  • 1. UNIVERSIDAD POLITECNICA SALESIANA VISION ARTIFICIAL Oscar David Sari Villa UNIVERSIDAD POLITÉCNICA SALESIANA Carrera de Ingeniería Electrónica Y Telecomunicaciones osari@est.ups.edu.ec este diagrama se explica desde arriba hacia abajo, Resumen—En este documento se presenta un en esta se dice que existen tres perfiles de usuario: informe de las diversas formas de visión artificial, Básico, intermedio y avanzado [5]. sus diferentes usos y aplicaciones, como por ejemplo la visión artificial aplicada a la detección de transeúntes para que de esta manera con poco personal humano se pueda realizar un trabajo amplio que originalmente requeriría muchas personas. PALABRAS CLAVES: Procesamiento de imágenes, seguimiento visual, conteo de personas, detección de flujo vehicular. I. INTRODUCCIÓN El proceso general que realizaremos es la de detectar el movimiento ya sea de personas u otro objeto mediante el uso de aparatos electrónicos o software como por ejemplo el Display IMG, TeamSoftware, Irmotion, Goratech Ireport. De esta manera facilitaremos el trabajo de las personas ya estas no tendrán que estar todo el tiempo tras las cámaras de vigilancia. FIG. 1 ESTRUCTURA DEL SOFTWARE Sea cual sea el mecanismo o software que vayamos a utilizar debe poseer la capacidad de detectar, analizar e informar sobre cualquier evento que III. ESTRUCTURA DEL CAMPO VISUAL suceda en área determinada [1] [2] [3]. Esto hace referencia a la imagen plana que refleja Los sistemas de visión artificial deben tener la gran una escena generalmente tridimensional, para esto capacidad de detectar objetos tal y cual como lo se han usado sensores foveales los cuales presentan hacen los seres humanos, mediante la detección de un perfil de resolución variable a lo largo del campo objetos estos deben tomar decisiones pero esto ya se de visión. Al realizar esto permite que la percepción vincula con la inteligencia artificial que en este caso y al ambiente visual en el que estamos trabajando sean coordinados y que se dé una mejor interacción, no hablares mucho de ello [4]. gracias a esto podremos recibir las imágenes más II. ESTRUCTURA DEL SOFTWARE detalladas pero sin perder de vista el campo visual en que estamos [6]. En la siguiente figura (Fig. 1) se indica la estructura implementada en el software de visión artificial, 1
  • 2. UNIVERSIDAD POLITECNICA SALESIANA De la misma manera podemos aplicar esto para También presentamos una propuesta para el detectar el densidad de peatonal en tiempo real, de reconocimiento invariante de objetos que está esta manera podremos detectar aumenta densidad de basada en el uso de formas cónicas dentro de la base personas en ciertas horas del día y sin la necesidad más simple de conocimiento, esto se puede de que alguna persona este sentado todo el día representar mediante un vector que se llama enfrente de una cámara de vigilancia para realizar [CDF&POSE] [9]. todo esto se presenta el siguiente diagrama de bloque detallando cada una de las etapas [8]: Generación del vector descriptivo [CDF&POSE]: Cuando la información ya ha sido procesada se conforma el vector descriptivo que en realidad es la entrada a la red neuronal. Di es la distancia al centro del perímetro. Xc, Yc, son las coordenadas del centroide. Φ es el ángulo de orientación. Z es la altura del objeto. ID es un numero codificado relacionado a la geometría de los componentes [9]. 1. Detección de movimiento invariante a la luz: IV. DETECCION DE OBJETOS EN MIVIMIENTO Cunado un objeto está en movimiento estos producen cambios de intensidad debido a los reflejos producidos por la luz, eso significa que si analizamos dos imágenes sucesivamente esto producirán cambios de intensidad tanto en objetos móviles como estáticos [8][9]. 2
  • 3. UNIVERSIDAD POLITECNICA SALESIANA 3. Clasificación VI. IMPLEMENTACION Y RESULTADOS Para la implementación de la visión artificial se utilizó una PC con un procesador Intel Pentium IV de 2.8 GHz y 512 MB de memoria RAM en un sistema operativo de Windows XP. La aplicación se la realizo en la plataforma de LabVIEW 8.0 de V. EXTRACCION DE CARACTERISITICAS National Instruments. Y CLASIFICACION La siguiente imagen se la capto con una cámara Web convencional o sea común y corriente la cámara estaba a 3.5m del suelo en una posición Descriptores de Fourier acimutal, captando una área de 9 metros cuadrados [8]. Mediante esta descripción se trata de extraer imágenes a partir de imágenes bizarras utilizando un análisis de conectividad, para esto primero se utilizan detectores de bordes. Los descriptores de Fourier se caracterizan por ser invariantes a transformación es geométricas y tolerantes al ruido [10]. Cuando se trata de una superficie cerrada la serie de Fourier se la puede representar con una adecuada parametrizacion z(k) = [Xk,Yk], k=1.2……N (1) z(k) = Xk + jYk (2) la transformada discreta de Fourier de a(n)=z(k) es: Se realizaron varias pruebas para una mejor verificación de resultados con diferentes velocidades de muestreo 7.5, 15, 30 pies, pero lastimosamente no se pudo hacer pruebas en tiempo 3
  • 4. UNIVERSIDAD POLITECNICA SALESIANA Arrebola, F., Urdiales, C., Camacho, P. y Sandoval, F., (1998) “Vision system based on shifted fovea real debido al software que se utilizó. Para la multirresolution retinotopologies”, Proc. of the distancia de 15 y 30 pies se obtuvieron resultados estadísticamente equivalentes por lo daba igual los 25th datos a 15 pies que los datos a 30 pies. Annual Conf. IEEE Ind. Electronics Soc., , pp. Las pruebas se realizaron en ambientes estáticos en 1357- donde no haya más movimiento que la que produce 1361, Aachen-Alemania. el objeto que estamos analizando, esto es un gran A. Bandera, C. Urdiales, J.L. Herreros y F. problema ya que en un ambiente real van a existir Sandoval muchos objetos en movimiento y tratar de analizar Dpto. Tecnología Electrónica, E.T.S.I. uno en específico nos resultara muy difícil [8]. Telecomunicación Universidad de Málaga, Campus de VII. CONCLUCIONES Teatinos, 29071 Málaga, España Scientia et Technica Año XIII, No 35, Agosto Con toda la información que presentamos de 2007. Universidad Tecnológica de Pereira. anteriormente tratamos de demostrar la importancia ISSN 0122-1701 que tiene la visión artificial que es una parte que abarca la inteligencia artificial, pero de igual Mario Peña Cabrera1, Ismael López Juárez2, manera no deja de ser importante ya que gracias a H. Gómez N1., R. Osorio C.1, Oleg Sergiyenko3 la visión artificial podemos crear mecanismos que 1 Instituto de Investigaciones en Matemáticas realicen trabajo no por el simple hecho de recibir Aplicadas y en Sistemas (IIMAS-UNAM) órdenes si no que son capaces de visualizar su Circuito Escolar, Cd. Universitaria, D.F. CP objetivo, tomar decisiones y ejecutarlas. 4100,México. En este artículo también se trata de explicar un poco mario@leibniz.iimas.unam.mx más sobre los proyectos que involucran la visión 2 CINVESTAV, Saltillo , Coahuila, México. artificial, como por ejemplo aplicada en la detección 3 Engineering Institute, Autonomous University de peatones. of Baja California, Mexicali, Baja California, Pero todo esto solo es un trabajo de investigación ya México. que todo lo realizado es simplemente una E. G, V. F. Batlle. A. A: Oliver y L. S. recopilación de información o experimentos que ya “Descriptores de Fourier para identificacin y fueron realizados. posicionamiento de objetos en entornos 3D”. In Hughett. P, ”A programable command Proc. 2004 XXV Jornadas de Automatica Cuidad VIII. REFERENCIAS interpreter to automate image Real. España, pp 8-10. processing of infrared thermography”,SPIE Vol 1467, Thermosense XIII,1991. Ballard, D. y Brown, C. (1982) Computer Vision, Prentice Hughett. P, ”A programmable command interpreter to automate image processing of infrared thermography”,SPIE Vol 1467, Thermosense XIII,1991. Tombropolous,R.Z., J.R. Adler et al. (1999), »Carabeamer : A treatment planner for a robotic radiosirurgical system with general kinematics », Medical Image Analysis 3(3) : 237,264. Hern´an Ben´ıtez,Humberto Loaiza,Bladimir Vacca,Javier Acevedo 4