SlideShare una empresa de Scribd logo
Introducción a las Tecnologías del
Procesamiento de laVoz y sus
Aplicaciones
Ing. Martín Propato
https://www.linkedin.com/in/martinpropato/
+54 911 5524 2237
Luis Martín Propato
 Nacido en Buenos Aires Argentina en 1963.
 Graduado con Honor en Ingeniería Electrónica
en la Universidad de Buenos Aires – 1988
 Masters In Electronics realizado en Philips
International Institute, Eindhoven, The
Netherlands – 1990
 MBA realizado en Purdue University, USA – 2001
 Trabajando en la industria de las Telco desde 1987
erbio
Temario
 Definiciones y breve historia
 Reconocimiento de laVoz
◦ Modelo determinista
◦ Modelo basado en IA
 Aplicaciones
◦ Transcriptores
 Speech Analytics
◦ Text to Speech
◦ Voice Bots
◦ Biometría
 (Se incluye un Glosario de Términos)
Breve Historia
 ASR:Automatic Speech Recognition (Reconocimiento
automático de laVoz)
 TTS:Text To Speech (Síntesis o Texto aVoz)
•Primeros desarrollos desde
1952 en los Laboratorios Bell
•1961 IBM “caja de zapatos”
Aplicaciones en Atención a Clientes
 Dos objetivos
◦ Reducción de costos
operativos
◦ Mejora en la calidad de
atención
ASR:Automatic Speech Recognition –
Tipos
 Modelo Determinista
◦ Basado en Gramáticas
◦ Alta confiabilidad
◦ “word spotting”
 Modelo basado en “redes neuronales”
◦ Más utilizado para Transcripciones (STT)
◦ NLP - CSR
ASR - Sensores
 Biométrico
 De género
 De edad
 Emociones
Aplicaciones de ASR Determinista
 Asistencia de Directorio
 Detección de palabras clave
 Alta precisión
 Bajos requerimientos computacionales
 Baja escalabilidad
◦ Diferente idioma, se hace todo el trabajo
nuevamente
Ejemplo de Entrenamiento de ASR
 https://lnkd.in/dJGgMPR
 Mozilla está recopilando el corpus para
entrenar un ASR open-source en
castellano.
 Hay que dictar 5 frases que proponen en
la web.
Aplicaciones de Transcriptores
 Reemplazo del menú de IVR tradicional
por una pregunta abierta
 Subtitulados
 Análisis de Grabaciones
◦ “Diarización”
 Aplicaciones enVoice-Bots
Voice Bots
 Interactuar naturalmente con máquinas
◦ Tecnología de Transcripción
◦ IA para el procesamiento de la “intención”
◦ TTS para la escucha de la respuesta.
◦ Manejo de contextos en la interacción
◦ Gran base de conocimientos
TTS o “Text To Speech”
 Estándares
◦ Ejemplo en español (de España)
◦ Ejemplo de TTS con acento latino: https://text-to-
speech-demo.ng.bluemix.net
 A medida:“Voz Corporativa”
◦ Corpus base
◦ Corpus específico
◦ Selección del Locutor
◦ Creación de la voz a medida.
Ejemplos deVoice Bots
 Asistentes (altavoces):
◦ Alexa de Amazon
◦ Google Assistant
◦ Proveen una sola respuesta a una pregunta.
◦ Basado en un “cerebro” de dos componentes
 NLP
 Base de conocimientos
 Cortana puede dar dos respuestas competitivas (diferentes perspectivas)
 Motor de búsqueda ->Web “conversacional”
 Ejemplos:
https://www.youtube.com/watch?v=vmINGWsyWX0
Tecnologías de Inteligencia Artificial
 Machine Learning es un campo de la Inteligencia Artificial cuyo objetivo es que
las computadoras puedan “aprender” a partir de la experiencia.
◦ Basados en redes neuronales artificiales
◦ Deben ser entrenados a partir de ejemplos conocidos
◦ Ejemplo: En el reconocimiento de imágenes se extraen bordes que, combinados,
permiten detectar contornos, que a su vez permiten reconocer diferentes partes del
objeto, para finalmente determinar su identidad
◦ El sistema puede generalizar el funcionamiento a casos no vistos previamente y de
manera automática, sin necesidad de reglas predefinidas.
◦ Durante el aprendizaje se mide la diferencia entre la respuesta deseada y la
proporcionada por la red y ésta ajusta sus parámetros de manera que esa diferencia
sea cada vez menor
Redes Neuronales Profundas
NLU
NLU: Natural Language Understanding.
Objetivo: es la obtención de:
 La Intención
 La Entidad
 Los Campos, y
 El Contexto
Para poder realizar una Acción o dar una
Respuesta
●Intención: Reservar una habitación
●Acción: si se puede, hacer una reserva
●Entidad: Hotel Palacio
●Campos:
○Fecha de Check-in: mañana
○Fecha de Check-out: Domingo
○Ubicación: Berlín
●Contexto: El usuario dijo mañana, entonces el
contexto es la fecha de hoy
“Necesito reservar una habitación en el Hotel Palacio desde mañana hasta el domingo en
Berlín”
Ejemplo: Reserva de habitación en hotel
Análisis de la interacción:
● Intención: Saber el año de construcción
● Acción: Responder el año de construcción.
● Entidad: de lo que se trata la interacción
● Campos: No hay campos.
● Contexto: El usuario se refiere a lo que se viene preguntando
en la interacción el BOT debe recordar que es el Hotel Palacio
en Berlín.
Análisis del Contexto
Pregunta del Usuario: en que año fué construido el hotel?
Animal
Canino Felino
Perro ... Gato ...
Comparacion
Basada en Ontologías
●Dominio:Animal
●Entidades:Animal, Canino, Felino,
Perro, Gato,...
●Relaciones: Las comparaciones.
●Atributos: Número de patas, etc-
Base de Conocimientos
Animal
Canino Felino
Perro ... Gato ...
compare
“Cual es la diferencia entre un canino y un felino?”
● Intención: Comparar dos entidades
● Entidades: Canino y Felino
● Campos:
○ Primera entidad: Canino
○ Segunda entidad: Felino
● Contexto: No se necesita
● Respuesta: Buscar la respuesta para la relación ontológica
(canino – felino)
Base de Conocimientos ampliada..
Un Chatbot “cognitivo” utiliza ontologías
para ampliar su base de respuestas
Animal
Canino Felino
Perro ... Gato ...
compare
Si se pregunta:
“cual es la diferencia entre un perro y un gato?”
● Caso 1: Que la relación de comparación entre perro y gato existe
en la ontología: entonces el bot usa esta relación como respuesta
● Caso 2: Si la relación de comparación no existe en la ontología,
podemos responder con la relación superior.
● Caso 3: Si no hay una relación superior se puede responder acerca
de que son “dos tipos de animales” y dar sus características.
Aplicaciones de Chat-Bots
 Atención a Clientes
 Soporte a Agentes
Aplicaciones deVoice-Bots
 Reemplazo de IVR
◦ Asistente de configuración de móvil, etc
 Agente virtual
 Asistente virtual
◦ https://www.youtube.com/watch?v=ogfYd705
cRs&feature=youtu.be&t=35m4s
Diagrama en Bloques de unVB
CSR / NLP NLU
Base de
Conocimientos
Task
Manager
TTS
“Quisiera reservar una
habitación……”
Análisis de intención y
extracción de datos.
Contexto, etc..
Biometría deVoz
 La biometría permite verificar la
identidad de los usuarios en el flujo
normal de la comunicación
 Verificar es diferente a Identificar (ASR)
 EER < 1%
 Segundo (y tercer) factor de seguridad
Ajuste de un sistema Biométrico
Ajuste de un sistema biométrico
 Armado de huella vocal
◦ Por repetición de una frase “explicito”
◦ Por detección silenciosa en interacciones
“implícito”
 Ajuste de los canales acústicos
◦ Teléfono Fijo
◦ Móvil
◦ App
Verificación
 Se compara el audio de verificación con la
huella
 Opciones
◦ Verificado, se sigue la operatoria
◦ NoVerificado:
 Pedir otro intento
 Transferencia a operador
Controles anti-fraude
 Segundo (y tercer método de
verificación)
◦ Para eliminar grabaciones
◦ Alteraciones momentáneas de la voz
 Ataques de intimidación
 Desafío dinámico (cadenas de dígitos
aleatorios)
Demo local
 5222-0805
 Usuarios: 102, 103, 104, 105
(identificación)
 Entrenamiento con 4 muestras
 Verificación
Aplicaciones de la Biometría
 Prueba deVida de Jubilados
 Autenticación Bancaria
◦ En reemplazo de claves secretas
 Sistemas de control de Asistencia
 Sistemas de votación electrónica
 Prueba pericial en juicios.
Información de Contacto
 martin.propato@alumni.purdue.edu
 (Movil / whatsapp) +54 11 5524 2237
 Skype: mpropato
 https://www.linkedin.com/in/martinpropato/
Glosario
 ASR: Automatic Speech Recognition (Reconocimiento automático de la Voz)
 TTS: Text To Speech (Síntesis o Texto a Voz)
 Transcripción: procesamiento de un audio que tiene como resultado la transcripción del mismo
 IVR: Interactive Voice Response. Máquina conectada a una red de comunicaciones que permite la interacción con
programas y datos, utilizando los dígitos telefónicos, y/o comandos por voz y respuestas pregrabadas o TTS.
 Speech Analytics: Sistema automático para el procesamiento de grabaciones para detectar patrones, palabras, frases,
emociones, y cumplimiento de normativas de calidad
 Voice Bots: Chat Bot con interface vocal (Transcripción y TTS)
 NLU: Natural Language Understanding; detecta la intención en una frase.
 NLP: Natural Language Processing; método de transcripción de un audio a texto.
 CSR: Continuous Speech Processing: otra manera de decir transcripción de audio.
 SST: Speech to Text: transcripción de audio.
 IA – Inteligencia Artificial: Es cuando una máquina imita las funciones «cognitivas» de los humanos como por ejemplo:
«aprender» y «resolver problemas»
 EER: Equal Error Rate: tasa de igual aceptación de falsos positivos y rechazo de falsos negativos en un sistema de
biometría
 FAR: False Accept Rate, tasa de aceptación de falsos positivos
 FRR: False Reject Rate: tasa de rechazo de falsos negativos

Más contenido relacionado

PPTX
El plagio: Qué es y cómo se evita.
PPTX
Voip2day Verbio 201511
PDF
Tendencias y aplicaciones prácticas sobre tecnologías del habla - Pablo Gil |...
PPTX
Inteligencia Artificial en la Educación Superior 2023-0.1.pptx
PPTX
dsdsdsdsdsdsdsdsdsdsdsdsdsdsdsdsiae.pptx
PPTX
Reconocimiento de voz y procesamiento de lenguaje natural
PDF
Inteligencia Artificial y Chat GPT para mortales (1).pdf
El plagio: Qué es y cómo se evita.
Voip2day Verbio 201511
Tendencias y aplicaciones prácticas sobre tecnologías del habla - Pablo Gil |...
Inteligencia Artificial en la Educación Superior 2023-0.1.pptx
dsdsdsdsdsdsdsdsdsdsdsdsdsdsdsdsiae.pptx
Reconocimiento de voz y procesamiento de lenguaje natural
Inteligencia Artificial y Chat GPT para mortales (1).pdf

Similar a Voice Processing Technologies (20)

PPTX
Inteligencia artificial rosaury rivera
PPTX
Office con IA, una buena introduccion.pptx
PDF
Sesión 20 pdf de inteligencia artificial
PPTX
Unidad 3 | Inteligencia Artificial Generativa
PPTX
760 Chatbots o Asistentes virtuales
PPTX
ASISTENTE DE VOZ 1.pptx
PDF
InteligenciaArtificial_Educacion.pdf
PPTX
Modulo_II - DIAPOSITIVAS, INTELIGENCIA ARTIFICIAL
PPTX
Inteligencia____Artificial___Apps__.pptx
PPTX
IA para el conseptos deszxarrrolo .pptx
PPTX
Chatbots y la revolución de la interacción hombre-máquina en la era de la int...
PDF
CLASE 3 CHATBOTS INTRODUCCION A WATSON ASSISTANT
PPTX
Tecnologías emergentes y datos abiertos: procesamiento del lenguaje natural
PDF
El Poder de la Inteligencia Artificial Ccesa007.pdf
PPTX
CHATGPT.pptx
PPTX
Recuperación de información para solicitantes de empleo
PDF
TRABAJO DE INVESTIGACION DE LA INTELIGENCÍA ARTIFICIAL
PPTX
inteligencia artificial383993760-PPT-pptx.pptx
PPTX
PRESENTACIÓN-Inteligencia-artificial.pptx
PPT
Tecnologias del habla_reconocimiento
Inteligencia artificial rosaury rivera
Office con IA, una buena introduccion.pptx
Sesión 20 pdf de inteligencia artificial
Unidad 3 | Inteligencia Artificial Generativa
760 Chatbots o Asistentes virtuales
ASISTENTE DE VOZ 1.pptx
InteligenciaArtificial_Educacion.pdf
Modulo_II - DIAPOSITIVAS, INTELIGENCIA ARTIFICIAL
Inteligencia____Artificial___Apps__.pptx
IA para el conseptos deszxarrrolo .pptx
Chatbots y la revolución de la interacción hombre-máquina en la era de la int...
CLASE 3 CHATBOTS INTRODUCCION A WATSON ASSISTANT
Tecnologías emergentes y datos abiertos: procesamiento del lenguaje natural
El Poder de la Inteligencia Artificial Ccesa007.pdf
CHATGPT.pptx
Recuperación de información para solicitantes de empleo
TRABAJO DE INVESTIGACION DE LA INTELIGENCÍA ARTIFICIAL
inteligencia artificial383993760-PPT-pptx.pptx
PRESENTACIÓN-Inteligencia-artificial.pptx
Tecnologias del habla_reconocimiento
Publicidad

Último (20)

PPTX
la-historia-de-la-medicina Edna Silva.pptx
PDF
informe_fichas1y2_corregido.docx (2) (1).pdf
PPTX
Presentación de Redes de Datos modelo osi
PDF
Instrucciones simples, respuestas poderosas. La fórmula del prompt perfecto.
DOCX
Zarate Quispe Alex aldayir aplicaciones de internet .docx
PDF
TRABAJO DE TECNOLOGIA.pdf...........................
PPTX
Acronis Cyber Protect Cloud para Ciber Proteccion y Ciber Seguridad LATAM - A...
PPTX
historia_web de la creacion de un navegador_presentacion.pptx
PPTX
ANCASH-CRITERIOS DE EVALUACIÓN-FORMA-10-10 (2).pptx
PDF
PRESENTACIÓN GENERAL MIPIG - MODELO INTEGRADO DE PLANEACIÓN
PPTX
COMO AYUDAN LAS TIC EN LA EDUCACION SUPERIOR.pptx
PPTX
modulo seguimiento 1 para iniciantes del
PPTX
Propuesta BKP servidores con Acronis1.pptx
PDF
Estrategia de Apoyo de Daylin Castaño (5).pdf
PPTX
Presentacion de Alba Curso Auditores Internos ISO 19011
PPTX
Presentación PASANTIAS AuditorioOO..pptx
PDF
Tips de Seguridad para evitar clonar sus claves del portal bancario.pdf
DOCX
Guía 5. Test de orientación Vocacional 2.docx
PPTX
Curso de generación de energía mediante sistemas solares
PDF
capacitación de aire acondicionado Bgh r 410
la-historia-de-la-medicina Edna Silva.pptx
informe_fichas1y2_corregido.docx (2) (1).pdf
Presentación de Redes de Datos modelo osi
Instrucciones simples, respuestas poderosas. La fórmula del prompt perfecto.
Zarate Quispe Alex aldayir aplicaciones de internet .docx
TRABAJO DE TECNOLOGIA.pdf...........................
Acronis Cyber Protect Cloud para Ciber Proteccion y Ciber Seguridad LATAM - A...
historia_web de la creacion de un navegador_presentacion.pptx
ANCASH-CRITERIOS DE EVALUACIÓN-FORMA-10-10 (2).pptx
PRESENTACIÓN GENERAL MIPIG - MODELO INTEGRADO DE PLANEACIÓN
COMO AYUDAN LAS TIC EN LA EDUCACION SUPERIOR.pptx
modulo seguimiento 1 para iniciantes del
Propuesta BKP servidores con Acronis1.pptx
Estrategia de Apoyo de Daylin Castaño (5).pdf
Presentacion de Alba Curso Auditores Internos ISO 19011
Presentación PASANTIAS AuditorioOO..pptx
Tips de Seguridad para evitar clonar sus claves del portal bancario.pdf
Guía 5. Test de orientación Vocacional 2.docx
Curso de generación de energía mediante sistemas solares
capacitación de aire acondicionado Bgh r 410
Publicidad

Voice Processing Technologies

  • 1. Introducción a las Tecnologías del Procesamiento de laVoz y sus Aplicaciones Ing. Martín Propato https://www.linkedin.com/in/martinpropato/ +54 911 5524 2237
  • 2. Luis Martín Propato  Nacido en Buenos Aires Argentina en 1963.  Graduado con Honor en Ingeniería Electrónica en la Universidad de Buenos Aires – 1988  Masters In Electronics realizado en Philips International Institute, Eindhoven, The Netherlands – 1990  MBA realizado en Purdue University, USA – 2001  Trabajando en la industria de las Telco desde 1987 erbio
  • 3. Temario  Definiciones y breve historia  Reconocimiento de laVoz ◦ Modelo determinista ◦ Modelo basado en IA  Aplicaciones ◦ Transcriptores  Speech Analytics ◦ Text to Speech ◦ Voice Bots ◦ Biometría  (Se incluye un Glosario de Términos)
  • 4. Breve Historia  ASR:Automatic Speech Recognition (Reconocimiento automático de laVoz)  TTS:Text To Speech (Síntesis o Texto aVoz) •Primeros desarrollos desde 1952 en los Laboratorios Bell •1961 IBM “caja de zapatos”
  • 5. Aplicaciones en Atención a Clientes  Dos objetivos ◦ Reducción de costos operativos ◦ Mejora en la calidad de atención
  • 6. ASR:Automatic Speech Recognition – Tipos  Modelo Determinista ◦ Basado en Gramáticas ◦ Alta confiabilidad ◦ “word spotting”  Modelo basado en “redes neuronales” ◦ Más utilizado para Transcripciones (STT) ◦ NLP - CSR
  • 7. ASR - Sensores  Biométrico  De género  De edad  Emociones
  • 8. Aplicaciones de ASR Determinista  Asistencia de Directorio  Detección de palabras clave  Alta precisión  Bajos requerimientos computacionales  Baja escalabilidad ◦ Diferente idioma, se hace todo el trabajo nuevamente
  • 9. Ejemplo de Entrenamiento de ASR  https://lnkd.in/dJGgMPR  Mozilla está recopilando el corpus para entrenar un ASR open-source en castellano.  Hay que dictar 5 frases que proponen en la web.
  • 10. Aplicaciones de Transcriptores  Reemplazo del menú de IVR tradicional por una pregunta abierta  Subtitulados  Análisis de Grabaciones ◦ “Diarización”  Aplicaciones enVoice-Bots
  • 11. Voice Bots  Interactuar naturalmente con máquinas ◦ Tecnología de Transcripción ◦ IA para el procesamiento de la “intención” ◦ TTS para la escucha de la respuesta. ◦ Manejo de contextos en la interacción ◦ Gran base de conocimientos
  • 12. TTS o “Text To Speech”  Estándares ◦ Ejemplo en español (de España) ◦ Ejemplo de TTS con acento latino: https://text-to- speech-demo.ng.bluemix.net  A medida:“Voz Corporativa” ◦ Corpus base ◦ Corpus específico ◦ Selección del Locutor ◦ Creación de la voz a medida.
  • 13. Ejemplos deVoice Bots  Asistentes (altavoces): ◦ Alexa de Amazon ◦ Google Assistant ◦ Proveen una sola respuesta a una pregunta. ◦ Basado en un “cerebro” de dos componentes  NLP  Base de conocimientos  Cortana puede dar dos respuestas competitivas (diferentes perspectivas)  Motor de búsqueda ->Web “conversacional”  Ejemplos: https://www.youtube.com/watch?v=vmINGWsyWX0
  • 14. Tecnologías de Inteligencia Artificial  Machine Learning es un campo de la Inteligencia Artificial cuyo objetivo es que las computadoras puedan “aprender” a partir de la experiencia. ◦ Basados en redes neuronales artificiales ◦ Deben ser entrenados a partir de ejemplos conocidos ◦ Ejemplo: En el reconocimiento de imágenes se extraen bordes que, combinados, permiten detectar contornos, que a su vez permiten reconocer diferentes partes del objeto, para finalmente determinar su identidad ◦ El sistema puede generalizar el funcionamiento a casos no vistos previamente y de manera automática, sin necesidad de reglas predefinidas. ◦ Durante el aprendizaje se mide la diferencia entre la respuesta deseada y la proporcionada por la red y ésta ajusta sus parámetros de manera que esa diferencia sea cada vez menor
  • 16. NLU NLU: Natural Language Understanding. Objetivo: es la obtención de:  La Intención  La Entidad  Los Campos, y  El Contexto Para poder realizar una Acción o dar una Respuesta
  • 17. ●Intención: Reservar una habitación ●Acción: si se puede, hacer una reserva ●Entidad: Hotel Palacio ●Campos: ○Fecha de Check-in: mañana ○Fecha de Check-out: Domingo ○Ubicación: Berlín ●Contexto: El usuario dijo mañana, entonces el contexto es la fecha de hoy “Necesito reservar una habitación en el Hotel Palacio desde mañana hasta el domingo en Berlín” Ejemplo: Reserva de habitación en hotel
  • 18. Análisis de la interacción: ● Intención: Saber el año de construcción ● Acción: Responder el año de construcción. ● Entidad: de lo que se trata la interacción ● Campos: No hay campos. ● Contexto: El usuario se refiere a lo que se viene preguntando en la interacción el BOT debe recordar que es el Hotel Palacio en Berlín. Análisis del Contexto Pregunta del Usuario: en que año fué construido el hotel?
  • 19. Animal Canino Felino Perro ... Gato ... Comparacion Basada en Ontologías ●Dominio:Animal ●Entidades:Animal, Canino, Felino, Perro, Gato,... ●Relaciones: Las comparaciones. ●Atributos: Número de patas, etc- Base de Conocimientos
  • 20. Animal Canino Felino Perro ... Gato ... compare “Cual es la diferencia entre un canino y un felino?” ● Intención: Comparar dos entidades ● Entidades: Canino y Felino ● Campos: ○ Primera entidad: Canino ○ Segunda entidad: Felino ● Contexto: No se necesita ● Respuesta: Buscar la respuesta para la relación ontológica (canino – felino) Base de Conocimientos ampliada..
  • 21. Un Chatbot “cognitivo” utiliza ontologías para ampliar su base de respuestas Animal Canino Felino Perro ... Gato ... compare Si se pregunta: “cual es la diferencia entre un perro y un gato?” ● Caso 1: Que la relación de comparación entre perro y gato existe en la ontología: entonces el bot usa esta relación como respuesta ● Caso 2: Si la relación de comparación no existe en la ontología, podemos responder con la relación superior. ● Caso 3: Si no hay una relación superior se puede responder acerca de que son “dos tipos de animales” y dar sus características.
  • 22. Aplicaciones de Chat-Bots  Atención a Clientes  Soporte a Agentes
  • 23. Aplicaciones deVoice-Bots  Reemplazo de IVR ◦ Asistente de configuración de móvil, etc  Agente virtual  Asistente virtual ◦ https://www.youtube.com/watch?v=ogfYd705 cRs&feature=youtu.be&t=35m4s
  • 24. Diagrama en Bloques de unVB CSR / NLP NLU Base de Conocimientos Task Manager TTS “Quisiera reservar una habitación……” Análisis de intención y extracción de datos. Contexto, etc..
  • 25. Biometría deVoz  La biometría permite verificar la identidad de los usuarios en el flujo normal de la comunicación  Verificar es diferente a Identificar (ASR)  EER < 1%  Segundo (y tercer) factor de seguridad
  • 26. Ajuste de un sistema Biométrico
  • 27. Ajuste de un sistema biométrico  Armado de huella vocal ◦ Por repetición de una frase “explicito” ◦ Por detección silenciosa en interacciones “implícito”  Ajuste de los canales acústicos ◦ Teléfono Fijo ◦ Móvil ◦ App
  • 28. Verificación  Se compara el audio de verificación con la huella  Opciones ◦ Verificado, se sigue la operatoria ◦ NoVerificado:  Pedir otro intento  Transferencia a operador
  • 29. Controles anti-fraude  Segundo (y tercer método de verificación) ◦ Para eliminar grabaciones ◦ Alteraciones momentáneas de la voz  Ataques de intimidación  Desafío dinámico (cadenas de dígitos aleatorios)
  • 30. Demo local  5222-0805  Usuarios: 102, 103, 104, 105 (identificación)  Entrenamiento con 4 muestras  Verificación
  • 31. Aplicaciones de la Biometría  Prueba deVida de Jubilados  Autenticación Bancaria ◦ En reemplazo de claves secretas  Sistemas de control de Asistencia  Sistemas de votación electrónica  Prueba pericial en juicios.
  • 32. Información de Contacto  martin.propato@alumni.purdue.edu  (Movil / whatsapp) +54 11 5524 2237  Skype: mpropato  https://www.linkedin.com/in/martinpropato/
  • 33. Glosario  ASR: Automatic Speech Recognition (Reconocimiento automático de la Voz)  TTS: Text To Speech (Síntesis o Texto a Voz)  Transcripción: procesamiento de un audio que tiene como resultado la transcripción del mismo  IVR: Interactive Voice Response. Máquina conectada a una red de comunicaciones que permite la interacción con programas y datos, utilizando los dígitos telefónicos, y/o comandos por voz y respuestas pregrabadas o TTS.  Speech Analytics: Sistema automático para el procesamiento de grabaciones para detectar patrones, palabras, frases, emociones, y cumplimiento de normativas de calidad  Voice Bots: Chat Bot con interface vocal (Transcripción y TTS)  NLU: Natural Language Understanding; detecta la intención en una frase.  NLP: Natural Language Processing; método de transcripción de un audio a texto.  CSR: Continuous Speech Processing: otra manera de decir transcripción de audio.  SST: Speech to Text: transcripción de audio.  IA – Inteligencia Artificial: Es cuando una máquina imita las funciones «cognitivas» de los humanos como por ejemplo: «aprender» y «resolver problemas»  EER: Equal Error Rate: tasa de igual aceptación de falsos positivos y rechazo de falsos negativos en un sistema de biometría  FAR: False Accept Rate, tasa de aceptación de falsos positivos  FRR: False Reject Rate: tasa de rechazo de falsos negativos