Introducción - Objetivos y alcance               Arquitectura del sistema    Fases del reconocimiento del habla           ...
Introducción - Objetivos y alcance                          Arquitectura del sistema               Fases del reconocimient...
Introducción - Objetivos y alcance                         Arquitectura del sistema              Fases del reconocimiento ...
Introducción - Objetivos y alcance                        Arquitectura del sistema             Fases del reconocimiento de...
Introducción - Objetivos y alcance                       Arquitectura del sistema            Fases del reconocimiento del ...
Introducción - Objetivos y alcance                         Arquitectura del sistema   Adquisición              Fases del r...
Introducción - Objetivos y alcance                         Arquitectura del sistema   Adquisición              Fases del r...
Introducción - Objetivos y alcance                         Arquitectura del sistema   Adquisición              Fases del r...
Introducción - Objetivos y alcance                        Arquitectura del sistema   Adquisición             Fases del rec...
Introducción - Objetivos y alcance                        Arquitectura del sistema   Adquisición             Fases del rec...
Introducción - Objetivos y alcance                        Arquitectura del sistema   Adquisición             Fases del rec...
Introducción - Objetivos y alcance                        Arquitectura del sistema   Adquisición             Fases del rec...
Introducción - Objetivos y alcance                         Arquitectura del sistema              Fases del reconocimiento ...
Introducción - Objetivos y alcance                          Arquitectura del sistema               Fases del reconocimient...
Introducción - Objetivos y alcance                          Arquitectura del sistema               Fases del reconocimient...
Introducción - Objetivos y alcance    Adquisición de datos                        Arquitectura del sistema   Extracción de...
Introducción - Objetivos y alcance    Adquisición de datos                        Arquitectura del sistema   Extracción de...
Introducción - Objetivos y alcance    Adquisición de datos                         Arquitectura del sistema   Extracción d...
Introducción - Objetivos y alcance    Adquisición de datos                         Arquitectura del sistema   Extracción d...
Introducción - Objetivos y alcance    Adquisición de datos                       Arquitectura del sistema   Extracción de ...
Introducción - Objetivos y alcance    Adquisición de datos                        Arquitectura del sistema   Extracción de...
Introducción - Objetivos y alcance    Adquisición de datos                        Arquitectura del sistema   Extracción de...
Introducción - Objetivos y alcance    Adquisición de datos                         Arquitectura del sistema   Extracción d...
Introducción - Objetivos y alcance    Adquisición de datos                        Arquitectura del sistema   Extracción de...
Introducción - Objetivos y alcance    Adquisición de datos                        Arquitectura del sistema   Extracción de...
Introducción - Objetivos y alcance                          Arquitectura del sistema               Fases del reconocimient...
Introducción - Objetivos y alcance                        Arquitectura del sistema             Fases del reconocimiento de...
Introducción - Objetivos y alcance                       Arquitectura del sistema            Fases del reconocimiento del ...
Próxima SlideShare
Cargando en…5
×

Utilización de trifonemas como modelo acústico para el reconocimiento del habla

960 visualizaciones

Publicado el

Publicado en: Tecnología
0 comentarios
0 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Sin descargas
Visualizaciones
Visualizaciones totales
960
En SlideShare
0
De insertados
0
Número de insertados
7
Acciones
Compartido
0
Descargas
8
Comentarios
0
Recomendaciones
0
Insertados 0
No insertados

No hay notas en la diapositiva.

Utilización de trifonemas como modelo acústico para el reconocimiento del habla

  1. 1. Introducción - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planificación Módulos del sistema ConclusionesUtilización de trifonemas como modelo acústico para el reconocimiento del habla Proyecto informático Daniel Garrido Garrochena Escuela Técnica Superior de Ingeniería Informática Junio 2009 Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  2. 2. Introducción - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planificación Módulos del sistema ConclusionesSumario Introducción - Objetivos y alcance. Arquitectura del sistema. Fases del reconocimiento del habla. Objetivos del proyecto. Planificación. Módulos del sistema. Conclusiones. Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  3. 3. Introducción - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planificación Módulos del sistema ConclusionesIntroducción - Objetivos y alcance Desarrollo de un sistema reconocedor de voz (a nivel local). Entrenamiento del sistema con trifonemas. Ampliación del sistema, agregando la posibilidad de reconocer a través del protocolo TCP/IP. Permitir que múltiples usuarios puedan emplear el mismo sistema reconocedor, con las consiguientes ventajas que ello conlleva. Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  4. 4. Introducción - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Sistema reconocedor de voz Objetivos del proyecto Reconocimiento de voz sobre TCP/IP Planificación Módulos del sistema ConclusionesSistema reconocedor de voz Reconocimiento de voz: proceso de convertir señales acústicas capturadas por, por ejemplo un micrófono, en texto. Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  5. 5. Introducción - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Sistema reconocedor de voz Objetivos del proyecto Reconocimiento de voz sobre TCP/IP Planificación Módulos del sistema ConclusionesReconocimiento de voz sobre TCP/IP Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  6. 6. Introducción - Objetivos y alcance Arquitectura del sistema Adquisición Fases del reconocimiento del habla Extracción de características Objetivos del proyecto Reconocimiento / clasificación probabilística Planificación Reconocimiento mediante fonemas Módulos del sistema Reconocimiento mediante trifonemas ConclusionesAdquisición Sistema desde el cual se adquieren los datos de entrada al sistema reconocedor, la señal de voz. Por lo general, estos datos son adquiridos desde un micrófono. En este sistema serán adquiridos a través de sockets. La fuente de generación podría ser un micrófono en otro equipo, un fichero de audio, . . . Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  7. 7. Introducción - Objetivos y alcance Arquitectura del sistema Adquisición Fases del reconocimiento del habla Extracción de características Objetivos del proyecto Reconocimiento / clasificación probabilística Planificación Reconocimiento mediante fonemas Módulos del sistema Reconocimiento mediante trifonemas ConclusionesExtracción de características Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  8. 8. Introducción - Objetivos y alcance Arquitectura del sistema Adquisición Fases del reconocimiento del habla Extracción de características Objetivos del proyecto Reconocimiento / clasificación probabilística Planificación Reconocimiento mediante fonemas Módulos del sistema Reconocimiento mediante trifonemas ConclusionesReconocimiento / clasificación probabilística Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  9. 9. Introducción - Objetivos y alcance Arquitectura del sistema Adquisición Fases del reconocimiento del habla Extracción de características Objetivos del proyecto Reconocimiento / clasificación probabilística Planificación Reconocimiento mediante fonemas Módulos del sistema Reconocimiento mediante trifonemas ConclusionesReconocimiento mediante fonemas Sonidos distinguibles. 34 para el español. Representan secuencias de senones. Modelado con cadenas ocultas de Markov. Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  10. 10. Introducción - Objetivos y alcance Arquitectura del sistema Adquisición Fases del reconocimiento del habla Extracción de características Objetivos del proyecto Reconocimiento / clasificación probabilística Planificación Reconocimiento mediante fonemas Módulos del sistema Reconocimiento mediante trifonemas ConclusionesReconocimiento mediante trifonemas 343 = 39304 trifonemas para el español. En la práctica, alrededor de 5000. Es capaz de diferenciar los sonidos según su contexto. Muy práctico para reconocimiento continuo del habla. Aumento de la tasa de aciertos. Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  11. 11. Introducción - Objetivos y alcance Arquitectura del sistema Adquisición Fases del reconocimiento del habla Extracción de características Objetivos del proyecto Reconocimiento / clasificación probabilística Planificación Reconocimiento mediante fonemas Módulos del sistema Reconocimiento mediante trifonemas ConclusionesReconocimiento mediante trifonemas ¿Cómo se modelan el resto de trifonemas? Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  12. 12. Introducción - Objetivos y alcance Arquitectura del sistema Adquisición Fases del reconocimiento del habla Extracción de características Objetivos del proyecto Reconocimiento / clasificación probabilística Planificación Reconocimiento mediante fonemas Módulos del sistema Reconocimiento mediante trifonemas ConclusionesReconocimiento mediante trifonemas ¿Cómo se modelan el resto de trifonemas? Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  13. 13. Introducción - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planificación Módulos del sistema ConclusionesObjetivos del proyecto Construir un sistema reconocedor de voz. Entrenamiento. Reconocimiento. Tecnologías inexploradas y en auge. Objetivos de carácter: Técnicos. Personales. Metodológicos. Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  14. 14. Introducción - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planificación Módulos del sistema ConclusionesPlanificación Concepto Estimado Real RE Búsqueda de 8 días 6 días -33.33 % documentación Planificación 8 días 9 días 11.11 % Adquirir conocimientos 40 días 43 días 6.97 % sobre sistemas reconocedores del habla Elicitación de requisitos 10 días 11 días 9.09 % Análisis 20 días 19 días -5.26 % Diseño 30 días 28 días -7.14 % Implementación 60 días 64 días 6.25 % Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  15. 15. Introducción - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planificación Módulos del sistema ConclusionesPlanificación Concepto Estimado Real RE Documentación 18 días 22 días 18.18 % Presentación 2 días 2 días 0% TOTAL 196 días 204 días 0.65 % Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  16. 16. Introducción - Objetivos y alcance Adquisición de datos Arquitectura del sistema Extracción de características Fases del reconocimiento del habla Modelos ocultos de Markov Entrenamiento Objetivos del proyecto Reconocimiento Planificación Gestor de bases de datos orales Módulos del sistema Gestión de la configuración y log Conclusiones ComunicacionesMódulos del sistema Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  17. 17. Introducción - Objetivos y alcance Adquisición de datos Arquitectura del sistema Extracción de características Fases del reconocimiento del habla Modelos ocultos de Markov Entrenamiento Objetivos del proyecto Reconocimiento Planificación Gestor de bases de datos orales Módulos del sistema Gestión de la configuración y log Conclusiones ComunicacionesAdquisición de datos Adaptable a diferentes formas/dispositivos de adquisición. Observador y fábrica simple. Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  18. 18. Introducción - Objetivos y alcance Adquisición de datos Arquitectura del sistema Extracción de características Fases del reconocimiento del habla Modelos ocultos de Markov Entrenamiento Objetivos del proyecto Reconocimiento Planificación Gestor de bases de datos orales Módulos del sistema Gestión de la configuración y log Conclusiones ComunicacionesExtracción de características Patrones de diseño observador y decorador. Encargado de: Preénfasis. Hamming. MFCC. ... Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  19. 19. Introducción - Objetivos y alcance Adquisición de datos Arquitectura del sistema Extracción de características Fases del reconocimiento del habla Modelos ocultos de Markov Entrenamiento Objetivos del proyecto Reconocimiento Planificación Gestor de bases de datos orales Módulos del sistema Gestión de la configuración y log Conclusiones ComunicacionesExtracción de características Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  20. 20. Introducción - Objetivos y alcance Adquisición de datos Arquitectura del sistema Extracción de características Fases del reconocimiento del habla Modelos ocultos de Markov Entrenamiento Objetivos del proyecto Reconocimiento Planificación Gestor de bases de datos orales Módulos del sistema Gestión de la configuración y log Conclusiones ComunicacionesModelos ocultos de Markov Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  21. 21. Introducción - Objetivos y alcance Adquisición de datos Arquitectura del sistema Extracción de características Fases del reconocimiento del habla Modelos ocultos de Markov Entrenamiento Objetivos del proyecto Reconocimiento Planificación Gestor de bases de datos orales Módulos del sistema Gestión de la configuración y log Conclusiones ComunicacionesEntrenamiento Algoritmo Baum-Welch. Cálculos de avance-retroceso. Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  22. 22. Introducción - Objetivos y alcance Adquisición de datos Arquitectura del sistema Extracción de características Fases del reconocimiento del habla Modelos ocultos de Markov Entrenamiento Objetivos del proyecto Reconocimiento Planificación Gestor de bases de datos orales Módulos del sistema Gestión de la configuración y log Conclusiones ComunicacionesReconocimiento Algoritmo de Viterbi. Estructura estática: palabras. Estructura dinámica: proceso del algoritmo. Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  23. 23. Introducción - Objetivos y alcance Adquisición de datos Arquitectura del sistema Extracción de características Fases del reconocimiento del habla Modelos ocultos de Markov Entrenamiento Objetivos del proyecto Reconocimiento Planificación Gestor de bases de datos orales Módulos del sistema Gestión de la configuración y log Conclusiones ComunicacionesGestor de bases de datos orales Albayzin. Posibilidad de gestionar otras bases de datos orales. Fábrica abstracta. Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  24. 24. Introducción - Objetivos y alcance Adquisición de datos Arquitectura del sistema Extracción de características Fases del reconocimiento del habla Modelos ocultos de Markov Entrenamiento Objetivos del proyecto Reconocimiento Planificación Gestor de bases de datos orales Módulos del sistema Gestión de la configuración y log Conclusiones ComunicacionesGestión de la configuración y log Acceso a los parámetros de configuración. Registro de errores, avisos, . . . Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  25. 25. Introducción - Objetivos y alcance Adquisición de datos Arquitectura del sistema Extracción de características Fases del reconocimiento del habla Modelos ocultos de Markov Entrenamiento Objetivos del proyecto Reconocimiento Planificación Gestor de bases de datos orales Módulos del sistema Gestión de la configuración y log Conclusiones ComunicacionesComunicaciones Realizan las comunicaciones cliente-servidor/servidor-cliente. Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  26. 26. Introducción - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Posibles mejoras Objetivos del proyecto ¡Gracias! Planificación Módulos del sistema ConclusionesConclusiones Campo de conocimiento muy amplio y numerosas variantes. Redes neuronales. Otro modelo acústico. Motivación personal satisfecha: adquisición de nuevos conocimientos. Objetivos técnicos y metodológicos cumplidos en mayor o menor medida. Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  27. 27. Introducción - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Posibles mejoras Objetivos del proyecto ¡Gracias! Planificación Módulos del sistema ConclusionesPosibles mejoras Implementación para otras plataformas. Inmunidad al ruido de ambiente. Prosodia: expresar emociones. Questions revisadas por especialistas. Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla
  28. 28. Introducción - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Posibles mejoras Objetivos del proyecto ¡Gracias! Planificación Módulos del sistema Conclusiones¡Gracias! Daniel Garrido Garrochena Utilización de trifonemas en el reconocimiento del habla

×