Este documento discute las áreas de estudio y aplicación de la inteligencia artificial. Las áreas de estudio incluyen el reconocimiento de voz y lenguaje natural, mientras que las áreas de aplicación incluyen el procesamiento del lenguaje natural. También describe los sistemas de reconocimiento de voz, incluidos los reconocedores de palabras aisladas y los sistemas de reconocimiento continuo y de habla espontánea.
2. Inteligencia Artificial
• Área de Estudio:
Reconocimiento de Voz y Lenguaje Natural
• Área de Aplicación:
Procesamiento del Lenguaje Natural
3. Reconocimiento de Voz y Lenguaje Natural
Interfaces de Usuario de
Lenguaje Natural
Tipo de interfaz de usuario que permite la
comunicación entre humanos y máquinas,
donde los fenómenos lingüísticos, como los
verbos, frases y cláusulas actúan como
controles de la interfaz de usuario para crear,
seleccionar y modificar datos en las
aplicaciones de software.
Características:
Velocidad
Facilidad de uso
Comprensión
4. Búsqueda Lenguaje Natural
VS
Motor de Búsqueda por Palabras Claves
• Que Estado de EE.UU, tiene el impuesto de renta más
alto?
5. Procesado y Reconocimiento del
Lenguaje Natural
• Sistemas de reconocimiento de patrones entrenados.
• Sistemas fonéticos: producción del habla y audición.
Dificultades del Reconocimiento
• Variación fonética inter-locutor e intra-locutor.
• Estilos de habla
• Difluencias en el habla espontánea:
o Pausas
o Repeticiones
o Palabras truncadas
o Alargamientos vocálicos
o Interrupciones
o Frases inacabadas
o Variaciones en la velocidad.
• Características del entorno
6. Tratamiento de la Señal
1. Captura de la señal de voz:
• Micrófono
• CAD(Conversor Analógico/Digital)
2. Segmentación y el etiquetado:
• Regiones estables
• Filtros de normalización y pre-énfasis
3. Cálculo de parámetros
• HMM – Márkov Hidden Model
• Redes neuronales
• Análisis de banco de filtros
• LPC Linear Predictive Coding
Para el cálculo de coeficientes que caracterizan la señal se sigue un
patrón de bloques estandarizado por la ETSI.
7. • La variación inter-locutor en el nivel
segmental: oscilograma de la palabra
"Hola" pronunciada por un hablante
femenino.
• La variación inter-locutor en el nivel
segmental: oscilograma de la palabra
"Hola" pronunciada por un hablante
masculino.
8. Tipos de Sistemas de Reconocimiento de
Voz
Reconocedores de palabras aisladas
• Requieren un enunciado delimitado en ambos lados de la
ventana de muestra.
• Requiere una expresión única a la vez.
• Estados: Escuchar / No-Escuchar.
• Por lo general hace el procesamiento durante las pausas.
Sistemas de palabra conectada
9. Tipos de Sistemas de Reconocimiento de
Voz
Reconocimiento continuo: reconocedores de voz continua
permiten a los usuarios hablar casi de manera natural,
mientras que la computadora determina el contenido.
Habla espontánea: Un sistema de ASR con la capacidad de
reconocer el habla espontánea debe ser capaz de manejar
una variedad de características de lenguaje natural.
Voz de verificación/identificación
• Amplitud de la señal
• Frecuencia
• MFCC - Coeficientes cepstrales de la escala Mel.