Este documento describe la historia y el proceso de la síntesis de voz, incluyendo los primeros intentos en 1835, el desarrollo de sistemas de conversión de texto a voz en la década de 1930 y los avances recientes en interfaces de voz humano-computadora. Explica el proceso de análisis del lenguaje natural, la generación de fonemas y la síntesis final de la voz, y presenta varios sistemas y demostraciones de síntesis de voz disponibles en línea.
2. Síntesis de voz
• Generación, por medios
electrónicos, de los sonidos
de la lengua
• Text-to-Speech (TTS): un
texto que se convierte en
una secuencia de sonidos
3. 2003
• Durante los últimos años ha
surgido un nuevo tipo de
interfaces humano-computadora,
que combina la más reciente
tecnología del lenguaje para
procurar un mejor acceso y
trasferencia de información a
través del habla
5. 1939
• A principios del siglo pasado, la
inquietud del ser humano por
las nuevas tecnologías
computacionales, buscó de
diversas maneras la forma en
que las computadoras imitaran
al hombre en todo, incluso en
hablar, escribir, escuchar, o
pensar...
7. Proceso de análisis
• La computadora realiza una
transcripción fonética del texto
leído, marcando la entonación,
el ritmo y las pausas deseados
para la voz de salida
• La meta principal del TTS es
reproducir voz con la mayor
naturalidad posible
8. Proceso de síntesis
• Los articuladores, formantes y
concatenadores generan la voz
tratando de reproducirla en la
mayor medida de lo posible
semejante a la voz humana
9. Talk it!
• Prueba las diferentes voces
para el inglés y el español;
también se puede jugar con la
velocidad y la entonación
10. Power
• Una computadora nos puede
ayudar a leer un libro, un texto
o unas frases
• Además, el programa Power
traduce de manera automática
inglés >< español
11. Lector_Voz
• En el programa Lector_Voz,
escribe tu nombre, o cualquier
frase u oración
• Sintetiza los siguientes pares
mínimos:
nana / nena
loco / poco
casa / caza
casa / pasa
mata / nata
tiro / miro
pero / perro
gato / pato
12. Intel_Ente
• Establece un pequeño diálogo
con el robot Intel_Ente
• Compara la calidad de ambos
sintetizadores
13. ATLAS
• Sintetizador ATLAS (Applied
Technologies on Language and
Speech)
http://www.atlas-cti.com/es/demotts.htm
• Sintetiza la misma frase y compara
la calidad de ambos sintetizadores
• Sintetiza con Bell Labs y ATLAS en
diferentes idiomas (inglés, francés,
alemán, catalán, etcétera)
14. Loquendo
• Sintetizador de Loquendo
http://www.loquendo.com/es/demos/demo_tts.htm
• Prueba las diferentes voces de
Loquendo
15. OGI-Festival
• El CSLU (Center for Spoken
Languages Understanding) del
Oregon Graduate Institute (OGI)
es uno de los grupos de trabajo
sobr procesamiento de lenguaje
natural más importantes del
mundo
• Trabaja con el sintetizador Festival
http://cslu.cse.ogi.edu/tts/
16. TextAloud MP3
• Puedes instalar de manera gratuita
por un mes, el sintetizador de voz
TextAloud
http://www.nextuptech.com/TextAloud/download.html