2. Reconocimiento automático del habla (RAH)
o reconocimiento automático de voz . Es una
disciplina de la inteligencia artificial que
tiene como objetivo permitir la
comunicación hablada entre seres humanos
y computadoras. Es una de las formas de
comunicación con las máquinas que se está
sobreponiendo con más fuerza a otras
formas de interacción más tradicionales,
sobre todo los botones físicos, aunque
también está desplazando a la funcionalidad
táctil en algunos casos.
Concepto
HTTPS://WWW.ECURED.CU/RECONOCIMIENTO_AUTOM%C3%A1TICO_DE_VOZ
RPASummer2020
02
3. A principios del año 1940, los
laboratorios de AT&T y Bell
desarrollaron un aparato primitivo
que podía reconocer la voz.
03
RESEÑA HISTÓRICA
C R E A C I Ó N :
E M P R E S A S :
A U T O R :
La historia del reconocimiento de voz empezó en el año de 1870. Alexander
GrahamBell quiso desarrollar un dispositivo que capaz de proporcionar la palabra
visible parala gente que no escuchara. Bell no tuvo éxito creando este
dispositivo, sin embargo, elesfuerzo de esta investigación condujo al desarrollo
del teléfono. Pero fue hasta 1950, cuando se hizo el primeresfuerzo para crear la
primera máquina de reconocimiento de voz. La investigación fue llevada a los
laboratorios de AT&T.
http://catarina.udlap.mx/u_dl_a/tales/documentos/lis/ahuactzin_l_a/capitulo1.pdf
4. PARTES
MODELO ACÚSTICO
Permite a la tecnología identificar si
el sonido procede de una llamada de
móvil, de un teléfono IP o cualquier
otro medio. Determinar el canal de
comunicación es importante para
establecer el grado de distorsión que
puede experimentar el mensaje.
MODELO SEMÁNTICO
Se consigue que un sistema de
reconocimiento de voz entienda la
forma de hablar de la gente, cómo
se construyen las frases y cómo
puede variar esta construcción,
dependiendo de la región, de la
cultura y de todas las influencias
personales de cada cual.
MODELO LINGÜÍSTICO
Se trata del idioma. Pero no es tan
sencillo como indicar al sistema
que reconozca castellano, francés
o mandarín. No sólo es preciso
entender la lengua sino los
distintos acentos con que se habla
e incluso entender las formas de
expresarse, que pueden ser
diferentes en cada hablante.
MOTOR ESTADÍSTICO
Recoge la frase una vez transcrita a
texto y realiza una búsqueda en la
base de datos con estos términos.
Esta consulta tiene que adivinar si
la frase dicha, con el nivel de
distorsión correspondiente si se
habla desde un móvil, el acento y
la forma de decirlo están pidiendo
una determinada acción.
RPA Summer 2020
04
https://www.ecured.cu/Reconocimiento_autom%C3%A1tico_de_voz
5. Funcionamiento
del Dispositivo
La base del reconocimiento de la voz es un algoritmo
que recorre un árbol de probabilidades llamado
modelo oculto de Markov analizando la unidad más
pequeña del idioma que se llama el fonema.
La base de datos del idioma que lo constituye se puede
construir grabando previamente
a muchos locutores de un idioma o al usuario mismo
del reconocedor de voz.
Por último se construye la gramática de lo que se va a
reconocer. Es la expresión escrita de todas las posibles
respuestas que se pueda obtener de una pregunta.
RPASummer2020
05
http://director-it.com/index.php/es/ssoluciones/servicio-de-voz/acd,-call-center,-pabx/178-asr-reconocedor-de-voz.html
6. Estadísticas de
Uso
Por su parte Gartner estima que en
2020 el 75% de los hogares
norteamericanos contará con un
dispositivo de voz. Según datos de
Comscore, un 20% de las búsquedas
en Android son vía voz; y se espera
que para 2020 sean un 50%.
RPA Summer 2020
06
https://robertocarreras.es/datos-y-estadisticas-sobre-el-crecimiento-del-mercado-de-asistentes-de-voz/
8. IMPRESICIÓN Y LENTITUD
FACTORES AMBIENTALES
ESFUERZO VOCAL
INTERPRETACIÓN DE
VOCES INUSUALES
Desventajas
08
AHORRA TIEMPO
EVITA ERRORES
MEJORA LA FIABILIDAD
MAYOR MOVILIDAD
AUMENTA LA
PRODUCTIVIDAD
Ventajas:
https://es.slideshare.net/YisselHernandez1/ventajas-y-desventjas-del-comando-de-voz