SlideShare una empresa de Scribd logo
1 de 10
Descargar para leer sin conexión
VERIFICA CIÓN A UTOMÁ TICA DEL
LOCUTOR
ESPECIALIDAD: Comunicaciones y Electrónica
Juan Arturo Nolazco Flores
PhD Ingeniería Informática
Fecha de Ingreso: 15 de Noviembre, 2012.
VERIFICACIÓN AUTOMÁTICA DEL LOCUTOR
Especialidad: Comunicaciones y Electrónica 2
VERIFK'A ('JÓN AUTOMÁTICA DEL LOCUTOR
CONTENIDO
RESUMENEJECUTIVO ...................... ...................................................... ................ . ........... . ........... ...4
INTRODUCCIÓN ..... ... .... . ..... . ................ . ................. .....--- ... .. ................... ........... . ............... .............. 5
SISTEMAS CONVENCIONALES [3,4] ............................................................................7
ESTADO DEL ARTE: JFA (Joint Factor Analysis) [5, 6] .................................10
ESTIMACIÓN DISCRIMINATIVA: MVE ("Minimum Verification Error")
........................................................................................................................11
S. MINIMIZANDO EL ÁREA BAJO LA CURVA DET ............ .... ....... . ... . .............. . .......... 13
RESULTADOS ..................................................................................................................................16
6.1 Base de Datos... ............. . ....................... ... .............. . ............................ . ..... ............................. 16
6.2 Condiciones de señal limpia ............. . ... . ...... . ... . ................... . ............. ... ....................... 16
6.3 Condiciones de señal con ruido... .... . ..................................................... . ................ ..17
CONCLUSIONES ............... . ....................... .. ... .......... .. .......... . .................. . ............. ......................... 18
REFERENCIAS ... . ............... .. ..... . .................................. . .......... .... ..................... . ............................... 19
BIBLIOGRAFÍA ......... . ...... . ................. . ................................. .... ............................. .. ......................... 21
AGRADECIMIENTOS ........... ........... . ... . ...... . ...................................................... ........................ 23
CURRICULUM VITAE ... . ..................... . .................. .. ............ . ........... . ............... . ......... .... ........... 24
Especialidad: Comunicaciones y Electrónica 3
VERIFICACIÓN A UTOMA'TICA DEL LOCUTOR
RESUMEN E)ECUTIVO
En el presente trabajo se presentó un sistema para Verificación de
Locutor basado en MVE (Minimum Verification Error), el cual es un
método discriminativo que minimiza el área bajo la curva en lugar de
optimizar un punto de operación.
Los resultados en señales limpias utilizando la técnica MVE mejoró a
la técnica convencional por más del 15.30%, y minimizando el área
bajo la curva todavía mejoró otro 2.22% mas. Aplicando la
minimización del área bajo la curva sobre JFA mejoró el resultado por
1.16% comparado con JFA puro.
Los resultados de AUC-JFA y AUC-MVE en señales corruptas con ruido
aditivo de diferentes tipos mejoran en un 6.05% y 10.49%
respectivamente con respecto al rendimiento de la técnica
convencional.
Palabras clave: verificación de personas, biométricas,
reconocimiento de patrones, reconocimiento de personas
Especialidad: Comunicaciones y Electrónica 4
VERIFICACIÓN AUTOMÁTICA DEL LOCUTOR
1. INTRODUCCIÓN
Los sistemas de reconocimiento biométrico utilizan alguna
característica de la persona para reconocerlo. Estas características
pueden ser intrusivas como pruebas de sangre; o puede ser no
intrusiva como características del rostro, de la palma de la mano, la
forma de caminar, la forma de hablar, el iris, etc.
Los sistemas de reconocimiento biométrico de personas se dividen en
sistemas de identificación y sistemas de verificación. En los sistemas
de identificación se desea obtener la persona que tiene las
características más parecidas a las presentadas. Generalmente, el
universo de personas que se busca es limitado, por ejemplo a un
departamento, a una empresa, a una ciudad, a afiliados, etc. En caso
de que se utilice identificación biométrica para una investigación
forense, entonces la principal amenaza para estos sistemas es que la
persona va a intente hablar diferente para evitar ser identificado.
En un sistema de verificación, el sistema coteja las características
biométricas del individuo con un modelo acústico de la persona quien
dice ser. El sistema debe de confirmar/negar si la personas es quien
dice ser. Los sistemas de verificación biométricas son generalmente
utilizados para control de acceso. La principal amenaza para los
sistemas de verificación de personas es que el individuo intente imitar
a la otra persona.
Los humanos utilizamos como uno de los medios de comunicación el
sonido generado por nuestra sistema bucal. La voz generada depende
de muchas variables como el tamaño, grosor, elasticidad de nuestras
cuerdas bucales, el tamaño de nuestra laringe, boca, etc. Tal es la
diferencia entre individuos de estas características que la voz se
puede utilizar como biométrica.
En el presente trabajo se presenta un sistema que se han diseñado y
desarrollado para realizar la tarea de verificación del locutor.
Con este sistema se ha participado en evaluaciones internacionales y
hemos obtenido muy buenos resultados.
En la sección 2 se presenta la arquitectura de un sistema para ASV
convencional. En esta arquitectura se presenta la función de cada
módulo de la arquitectura.
En la sección 3 se presenta la técnica JFK (Joint Factor Analysis) que
se utiliza en un sistemas ASV para separar las características del
canal de las características de los usuarios.
En la sección 4 se presenta una técnica discriminativa que aplicamos
a un sistema ASV.
Especialidad: Comunicaciones y Electrónica 5
VERIFICACIÓN AUTOMÁTICA DEL LOCUTOR
En la sección 5 se presenta una técnica de optimización que se aplica
a diferentes técnicas utilizadas en sistemas ASV5.
En la sección 6 se presentan resultados tanto de técnicas
tradicionales como las que hemos desarrollado.
En la sección 7 se presentan las Conclusiones.
0
Especialidad: Comunicaciones y Electrónica 6
VERIFICACIÓN AUTOMÁTICA DEL LOCUTOR
2. SISTEMAS CONVENCIONALES [3, 41
En la figura se muestra la arquitectura de nuestro sistema de
Verificadón de Locutor.
Esta arquitectura tiene dos partes. La parte de entrenamiento de los
modelos acústicos de los Locutores. La parte de evaluación del
sistema utilizando los modelos acústicos de los Locutores.
Udez
__j
MAV
í1 •1AF' GMM
proce5amlent MFCC (JIM de 1rget
de voz)
[ntrenamiento
(i" (Tlcuhd')
1
Acept3d
rocesamlentL 1-r1 pUntu.00n L p =(:lH1 rechazclo
voz 1..L__J 1J Nomalizcón
Cálculo de decsón
untuación y = NIH
Lvaluacion del Target
En el primer módulo de la arquitectura el "pre-procesamiento" de la
señal de voz de los locutores objetivo, como locutores intrusos. En
este módulo se procesa la señal de voz para obtener las
características de la voz de los locutores. Lo deseable de estas
características es que sean lo más diferenciadoras posibles entre
locutores, tal que faciliten la verificación de los mismos. Este módulo
es el mismo tanto en la parte de entrenamiento de los modelos
acústico, como en la parte de evaluación del sistema.
El procesamiento de la señal de voz se hace por segmentos de
tiempo; cada segmento de tiempo con una duración de entre 20ms y
40ms. Esto se debe a que es importante que la señal analizada sea
estacionaria; y resulta que la señal de voz generada por las personas
es una señal estacionaria en segmentos pequeños (quasi-
estacionaria).
Entonces podemos analizar la señal por intervalos pequeños en
tiempo. En este intervalo de tiempo podemos obtener características
como número de cruces por Cero (al graficar la señal), energía,
máxima amplitud, periodo. También podemos obtener su espectro de
Especialidad: Comunicaciones y Electrónica 7
VERIFICACIÓN AUTOMÁTICA DEL LOCUTOR
Fourier y obtener otras características en función de la frecuencia
como distribución de la energía y frecuencias de resonancia.
En nuestro trabajo hemos encontrado buenos resultados para
periodos de tiempo de 40ms y calculando la energía de este segment
así como los coeficientes MFCC ("Me! Frequency Cepstral
Coefficients"). Los MFCC se calculan primeramente calculando la
Transformada Discreta de Fourier para cada segmento de tiempo
("STFT- Short-Time Discrete Fourier Transform"); después se calcula
la Transformada Coseno del logaritmo de la magnitud de la energía
para cada uno de los componentes de STFT. La transformada Coseno
genera los MFCC5. Utilizamos también las características dinámicas
de los coeficientes representadas por la primera y segunda derivada.
En nuestro trabajo hemos encontrado buenos resultados para
periodos de tiempo de 40ms, y para cada segmente obtenemos un
vector de dimensión 58 (1 representando la energía de la señal, 19
coeficientes MFCC, y sus primeras y segundas derivadas).
Con las características de la señal de voz de los locutores objetivos, el
siguiente módulo del sección del entrenamiento son los módulos para
"Modelación Locutores Objetivos (Targets)". Con las características de
los locutores intrusos se crea un "Modelo de Locutores Intrusos", lo
que se le conoce como UBM (Universal Background Model).
La modelación acústica de cada locutor es un GMM ("Gaussian
Mixture Model") que es una Cadena Escondida de Markov de un
estado. Cada estado de la GMM tiene un vector con las medias de la
energía y de los MFCCs, incluyendo su primer y segunda derivada; y
el otro vector con las varianzas de la energía y de cada uno de los
MFCCs, incluyendo sus primera y segunda derivada. Debido a la
cantidad de datos que generalmente se encuentran en una tarea de
Verificación de Locutores, la estimación de estos parámetros es
utilizando MAP (Maximum A Posteriori).
En la parte de la Evaluación, el locutor se identifica y genera una
señal de voz, entonces primero calculamos los MFCCs de la señal de
voz; después, calculamos las puntuaciones del locutor tanto para el
modelo del locutor objetivo, como para el modelo UBM.
Dados las dos puntuaciones, el problema de clasificación involucra
dos hipótesis: que el usuario legítimo (quien dice ser), 7-t, o que el
usuario sea un impostor, J-(.
Sea pA(zIJCo) la función de densidad condicional de la puntuación
observada z generada por el locutor auténtico A. De la misma
manera sea pA(zI/-(1) la función de densidad condicional de la
puntuación (score) observada z generada por locutores impostores de
A.
Especialidad: Comunicaciones y Electrónica 8
VERIFICACIÓN A UTOMA' TICA DEL LOCUTOR
La densidad condicional pA(zIXo) se estima con las puntuaciones de
del mismo locutor A utilizando su modelo acústico. La densidad
condicional pA(zIH'l) se estima con las puntuaciones de todos los
impostores posibles utilizando el modelo acústico de A. Cuando todos
los impostores comparten el mismo modelo entonces se le conoce
como Modelo Universal (UBM- Universal Background Model)
Si conocemos las densidades condicionales de pA(zIfHo) ' pA(zIfH'l),
entonces una prueba de Bayes, con el mismo "costo de error en la
clasificación" por locutor, se basa en la taza de verosimilitud
(Iikelihood ratio) para el locutor A [2,15] como se muestra a
continuación:
2
PA(ZI1)
A
- PACZI'O)
o en el dominio logarítmico
= 109(pA(zIi-c1)) - log(pA (zIJ-CO)).
Entonces, el problema de clasificación es el siguiente:
'r seleccione 1f1
Si log(p(zIJ-C)) - log(pA(z11-CO))
t< -r seleccione J{0
Con el propósito de simplificar las figura que se presentan de aquí en
adelante, vamos a simplificar la gráfica de la arquitectura como se
muestra a continuación:
rce&:rnient MAP
[ntrenamjento d iarget.
Norm, LIC!(lfl
Pro ce-sarn iento c,re 1ec:ión
Iltva Iuacjón
Especialidad: Comunicaciones y Electrónica 9
VERIFICACIÓN AUTOMÁTICA DEL LOCUTOR
3. ESTADO DEL ARTE: iFA (Joint Factor Analysis) [5, 6]
El propósito de JFA es separar la voz del locutor y las características
del canal. Esto es porque el canal crea distorsión en la señal, lo cual
afecta la precisión para identificar las personas.
En JFA, las medias de todas las Gaussianas en una GMM son
concatenadas en un solo vector llamado, supervector MSCh = II
112 11/23 II }. El supervector M representa el GMM para la distribución
de datos sobre cada tipo de canal Ch para el locutor S.
Ms,Ch = 172 + Vy + UXSCh + DZ5
donde m es una media global de todos los locutors; y es un conjunto
de voces características (elgenvoices) representando el subespacio en
el que se ubican los componentes específicos de los locutors,
U es un conjunto de canales característicos (eigenchannels)
representando el subespacio sobre el cual están los componentes
específicos de un canal. D es una matriz diagonal. Ys es un vector con
distribución Normal que representa los factores específicos del locutor
5. Xç, es un vector con distribución Normal que representa los
factores específicos del locutor 5 sobre el canal Ch. Z5 es un vector
con distribución Normal que representa un error residual;
El entrenamiento de V,UyD es utilizando el algoritmo de Baum-
Welch; El aprendizaje de YS,ZSYXS,Ch es utilizando procedimiento EM
(Expectation Maximization) [6, 5].
EW - baum Lxoect.iton
Fre-
MAP 1 V (J.D
and Wekh 1.43Jmz.3tIon
rrocesamlentoj
t J Crea iupervector
(TiP1M
1 de 1- de
[ntrenamiento CIeUrM
(Jsuanos (Isuanos
F're- Cilculode
......prcesamIent scores EJecisión
rchz o
tvaIuacíán
Especialidad: Comunicaciones y Electrónica 10

Más contenido relacionado

Similar a Verificación Automática del Locutor

recognition presentationSing D
recognition presentationSing Drecognition presentationSing D
recognition presentationSing Dmucura11
 
6528794 estudio-de-fallas-comunes-en-rodamientos-rigidos-de-una-hilera-de-bol...
6528794 estudio-de-fallas-comunes-en-rodamientos-rigidos-de-una-hilera-de-bol...6528794 estudio-de-fallas-comunes-en-rodamientos-rigidos-de-una-hilera-de-bol...
6528794 estudio-de-fallas-comunes-en-rodamientos-rigidos-de-una-hilera-de-bol...Roberto Ortega
 
Practica 2. identificacion de componentes electronicos analogicos
Practica 2. identificacion de componentes electronicos analogicosPractica 2. identificacion de componentes electronicos analogicos
Practica 2. identificacion de componentes electronicos analogicosWendoly Zamudio
 
Digital señales (diapositava 1)
Digital señales (diapositava 1)Digital señales (diapositava 1)
Digital señales (diapositava 1)Jose Saenz
 
Experiencias exitosas en la aplicación y usos de las tecnologías
 Experiencias exitosas en la aplicación y usos de las tecnologías Experiencias exitosas en la aplicación y usos de las tecnologías
Experiencias exitosas en la aplicación y usos de las tecnologíasRedAccesible
 
Control digital: Programa control digital
Control digital: Programa control digitalControl digital: Programa control digital
Control digital: Programa control digitalSANTIAGO PABLO ALBERTO
 
Tesis Radio Digital
Tesis Radio DigitalTesis Radio Digital
Tesis Radio DigitalM. F.
 
Electroneumática: manual de detección de fallas en circuitos neumáticos
Electroneumática: manual de detección de fallas en circuitos neumáticosElectroneumática: manual de detección de fallas en circuitos neumáticos
Electroneumática: manual de detección de fallas en circuitos neumáticosSANTIAGO PABLO ALBERTO
 
1er parcial Biocontroladores
1er parcial Biocontroladores1er parcial Biocontroladores
1er parcial BiocontroladoresMariannN1
 
Redes Locales Básicos
Redes Locales Básicos Redes Locales Básicos
Redes Locales Básicos heibame
 
Analisador de espectros.odp
Analisador de espectros.odpAnalisador de espectros.odp
Analisador de espectros.odpDamián
 
Trabajo de la estruct modul
Trabajo de la estruct modulTrabajo de la estruct modul
Trabajo de la estruct modulerazorosario07
 
Trabajo de la estruct modul
Trabajo de la estruct modulTrabajo de la estruct modul
Trabajo de la estruct modulerazorosario07
 

Similar a Verificación Automática del Locutor (20)

recognition presentationSing D
recognition presentationSing Drecognition presentationSing D
recognition presentationSing D
 
6528794 estudio-de-fallas-comunes-en-rodamientos-rigidos-de-una-hilera-de-bol...
6528794 estudio-de-fallas-comunes-en-rodamientos-rigidos-de-una-hilera-de-bol...6528794 estudio-de-fallas-comunes-en-rodamientos-rigidos-de-una-hilera-de-bol...
6528794 estudio-de-fallas-comunes-en-rodamientos-rigidos-de-una-hilera-de-bol...
 
Control de liquido
Control de liquidoControl de liquido
Control de liquido
 
Practica 2. identificacion de componentes electronicos analogicos
Practica 2. identificacion de componentes electronicos analogicosPractica 2. identificacion de componentes electronicos analogicos
Practica 2. identificacion de componentes electronicos analogicos
 
32.formatos deaudiodigital
32.formatos deaudiodigital32.formatos deaudiodigital
32.formatos deaudiodigital
 
Digital señales (diapositava 1)
Digital señales (diapositava 1)Digital señales (diapositava 1)
Digital señales (diapositava 1)
 
UTP TESIS
UTP TESISUTP TESIS
UTP TESIS
 
Experiencias exitosas en la aplicación y usos de las tecnologías
 Experiencias exitosas en la aplicación y usos de las tecnologías Experiencias exitosas en la aplicación y usos de las tecnologías
Experiencias exitosas en la aplicación y usos de las tecnologías
 
Control digital: Programa control digital
Control digital: Programa control digitalControl digital: Programa control digital
Control digital: Programa control digital
 
Paperman
PapermanPaperman
Paperman
 
Tesis Radio Digital
Tesis Radio DigitalTesis Radio Digital
Tesis Radio Digital
 
Electroneumática: manual de detección de fallas en circuitos neumáticos
Electroneumática: manual de detección de fallas en circuitos neumáticosElectroneumática: manual de detección de fallas en circuitos neumáticos
Electroneumática: manual de detección de fallas en circuitos neumáticos
 
1er parcial Biocontroladores
1er parcial Biocontroladores1er parcial Biocontroladores
1er parcial Biocontroladores
 
Informe ieee de robot sumo(cronos)
Informe ieee de robot sumo(cronos)Informe ieee de robot sumo(cronos)
Informe ieee de robot sumo(cronos)
 
Invidentes
InvidentesInvidentes
Invidentes
 
Redes Locales Básicos
Redes Locales Básicos Redes Locales Básicos
Redes Locales Básicos
 
Analisador de espectros.odp
Analisador de espectros.odpAnalisador de espectros.odp
Analisador de espectros.odp
 
Trabajo de la estruct modul
Trabajo de la estruct modulTrabajo de la estruct modul
Trabajo de la estruct modul
 
Trabajo de la estruct modul
Trabajo de la estruct modulTrabajo de la estruct modul
Trabajo de la estruct modul
 
Telecomunicaciones
TelecomunicacionesTelecomunicaciones
Telecomunicaciones
 

Más de Academia de Ingeniería de México

Anomalías de flujo de calor terrestre y la definición de la provincia geotérm...
Anomalías de flujo de calor terrestre y la definición de la provincia geotérm...Anomalías de flujo de calor terrestre y la definición de la provincia geotérm...
Anomalías de flujo de calor terrestre y la definición de la provincia geotérm...Academia de Ingeniería de México
 
Ground deformation effects on subsurface pipelines and infrastructure
Ground deformation effects on subsurface pipelines and infrastructureGround deformation effects on subsurface pipelines and infrastructure
Ground deformation effects on subsurface pipelines and infrastructureAcademia de Ingeniería de México
 
From force-based to displacement-based seismic design. What comes next?
From force-based to displacement-based seismic design. What comes next?From force-based to displacement-based seismic design. What comes next?
From force-based to displacement-based seismic design. What comes next?Academia de Ingeniería de México
 
New Paradigm in Earthquaker Engineering of Bridges-Resilient, Fast, Recyclable
New Paradigm in Earthquaker Engineering of Bridges-Resilient, Fast, RecyclableNew Paradigm in Earthquaker Engineering of Bridges-Resilient, Fast, Recyclable
New Paradigm in Earthquaker Engineering of Bridges-Resilient, Fast, RecyclableAcademia de Ingeniería de México
 
Derivación y aplicación de un Modelo de Estimación de Costos para la Ingenier...
Derivación y aplicación de un Modelo de Estimación de Costos para la Ingenier...Derivación y aplicación de un Modelo de Estimación de Costos para la Ingenier...
Derivación y aplicación de un Modelo de Estimación de Costos para la Ingenier...Academia de Ingeniería de México
 
Economic Assessment and Value Maximizations of a Mining Operation based on an...
Economic Assessment and Value Maximizations of a Mining Operation based on an...Economic Assessment and Value Maximizations of a Mining Operation based on an...
Economic Assessment and Value Maximizations of a Mining Operation based on an...Academia de Ingeniería de México
 
Desarrollo de la Ingeniería de Proyecto como un cambio de paradigma en México
Desarrollo de la Ingeniería de Proyecto como un cambio de paradigma en MéxicoDesarrollo de la Ingeniería de Proyecto como un cambio de paradigma en México
Desarrollo de la Ingeniería de Proyecto como un cambio de paradigma en MéxicoAcademia de Ingeniería de México
 
Desarrollo de Indicadores de Desempeño para Centrales Nucleares
Desarrollo de Indicadores de Desempeño para Centrales NuclearesDesarrollo de Indicadores de Desempeño para Centrales Nucleares
Desarrollo de Indicadores de Desempeño para Centrales NuclearesAcademia de Ingeniería de México
 
Administración de activos físicos: Nuevos paradigmas para la conservación de ...
Administración de activos físicos: Nuevos paradigmas para la conservación de ...Administración de activos físicos: Nuevos paradigmas para la conservación de ...
Administración de activos físicos: Nuevos paradigmas para la conservación de ...Academia de Ingeniería de México
 
Creación de capacidades de Innovación en México desde la perspectiva de la em...
Creación de capacidades de Innovación en México desde la perspectiva de la em...Creación de capacidades de Innovación en México desde la perspectiva de la em...
Creación de capacidades de Innovación en México desde la perspectiva de la em...Academia de Ingeniería de México
 
Proceso de optimización de reservas minables de un depósito de oro orogénico
Proceso de optimización de reservas minables de un depósito de oro orogénicoProceso de optimización de reservas minables de un depósito de oro orogénico
Proceso de optimización de reservas minables de un depósito de oro orogénicoAcademia de Ingeniería de México
 
Tecnología de captura, uso y almacenamiento de CO2 (CCUS) con registros geofí...
Tecnología de captura, uso y almacenamiento de CO2 (CCUS) con registros geofí...Tecnología de captura, uso y almacenamiento de CO2 (CCUS) con registros geofí...
Tecnología de captura, uso y almacenamiento de CO2 (CCUS) con registros geofí...Academia de Ingeniería de México
 
Modelo conceptual para el pronóstico del funcionamiento hidráulico del sistem...
Modelo conceptual para el pronóstico del funcionamiento hidráulico del sistem...Modelo conceptual para el pronóstico del funcionamiento hidráulico del sistem...
Modelo conceptual para el pronóstico del funcionamiento hidráulico del sistem...Academia de Ingeniería de México
 

Más de Academia de Ingeniería de México (20)

Anomalías de flujo de calor terrestre y la definición de la provincia geotérm...
Anomalías de flujo de calor terrestre y la definición de la provincia geotérm...Anomalías de flujo de calor terrestre y la definición de la provincia geotérm...
Anomalías de flujo de calor terrestre y la definición de la provincia geotérm...
 
Nanoscale Properties of Biocompatible materials
Nanoscale Properties of Biocompatible materialsNanoscale Properties of Biocompatible materials
Nanoscale Properties of Biocompatible materials
 
Ground deformation effects on subsurface pipelines and infrastructure
Ground deformation effects on subsurface pipelines and infrastructureGround deformation effects on subsurface pipelines and infrastructure
Ground deformation effects on subsurface pipelines and infrastructure
 
Engineering the Future
Engineering the FutureEngineering the Future
Engineering the Future
 
From force-based to displacement-based seismic design. What comes next?
From force-based to displacement-based seismic design. What comes next?From force-based to displacement-based seismic design. What comes next?
From force-based to displacement-based seismic design. What comes next?
 
Impact of Earthquaker Duration on Bridge Performance
Impact of Earthquaker Duration on Bridge PerformanceImpact of Earthquaker Duration on Bridge Performance
Impact of Earthquaker Duration on Bridge Performance
 
New Paradigm in Earthquaker Engineering of Bridges-Resilient, Fast, Recyclable
New Paradigm in Earthquaker Engineering of Bridges-Resilient, Fast, RecyclableNew Paradigm in Earthquaker Engineering of Bridges-Resilient, Fast, Recyclable
New Paradigm in Earthquaker Engineering of Bridges-Resilient, Fast, Recyclable
 
Derivación y aplicación de un Modelo de Estimación de Costos para la Ingenier...
Derivación y aplicación de un Modelo de Estimación de Costos para la Ingenier...Derivación y aplicación de un Modelo de Estimación de Costos para la Ingenier...
Derivación y aplicación de un Modelo de Estimación de Costos para la Ingenier...
 
Economic Assessment and Value Maximizations of a Mining Operation based on an...
Economic Assessment and Value Maximizations of a Mining Operation based on an...Economic Assessment and Value Maximizations of a Mining Operation based on an...
Economic Assessment and Value Maximizations of a Mining Operation based on an...
 
Desarrollo de la Ingeniería de Proyecto como un cambio de paradigma en México
Desarrollo de la Ingeniería de Proyecto como un cambio de paradigma en MéxicoDesarrollo de la Ingeniería de Proyecto como un cambio de paradigma en México
Desarrollo de la Ingeniería de Proyecto como un cambio de paradigma en México
 
El mundo real y la interdisciplina
El mundo real y la interdisciplinaEl mundo real y la interdisciplina
El mundo real y la interdisciplina
 
Desarrollo de Indicadores de Desempeño para Centrales Nucleares
Desarrollo de Indicadores de Desempeño para Centrales NuclearesDesarrollo de Indicadores de Desempeño para Centrales Nucleares
Desarrollo de Indicadores de Desempeño para Centrales Nucleares
 
Administración de activos físicos: Nuevos paradigmas para la conservación de ...
Administración de activos físicos: Nuevos paradigmas para la conservación de ...Administración de activos físicos: Nuevos paradigmas para la conservación de ...
Administración de activos físicos: Nuevos paradigmas para la conservación de ...
 
Creación de capacidades de Innovación en México desde la perspectiva de la em...
Creación de capacidades de Innovación en México desde la perspectiva de la em...Creación de capacidades de Innovación en México desde la perspectiva de la em...
Creación de capacidades de Innovación en México desde la perspectiva de la em...
 
Modelo educativo para la industria 4.0
Modelo educativo para la industria 4.0Modelo educativo para la industria 4.0
Modelo educativo para la industria 4.0
 
Proceso de optimización de reservas minables de un depósito de oro orogénico
Proceso de optimización de reservas minables de un depósito de oro orogénicoProceso de optimización de reservas minables de un depósito de oro orogénico
Proceso de optimización de reservas minables de un depósito de oro orogénico
 
El camino real de la plata
El camino real de la plataEl camino real de la plata
El camino real de la plata
 
Importancia de la Geomecánica petrolera profunda
Importancia de la Geomecánica petrolera profundaImportancia de la Geomecánica petrolera profunda
Importancia de la Geomecánica petrolera profunda
 
Tecnología de captura, uso y almacenamiento de CO2 (CCUS) con registros geofí...
Tecnología de captura, uso y almacenamiento de CO2 (CCUS) con registros geofí...Tecnología de captura, uso y almacenamiento de CO2 (CCUS) con registros geofí...
Tecnología de captura, uso y almacenamiento de CO2 (CCUS) con registros geofí...
 
Modelo conceptual para el pronóstico del funcionamiento hidráulico del sistem...
Modelo conceptual para el pronóstico del funcionamiento hidráulico del sistem...Modelo conceptual para el pronóstico del funcionamiento hidráulico del sistem...
Modelo conceptual para el pronóstico del funcionamiento hidráulico del sistem...
 

Último

NTP- Determinación de Cloruros en suelos y agregados (1) (1).pptx
NTP- Determinación de Cloruros  en suelos y agregados (1) (1).pptxNTP- Determinación de Cloruros  en suelos y agregados (1) (1).pptx
NTP- Determinación de Cloruros en suelos y agregados (1) (1).pptxBRAYANJOSEPTSANJINEZ
 
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.pptARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.pptMarianoSanchez70
 
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdfTEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdfXimenaFallaLecca1
 
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdfECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdffredyflores58
 
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
01 MATERIALES AERONAUTICOS VARIOS clase 1.pptoscarvielma45
 
ECONOMIA APLICADA SEMANA 555555555544.pdf
ECONOMIA APLICADA SEMANA 555555555544.pdfECONOMIA APLICADA SEMANA 555555555544.pdf
ECONOMIA APLICADA SEMANA 555555555544.pdfmatepura
 
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIAS
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIASTEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIAS
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIASfranzEmersonMAMANIOC
 
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdfCristhianZetaNima
 
PERFORACIÓN Y VOLADURA EN MINERÍA APLICADO
PERFORACIÓN Y VOLADURA EN MINERÍA APLICADOPERFORACIÓN Y VOLADURA EN MINERÍA APLICADO
PERFORACIÓN Y VOLADURA EN MINERÍA APLICADOFritz Rebaza Latoche
 
UNIDAD 3 ELECTRODOS.pptx para biopotenciales
UNIDAD 3 ELECTRODOS.pptx para biopotencialesUNIDAD 3 ELECTRODOS.pptx para biopotenciales
UNIDAD 3 ELECTRODOS.pptx para biopotencialesElianaCceresTorrico
 
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdfLA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdfbcondort
 
Comite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxComite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxClaudiaPerez86192
 
clasificasion de vias arteriales , vias locales
clasificasion de vias arteriales , vias localesclasificasion de vias arteriales , vias locales
clasificasion de vias arteriales , vias localesMIGUELANGEL2658
 
Magnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMagnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMarceloQuisbert6
 
CAPITULO 4 ANODIZADO DE ALUMINIO ,OBTENCION Y PROCESO
CAPITULO 4 ANODIZADO DE ALUMINIO ,OBTENCION Y PROCESOCAPITULO 4 ANODIZADO DE ALUMINIO ,OBTENCION Y PROCESO
CAPITULO 4 ANODIZADO DE ALUMINIO ,OBTENCION Y PROCESOLUISDAVIDVIZARRETARA
 
Ingeniería clínica 1 Ingeniería biomedica
Ingeniería clínica 1 Ingeniería biomedicaIngeniería clínica 1 Ingeniería biomedica
Ingeniería clínica 1 Ingeniería biomedicaANACENIMENDEZ1
 
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaSesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaXimenaFallaLecca1
 
desarrollodeproyectoss inge. industrial
desarrollodeproyectoss  inge. industrialdesarrollodeproyectoss  inge. industrial
desarrollodeproyectoss inge. industrialGibranDiaz7
 
CLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxCLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxbingoscarlet
 
osciloscopios Mediciones Electricas ingenieria.pdf
osciloscopios Mediciones Electricas ingenieria.pdfosciloscopios Mediciones Electricas ingenieria.pdf
osciloscopios Mediciones Electricas ingenieria.pdfIvanRetambay
 

Último (20)

NTP- Determinación de Cloruros en suelos y agregados (1) (1).pptx
NTP- Determinación de Cloruros  en suelos y agregados (1) (1).pptxNTP- Determinación de Cloruros  en suelos y agregados (1) (1).pptx
NTP- Determinación de Cloruros en suelos y agregados (1) (1).pptx
 
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.pptARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
 
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdfTEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
 
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdfECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
 
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
01 MATERIALES AERONAUTICOS VARIOS clase 1.ppt
 
ECONOMIA APLICADA SEMANA 555555555544.pdf
ECONOMIA APLICADA SEMANA 555555555544.pdfECONOMIA APLICADA SEMANA 555555555544.pdf
ECONOMIA APLICADA SEMANA 555555555544.pdf
 
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIAS
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIASTEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIAS
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIAS
 
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
 
PERFORACIÓN Y VOLADURA EN MINERÍA APLICADO
PERFORACIÓN Y VOLADURA EN MINERÍA APLICADOPERFORACIÓN Y VOLADURA EN MINERÍA APLICADO
PERFORACIÓN Y VOLADURA EN MINERÍA APLICADO
 
UNIDAD 3 ELECTRODOS.pptx para biopotenciales
UNIDAD 3 ELECTRODOS.pptx para biopotencialesUNIDAD 3 ELECTRODOS.pptx para biopotenciales
UNIDAD 3 ELECTRODOS.pptx para biopotenciales
 
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdfLA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
LA APLICACIÓN DE LAS PROPIEDADES TEXTUALES A LOS TEXTOS.pdf
 
Comite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxComite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptx
 
clasificasion de vias arteriales , vias locales
clasificasion de vias arteriales , vias localesclasificasion de vias arteriales , vias locales
clasificasion de vias arteriales , vias locales
 
Magnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMagnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principios
 
CAPITULO 4 ANODIZADO DE ALUMINIO ,OBTENCION Y PROCESO
CAPITULO 4 ANODIZADO DE ALUMINIO ,OBTENCION Y PROCESOCAPITULO 4 ANODIZADO DE ALUMINIO ,OBTENCION Y PROCESO
CAPITULO 4 ANODIZADO DE ALUMINIO ,OBTENCION Y PROCESO
 
Ingeniería clínica 1 Ingeniería biomedica
Ingeniería clínica 1 Ingeniería biomedicaIngeniería clínica 1 Ingeniería biomedica
Ingeniería clínica 1 Ingeniería biomedica
 
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaSesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
 
desarrollodeproyectoss inge. industrial
desarrollodeproyectoss  inge. industrialdesarrollodeproyectoss  inge. industrial
desarrollodeproyectoss inge. industrial
 
CLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxCLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptx
 
osciloscopios Mediciones Electricas ingenieria.pdf
osciloscopios Mediciones Electricas ingenieria.pdfosciloscopios Mediciones Electricas ingenieria.pdf
osciloscopios Mediciones Electricas ingenieria.pdf
 

Verificación Automática del Locutor

  • 1. VERIFICA CIÓN A UTOMÁ TICA DEL LOCUTOR ESPECIALIDAD: Comunicaciones y Electrónica Juan Arturo Nolazco Flores PhD Ingeniería Informática Fecha de Ingreso: 15 de Noviembre, 2012.
  • 2. VERIFICACIÓN AUTOMÁTICA DEL LOCUTOR Especialidad: Comunicaciones y Electrónica 2
  • 3. VERIFK'A ('JÓN AUTOMÁTICA DEL LOCUTOR CONTENIDO RESUMENEJECUTIVO ...................... ...................................................... ................ . ........... . ........... ...4 INTRODUCCIÓN ..... ... .... . ..... . ................ . ................. .....--- ... .. ................... ........... . ............... .............. 5 SISTEMAS CONVENCIONALES [3,4] ............................................................................7 ESTADO DEL ARTE: JFA (Joint Factor Analysis) [5, 6] .................................10 ESTIMACIÓN DISCRIMINATIVA: MVE ("Minimum Verification Error") ........................................................................................................................11 S. MINIMIZANDO EL ÁREA BAJO LA CURVA DET ............ .... ....... . ... . .............. . .......... 13 RESULTADOS ..................................................................................................................................16 6.1 Base de Datos... ............. . ....................... ... .............. . ............................ . ..... ............................. 16 6.2 Condiciones de señal limpia ............. . ... . ...... . ... . ................... . ............. ... ....................... 16 6.3 Condiciones de señal con ruido... .... . ..................................................... . ................ ..17 CONCLUSIONES ............... . ....................... .. ... .......... .. .......... . .................. . ............. ......................... 18 REFERENCIAS ... . ............... .. ..... . .................................. . .......... .... ..................... . ............................... 19 BIBLIOGRAFÍA ......... . ...... . ................. . ................................. .... ............................. .. ......................... 21 AGRADECIMIENTOS ........... ........... . ... . ...... . ...................................................... ........................ 23 CURRICULUM VITAE ... . ..................... . .................. .. ............ . ........... . ............... . ......... .... ........... 24 Especialidad: Comunicaciones y Electrónica 3
  • 4. VERIFICACIÓN A UTOMA'TICA DEL LOCUTOR RESUMEN E)ECUTIVO En el presente trabajo se presentó un sistema para Verificación de Locutor basado en MVE (Minimum Verification Error), el cual es un método discriminativo que minimiza el área bajo la curva en lugar de optimizar un punto de operación. Los resultados en señales limpias utilizando la técnica MVE mejoró a la técnica convencional por más del 15.30%, y minimizando el área bajo la curva todavía mejoró otro 2.22% mas. Aplicando la minimización del área bajo la curva sobre JFA mejoró el resultado por 1.16% comparado con JFA puro. Los resultados de AUC-JFA y AUC-MVE en señales corruptas con ruido aditivo de diferentes tipos mejoran en un 6.05% y 10.49% respectivamente con respecto al rendimiento de la técnica convencional. Palabras clave: verificación de personas, biométricas, reconocimiento de patrones, reconocimiento de personas Especialidad: Comunicaciones y Electrónica 4
  • 5. VERIFICACIÓN AUTOMÁTICA DEL LOCUTOR 1. INTRODUCCIÓN Los sistemas de reconocimiento biométrico utilizan alguna característica de la persona para reconocerlo. Estas características pueden ser intrusivas como pruebas de sangre; o puede ser no intrusiva como características del rostro, de la palma de la mano, la forma de caminar, la forma de hablar, el iris, etc. Los sistemas de reconocimiento biométrico de personas se dividen en sistemas de identificación y sistemas de verificación. En los sistemas de identificación se desea obtener la persona que tiene las características más parecidas a las presentadas. Generalmente, el universo de personas que se busca es limitado, por ejemplo a un departamento, a una empresa, a una ciudad, a afiliados, etc. En caso de que se utilice identificación biométrica para una investigación forense, entonces la principal amenaza para estos sistemas es que la persona va a intente hablar diferente para evitar ser identificado. En un sistema de verificación, el sistema coteja las características biométricas del individuo con un modelo acústico de la persona quien dice ser. El sistema debe de confirmar/negar si la personas es quien dice ser. Los sistemas de verificación biométricas son generalmente utilizados para control de acceso. La principal amenaza para los sistemas de verificación de personas es que el individuo intente imitar a la otra persona. Los humanos utilizamos como uno de los medios de comunicación el sonido generado por nuestra sistema bucal. La voz generada depende de muchas variables como el tamaño, grosor, elasticidad de nuestras cuerdas bucales, el tamaño de nuestra laringe, boca, etc. Tal es la diferencia entre individuos de estas características que la voz se puede utilizar como biométrica. En el presente trabajo se presenta un sistema que se han diseñado y desarrollado para realizar la tarea de verificación del locutor. Con este sistema se ha participado en evaluaciones internacionales y hemos obtenido muy buenos resultados. En la sección 2 se presenta la arquitectura de un sistema para ASV convencional. En esta arquitectura se presenta la función de cada módulo de la arquitectura. En la sección 3 se presenta la técnica JFK (Joint Factor Analysis) que se utiliza en un sistemas ASV para separar las características del canal de las características de los usuarios. En la sección 4 se presenta una técnica discriminativa que aplicamos a un sistema ASV. Especialidad: Comunicaciones y Electrónica 5
  • 6. VERIFICACIÓN AUTOMÁTICA DEL LOCUTOR En la sección 5 se presenta una técnica de optimización que se aplica a diferentes técnicas utilizadas en sistemas ASV5. En la sección 6 se presentan resultados tanto de técnicas tradicionales como las que hemos desarrollado. En la sección 7 se presentan las Conclusiones. 0 Especialidad: Comunicaciones y Electrónica 6
  • 7. VERIFICACIÓN AUTOMÁTICA DEL LOCUTOR 2. SISTEMAS CONVENCIONALES [3, 41 En la figura se muestra la arquitectura de nuestro sistema de Verificadón de Locutor. Esta arquitectura tiene dos partes. La parte de entrenamiento de los modelos acústicos de los Locutores. La parte de evaluación del sistema utilizando los modelos acústicos de los Locutores. Udez __j MAV í1 •1AF' GMM proce5amlent MFCC (JIM de 1rget de voz) [ntrenamiento (i" (Tlcuhd') 1 Acept3d rocesamlentL 1-r1 pUntu.00n L p =(:lH1 rechazclo voz 1..L__J 1J Nomalizcón Cálculo de decsón untuación y = NIH Lvaluacion del Target En el primer módulo de la arquitectura el "pre-procesamiento" de la señal de voz de los locutores objetivo, como locutores intrusos. En este módulo se procesa la señal de voz para obtener las características de la voz de los locutores. Lo deseable de estas características es que sean lo más diferenciadoras posibles entre locutores, tal que faciliten la verificación de los mismos. Este módulo es el mismo tanto en la parte de entrenamiento de los modelos acústico, como en la parte de evaluación del sistema. El procesamiento de la señal de voz se hace por segmentos de tiempo; cada segmento de tiempo con una duración de entre 20ms y 40ms. Esto se debe a que es importante que la señal analizada sea estacionaria; y resulta que la señal de voz generada por las personas es una señal estacionaria en segmentos pequeños (quasi- estacionaria). Entonces podemos analizar la señal por intervalos pequeños en tiempo. En este intervalo de tiempo podemos obtener características como número de cruces por Cero (al graficar la señal), energía, máxima amplitud, periodo. También podemos obtener su espectro de Especialidad: Comunicaciones y Electrónica 7
  • 8. VERIFICACIÓN AUTOMÁTICA DEL LOCUTOR Fourier y obtener otras características en función de la frecuencia como distribución de la energía y frecuencias de resonancia. En nuestro trabajo hemos encontrado buenos resultados para periodos de tiempo de 40ms y calculando la energía de este segment así como los coeficientes MFCC ("Me! Frequency Cepstral Coefficients"). Los MFCC se calculan primeramente calculando la Transformada Discreta de Fourier para cada segmento de tiempo ("STFT- Short-Time Discrete Fourier Transform"); después se calcula la Transformada Coseno del logaritmo de la magnitud de la energía para cada uno de los componentes de STFT. La transformada Coseno genera los MFCC5. Utilizamos también las características dinámicas de los coeficientes representadas por la primera y segunda derivada. En nuestro trabajo hemos encontrado buenos resultados para periodos de tiempo de 40ms, y para cada segmente obtenemos un vector de dimensión 58 (1 representando la energía de la señal, 19 coeficientes MFCC, y sus primeras y segundas derivadas). Con las características de la señal de voz de los locutores objetivos, el siguiente módulo del sección del entrenamiento son los módulos para "Modelación Locutores Objetivos (Targets)". Con las características de los locutores intrusos se crea un "Modelo de Locutores Intrusos", lo que se le conoce como UBM (Universal Background Model). La modelación acústica de cada locutor es un GMM ("Gaussian Mixture Model") que es una Cadena Escondida de Markov de un estado. Cada estado de la GMM tiene un vector con las medias de la energía y de los MFCCs, incluyendo su primer y segunda derivada; y el otro vector con las varianzas de la energía y de cada uno de los MFCCs, incluyendo sus primera y segunda derivada. Debido a la cantidad de datos que generalmente se encuentran en una tarea de Verificación de Locutores, la estimación de estos parámetros es utilizando MAP (Maximum A Posteriori). En la parte de la Evaluación, el locutor se identifica y genera una señal de voz, entonces primero calculamos los MFCCs de la señal de voz; después, calculamos las puntuaciones del locutor tanto para el modelo del locutor objetivo, como para el modelo UBM. Dados las dos puntuaciones, el problema de clasificación involucra dos hipótesis: que el usuario legítimo (quien dice ser), 7-t, o que el usuario sea un impostor, J-(. Sea pA(zIJCo) la función de densidad condicional de la puntuación observada z generada por el locutor auténtico A. De la misma manera sea pA(zI/-(1) la función de densidad condicional de la puntuación (score) observada z generada por locutores impostores de A. Especialidad: Comunicaciones y Electrónica 8
  • 9. VERIFICACIÓN A UTOMA' TICA DEL LOCUTOR La densidad condicional pA(zIXo) se estima con las puntuaciones de del mismo locutor A utilizando su modelo acústico. La densidad condicional pA(zIH'l) se estima con las puntuaciones de todos los impostores posibles utilizando el modelo acústico de A. Cuando todos los impostores comparten el mismo modelo entonces se le conoce como Modelo Universal (UBM- Universal Background Model) Si conocemos las densidades condicionales de pA(zIfHo) ' pA(zIfH'l), entonces una prueba de Bayes, con el mismo "costo de error en la clasificación" por locutor, se basa en la taza de verosimilitud (Iikelihood ratio) para el locutor A [2,15] como se muestra a continuación: 2 PA(ZI1) A - PACZI'O) o en el dominio logarítmico = 109(pA(zIi-c1)) - log(pA (zIJ-CO)). Entonces, el problema de clasificación es el siguiente: 'r seleccione 1f1 Si log(p(zIJ-C)) - log(pA(z11-CO)) t< -r seleccione J{0 Con el propósito de simplificar las figura que se presentan de aquí en adelante, vamos a simplificar la gráfica de la arquitectura como se muestra a continuación: rce&:rnient MAP [ntrenamjento d iarget. Norm, LIC!(lfl Pro ce-sarn iento c,re 1ec:ión Iltva Iuacjón Especialidad: Comunicaciones y Electrónica 9
  • 10. VERIFICACIÓN AUTOMÁTICA DEL LOCUTOR 3. ESTADO DEL ARTE: iFA (Joint Factor Analysis) [5, 6] El propósito de JFA es separar la voz del locutor y las características del canal. Esto es porque el canal crea distorsión en la señal, lo cual afecta la precisión para identificar las personas. En JFA, las medias de todas las Gaussianas en una GMM son concatenadas en un solo vector llamado, supervector MSCh = II 112 11/23 II }. El supervector M representa el GMM para la distribución de datos sobre cada tipo de canal Ch para el locutor S. Ms,Ch = 172 + Vy + UXSCh + DZ5 donde m es una media global de todos los locutors; y es un conjunto de voces características (elgenvoices) representando el subespacio en el que se ubican los componentes específicos de los locutors, U es un conjunto de canales característicos (eigenchannels) representando el subespacio sobre el cual están los componentes específicos de un canal. D es una matriz diagonal. Ys es un vector con distribución Normal que representa los factores específicos del locutor 5. Xç, es un vector con distribución Normal que representa los factores específicos del locutor 5 sobre el canal Ch. Z5 es un vector con distribución Normal que representa un error residual; El entrenamiento de V,UyD es utilizando el algoritmo de Baum- Welch; El aprendizaje de YS,ZSYXS,Ch es utilizando procedimiento EM (Expectation Maximization) [6, 5]. EW - baum Lxoect.iton Fre- MAP 1 V (J.D and Wekh 1.43Jmz.3tIon rrocesamlentoj t J Crea iupervector (TiP1M 1 de 1- de [ntrenamiento CIeUrM (Jsuanos (Isuanos F're- Cilculode ......prcesamIent scores EJecisión rchz o tvaIuacíán Especialidad: Comunicaciones y Electrónica 10