TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
La biometria voz_elemento_de_conviccion
1. ENSAYO
TEMA:
LA BIOMETRIA DE VOZ COMO NUEVO ELEMENTO DE CONVICCION
DENTRO DE LA PRUEBA PENAL
1. INTRODUCCIÓN
Desde los primeros días del hombre en la tierra, uno de los principios
naturales fue, es y seguirá siendo la identificación de personas, claro en
sus inicios se utilizaron métodos arcaicos y nada técnicos como
mutilaciones, deformaciones, marcas, etc.; desde luego estos métodos
de identificación eran usados en personas que cometían actos que se
encontraban fuera de los márgenes de la ley, pero con el transcurrir del
tiempo y la evolución de los medios de prueba, el intelecto del hombre
ha permitido desarrollar nuevos métodos, técnicas y sistemas seguros y
fiables para determinar la identidad y participación de una o varias
personas en un hecho presumiblemente delictuoso.
La sociedad actual enfrenta un temor constante al ser víctimas de actos
de violencia, la imparable proliferación de los distintos tipos de delitos, la
falta de control y seguridad han pasado a convertirse en un fenómeno de
connotación y trascendencia social a nivel mundial, traspasando
fronteras y violentando leyes y normas internacionales y nacionales,
generando en la sociedad un sentimiento de inseguridad y falta de
confianza en los operadores de justicia y seguridad social.
Dado el aumento de la delincuencia, las denuncias judiciales y reportajes
periodísticos de las conductas ilícitas en los últimos años, el Gobierno
Nacional Ecuatoriano ha visto necesario e indispensable fortalecer el
desarrollo de la Criminalística en el país, generando transformaciones
positivas, aunadas a los adelantos tecnológicos y descubrimientos
científicos.
La era cibernética ha tomado mucha importancia, obligándonos a utilizar
programas computacionales para una adecuada intervención pericial, en
este contexto el éxito de toda investigación criminalística radica hoy en
día en la correcta aplicación de cada uno de los pasos y métodos
científicos, para poder alcanzar conocimientos validos susceptibles de
ser verificados por instrumentos confíales y de esta manera alcanzar un
resultado o un determinado fin, lo que permitirá obtener información
fidedigna respecto al delito que se está investigando.
La labor del perito criminalistico radica en dar respuesta a todas las
interrogantes periciales que surgen de cualquier hecho desconocido y la
obtención de pruebas suficientes y adecuadas que se puedan adquirir a
2. través del estudio, pero también de la práctica, con la finalidad de
determinar en qué forma se cometió el delito y quien lo cometió.
2. ABSTRACT
From the earliest days of man on the earth, one of the natural principles
was, is and will be the identification of persons, archaic and non-technical
methods were used as mutilation, deformations, brands, etc.; these
methods were used in identifying persons who committed acts were
outside the margins of the law, with the passage of time and the
evolution of the evidence, man's intellect has helped to develop new
methods, techniques and systems reliable to determine the identity and
participation of one or more persons into a potentially criminal act.
Today's society faces a constant fear of being victims of violence, the
unstoppable proliferation of different types of crime, lack of control and
security have gone on to become a social problem worldwide, crossing
borders and violating international and national laws and regulations,
generating in society a feeling of insecurity and lack of confidence in the
administration of justice and social security.
Given the increase of the crime, lawsuits and media reports of illegal
activities in recent years, the Ecuadorian Government has been
necessary and essential to strengthen the development of forensic
investigation in the country, generating positive changes, with
technological advances and scientific discoveries.
The cyber age has become increasingly important, forcing us to use
computer programs to an appropriate expert investigation, the success of
any criminal investigation today depends on the correct application of
each of the steps and scientific methods, with the purpose to attain
knowledge on valid and results confide, allowing to obtain reliable
information about the crime being investigated.
The work of the forensic investigator is to answer all questions that arise
expert of any unknown fact and obtaining sufficient and appropriate
evidence can be gained through the study and practice, to determine
how the crime was committed and who committed it.
3. 3. IDENTIFICACIÓN HUMANA POR LA VOZ 1
La frecuencia y la amplitud de las vibraciones de las cuerdas vocales
resultan propias e idénticas para cada persona, inclusive si se intenta
disimular la voz (Principio de mismidad).
Por otra parte, mediante la aplicación de métodos lingüísticos analíticos,
es posible obtener indicios sobre la edad, el sexo, el nivel cultural, la
ocupación y los antecedentes geográficos y étnicos del hablante.
En el ser humano se da la condición única entre los mamíferos
superiores de poder modificar voluntariamente el diámetro del tracto
vocal en distintos nivele del mismo, alterando la resonancia del sonido
emitido a nivel glótico, hecho que cambia la frecuencia de los formantes,
consiguiendo la emisión de una infinita gama de sonidos vocálicos o
semivocalicos.
La producción de la voz humana es la materialización del sonido de un
instrumento único que puede, a diferencia de los demás instrumentos,
modificar su estructura intima para variar el sonido con la sola acción,
consciente o subconsciente, voluntaria o no de su dueño. Es un
instrumento que forma parte de nosotros mismos y que nos acompaña
toda la vida.
La aparición de la grabación electromagnética del sonido y la invención
del tubo de rayos catódicos aplicado en el osciloscopio, permitieron que
surjan los métodos de observación directa y grafica de las ondas
sonoras, los cuales inauguran una etapa completamente distinta en la
apreciación e investigación del sonido.
Lo primero que surge del análisis de la imagen de la onda sonora
generada en la glotis, es que si característica de sinusoide perfecta o
tono puro se va modificando según la suma y sustracción de los valores
de las ondas sobrepuestas, convirtiéndose en una onda compleja.
Dicha modificación ocurre a medida que el sonido glotal, en su paso por
el tracto vocal, encuentra la respuesta de resonancia natural de las
estructuras a diversas alturas del mismo; éstas generan las llamadas
formantes de la voz.
Los gráficos de los sonidos presentan un patrón de constante según el
sonido emitido. Si bien existen variaciones en la frecuencia y en la
intensidad, se mantiene un patrón de fondo que hace reconocible al
fenómeno en todo momento.
1
Jorge Silveyra, Sistemas de Identificación Humana.
4. 4. LA VOZ 2
Es el resultado de la función que realiza el conjunto de órganos del
cuerpo humano, conocido como aparato fonador.
La voz “femenina” se divide en grave, media y aguda. Si es aguda se
llama de soprano; si es media se llama de mezo soprano y si es grave
se llama de alto o contralto.
La voz “masculina” también puede ser grave, media y aguda. Si es
grave se llama de bajo, es media de barítono y si es aguda de tenor.
La emisión de la voz se mide mediante tres parámetros básicos:
Intensidad: Son los decibelios los que miden dicha intensidad. Se
determinan las voces fuertes o flojas.
Tono o frecuencia de la voz: Se mide mediante ciclos por segundo o
hertz. Se determinan de este modo las voces graves o agudas.
Timbre: Determina las características propias de la voz. Son los
armónicos. Así tenemos voces metálicas, voces apagadas, etc. Las
cavidades de resonancia determinan en parte el timbre de la voz.
5. CUALIDADES DE LA VOZ 3
Fuente: psique0101.blogspot.com
5.1. Las articulaciones
Son los movimientos de la boca que modifican la voz. Las
articulaciones producen las letras, las sílabas y las palabras.
5.2. La intensidad de la voz
Es el mayor o menor grado de fuerza al emitir los sonidos.
2
Tomado de: http://www.juntadeandalucia.es/averroes/iesmateoaleman/musica/la_voz.htm
3
Tomado de: http://www.slideshare.net/akamaru11/cualidades-de-la-voz
5. 5.3. La duración de la voz
Es el tiempo que se emplea en la emisión de los sonidos, la
duración de la voz constituye la cantidad de sílabas emitidas y
pueden ser largas o breves.
5.4. La extensión de la voz
Es la inflexión aguda o grave que se produce según se dilata más
o menos la laringe. El tono que puede ser grave o agudo.
6. RECONOCIMIENTO DE LA VOZ 4
La voz es otra característica que las personas utilizan comúnmente para
identificar a los demás. Es posible detectar patrones en el espectro de la
frecuencia de voz de una persona, que son casi tan divisivos como las
huellas dactilares. Sólo basta recordar las veces en que reconocemos a
alguien por teléfono para comprender la riqueza de esta característica
como método de identificación.
Los sistemas de verificación mediante la voz escuchan mucho más allá
del modo de hablar y el tono de voz. Mediante al análisis de los sonidos
que emitimos-tonos bajos y agudos, vibración de la laringe, tonos
nasales y de la garganta, también crean modelos de la anatomía de la
tráquea, cuerdas vocales y cavidades. Muchos de estos sistemas operan
independientemente del idioma o el acento de la persona.
La manera de operación consiste en que la persona pronuncie un código
de acceso prefijado (nombre, apellido, teléfono, cedula, o una frase
diferente cada vez por invitación del sistema-lo cual suele ser más
seguro), y el sistema lo reconoce o no, a partir de las características de
la voz grabada en el momento de acceso.
En un sistema para el reconocimiento de voz, se emplea la biometría
física y de conducta, con el objeto de poder analizar patrones de habla e
identificar al interlocutor. Para llevar a cabo esta tarea, el patrón creado
previamente por el interlocutor debe ser digitalizado y mantenido en una
base de datos, que generalmente es una cinta digital de audio. Este
sistema no requiere de ningún nuevo hardware, ya que la mayoría de las
PC contienen un micrófono.
Para autenticar a un usuario utilizando un reconocedor de voz se debe
disponer de ciertas condiciones para el correcto registro de los datos,
tales como ausencia de ruidos, reverberaciones o ecos; idealmente,
estas condiciones han de ser las mismas siempre que se necesite la
autenticación.
4
Jorge Silveyra, Sistemas de Identificación Humana.
6. Los sistemas que van proponiendo a la persona la pronunciación de
ciertas palabras extraídas de un conjunto bastante grande, proporcionan
menor seguridad en comparación con los del texto independiente. De
cualquier forma, sea cual sea el modelo, lo habitual es que las frases o
palabras sean características para maximizar la cantidad de datos que
se pueden analizar (por ejemplo, frases con una cierta entonación,
pronunciación de los diptongos, palabras con muchas vocales, etc.).
Conforme va hablando el usuario, el sistema registra toda la información
que le es útil; cuando termina la frase, ya ha de estar en disposición de
facilitar o denegar el acceso, en función de la información analizada y
contrastada con la de la base de datos.
Cuando un usuario desea acceder por medio de este sistema,
pronunciara unas frases en las cuales reside gran parte de la seguridad
del protocolo; en algunos modelos (los denominados de texto
dependiente), el sistema tiene almacenadas un conjunto muy limitado de
frases que es capaz de reconocer: por ejemplo, imaginemos que el
usuario se limita a pronunciar su nombre, de forma que el reconocedor lo
entienda y lo autentique.
Esa tecnología ya fue utilizada, pero no fue bien recibida (a pesar de ser
relativamente barata), pues es bastante fácil de romper con grabaciones
digitales y por la posibilidad de rechazar una autenticación de alguien
que tenga los patrones levemente alterados por causa de la inestabilidad
de la voz.
El principal problema del reconocimiento de voz es la inmunidad frente a
replay attacks, un modelo de ataques de simulación en los que un
atacante reproduce (por ejemplo, por medio de un magnetófono) las
frases o palabras que el usuario legítimo pronuncia para acceder al
sistema. Este problema es especialmente dificultoso en los sistemas que
se basan en textos preestablecidos. Por otro lado, en modelos de textos
independientes, más atractivos, este ataque no es tan sencillo, por
cuanto la autenticación se produce realmente por una especie de
desafío-respuesta entre el usuario y la máquina.
Otro grave problema de los sistemas basados en reconocimiento de voz
es el tiempo que el usuario emplea hablando delante del analizador, al
que se añade el que éste necesita para extraer la información y
contestarla con la de su base de datos; aunque actualmente en la
mayoría de los sistemas basta con una sola frase.
Generalmente se tiende a confundir este tipo sistemas con el de
reconocimiento de palabras o interpretador de comandos hablado, los
cuales existen comercialmente para ser integrados a una computadora
personal. Este reconocimiento de palabras no es biometría, ya que solo
está diseñado para reconocer palabras del interlocutor.
7. 7. PERITAJES TENDIENTES A LA IDENTIFICACIÓN DE LA VOZ 5
7.1. Concepto
“El peritaje de reconocimiento de voz humana es la actividad
pericial capaz de determinar si dos voces fueron producidas por un
mismo hablante”.
Los peritajes tendientes a la identificación de voz se realizan con el
objeto de individualizar a personas que se encuentran grabadas en
medios de audio convencionales, casetes, microcasetes, en
formato de videos VHS, discos compactos CD, o cualquier otro
medio de grabación que permita la conversión del mismo a los
sistemas de audio descriptos.
En este tipo de estudios no hay cantidades de puntos
característicos a señalar en la voz (como ocurre en la
dactiloscopia) para que se establezca un límite por encima del cual
estos determinan la autoría de la voz.
Los peritajes no son del tipo descriptivo, en los cuales la función del
perito es describir lo que se ve sin el compromiso de concluir sobre
lo que está siendo examinado, sino que es mucho más que eso, el
perito necesita equipamiento adecuado y conocimientos técnicos
en el área, para poder llegar a la conclusión de la existencia o no
de la autoría.
Los estudios son también denominados por algunos juristas como
peritaje fonolingual, y están dentro de las llamadas investigaciones
electrónicas. A través de estas metodologías se permite la
identificación del hablante, pero no con el carácter de huella
vocálica, o su sinónimo en ingles voiceprint, concepto que fue
creado por Gray y G. Koop en 1944, y luego retomado en la
década del 60 por L. Kresta.
El termino voiceprint, está asociado a fingerprint (huella digital),
posiblemente con el objeto de darle a la huella vocal un valor de
infalibilidad similar a la huella digital, pero en la práctica esa
similitud no existe. En la década de 70, O. Tossi vuelve a defender
el término infalibilidad empleando la voz voiceprint.
En 1979, la Academia Nacional de Ciencias de Estados Unidos de
América, declaró el uso del término voicegram (grafico de la voz)
en lugar de voiceprint.
Como se pueden apreciar las controversias presentadas llevan a
concluir que este tipo de estudios de identificación humana son
muy distintos a los conocidos comúnmente en scopometría, ya que
para llegar a conclusiones categóricas es necesario combinar en
los análisis la parte objetiva de los confrontes (sistema electrónico
5
Jorge Silveyra, Sistemas de Identificación Humana.
8. de medición) y la parte subjetiva (interpretación de la fonética del
hablante), hallándose ambos estudios dentro del campo de los
expertos en electrónica o informática, y en fonoaudiología; ambos
conocimientos también se conjugan en el campo de los estudios de
los licenciados en criminalística especializados.
7.2. Estructura recomendada para la investigación 6
La estructura de la investigación de identificación de fonogramas
verbales depende directamente de los métodos utilizados y en
general de su correspondencia con el tipo de estructura de las
conclusiones de los peritajes de fonoscopia elaborados por los
expertos, reconocidos hoy en día en este tipo de peritajes en las
dependencias de los sistemas del Ministerio de Asuntos Internos,
Ministerio de Justicia, Servicio Federal de Seguridad, y Servicio de
control financiero antinarcóticos en la Federación Rusa.
El siguiente manual metodológico, considera la utilización de los
siguientes tipos de análisis: auditivo (análisis de las
particularidades del sonido del lenguaje), Lingüístico e
Instrumental.
El peritaje ejecutado en base a esta metodología tiene que ser
ejecutado por una comisión de expertos (dos o más expertos),
poseedores de conocimientos especializados en el campo de la
investigación instrumental del lenguaje así como en lingüística, aun
que, en principio, es aceptable que la ejecución del peritaje la
efectué un solo experto, que posea conocimientos teóricos
indispensables así como la experiencia práctica en las ramas de la
ciencia y técnica necesarias.
8. TÉCNICA DE ANALISIS PATRA LA IDENTIFICACION POR VOZ 7
Las características de frecuencia de los fonogramas, en general ofrecen
la posibilidad de ejecutar un análisis espectral informativo, esto es
ejecutar la segmentación de la señal de voz en base a las diferentes
características de los fragmentos de sonido, así como permiten
seleccionar y valorar las particularidades de la voz a través de la
estructura de formantes indispensables para la investigación de
identificación de locutores, con la utilización de los medios
indispensables de compensación de distorsiones de frecuencias y
amplitudes en los fonogramas. En otras palabras, permiten ejecutar un
análisis espectral informativo en todo el diapasón de frecuencia de la
señal verbal.
6
Speech Technology Center
7
TransformAda Rapida de Fourier
9. De esta manera, la comparación de formantes es útil para la
ejecución del peritaje de fonoscopia: investigación de indicadores
de inninterrupción de los fonogramas y las tareas de investigación
para la identificación en todo su contenido.
9. PROCEDIMENTO 8
9.1. Análisis auditivo
Dentro de este método de análisis, el experto valora al escuchar
los archivos «al oído» : el sexo del locutor, la edad, la altura de la
voz, caracteres generales del sonido de la voz, fuerza,
entonación, tiempo, ritmo, articulación, intermitencia del habla,
maneras del lenguaje, pausas de vacilación, trastornos del
lenguaje, respiración verbal. Respiración del habla.
9.2. Análisis Auditivo – Lingüístico
La principal dirección en la investigación lingüística esta orientada
a la determinación o detección de las identidades-diferencias del
lenguaje de los locutores comparados en base al análisis de sus
particularidades individuales en la pronunciación de unidades del
lenguaje de diferente nivel: fluente verbal – frase – palabra-
sonido.
Fluente de sonido. Voz.
Articulación.
Cultura Verbal.
Frases, sintagmas,
palabras.
Sintáxis.
Morfología.
Léxico.
Fonética.
Sonidos. Vocales.
Consonantes.
Los indicadores de la voz, traen con sigo información sobre la
altura, estilo, y timbre de la voz que nos indican las
particularidades individuales en la conformación del tracto bucal
del hablante. La altura de la voz se define como la frecuencia de
la ondulación de las cuerdas bucales, las que a su véz, dependen
8
Speech Technology Center
10. de su longitud, espesura y tensión Se diferencian algunos tipos
de voz: alta, media, y baja.
La fuerza de la voz, depende de la intensidad de la corriente de
aire respirado y la fuerza de tensión en las cuerdas bucales.
El timbre de voz, está motivado por la unión al tono principal
generador del sonido de tonos adicionales (obertonos). Su
cantidad y fuerza de elocución dependen principalmente de la
estructura de la laringe. La concreta combinación y expresión de
los obertonos, es la que determina las particularidades
individuales de la voz y el timbre.
La voz suena suave o baja, «estancada», en la parte trasera de
las cuerdas bucales y por esta razón, rápidamente se
apaga/debilita.
Al contrario al timbre de voz sordo están los timbres sonoros,
eso es, la voz correcta orientada por la parte frontal o delantera de
las cuerdas bucales y que resuena en este lugar. El matiz
nasalizado de la voz es un indicador de la entrada de una parte de
la corriente de aire en la nasofaringe.
El sonido brusco forzado habla de exagerada tensión en las
cuerdas bucales. Si la tensión cae a un tono bajo, la voz suena
de una manera chillona, si en un tono alto, resulta una voz
chillona- aguda.
El timbre fuerte de voz aparece ante la incompleta e inconsistente
tensión de las cuerdas bucales, lo que puede haber sido
producido, en particular, por la irritación o henchimiento de la
hortal, así como de las cuerdas bucales en sí. El tono ronco –, es
el estado más fuerte de la voz ronca.
9.3. Análisis Instrumental
Análisis integral estadístico de las frecuencias del tono
principal:
El método del análisis integral estadístico de las frecuencias del
tono principal permite al experto o perito, en el régimen
automático ejecutar la comparación de la voz de dos locutores.
9.4. Análisis Fonético-espectral
En los análisis objetivos, auditivos e instrumentales, diferencias en
la utilización del sistema del idioma español, contradictorias en
serie, profundidades, levantamientos, en los locutores
investigados no se encontraron. Así como no fueron detectadas
11. diferencias en el sistema de utilización de los locutores de los
fonemas consonantes.
La conclusión señalada con anterioridad se obtuvo como
resultado del análisis comparativo de los locutores en el nivel
del fluido verbal, al igual que en la comparación de la
pronunciación de frases y palabras por separado. Más adelante,
vendrán descripciones gráficas y cálculos, que corroboraran la
coincidencia en las características del habla y la voz de los
locutores comparados.
10. CONCLUSIONES
Cada tipo de análisis ejecutado durante la investigación de
comparación de objetos llego a la coincidencia del conjunto de los
indicadores individualizados característicos de la voz y el lenguaje
del locutor desconocido “locutor 1 Hombre” en el fonograma
dubitado y las muestras de voz y lenguaje de “Indubitada voz
Hombre”.
En los casos de investigación de expertos, la utilización de diferentes
subtipos de análisis que son relativamente independientes,
frecuentemente las decisiones de identificación, tomadas en base a
cada tipo de análisis por separado, son así mismo relativamente
independientes. Por esta razón previa a la toma de una decisión
sintetizada definitiva la posibilidad de una error en cada uno de los
análisis podemos multiplicarla.
En base a los cálculos valorados por los expertos, considerando la
cantidad de material de voz-habla a su disposición y el nivel establecido
del parecido de las particularidades anatómico-fisiológicas, hábitos del
habla de diferentes niveles y la especificidad individual-personal de los
12. locutores comparados, el conjunto de posibilidades de una coincidencia
fortuita en los resultados de la investigación utilizando los resultados de
los indicadores de identificación del locutor « locutor 1 Hombre » en y
para la muestra de voz y habla « indubitada voz Hombre » en base a los
materiales de esta investigación de expertos son menores al mínimo
necesario, lo que permite a los expertos tomar una decisión de
identificación categórica.
Situativamente no condicionadas, diferencias importantes en el lenguaje
oral así como indicadores de imitación de la voz, que hablarían de una
diferencia en la identificación del locutor « locutor 1 Hombre » y para la
muestra de voz y habla « indubitada voz Hombre », no fueron
encontradas.
En el proceso de identificación a través de los análisis auditivos,
lingüístico e instrumental de los indicadores de identificación individuales
con las características representativas del lenguaje oral de los locutores
comparados generan un único e incontradecible y solido complejo del
nivel de coincidencia, que es lo suficientemente necesaria para
establecer la identidad individual concreta de los locutores.
De esta manera, la investigación compleja de identificación ejecutada
permite llegar a la conclusión de que la voz y el lenguaje del locutor
cuyas replicas están señaladas como « locutor 1 Hombre » y las
muestras de voz y lenguaje de « indubitada voz Hombre »
pertenecen a una misma persona.
BIBILOGRAFIA
Jorge Silveyra, Sistemas de Identificación Humana.
http://www.juntadeandalucia.es/averroes/iesmateoaleman/musica/la_voz
http://www.slideshare.net/akamaru11/cualidades-de-la-voz
Speech Technology Center
Transformada Rápida de Fourier