Aplicacion de descriptores de sonido

Aplicación de métodos de descripción de sonidos
Universidad Nacional de Trujillo
Ingenier´ıa informática
Orlando Salazar Campos
Daniel Cam Urquizo
danielcam3@hotmail.com
Palabras claves
Multimedia, metodos, descriptores, sonido, texturas
1 Introducción
El objetivo del resumen es revisar los métodos de medición conocidos y descriptores objetivas
existentes para la cuantificación de campo de sonido. Se verá algunos conceptos, los méritos,
las deficiencias y el uso potencial. La aplicación de los descriptores será: la construcción de
descriptores de audio perceptiva de alto nivel para los sonidos de textura.
Para hacer música en la era digital, las técnicas para la navegación eficiente en el vasto
universo de almacenar digitalmente sonidos se han vuelto indispensables.
Se detallará también la construcción de descriptores computables capaces de modelar
cualidades perceptivas relevantes de sonido.
2 Método
La idea general de este trabajo es construir descriptores perceptuales de una representación
subyacente uniforme para los datos de audio digitales con unos pocos pasos de procesamiento
y un número pequeño (para evitar el peligro de exceso de ajuste desde el principio) de
parámetros ajustables. Estos parámetros se pueden ajustar para que coincida con puntua-
ciones de percepción de sonidos de un cuerpo representativo.
3 Tipos de metodos de descriptores
3.1 Descriptor de alto-bajo
Esta caracter´ıstica de audio está bastante bien representado por el descriptor de audio Per-
ceptualSharpness existente, que es el ”equivalente perceptual al centroide espectral pero
calcula utilizando la sonoridad espec´ıfica de las bandas Bark”. Este último ya está pro-
porcionado por nuestra representación tiempo-frecuencia elegida, por lo que sólo tienen que
calcular los centroides espectrales, pero no sin la aplicación de algunos coeficientes de defor-
mación sintonizables.
3.2 Descriptores para ordenado-caótico
Tenemos la sospecha de que la percepción del orden contra el caos no es sensible con respecto
a la intensidad, sino más bien para temporal estructura. Por lo tanto, lo primero quitamos
la dirección de la ecograf´ıa con respecto al volumen de filtrado de paso alto a lo largo del eje
de tiempo. Esto se hace mediante la sustracción de una convolución el volumen medio (en
todas las frecuencias)
1

Figure 1: Mapa mosaico interactivo para navegar por los sonidos de textura
3.3 Descriptor de lisa-gruesa
Es intuitivo para identificar la noción de grosor con cambios bruscos en la intensidad más
amplias gamas de frecuencia. Por lo tanto, calculamos las diferencias absolutas a lo largo
del eje de tiempo e integrar a lo largo del eje de frecuencia. Por esa usamos una media
generalizada la máxima exponente , con lo que apretando las diferencias de magnitud entre
las bandas de frecuencia individuales.
3.4 Descriptor de ruido-tonal
La noción de pitchedness se expresa comúnmente por el presencia espectral fuerte, aislado
e inmóvil componentes. Esto se opone a un continuo espectral fluctúa en el tiempo, lo que
indica el ruido.Como prueba de concepto, una aplicación de navegador sonido protot´ıpico 8
se ha desarrollado que proporciona una adecuada visualización de las cualidades perceptivas
bajo examen, mediante el uso de valores de descriptor calculados para el conjunto de los
100 sonidos de textura. La figura 1 muestra una captura de pantalla de las principales
correlaciones apenas degrada, las correlaciones laterales son notablemente más reducido.
4 Conclusiones
Hemos detallado la construcción de descriptores de audio capaz de modelar cualidades de alto
nivel, metafóricas de sonido de textura que se han identificado como perceptivamente rele-
vantes en la investigación anterior. Cada uno de del descriptores contiene un pequeño número
de parámetros ajustables que se han sintonizado a un corpus de 100 texturales-sonidos en
su mayor´ıa abstracto y del medio ambiente. La evaluación ha dado las correlaciones de
Pearson entre los descriptores de audio y valoraciones humanas obtenidas de pruebas de es-
cucha de arriba 0,74 para las construcciones ordenado-caótico, suave gruesa, tonal-ruidoso,
homogéneo-heterogéneo y hasta 0,90 para la construcción de máximos y m´ınimos.
5 Referencia
5.1 webgraf´ıa
• Diemo Schwarz, DESCRIPTOR-BASED SOUND TEXTURE SAMPLING,2010. Disponible
en: urlsmcnetwork.org/files/proceedings/2010/75.pdf
• Stanislav Barton, Qualitative Comparison of Audio and Visual Descriptors Distribu-
tions ,2011. Disponible en: urlhttp://www.xtec.cat/ pmarques/uabtranp/sld032.htm
2

Aplicacion de descriptores de sonido

Recomendados

Recomendados

Más contenido relacionado

Similar a Aplicacion de descriptores de sonido

Similar a Aplicacion de descriptores de sonido (20)

Más de Daniel Cam Urquizo

Más de Daniel Cam Urquizo (13)

Último

Último (13)

Aplicacion de descriptores de sonido