SlideShare una empresa de Scribd logo
1 de 229
Descargar para leer sin conexión
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
Introducción
El audio digital acaba de cumplir cuarenta años.
Más de uno se asombrará con semejante afirmación, pero lo cierto es que la aplicación de la
informática al sonido es casi tan antigua como los propios ordenadores. Lo que tal vez no
preveían aquellos visionarios pioneros era la importancia que este fenómeno iría tomando con
el tiempo. Tanta, que hoy en día, el ordenador está presente en todas las facetas de la
creación musical, en la composición, la interpretación, la grabación, la producción y la
reproducción.
Lo que durante años fue casi un “secreto” en manos de centros de investigación privados o
universitarios, sufrió una primera democratización hace algo más de una década, con la llegada
del MIDI y del disco compacto, dos muestras muy diferentes de las posibilidades del
ordenador en el campo de la música. Desde entonces, pocos son los músicos profesionales
que no aprovechan en alguna medida el enorme potencial del MIDI y, muchos menos, los
aficionados que siguen reproduciendo aquel rito consistente en sacar el vinilo de su funda
flexible y levantar con cuidado el brazo del tocadiscos.
La segunda revolución se está produciendo ahora mismo, y su líder tiene un nombre:
“multimedia”. Como todos los cambios, éste tiene su aspecto positivo y su aspecto negativo.
Por un lado, ha abierto la posibilidad teórica de que cualquiera pueda participar, casi en
igualdad de condiciones, en la vorágine del mercado musical y, lo que es más importante, está
fomentando el surgimiento de nuevas formas de entender y de crear la música. Como
contrapartida, los ordenadores se han llenado de muchas “musiquillas” totalmente
prescindibles, trivializando al máximo el fenómeno de la creación musical. Y en consecuencia,
han proliferado también en revistas “especializadas” en multimedia un sinfín de artículos poco
claros y nada rigurosos, en muchos casos plagados incluso de incorrecciones y barbaridades,
que han colaborado a enmarañar este campo y a confundir totalmente al aficionado.
Para hacer música, no hay desde luego nada como saber música, pero este conocimiento
(cada vez más relativo) no es ni estrictamente necesario ni siquiera suficiente. Hasta hace
poco, cuando uno sentía esta necesidad y no poseía demasiados conocimientos, solía
plantearse dos opciones: o ponerse a estudiar, o coger una guitarra, un micro o una batería. Y
la historia más reciente nos demuestra que por este último camino también se puede llegar a
obtener resultados muy loables. Ahora, puede además, coger un ordenador.
Como cada medio, éste posee sus propias reglas, exigencias y peculiaridades. Desde este
libro no le podemos enseñar a hacer música “interesante”, pero sí al menos a que conozca las
herramientas de que dispone, las principales mejoras que podría incorporar a su sistema
informático-musical, y los muchos trucos que le permitirán enriquecer cualquier resultado. Y le
ayudaremos también a tener nuevas ideas, ya que éstas surgen con mayor facilidad, cuando
mejor se conoce el medio con el que se trabaja. Tenga en cuenta que, en la música
informática, la agilidad mental es más importante que la agilidad “digital”1
.
Y si usted no siente deseos, o no se cree capacitado para componer, probablemente tiene la
curiosidad de saber cómo funcionan estas cosas, de conocer más a fondo para qué sirve la
tarjeta que se oculta en las entrañas de su ordenador (si no fuera así, no estaría leyendo esta
1
De “dedo” ¡no de “dígito”!
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
introducción). En este caso, su curiosidad quedará satisfecha. Y quién sabe, tal vez incluso le
acabe picando el gusanillo…
Después están los programadores, que intuyen el potencial que se oculta tras el MIDI y el
audio digital, pero no encuentran la información necesaria. Para ellos, dedicamos dos extensos
capítulos a la programación MIDI, con ejemplos operativos en Visual Basic y en lenguaje
“C”.
Por último, este libro también tiene bastante que aportar a los músicos que trabajan con el
MIDI desde hace tiempo, y que dominan con soltura sus aspectos más prácticos. Aquellos
que acaban de cambiar de ordenador, y que se han decidido a jubilar aquel Atari que tan
buenos momentos y resultados les ha proporcionado, podrán descubrir todas las prestaciones
de un sistema que, como el PC de hoy en día, es mucho más potente y abre un sinfín de
nuevas posibilidades (samplers económicos, grabación multipista a disco duro, etc.). Y los
que deseen consolidar sus conocimientos y profundizar en los aspectos más teóricos de las
tecnologías que usan a diario, también encontrarán aquí una importante fuente de
conocimientos, así como una rápida referencia para muchas de las dudas que les puedan ir
surgiendo. Varios cursos de informática musical, impartidos a estudiantes de cierto nivel, me
han evidenciado que muchos conocimientos, supuestamente básicos, no siempre están tan
claros como cabría esperar.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
Cómo usar este libro
La idea de este libro surgió a raíz de varios cursos de informática musical y programación
MIDI impartidos en el Institut Universitari de l’Audiovisual, de la universidad Pompeu
Fabra de Barcelona, al observar que la bibliografía sobre el tema, sigue siendo hoy bastante
reducida. La mayoría de libros interesantes están en inglés y no son además fáciles de
conseguir. Los pocos publicados en castellano, son, salvo honrosas excepciones, demasiado
superficiales o han quedado desfasados. La intención inicial era dar una base sólida y
completa tanto para el músico que comienza, como para el que desea consolidar sus
conocimientos, en el área de la informática musical.
Por otro lado, es innegable que con el auge del multimedia, existen muchos nuevos usuarios
con inquietudes y disposición, que no encuentran la información necesaria para comenzar a
adentrarse en estos terrenos. Por ello, este libro intenta combinar los aspectos teóricos
fundamentales que rigen el sonido digital y la música por ordenador, con las posibilidades
prácticas que los ordenadores multimedia ofrecen hoy en día. Cuando ha habido que elegir
una plataforma y un sistema en los que mostrar los ejemplos y los productos actualmente
disponibles, la elección ha recaído sobre el PC y el sistema operativo Windows
(especialmente la versión 95).
Los productos cambian muy rápido, y es por ello peligroso aconsejar determinadas
aplicaciones o dispositivos de hardware, pero creemos que el salto cuantitativo importante
que se ha producido en el terreno de los ordenadores PC compatibles durante los años 1995
y 1996, dejará sus secuelas durante cierto tiempo.
Material necesario
Se asume que el lector dispone de un ordenador y de una tarjeta de sonido. Si no fuera así, en
los capítulos 11 y 12 se estudian las tarjetas de sonido en profundidad, lo cual puede servir de
ayuda a la hora de adquirir una. En los capítulos 5 y 6 es conveniente la utilización de un
software editor de sonido para aplicar los conceptos tratados. El libro no sigue ninguno en
particular, aunque en esos capítulos, se recomiendan varias utilidades shareware. Más
adelante se estudia el software secuenciador, también de forma genérica, por lo que sería muy
conveniente que el usuario dispusiera de uno, así como de un teclado MIDI. Muchos de los
programas shareware o de dominio público que se mencionan a lo largo de la obra pueden
obtenerse en Internet, y en un apéndice se incluyen algunas direcciones interesantes.
Esquema general de la guía
Como reza el título, este libro trata dos grandes temas, que en la práctica se combinan, pero
que están conceptualmente separados: el audio digital y el MIDI. Nos ha parecido
incuestionable comenzar por el audio digital, para pasar después al MIDI, y mostrar
finalmente en el último capítulo el inmenso potencial que ofrece el uso combinado de ambas
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
tecnologías; posibilidad que en el terreno de los ordenadores compatibles está disponible, a
nivel masivo, sólo desde 1996.
Aconsejamos una lectura progresiva, aunque el lector impaciente podrá saltar de un tema a
otro intentando respetar los bloques que se indican a continuación. Asimismo muchos de los
capítulos podrán ser utilizados para consultas posteriores, por lo que hemos dedicado un
especial esfuerzo en facilitar la localización y el acceso a informaciones puntuales.
El audio digital se trata en los capítulos 1 a 6. El capítulo 1 estudia principios básicos de
acústica musical y el capítulo 2, los aspectos fundamentales del audio digital. Aunque en
ambos se han evitado complejas fórmulas y demostraciones matemáticas, incluyen todo lo
necesario para la comprensión de lo que sigue. Un lector con conocimientos en ambos
campos podría tal vez saltárselos, pero un breve repaso le ayudará a refrescar la memoria y a
aclarar conceptos.
El capítulo 3 explica las peculiaridades y el uso del audio digital en los ordenadores, de forma
totalmente independiente de cualquier plataforma. El capítulo 4, se centra en cambio en la
implementación que del audio digital hace Windows 95 (indicando cuando las hubiera, las
particularidades de Windows 3.1), y aunque su contenido teórico es muy escaso, ayudará a
cualquier usuario de este sistema, a configurar bien el ordenador, a comprender sus
peculiaridades y a realizar las operaciones más básicas (digitalización de sonido, control del
mezclador, etc.) algunas de ellas fundamentales para el resto de la obra. Un usuario de otra
plataforma (Apple, Unix, etc.) podrá saltarse este tema.
En los capítulos 5 y 6 se explican los procesos típicos disponibles en un programa editor de
sonido. En ambos se describen ejemplos con varios programas de Windows (en su mayoría
de dominio público), por lo que para seguirlos sería conveniente que el lector dispusiera de
algunos de ellos. Las técnicas descritas en el capítulo 5 pueden considerarse más básicas,
mientras que las del capítulo 6 implican un contenido teórico superior. Por ello, se discuten
también de forma sencilla algunos conceptos de proceso digital de señal.
Los capítulo 7 a 14, tratan del MIDI en general. El capítulo 7 es una introducción al tema, que
podrán saltarse los que lleven tiempo trabajando con él. El capítulo 8, trata en cambio todos
los mensajes MIDI en profundidad, por lo que es de lectura (y relectura) obligada. En algunos
puntos se asumen ciertos conocimientos informáticos básicos (sistema binario), por lo que es
posible que, en el primer acercamiento, este capitulo pueda parecer un tanto denso, pero está
estructurado de forma que permita una utilización como referencia rápida. Por ello, si la
primera lectura se le hace excesivamente farragosa, podrá volver a él siempre que necesite
reafirmar sus conocimientos.
El capítulo 9 cubre la síntesis digital. En principio está enfocada a los sintetizadores MIDI y al
sampler, pero también podría leerse como continuación del capítulo 6. En cualquier caso
incluye muchos aspectos fundamentales que serán desarrollados en los capítulos 11 y 12,
dedicados a las tarjetas de sonido.
Los capítulos 10, 11 y 12 se dedican al hardware MIDI. En el 10, se tratan brevemente
desde los dispositivos más frecuentes (como el teclado) a otros que no lo son tanto. No se
trata de adquirirlos todos, sino de obtener una visión global de la multiplicidad de enfoques
permitidos y de las posibilidades actuales. Los capítulos 11 y 12 se centran en las tarjetas de
sonido. Primero de forma más teórica, estudiando los diversos tipos y sus características, para
realizar, en el capítulo 12, un análisis comparativo de los modelos más aconsejables,
disponibles a principios de 1997.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
Los capítulos 13 y 14, tratan sobre el software MIDI. El primero se dedica por completo al
secuenciador, el programa más importante de todo estudio MIDI, mientras que en el segundo,
se contemplan los restantes tipos de programas disponibles. En ambos casos se analizan las
prestaciones de varios paquetes disponibles para Windows.
Los capítulos 15, 16 y 17, cubren varios aspectos de la configuración, gestión y programación
MIDI en Windows. El primero es obligado para entender las peculiaridades de este sistema
operativo en lo que al MIDI se refiere. Los dos siguientes se reservan para los
programadores. El capítulo 16 trata el uso de comandos MCI, mientras que el 17 se centra en
la programación MIDI de bajo nivel. Ambos pueden estudiarse de forma independiente. En
los dos casos puede resultar conveniente repasar previamente el capítulo 8.
Finalmente, en el capítulo 18 se abordan las nuevas posibilidades de integración del MIDI y el
audio digital, para finalizar con un repaso de los dispositivos analógicos imprescindibles en
todo estudio de música por ordenador.
Termina el libro con tres apéndices. El primero, destinado a aclarar algunos términos y
conceptos musicales, está pensado para el lector con escasa formación musical. En el segundo
se presentan en modo de tablas, algunas especificaciones técnicas referentes al MIDI,
mientras que en el tercero se incluye una lista comentada de direcciones en Internet,
relacionadas con la informática musical.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
Agradecimientos
Me gustaría dar las gracias a todas aquellas personas que a lo largo de los últimos diez años
me han ayudado o encaminado a seguir en el campo de la informática musical, y en especial a
Adolfo Nuñez del Laboratorio de Informática y Electrónica Musical de Madrid y a Xavier
Serra de la Fundaciò Phonos de Barcelona. También quisiera agradecer a Marisa Manchado
y a Gabriel Brncic por haberme animado a seguir componiendo en algunos momentos en que
no lo he tenido tan claro, a Marcel.lí Antúnez que me fuerza, con sus propuestas, a descubrir
cada día nuevos horizontes informático-creativos y a Cristina Casanova que ha colaborado en
las imágenes del libro y con sus apreciaciones, sugerencias y acertados comentarios.
Sergi Jordà, Barcelona 1997.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
1. Principios de acústica
1.1. Introducción
Aunque se puede hacer música sin tener demasiados conocimientos de acústica, parece
imposible comprender lo que es el sonido digital si no se tiene una idea de lo que es el sonido
en general. Por ello, este capítulo describe de forma básica los aspectos físicos y matemáticos
de las ondas sonoras que, junto con sus consecuencias psicológicas, son la base de toda
experiencia musical. Empecemos pues por el principio.
1.2. ¿Que es el sonido?
Lo que entendemos por sonido es fruto de una compleja interacción entre un objeto vibrante,
un medio transmisor (frecuentemente el aire), el oído, y el cerebro. Para que la vibración sea
audible para un ser humano, este objeto debe oscilar aproximadamente entre 20 y 20.000
veces por segundo. Al oscilar, el objeto desplaza el aire que lo rodea, comprimiendo y
descomprimiendo periódicamente las moléculas que lo integran, y modificando por
consiguiente la presión del aire de forma periódica. Dado que las moléculas desplazadas van
empujando a las contiguas, la variación periódica de la presión se propaga originando lo que
recibe el nombre de ondas sonoras. Cuando las ondas llegan al oído, el cerebro interpreta
estas variaciones de presión como sonido. Si la presión del aire que circunda el oído se
mantiene constante, no oímos nada, u “oímos el silencio”.
Las ondas sonoras se propagan en el espacio, formando invisibles esferas centradas en el
objeto que oscila. Conforme aumenta la distancia al origen y el radio de estas ondas, aumenta
también el volumen y la masa de aire que éstas deben desplazar, por lo que las oscilaciones se
hacen cada vez más débiles (la presión del aire varía cada vez menos, aunque siga haciéndolo
con la misma frecuencia) hasta que, a una cierta distancia, se tornan imperceptibles.
Este principio es válido independientemente del objeto oscilador, que puede ser por ejemplo
una cuerda (guitarras, violines, pianos, cuerdas vocales, etc.), una columna de aire
semicerrada y excitada por una caña o una boquilla (saxofones, flautas, trompetas, órganos,
etc.), una pieza de madera, metal, piel, piedra, etc. golpeada (percusiones), o un cono de
papel (altavoces). En muchos casos, los objetos que entran en vibración son en realidad
varios, como es el caso de la guitarra (o de la voz) donde lo que oímos es la suma de las
vibraciones de las cuerdas y de la caja.
Asimismo, cuando estas ondas encuentran un obstáculo, parte de las moléculas que las
componen son absorbidas por el material, mientras que las restantes son reflejadas. Este
fenómeno origina que en la mayoría de los casos, lo que nos llega al oído sea una suma del
sonido directo combinado con múltiples reflexiones de este sonido, ligeramente retardadas1.
1 El tiempo de estos retardos será proporcional a la distancia adicional recorrida, teniendo en cuenta que la
velocidad del sonido en el aire, es de aproximadamente 344 m/s.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
1.3. Características de los sonidos musicales
Para describir un sonido musical se utilizan tres términos: altura, timbre e intensidad. Todo
sonido tiene una duración y, a lo largo de ésta, cualquiera de estos tres parámetros puede
variar (los sonidos naturales jamás son perfectamente estables o constantes).
1.3.1. La altura y la frecuencia
La altura está directamente relacionada con la frecuencia de la oscilación, pero ambos
términos no son sinónimos. De hecho, muchos sonidos (como los percusivos) no tienen una
altura definida. El motivo de esta aparente paradoja es que, mientras la frecuencia es una
propiedad física indisociable de todo aquello que, como el sonido, vibra u oscila, la altura es
una cualidad subjetiva que percibimos sólo en algunos sonidos2. Si golpeamos, por ejemplo,
un bombo o un platillo, podremos sin duda afirmar que el platillo suena más agudo que el
bombo, pero no podremos decir si estos sonidos correspondían a un Do o a un La.
¿Que es lo que hace que un sonido posea o no una altura clara? Básicamente, su
periodicidad. Es necesario que un sonido sea aproximadamente periódico, es decir que su
frecuencia de oscilación no varíe (o varíe poco) dentro de un determinado lapso de tiempo,
para que lleguemos a percibir una altura. En una escala temporal mayor, la frecuencia sí que
puede variar, y en este caso, lo que percibiremos son alturas variables en el tiempo.
Figura 1.1. Variación de la presión en función del tiempo en un sonido periódico
En la figura 1.1 se muestra un sonido periódico, ya que la forma de la onda se repite
claramente. La frecuencia de este sonido vendrá dada por el tiempo que dura este período, ya
que ambas magnitudes son inversas. Si este período durase por ejemplo una centésima de
segundo, su frecuencia sería de 100 Hz3.
2Por este motivo hemos añadido el epíteto "musicales", en el título de este apartado. Eso no significa que
estos sonidos sean los únicos válidos para hacer música, y la percusión es un claro ejemplo de ello.
3El Hz o hertzio es la magnitud física que mide la frecuencia, e indica el número de veces por segundo que
se repite determinado fenómeno.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
1.3.2. La octava y las notas
Un fenómeno muy importante relacionado con la apreciación de las alturas, es el de la octava.
Si escuchamos dos sonidos cuyas frecuencias guardan una relación de 2:1 (por ejemplo 400
Hz y 200 Hz), nos sonarán muy cercanos. El motivo es que entre los dos dista exactamente
una octava. Dado que cada vez que se dobla la frecuencia se sube una octava, un sonido de
880 Hz estará dos octavas por encima de uno de 220 Hz. Esta idea de octava se repite en
casi todas las culturas, a lo largo de la historia. Lo que sí varía enormemente de una cultura a
otra es el número de subdivisiones que se aplican a la octava.
En la música occidental, la octava se divide en doce alturas o semitonos, de las cuales siete
tienen “nombre propio” y corresponden a las teclas blancas de un piano. Las cinco restantes
(que corresponden a las teclas negras) pueden tomar el nombre de la inmediatamente anterior,
en cuyo caso se les añade el símbolo # (sostenido), o de bien la posterior, en cuyo caso se les
añade el símbolo b (bemol). De esta forma las doce notas de una octava pueden nombrarse
de dos maneras diferentes ( “do, do#, re, re#, mi, fa, fa#, sol, sol#, la, la# y si”, o bien “do,
reb, re, mib, mi, fa, solb, sol, lab, la, sib y si”). En la nomenclatura sajona las notas se
designan mediante letras mayúsculas, de acuerdo con la siguiente equivalencia (que conviene
tener presente, dado que, como se verá en la segunda parte de este libro, los programas
MIDI la utilizan profusamente)4.
Do Re Mi Fa Sol La Si
C D E F G A B
Conviene indicar que antes de J.S.Bach (siglo XVIII), la división de la octava se basaba en las
teorías del filósofo griego Pitágoras, según la cual los intervalos formados por cada nota y la
siguiente no eran siempre idénticos. Para simplificar la construcción de instrumentos, en el siglo
XVIII se decidió dividir la octava en doce partes iguales, por lo que actualmente, la relación
de frecuencias entre cualquier nota y la siguiente es siempre igual a 21/12
(1.05946). De esta
forma, al avanzar doce semitonos (una octava), obtenemos un factor de (21/12
)12
que es
efectivamente igual a 2.
1.3.3. El timbre y los armónicos
El timbre podría definirse como el "color" de un sonido, y es lo que nos ayuda a caracterizar y
distinguir diferentes tipos de instrumentos, o a reconocer a las personas por su voz. Un La de
440 Hz en una clarinete suena diferente que el mismo La en un saxo; aunque ambos tienen la
misma altura, sus timbres no son iguales. La figura 1.2, que muestra fragmentos de estos dos
sonidos, junto con un tercer fragmento correspondiente a onda sinusoidal pura de la misma
altura, nos puede ayudar a comprender la naturaleza física del timbre. En los tres fragmentos,
el período es el mismo (pues tienen la misma altura), pero sus formas son diferentes.
4 En el apéndice B se indican las frecuencias de todas las notas MIDI, y se puede observar como
efectivamente, estas frecuencias se duplican en cada nueva octava.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
Figura 1.2. Fragmentos de tres sonidos de la misma altura (La de 440 Hz) en un
clarinete (a), un saxofón (b) y una onda sinusoidal pura (c)
El motivo de esta diferencia de forma, es que las ondas de los sonidos naturales son más
complejas porque vibran con varias frecuencias simultáneas. En la naturaleza no se encuentran
sonidos puros con una sola frecuencia, como el de la figura 1.2.c; éstos sólo son obtenibles
por medios electrónicos.
En los sonidos naturales, la frecuencia de vibración más grave es la que determina
normalmente el período y la altura, y se denomina frecuencia base. Las restantes frecuencias,
que suelen ser múltiplos de la frecuencia base se denominan armónicos, y cada tipo de
instrumento tiene, por su construcción, una serie diferente de armónicos de amplitudes
diferentes, que son los que definen su timbre y otorgan las "señas de identidad" al instrumento.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
Las matemáticas relacionadas con este concepto, fueron establecidas en el siglo XIX por el
físico Jean-Baptiste Fourier, que descubrió que toda señal periódica, por compleja que esta
sea, puede descomponerse como una suma de señales sinusoidales armónicas, es decir de
frecuencias múltiplos de la original. En la figura 1.3 se muestra la descomposición de una onda
periódica (d) en sus varias ondas sinusoidales simples armónicas, de amplitudes diferentes.
Dicho de otro modo, la señal d es la resultante de sumar de las señales a, b y c.
Figura 1.3. Descomposición de Fourier de una señal periódica en varias señales
sinusoidales
Cuando el sonido no es periódico, su descomposición no puede llevarse a cabo mediante
frecuencias múltiplos por lo que los factores dejan de ser números enteros. En estos casos
tenemos sonidos inarmónicos, en los cuales se hace difícil apreciar una altura precisa.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
1.3.4. La intensidad y los decibelios
Si la altura viene determinada por el número de oscilaciones por unidad de tiempo, la
intensidad depende del cuadrado de la amplitud de estas oscilaciones, o la diferencia entre las
presiones máxima y mínima que la onda puede alcanzar. La percepción de la intensidad
sonora es, en realidad, un fenómeno auditivo muy complejo, mucho más que el de la altura, y
lo que sigue es una inevitable simplificación.
Las intensidades de diferentes sonidos pueden variar, aunque parezca increíble, en varios
millones de órdenes de magnitud (es decir, el sonido más intenso que podamos oír, lo será
varios millones de veces más, que el más tenue). Por ello, la intensidad se mide en una escala
logarítmica, los decibelios (dB), de acuerdo con la siguiente fórmula
Nivel de intensidad en decibelios (dB) = 10 x log10 (amplitud2
/amplitud referencia2
)
Esta expresión determina un nivel o diferencia de intensidad entre dos amplitudes. El origen (0
dB) corresponde al umbral de audición (mínimo sonido audible). Por debajo de este valor
tenemos el auténtico silencio, aunque en el mundo en que vivimos la experimentación del
silencio se hace francamente difícil, por lo que muchos de nosotros probablemente no
lleguemos a conocer nunca el significado real de esta palabra. Por encima de los 130 dB se
produce una sensación dolorosa. Valores superiores prolongados llegan a destrozar el
tímpano. En la tabla 1.1 siguiente se muestran algunos valores típicos.
.
Descripción Nivel (dB) Relación de intensidad
Despegue de cohete espacial 190 1019
Despegue de un reactor 150 1015
Umbral de dolor 130 1013
Concierto de heavy metal 120 1012
Martillazos sobre una plancha metálica (a 50 cm) 110 1011
Tráfico en calle concurrida 70 10.000.000
Conversación normal (a 1 m) 60 1.000.000
Restaurante concurrido 50 100.000
Casa en la ciudad 40 10.000
Iglesia vacía 30 1.000
Estudio de grabación 20 100
Umbral de audición 0 1
Tabla 1.1. Ejemplos de niveles sonoros en dB.
He aquí algunas consideraciones adicionales:
• El oído no es normalmente capaz de distinguir diferencias inferiores a 3 dB.
• La intensidad de un sonido decrece aproximadamente en 6 dB cada vez que se dobla la
distancia.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
1.3.5 El rango dinámico
La diferencia entre los valores mínimos y máximos en dB, que un sistema puede producir se
denomina rango dinámico. En la tabla 1.2 se indican algunos valores típicos.
Clarinete 86
Piano 94
Disco compacto 96
Trombón 107
Orquesta sinfónica 120
Tabla 1.2. Varios ejemplos de rangos dinámicos (en dB).
En la mayoría de dispositivos de audio (amplificadores, pletinas de casete, reproductores de
compactos, altavoces, etc.) este valor figura entre las especificaciones técnicas, como rango
dinámico o relación señal/ruido5. En un aparato electrónico, el rango dinámico indica la
diferencia entre el nivel máximo que el dispositivo puede emitir, y el nivel del ruido existente
cuando no hay señal (el ruido de fondo). Cuanto mayor sea esta diferencia, más limpio será el
sonido del dispositivo. En una cadena de varios dispositivos de audio (emisor, amplificador,
altavoces, etc.) el valor real, es decir el máximo rango dinámico que podremos llegar a
apreciar, corresponderá al del dispositivo con peores características.
En aparatos de cierta calidad, este valor suele estar comprendido entre los 80 y los 95 dB.
Tal como se indica en la tabla 1.2, en los reproductores de compactos, y en cualquier otro
dispositivo de sonido digital de 16 bits, este valor no podrá nunca ser superior a 96 dB (en el
próximo capítulo explicaremos la razón), pero incluso pocas veces se alcanza este máximo
teórico, ya que la circuitería analógica presente en el dispositivo tiende a añadir ruido.
1.4. El sonido analógico
Hasta la aparición de los ordenadores, el sonido se grababa siempre de forma analógica. Pero
¿qué significa exactamente este término?
El término analógico se utiliza actualmente en contraposición a digital. Las señales analógicas
son funciones de variables continuas (frecuentemente del voltaje) cuyas evoluciones
temporales imitan (son una analogía de) las señales originales. La representación gráfica de
un sonido grabado analógicamente tendrá aproximadamente la misma forma que el sonido
original, pero la curva indicará variaciones de voltaje, en lugar de variaciones de presión de
aire. Estas nuevas señales analógicas se obtienen por medio de transductores, término con el
que se designa a todo dispositivo capaz de convertir una magnitud física en otra.
El micrófono y los altavoces son los dos transductores básicos utilizados en la grabación y
reproducción del sonido. En primer lugar, el micrófono convierte la variación de la presión de
5 Aunque ambos términos no son exactamente idénticos, de momento podemos obviar la diferencia.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
aire ejercida sobre su membrana, en una señal de voltaje variable en el tiempo. Este voltaje
puede ser grabado, utilizando diferentes tecnologías, sobre una cinta magnética o en los surcos
de un disco de vinilo. Cuando deseamos reproducir el sonido, la señal eléctrica generada por
el cabezal de la pletina o la aguja del tocadiscos, es amplificada y enviada a los altavoces,
donde un nuevo transductor la convierte en un campo magnético capaz de desplazar y de
hacer oscilar (con las frecuencias originales) los conos de papel de los altavoces.
Conviene resaltar que aunque la grabación se realice digitalmente, tal como se describe en el
próximo capítulo, “Principios de sonido digital”, se seguirán llevando a cabo las
transducciones analógicas en el micrófono y en los altavoces. En la figura 1.4 se esquematizan
los dos procesos de grabación alternativos.
Figura 1.4. Esquema de los procesos de grabación analógica y digital
Al contrario de lo que opina la mayoría, una grabación analógica no tiene por qué sonar peor
que una grabación digital (en condiciones óptimas, suena de hecho mejor). Sus inconvenientes
radican en que la señal analógica se degrada mucho más rápidamente (las cintas magnéticas se
desmagnetizan, y los surcos en el vinilo se desgastan), y que en cada nueva generación se
produce una pequeña pero inevitable perdida, de forma que, a cada nueva copia, la señal se
parece cada vez menos a la original.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
Por estas razones el sonido digital ha tomado definitivamente el relevo del analógico. Al
margen de la discutible cuestión de la calidad, en este libro se verá porque el sonido digital
aporta un sinfín de nuevas y excitantes posibilidades en la manipulación, creación y
experimentación sonoras.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
2. Principios del sonido digital
2.1 Introducción
El principio fundamental del audio digital consiste en discretizar las señales sonoras continuas
(como las emitidas por un micrófono) para convertirlas en secuencias de números. La
discretización de estas señales se lleva a cabo en dos niveles diferentes, el temporal y el de la
amplitud. En la figura 2.1 se muestra una señal continua, discretizada sólo en el tiempo
(cuadros blancos) y en el tiempo y la amplitud (puntos negros). Cuanto menor sea la
cuadrícula, mayor similitud existirá entre la señal original y la señal digitalizada.
Figura 2.1. Discretización de una señal continua.
2.2. Comparación con el cine y el vídeo digital
Para aclarar algunos conceptos, haremos una analogía con el cine y el vídeo digital. En ambos
medios, existe una discretización temporal (incluso en el caso del cine que no es un medio
digital). En el cine, la unidad de discretización temporal es el fotograma (24
fotogramas/segundo), mientras que en el vídeo esta unidad se suele denominar con el término
inglés frame (dependiendo del sistema, este valor suele ser de 25 ó 30 frames/segundo). Esto
correspondería, en el audio, a la discretización temporal.
Pero en el caso del vídeo digital se producen dos discretizaciones adicionales. La segunda
convierte cada frame en una matriz de puntos (por ejemplo 800x600), y la tercera asigna un
número (de entre un conjunto finito de valores) a cada punto, de forma que cada uno de estos
números corresponde a un color y un brillo determinado.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
Es obvio que cuantos más puntos apliquemos, y cuantos más números utilicemos para cada
punto, mayor será la similitud entre la señal analógica original y la señal digitalizada. Si
disponemos de pocos puntos, la imagen aparecerá cuadriculada, y si el número de valores
posibles para cada punto es pequeño, perderemos matices en los colores y en los brillos. En
la figura 2.2 se muestran estos casos. Algo parecido sucede con el sonido.
Figura 2.2. Ejemplos de imágenes deficientemente digitalizadas.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
2.3. Muestreo del sonido - Frecuencia de muestreo
La palabra muestreo es el equivalente del término inglés sampling, y se utiliza para indicar la
acción de tomar muestras a intervalos de tiempo regulares. Para digitalizar un sonido es
necesario muestrearlo, pero ¿con qué frecuencia? En el apartado anterior comentábamos que
para la imagen animada, la frecuencia de muestreo suele estar entre los 24 y los 30 fotogramas
por segundo. Con esta frecuencia se consigue engañar a la retina, haciéndole creer que lo que
recibe no son imágenes discontinuas, sino un flujo continuo de luz, pero estos valores son
totalmente insuficientes en el caso del sonido.
Para comprender este fenómeno observemos la figura 2.3 que representa una señal sinusoidal
de 30 Hz. (el ciclo se repite 30 veces por segundo) ¿Que ocurre si la muestreamos a una
frecuencia de 20 Hz? En este caso, estaremos tomando el valor de la onda original cada 0,05
segundos (corresponden a los seis cuadros de la figura). La nueva señal obtenida juntando los
puntos muestreados tiene un período aparente de 0,1 segundos, ¡es decir una frecuencia de
10 Hz, lo cual no se corresponde en absoluto con la señal original!
Figura 2.3. Señal muestreada incorrectamente.
¿Cual sería la mínima frecuencia de muestreo correcta?
El teorema del muestreo o teorema de Nyquist, afirma que para muestrear
correctamente una señal de X Hz, se requiere como mínimo una frecuencia de muestreo
de 2X Hz.
En nuestro ejemplo anterior, una frecuencia de 60 Hz hubiese pues bastado para muestrear
correctamente la señal original. Pero tal como indicamos en el capítulo 1,”Principios de
acústica”, el oído humano es capaz de detectar frecuencias sonoras de hasta
aproximadamente 20.000 Hz, por lo que, para muestrear correctamente cualquier sonido se
necesitará una frecuencia de muestreo superior o igual a 40.000 Hz. ¡De aquí proceden los
famosos 44.100 Hz. utilizados en los discos compactos!
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
2.4. Muestreo con frecuencias inferiores - El aliasing
Si muestreamos a una frecuencia inferior, como por ejemplo a 30.000 Hz, los resultados que
obtengamos podrán ser correctos para las frecuencias por debajo de los 15.000 Hz (la mitad
de la frecuencia de muestreo). Para las aplicaciones que no precisen de la máxima fidelidad,
esto es más que suficiente. El sonido será un poco menos brillante, pero se parecerá todavía
bastante al original, pues la zona frecuencial con mayor energía suele estar aproximadamente
entre los 1.000 y los 3.000 Hz.
Existe, sin embargo un problema adicional, algo complicado de entender. Tal como vimos en
el ejemplo gráfico anterior, al muestrear con frecuencias inferiores, surgen frecuencias
“fantasmas” que realmente no están en el sonido original (como los 10 Hz que aparecían
misteriosamente en nuestro ejemplo) y que alteran el sonido muestreado. Este fenómeno
recibe el nombre de aliasing.
Si lo que sigue le parece excesivamente complicado, no se preocupe: volveremos a tratar el
tema con más detalle en el apartado 5.7. “Efectos simples aplicables a la frecuencia”, pero
para los más impacientes, he aquí un pequeño adelanto.
El aliasing “inventa” frecuencias de valores aproximados a la diferencia entre la frecuencia
original y la frecuencia de muestreo. Para evitarlo, cuando se desee muestrear a frecuencias
inferiores a 44.100 Hz, se debería filtrar previamente la señal entrante, eliminando todos sus
valores por encima de la mitad de la frecuencia de muestreo. Si decidimos muestrear a 20.000
Hz, deberíamos filtrar la señal original, eliminando todos sus componentes por encima de
10.000 Hz. Esto no siempre es posible si no se dispone del hardware adecuado, ya que la
mayoría de tarjetas de sonido no permiten modificar el filtro de entrada. Existe una solución
para realizar todo este proceso por software, consistente en:
• muestrear a 44.100 Hz
• filtrar por software el sonido obtenido, a la mitad de la frecuencia deseada (e.g. 10.000
Hz)
• reconvertir por software el sonido a la frecuencia deseada (e.g. 20.000 Hz)
Parece muy complicado, pero no se apure; como veremos, la mayoría de editores de sonido
facilitan bastante esta tarea.
2.5. Número de bits, resolución y rango dinámico
Hasta aquí, hemos resuelto la primera parte teórica de la digitalización, consistente en obtener
una serie de muestras a intervalos regulares. Falta todavía la segunda parte, que consiste en
asignar a cada una de estas muestras un valor numérico que pueda ser manejado por un
ordenador. Para ello, volveremos momentáneamente al ejemplo del vídeo digital, que para
muchos lectores resultará más familiar. La resolución de color de una imagen (y de las tarjetas
de vídeo) se mide en bits. Así, una imagen de 8 bits, podrá incluir 256 (28
) colores diferentes,
mientras que una de 24 bits podrá representar más de 16 millones (224
) de colores. Con el
sonido sucede algo parecido: cuantos más bits apliquemos, más niveles o escalones tendrá el
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
sonido digitalizado y más parecido será en consecuencia al sonido analógico original (que al
ser continuo, poseía un número infinito de niveles).
El rango dinámico en decibelios viene dado aproximadamente por la fórmula:
rango dinámico en dB = 10 x log10 (amplitud máxima2
/amplitud mínima2
)
Si en un sistema digital consideramos la amplitud máxima como 2bits
y la amplitud mínima
como 1, tendremos que un sistema de conversión de 8 bits posee un rango dinámico de
aproximadamente 48 dB, mientras que en uno de 16 bits, el rango dinámico es de 96 dB.
Dado que el umbral de dolor no se sitúa hasta alrededor de los 130 dB, sería deseable que un
sistema de alta fidelidad pudiese alcanzar este rango dinámico. Para ello serían necesarios
unos 22 bits de resolución. Todos sabemos que no es éste el estándar que se ha adoptado,
que ha quedado establecido en 16 bits. Por ello, todo sistema digital convencional posee
un rango dinámico máximo de 96 dB (valor teórico que en la práctica se ve disminuido por
factores de circuitería).
2.6. La calidad del sonido digital
Estos valores de 44.100 Hz y 16 bits adoptados en el disco compacto y otros dispositivos
digitales, son los que nos llevan a afirmar que el sonido digital de alta fidelidad no es todo lo
bueno que podría ser, ya que ciertos equipos analógicos superan estas cotas. No se puede
negar sin embargo que el sonido digital ofrece muchas ventajas, entre las que hay que destacar
el menor desgaste y sobretodo, la posibilidad de realizar copias idénticas, es decir, sin ninguna
pérdida. El formato digital permite además, tal como iremos viendo, muchas más posibilidades
de manipulación y procesado.
Por otro lado, cuando no se necesite una calidad de alta fidelidad, se pueden utilizar
especificaciones inferiores. En este sentido, una frecuencia de muestreo de 11.025 Hz y una
resolución de 8 bits, ofrecen una calidad comparable a la de una línea telefónica convencional,
por lo que serán suficientes para algunas aplicaciones de voz, donde lo que se busque sea la
comprensión de un mensaje, al margen de preocupaciones estéticas.
2.7. Los conversores A/D y D/A
Hasta aquí la teoría. Veamos ahora como funciona un sistema digitalizador de sonido. El
sistema se compone de dos conversores: un conversor analógico/digital (a partir de ahora
A/D) en la entrada, y un conversor digital/analógico (a partir de ahora D/A) en la salida.
Ambos están controlados por un reloj digital que determina la frecuencia de muestreo. Para
evitar el aliasing se coloca en la entrada un filtro pasa-bajo (véase apartado 6.4.3), que
elimina de la señal analógica todos los componentes con frecuencias superiores a los 22.050
Hz. En el proceso de digitalización, el conversor A/D genera un número binario (de 8 ó 16
bits) a cada pulso del reloj. Este número es almacenado en la memoria o grabado en un disco
duro. Para la audición de esta señal digital, es necesaria la reconversión inversa, de forma que
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
los números almacenados son enviados a un conversor D/A que los convierte en voltajes, a la
misma frecuencia de reloj. Esta señal analógica es suavizada mediante un nuevo filtro,
amplificada y enviada a unos altavoces, que con su vibración, convierten finalmente los
voltajes en variaciones de presión de aire. La figura 2.4 esquematiza este proceso.
Figura 2.4. Esquema de un sistema de conversión A/D y D/A
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
2.8. Breve historia del audio digital
Los primeros experimentos en audio digital datan de finales de los cincuenta, cuando Max
Mathews obtuvo en los laboratorios Bell los primeros sonidos generados por ordenador. En
esta época, la escasa potencia de las computadoras no permitía una velocidad suficiente para
digitalizar el sonido. Los experimentos consistieron en obtener sonidos sintéticos, generando
los números en el ordenador.
Tras muchos experimentos que ayudaron a comprender mejor la naturaleza del sonido digital,
el primer grabador comercial, el Sony PCM-1, vio la luz en 1977. El conversor era de 13 bits
y utilizaba como soporte cintas de vídeo Beta (al año siguiente, el modelo PCM-1600, ya
utilizaba conversión de 16 bits). En 1982 apareció el disco compacto, desarrollado
conjuntamente por Sony y Philips, con un éxito fulminante.
A principios de los ochenta aparecieron también los primeros sintetizadores digitales y los
primeros samplers, pero de ello hablaremos profusamente en el capítulo 9, “Síntesis y
generación digital de sonido”.
Los primeros sistemas domésticos de grabación digital no llegaron hasta finales de los
ochenta, inicialmente con la cinta DAT (Digital Audio Tape), y posteriormente con el DCC
(Digital Compact Cassette), el MiniDisc, la grabación a disco duro, los CD-R (grabadores de
discos compactos) y varios formatos de multipistas digitales (Alesis, Tascam, etc.). Las
tarjetas de sonido para ordenadores, dotadas de conversores A/D y D/A, aparecidas en los
últimos años, han supuesto la definitiva democratización del sonido digital. A ellas dedicamos
el próximo capítulo.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
3. El audio digital en el ordenador personal
3.1 Introducción
Hemos visto en el capítulo anterior que para trabajar con sonido digital en un ordenador, son
necesarios como mínimo dos conversores (A/D y D/A) que cumplan la función de digitalizar y
reconstituir posteriormente la señal analógica. En los IBM PC compatibles esta posibilidad
llegó hace unos años de la mano de las primeras tarjetas de sonido de tipo Sound Blaster,
inicialmente con una calidad bastante lamentable, pero en otros ordenadores ya era posible
desde años atrás. En esta obra nos centraremos básicamente en las posibilidades de los
ordenadores PC compatibles actuales, dotados con una tarjeta de sonido de 16 bits, pero
antes de entrar en materia repasaremos brevemente la historia del audio digital en los
ordenadores.
3.2. Un poco de historia
3.2.1. Los inicios
Como se comenta en el capítulo anterior, Max Mathews consiguió sintetizar sonido digital en
un ordenador ¡a finales de la década de los cincuenta! Aunque se tardó unos años más en
disponer de la velocidad suficiente para muestrear sonido analógico, las posibilidades abiertas
por Mathews iniciaron dos largas décadas de investigaciones en el terreno de la síntesis digital,
llevadas a cabo inevitablemente en ordenadores mainframes yestaciones de trabajo Unix, en
centros universitarios o laboratorios de importantes empresas informáticas. Volveremos a
tratar este tema en el capítulo 9, “Síntesis y generación digital de sonido”.
3.2.2. Audio digital para las masas
El Commodore Amiga fue el primer ordenador doméstico que incorporó, en 1985, ciertas
posibilidades de audio digital. El Amiga disponía de cuatro conversores D/A de 8 bits.
Carecía de conversores A/D, por lo que si no se compraba un dispositivo muestreador
adicional conectable al puerto paralelo, sólo funcionaba como reproductor. Estos primeros
conversores D/A adicionales eran realmente muy económicos1
, pero tenían una limitación muy
importante: por motivos de velocidad sólo permitían muestrear en memoria RAM, y no
directamente al disco duro, por lo que la duración de los sonidos almacenables era muy
1
Entre 5.000 y 15.000 ptas.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
limitada. Aun con todas estas limitaciones, que lo hacían inviable para un trabajo profesional,
el Amiga supuso para muchos la entrada al sonido digital2
.
Las primeras aplicaciones serias se dieron a finales de los ochenta en dos plataformas que ya
de por si, no eran nada baratas (Apple Macintosh y NeXT), mientras que el coste del
hardware adicional superaba fácilmente el medio millón de pesetas. No eran productos “para
las masas”, pero los estudios de grabación y algunos músicos profesionales se los pudieron ya
permitir. Especialmente en el caso del Mac, el hardware y el software de Digidesign, que
ofrecía cuatro canales de 16 bits, se convirtió (y sigue siendo hoy) en un estándar de la
grabación y edición de audio digital en disco duro.
3.2.3. ... Y los PCs comenzaron a sonar
El bautizo sonoro del PC fue realmente tímido y tardío. En 1988, una compañía canadiense,
Ad Lib, fabricó las primeras tarjetas de sonido. Soportaban tan solo cuatro voces con sonidos
sintéticos y, aunque muchos juegos comenzaron a tener en cuenta el nuevo hardware, los tipos
de sonidos ofrecidos por el pequeño sintetizador3
permitían poco más que generar una cierta
musiquilla de fondo, con una calidad sonora bastante infame. Al no disponer de sonido
digitalizado, la Ad Lib no favorecía la reproducción de efectos convincentes (golpes, motores,
etc.) o voces (o gritos), que el mercado de los juegos estaba esperando.
Un año más tarde, Creative Labs, una empresa de Singapur que había trabajado en síntesis de
voz, lanzó al mercado la primera Sound Blaster, que añadía a la compatibilidad con la Ad Lib
unas pequeñas posibilidades de audio digital. Pese a que estas posibilidades eran limitadas
(dos canales de 8 bits) el éxito fue tremendo y propulsó a la compañía al primer puesto del
mercado multimedia internacional, lugar que sigue ocupando en la actualidad.
Aunque las tarjetas de hoy han cambiado bastante desde las Sound Blaster iniciales, muchas
de las mejoras y variaciones están teniendo lugar en el terreno del MIDI, que trataremos en la
segunda parte de este libro. En lo referente a audio digital, casi todas las tarjetas actuales
ofrecen las mismas prestaciones desde aproximadamente 1994: dos canales de audio a 16
bits y hasta 44.100 Hz de frecuencia de muestreo, con posibilidad de grabación y
reproducción a disco duro.
3.3. ¿Por qué la calidad CD no es siempre calidad CD?
Existe la creencia popular de que en el sonido digital no hay mejores ni peores, “como todo
son ceros y unos, mientras no se confundan unos con otros …”. Sin embargo, nada más lejos
de la realidad. Los fabricantes de equipos multimedia se escudan detrás de los 16 bits y
44.100 Hz, para colocar la indiscriminada etiqueta “calidad CD”. Pero, ¿se ha preguntado
alguna vez por qué existen actualmente lectores de CD-ROM por 5.000 ptas., mientras que
se pueden adquirir lectores de CD Audio (que, por cierto, son siempre, como veremos más
adelante, de velocidad simple) por 100.000 ptas.? La respuesta está en los conversores D/A
2
Con estos sonidos almacenados en memoria, el Amiga podía funcionar como un sampler (véase apartado
9.6).
3
En el capítulo 9, “Síntesis y generación digital de sonido”, se trata a fondo el tema de los sintetizadores.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
comentados en el anterior capítulo, y en otros componentes electrónicos analógicos, que son
los responsables finales del sonido. Es cierto que el láser no suele confundir los ceros con los
unos, pero para que estos enteros binarios lleguen a sonar, tienen que pasar por un
complicado proceso de conversión, que se puede realizar con muy diversos criterios de
calidad.
Un factor a tener en cuenta a la hora de evaluar la calidad de un dispositivo de audio digital,
como una tarjeta de sonido, puede ser la relación señal/ruido comentada en el capítulo
anterior. Aunque muchas tarjetas no incluyen estas especificaciones, es frecuente encontrarlas
en los estudios comparativos realizados en revistas especializadas. Comentamos que el
máximo teórico alcanzable con 16 bits de resolución es de 96 dB; una tarjeta con niveles
inferiores a 80 dB debería ser descartada por demasiado “ruidosa”.
Sin embargo, muchas otras prestaciones importantes a la hora de evaluar actualmente una
tarjeta de sonido, vienen dadas por sus capacidades MIDI. Por ello, en el capítulo 11,” El
ordenador MIDI y la tarjeta de sonido”, trataremos con detalle la elección de este
componente tan fundamental.
3.4. Tamaños en el audio digital
Cuando los ordenadores sólo manejaban texto, un megabyte (aproximadamente un millón de
caracteres) parecía una cifra monstruosa. Hoy en día, con la llegada del multimedia, los
sonidos y especialmente las imágenes digitales, han disparado estas cifras.
¿Cuánto ocupa un segundo de sonido digital estéreo de 16 bits y 44.100 Hz?
El cálculo es sencillo: en un sonido de 16 bits, cada muestra ocupa dos bytes (un byte son
ocho bits), y si la frecuencia de muestreo es de 44.100 Hz, significa que cada segundo
requiere de 44.100 muestras. Si el sonido es estéreo, utiliza dos canales, por lo que estas
necesidades se ven duplicadas.
2 bytes/muestra x 44.100 muestras/segundo x 2 (canales) = 176.400 bytes/segundo ó
172,2 Kb/s.
Esta es forzosamente la velocidad de transferencia de los lectores de CD Audio, y es la que
se designó en su día como velocidad simple. A partir de aquí, se tomó la costumbre de medir
la velocidad de los lectores de CD-ROM en múltiplos de este valor (igual que la velocidad de
los aviones reactores se mide a veces en múltiplos de la velocidad del sonido).
Realizando una multiplicación más, se observa que un minuto de sonido digital estéreo de
calidad, ocupa un valor muy cercano a los 10 Mb. Sabemos por experiencia que los CD
Audio raramente superan los 70 minutos. Esta duración límite aproximada viene dada por su
capacidad, que suele ser de 720 Mb.
Cuando el sonido no es estéreo, estos tamaños descienden a la mitad, y lo mismo sucede si la
resolución es de 8 en lugar de 16 bits, o la frecuencia de muestreo es de 22.050 Hz. Por ello,
limitando la calidad al mínimo, el tamaño necesario para un minuto de sonido mono de 8 bits y
11.025 Hz, se reduce aproximadamente a 646 Kb. (estas condiciones suelen designarse
como calidad telefónica).
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
3.4.1. ¿Qué calidad seleccionar?
No existe una respuesta unívoca a esta pregunta, ya que todo depende del uso que queramos
dar a cada sonido. Sí que es posible indicar, a modo de guía, el orden de los pasos a seguir si
necesitamos ahorrar memoria o espacio de disco duro. La reducción de calidad menos
perceptible es utilizar 22.050 Hz en lugar de 44.100 Hz. Si el efecto estéreo no es importante,
puede también limitar el sonido a un único canal, pero manteniendo los 16 bits de resolución.
Con esto nos situamos a 42,05 Kb/segundo, y es el mínimo aconsejable para un sonido
“musical”. Si lo que desea es grabar mensajes de voz, puede seguir reduciendo la frecuencia,
o pasar directamente a los 8 bits. El que se indiquen valores de frecuencia de 44.100, 22.050
ó 11.025, no es casual, ya que éstos son los valores estándar que soportan la mayoría de las
tarjetas (aunque algunas soporten también frecuencias intermedias).
Dado que hasta hace poco la mayoría de las tarjetas eran de 8 bits, muchos CD-ROMs
interactivos utilizan todavía esta resolución, más por criterios de compatibilidad que de
economía a ultranza.
3.5. Formatos de sonido digital
La información incluida en un fichero de sonido digital no es más que un array de bytes o de
enteros de 16 bits, dependiendo de la resolución aplicada. Pero a pesar de la sencillez de su
contenido, la lista de formatos existentes es inmensa, pues cada plataforma, y a veces cada
programa dispone de una serie de formatos preferidos con ligeras variaciones entre uno y
otro. Las diferencias pueden radicar en el tipo aplicado a las muestras (por ejemplo enteros
con o sin signo), el tipo de compresión utilizado (si es que lo hubiera) y la forma en que estas
muestras se ordenan. Para un sonido estéreo algunos formatos optan por guardar cada canal
de forma independiente, mientras que otros eligen guardar muestras alternas de cada una de
las pistas. Todos los formatos incluyen una cabecera (en la que se indica la resolución, la
frecuencia de muestreo, el número de canales, etc.) cuyo tamaño, contenido y ordenación
varía también de un formato a otro.
En Windows, el formato estándar es el WAV, aunque algunos fabricantes disponen también
de formatos nativos (como es el caso del VOC de Creative Labs, utilizado en las primeras
tarjetas Sound Blaster). Esta extensión es una abreviación de la palabra inglesa wave, que
significa ola u onda; por ello este tipo de ficheros se conocen también como ficheros de onda.
Si sólo trabaja con PC compatibles probablemente nunca tenga que preocuparse de otros
formatos, salvo si desee importar ficheros procedentes de otras plataformas. En el entorno
Macintosh, uno de los formatos más extendidos es el AIF, algo que deberán tener muy en
cuenta los programadores de aplicaciones multimedia multiplataforma. En Internet se utiliza
mucho el formato AU, propio de los sistemas Unix.
También es posible trabajar con ficheros sin cabecera (suelen venir con las extensiones PCM
o RAW). Estos constituyen un caso particular, ya que a la hora de abrir un fichero de estas
características, deberemos indicar nosotros la resolución, la frecuencia de muestreo y el
número de canales. Si el fichero suena bien, habremos acertado. Si suena mal, habrá que
volver a probar con parámetros diferentes.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
Los programas de edición de audio que se comentan en el capítulo 5, ofrecen normalmente
opciones para cargar y salvar formatos diferentes. En cualquier caso conviene tener en cuenta
que dos ficheros no comprimidos, y con la misma resolución y frecuencia de muestreo,
contendrán la misma información (aunque organizada de diversas formas) y sonarán
exactamente igual, independientemente del formato. En la tabla 3.1 se enumeran algunos de
estos formatos más frecuentes.
Extensión Plataforma - aplicaciones
AU Next/Sun - Internet
AIF Macintosh - Multimedia (Director, etc.)
IFF Amiga
PCM Cualquiera
RAW Cualquiera
WAV PC
Tabla 3.1. Algunos formatos de ficheros de audio digital
3.6. Compresión de ficheros de audio
Dado el tamaño que pueden adquirir los ficheros de audio digital es lógico que se haya
buscado formas de compresión que permitan reducir esta cantidad de información. Al igual
que ocurre con la imagen, existen técnicas sin perdida y técnicas con perdida. Un factor
importante en los sistemas de compresión de audio es que deben ser capaces de comprimir y
descomprimir en tiempo real (para comprimir y descomprimir en diferido existen ya multitud
de sistemas de uso general como el ZIP o el ARJ, que también pueden ser aplicados a
ficheros de audio).
Las matemáticas involucradas en cualquier sistema de compresión son demasiado complejas
para ser tratadas con rigor en esta obra, por lo que nos limitaremos a esbozar ciertas ideas.
Muchos de estos sistemas son independientes de los formatos citados en el apartado anterior,
de forma que un mismo formato de fichero puede soportar varios métodos de compresión.
• Probablemente le suenen las siglas ADPCM. Corresponden a Adaptative Delta Pulse
Code Modulation, una forma de compresión de la que existen múltiples variantes, en la
que se reduce el número de bits de la señal (por ejemplo a 4 bits) tratando únicamente las
diferencia entre una muestra y la siguiente. Es fácil intuir que esto provoca una inevitable
degradación de la señal ya que el sistema es incapaz de representar saltos grandes de
amplitud entre dos muestras.
• Las compresiones µ-law y A-law, utilizan un sistema de compresión no lineal que permite
utilizar una resolución de 8 bits, pero ofreciendo una calidad sonora y un rango dinámico
próximos a los obtenidos con 14 bits. Son por lo general más rápidos que los métodos
basados en ADPCM.
• Otros métodos como los utilizados por los grabadores digitales en formato DCC o
MiniDisc, son variantes del sistema ADPCM, que eliminan de la señal original ciertos
componentes que teóricamente no son audibles por quedar enmascarados (es como si en
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
una imagen 3D, eliminásemos toda la información de los objetos tapados por planos más
próximos al observador).
Algunos de estos sistemas se ven favorecidos por la presencia de hardware especializado
como pueda ser la inclusión de un DSP (procesador digital de señal) en la tarjeta de sonido,
mientras que otros funcionan perfectamente por software. Si abre el icono de multimedia en el
panel de control de Windows 95, y selecciona la forma de visualización Avanzado, podrá ver
en el apartado de Codecs4
de compresión de audio, todos los compresores instalados en su
sistema, tal como se observa en figura 3.1.
Figura 3.1. Comprobación de los Codecs de compresión instalados en el sistema
La compresión puede plantear problemas de compatibilidad entre diferentes ordenadores, por
lo que sólo debería utilizarse en aquellos casos en los que el ahorro de espacio sea un
imperativo. En la medida de lo posible, tampoco debería comprimir un fichero hasta que esté
4
El término codec proviene de la contracción de las dos palabras codificador y descodificador.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
seguro de que no va a manipularlo más, pues aunque la pérdida pueda ser poco perceptible,
siempre es preferible trabajar sobre la señal original.
3.7. Obtención de sonidos
A grandes trazos, existen dos formas de obtener un fichero de sonido digital: sintetizándolo
desde el propio ordenador o digitalizando el sonido de una fuente externa. El primer método
fue también el que, por menores requerimientos de potencia (la máquina no necesita adquirir la
información en tiempo real) se implementó primero, hace ya cerca de cuarenta años. De él
hablaremos en el capítulo 9,”Síntesis y generación digital de sonido”. De momento, en el
próximo capítulo “Audio digital en Windows 95”, aprenderemos a configurar correctamente el
sistema, y a realizar grabaciones digitales de diferentes fuentes externas, a partir de las
posibilidades que nos brinda Windows 95.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
4. Audio digital en Windows 95
4.1. Introducción
Tenemos ya unos conocimientos básicos sobre la naturaleza del sonido digital y sus
propiedades fundamentales. En este capítulo veremos las posibilidades que ofrece Windows
95 en cuanto a obtención y almacenamiento de audio digital. Dejamos para el próximo
capítulo las posibilidades de edición y manipulación de sonido, que aportan los paquetes de
software especializados. Si todavía tuviera instalado Windows 3.1 podrá realizar
prácticamente lo mismo, aunque el acceso y el aspecto de estos programas variarán. Tenga en
cuenta sin embargo, que la mayoría de los nuevos programas y posibilidades, especialmente
los relacionados con el sonido y el multimedia en general, están apareciendo únicamente en
versiones de 32 bits, por lo que mantener un sistema de 16 bits supone un lastre cada vez más
evidente.
Asumimos que tiene correctamente instalada una tarjeta de sonido. Las tarjetas actuales
combinan el sonido producido por un sintetizador MIDI interno, con dos pistas de audio
digital. Dado que las diferentes prestaciones de estos dispositivos se ponen más en evidencia
en el terreno del MIDI que en el del audio digital, esperaremos a la segunda parte de esta
obra para realizar un estudio pormenorizado (véase capítulos 11,”El ordenador MIDI y la
tarjeta de sonido” y 12,”Estudio comparativo de tarjetas de sonido”). De momento, bastará
con una sencilla descripción de las diferentes partes que la integran.
4.2. Estructura de una tarjeta de sonido genérica
En lo que respecta a las posibilidades de audio, la mayoría de tarjetas actuales ofrecen más o
menos las mismas características: 16 bits de resolución, frecuencia de muestreo configurable
hasta 44,1 Khz., dos canales y posibilidad de grabación y reproducción en disco duro. Como
comentábamos en el apartado 3.3, no todas garantizan la misma calidad sonora, pero ésta es
una cuestión más compleja que queda también relegada a los capítulos 11 y 12 ya
mencionados.
4.2.1. Entradas y salidas de audio
El número de entradas y salidas de audio puede variar ligeramente de una tarjeta a otra, pero
muchos modelos incorporan, tal como se muestra en la figura 4.1, dos entradas y dos salidas
estéreo, todas ellas de tipo minijack como los que se utilizan en los auriculares pequeños.
Disponen además de un conector al que se puede acoplar un joystick, pero que permite
también, con los cables adecuados, recibir y enviar mensajes MIDI, y de un conector interno
situado en la placa, destinado a recibir el audio procedente del CD-ROM.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
Figura 4.1. Entradas y salidas de audio de una tarjeta de sonido
• La entrada de línea, permite recibir señales de audio procedentes de un amplificador,
pletina de casetes, CD o sintetizador externos, etc.
• El micrófono utiliza una entrada específica ya que los niveles de señal son diferentes
(algunas tarjetas disponen de una única entrada micrófono/línea, conmutable por software).
• La salida de línea se conecta a una entrada de amplificador o cadena hi-fi (puede utilizar
indistintamente cualquier entrada del amplificador, salvo la de PHONO). Utilice esta salida
si desea realizar una grabación.
• A la salida de altavoz puede conectar unos auriculares o unos altavoces multimedia. Al
incluir un pequeño amplificador, esta suele ser bastante más ruidosa que la de línea.
• La entrada interna se utiliza para conectar la salida de audio del CD-ROM, aunque en
principio es posible conectar cualquier salida de línea estándar. La conexión se realiza con
un cable especial que suele estar incluido con la compra del CD-ROM. Consulte los
manuales de su CD-ROM y de su tarjeta.
• Por el conector de joystick no circula ninguna señal de audio, sino mensajes MIDI. Para
aprovechar esta prestación fundamental se necesita un cable especial que en muchos casos
debe adquirirse separadamente (véase capítulos 11 y 12).
En el apartado 18.7 trataremos los dispositivos externos presentes en un estudio de audio
digital (altavoces, mezclador, multipistas, grabadores, etc.). De momento un consejo: en la
medida de lo posible, rehuya los altavoces multimedia autoamplificados adquiribles en las
tiendas de informática. Si dispone de un equipo hi-fi a una distancia razonable del ordenador,
utilice una de sus entradas (cualquiera menos de la PHONO). Si se ve obligado a utilizar
altavoces multimedia, escuche de vez en cuando los fragmentos más críticos con unos
auriculares de calidad (a partir de las 5.000 ptas.), y piense que unos altavoces decentes para
el trabajo de sonido no se consiguen por debajo de las 20.000 ptas.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
4.2.2. El mezclador interno
Para controlar estos diferentes canales, muchas tarjetas (todas las compatibles MPC21
)
incluyen un mezclador por software que permite activar, desactivar y mezclar las diferentes
entradas y salidas para grabación y reproducción. En la figura 4.2 se esquematiza el diagrama
de bloques de este mezclador, cuyo uso se detalla en el apartado 4.7. De momento, conviene
tener presente que ambas salidas (línea y altavoz) pueden combinar como mínimo tres fuentes
internas estéreo: los dos canales de audio, el sonido del sintetizador MIDI interno y la salida
de los CD Audio (suponiendo que esté conectada a la entrada interna de la tarjeta)
reproducidos desde la unidad de CD-ROM.
Figura 4.2. Diagrama de bloques simplificado de una tarjeta de sonido
4.3. El CD-ROM
Hemos mencionado en repetidas ocasiones la unidad de CD-ROM sin indicar nada al
respecto. ¿Cuál es el cometido de este dispositivo en un sistema informático de producción
musical? ¿Qué cualidades específicas debe satisfacer?
Al margen de sus funciones típicas como unidad de almacenamiento masivo, que se
aprovechan en interactivos multimedia o para la distribución e instalación de software, y que
hacen del CD-ROM un elemento imprescindible en cualquier configuración, una unidad de
CD-ROM puede también leer discos compactos de audio. Esta prestación simplifica
enormemente la extracción de material sonoro incluido en discos compactos y su conversión
en ficheros de audio digital de tipo WAV. Dado que la reproducción de los CD Audio se
realiza siempre a velocidad simple, el CD-ROM “musical” no requiere ninguna cualidad
especial.
1
En los apartados 11.6.2 y 11.7 se explican con detalle las especificaciones MPC1, MPC2 y MPC3.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
En realidad, sí que existe una prestación que sería muy recomendable, pero que
lamentablemente los fabricantes de CD-ROM no suelen documentar: algunos lectores
permiten la extracción digital directa de la información incluida en un CD Audio. En este caso
la obtención de ficheros WAV se puede realizar sin ninguna conversión, con lo que
obtendremos copias digitales idénticas. En el apartado 4.10 trataremos este tema en detalle.
4.4. Componentes multimedia en Windows 95
En el momento de la instalación Windows 95 pregunta al usuario muchas opciones para una
configuración personalizada. Aunque los elementos que utilizaremos se incluyen en la
instalación por defecto, si no dispusiera del mezclador (o control de volumen), el reproductor
de CD, el reproductor multimedia o la grabadora de sonidos, puede reinstalar cualquiera de
ellos. Aunque no los utilizaremos directamente también es conveniente que tenga instaladas la
compresión de audio y de vídeo. El proceso a seguir es el siguiente:
1. Seleccione el icono Agregar o quitar programas en el panel de control.
2. Seleccione la opción Instalación de Windows.
3. Seleccione el componente Multimedia y haga clic en detalles. Aparecerá la ventana que
se muestra en la figura 4.3. En ella puede activar o desactivar diversos componentes.
4. Compruebe que, como mínimo, tiene seleccionados el control de volumen, el reproductor
de CD, el reproductor multimedia y la grabadora de sonidos. Puede también seleccionar
los compresores de audio y de vídeo, y si lo desea alguna combinación de sonidos.
5. Inserte los disquetes o el CD-ROM de instalación según le solicite el sistema y espere a
que la reinstalación termine.
Figura 4.3. Instalación de componentes multimedia en Windows 95
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
4.5. Información sobre el hardware en el icono de sistema
del panel de control
En Windows 95 toda la información sobre los componentes hardware instalados es accesible
desde el panel de control y las tarjetas de sonido no son una excepción. Para comprobar su
correcta instalación puede abrir el icono de Sistema y seleccionar la opción Controladores
de sonido, de vídeo y de juegos. Haciendo clic sobre cualquiera de los componentes que
aparecen, podrá verificar, como se aprecia en la figura 4.4, que no exista ningún conflicto de
IRQs, canales DMA o direcciones de memoria. Si la previa instalación del hardware ha sido
correcta todo debería aparecer en orden, sin ningún mensaje de alarma. Si apareciera algún
mensaje de error, consulte nuevamente el manual de instalación de los dispositivos. En
cualquier caso, la información contenida en este apartado puede ser de gran utilidad a la hora
de resolver algún conflicto de hardware, pero no aporta ningún dato sobre las prestaciones de
los dispositivos instalados. Para ello habrá que seleccionar el icono Multimedia dentro del
mismo panel de control.
Figura 4.4. La ventana de sistema permite detectar posibles conflictos de
hardware
Conviene que sepa por último, tal como comentaremos en el capítulo 12,”Estudio
comparativo de tarjetas de sonido”, que es perfectamente posible disponer de varias tarjetas
de sonido en un mismo ordenador, quedando este número limitado por las ranuras o slots
disponibles en la placa base, así como por las IRQs asignables.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
4.6. Información multimedia en el panel de control
Haciendo clic sobre el icono Multimedia se abre una ventana similar a la de la figura 4.5, que
contiene cinco solapas (Audio, Vídeo, MIDI, CD de música y Avanzado). Dejando aparte el
vídeo y el MIDI (que trataremos en la segunda parte de la obra), comentaremos brevemente
la información contenida en las tres restantes solapas, que es realmente muy sencilla.
Figura 4.5. Propiedades de Audio
4.6.1. Audio
Esta solapa muestra dos apartados de aspecto similar que corresponden a las opciones de
reproducción y grabación de audio digital. Cada uno de ellos incluye un nivel de volumen y
una lista desplegable con los dispositivos de estas características incluidos en nuestro sistema.
Si tan sólo disponemos de una tarjeta de sonido ambas listas tendrán un elemento único; si
dispusiéramos de varios, el dispositivo elegido en cada uno de los dos apartados sería el
utilizado por defecto, aunque, como veremos, la mayoría de programas especializados
permitirán modificar esta elección.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
Supongamos que tenemos dos tarjetas de sonido A y B. Si seleccionamos A para grabación y
B para reproducción, al utilizar un programa de grabación que no permita la elección del
dispositivo, sólo se grabará el sonido procedente de la entrada de la tarjeta A. Asimismo,
cuando reproduzcamos lo grabado, el programa utilizará la salida de la tarjeta B.
Los niveles de reproducción y grabación se corresponden con los programa mezclador que
veremos más adelante, de forma que todo cambio de nivel en cualquiera de las dos
aplicaciones, se actualizará en el otro. Dado que el mezclador es más flexible, normalmente
preferirá controlar los volúmenes desde este último.
La calidad de grabación aparece como una lista desplegable con las tres opciones
predeterminadas que se muestran en la tabla 4.1, aunque estas opciones pueden ser
configuradas por el usuario e incluso salvadas con un nuevo nombre.
Calidad bits frecuencia canales compresión
teléfono 8 11.025 Mono NO
radio 8 22.050 Mono NO
CD 16 44.100 Estéreo NO
Tabla 4.1. Opciones predeterminadas de grabación
Además de seleccionar cualquiera de las tres frecuencias de muestreo y las dos resoluciones
estándares, en la casilla formato, podremos elegir entre varios sistemas de compresión
dependiendo de los que haya instalado Windows. El formato PCM no utiliza compresión.
La mayoría de programas de grabación y edición de audio también permiten seleccionar
directamente todas estas opciones de calidad.
4.6.2. CD de música
Si dispone de un CD-ROM, el volumen de los CD Audio puede ser controlado desde esta
ventana, aunque, al igual que en el caso anterior, este nivel también es controlable desde el
mezclador. Este volumen afectará al sonido del CD por las salidas de la tarjeta de sonido, no
al de la salida de auriculares que muchos CD-ROMs incluyen en su panel frontal.
4.6.3. Modo de visualización avanzado
Activando esta ventana, aparece la lista completa de los dispositivos multimedia instalados,
tanto de hardware como de software, y agrupados en varias familias. Esta es la única forma
de obtener información sobre componentes como el mezclador, la entrada de línea de la
tarjeta, o los compresores de audio (y de vídeo) instalados en el sistema. En lo referente a los
dispositivos de audio y de MIDI la información no difiere demasiado de la observada en las
ventanas anteriores. En la figura 4.6 se pueden apreciar varios componentes en los
dispositivos de audio, los mezcladores y las entradas de línea, lo que significa que el
ordenador incorpora más de una tarjeta de sonido.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
Figura 4.6. Modo de visualización avanzado
4.7. El mezclador
Windows 95 incorpora un mezclador de audio por software, denominado Control de
volumen, que no estaba incluido en versiones anteriores, pero que suele venir duplicado con
el software de la tarjeta de sonido. Aunque ambos pueden presentar estéticas ligeramente
diferentes tienen exactamente la misma funcionalidad, ya que el propio de Windows se adapta
automáticamente para emular al de la tarjeta.
Cuando un sistema incluye dos o más tarjetas de sonido y por consiguiente más de un
mezclador, el mezclador de Windows se configura para emular a uno de ellos. Esto significa
que toda modificación en uno de los dos mezcladores (el de Windows o el asociado) se
visualiza inmediatamente en el otro.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
Estos mezcladores suelen presentar dos ventanas alternativas, la de reproducción y la de
grabación. Para seleccionar una de ellas elija Propiedades en el menú de Opciones: se
abrirá una caja de diálogo en la que podrá seleccionar el dispositivo asociado, el modo
(grabación o reproducción) y los canales visibles (MIDI, Audio, CD-ROM, etc.). En la figura
4.7 se muestra el mezclador en modo reproducción con la caja de propiedades abierta.
Figura 4.7. Mezclador en modo reproducción con ventana de configuración de
propiedades abierta
• A Selección del dispositivo mezclador (válido si se dispone de más de una tarjeta)
• B Modo reproducción/grabación
• C Selección de canales visibles en la ventana del mezclador
• D Mezcla general
• E Canal de audio (ficheros .WAV)
• F Canal del sintetizador MIDI interno
• G Canal del CD-ROM (CD Audio)
• H Canal de entrada de línea
• I Canal del micrófono
• J Balance
• K Volumen
• L Canal activado/desactivado
• M Dispositivo mezclador asociado
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
• Si en el panel de propiedades elegimos visualizar menos canales (C), éstos no se
desactivan, simplemente no se visualizan.
• Cada canal incorpora un control de balance (J), uno de volumen (K) y una casilla de
activación/desactivación (L).
• Para desactivar un canal (anular totalmente su volumen) se debe marcar la casilla L.
• Cuando no utilice un canal, es mejor tenerlo desactivado, pues de esta forma limita las
interferencias y las posibles fuentes de ruido.
• Existe además un control de volumen general que afecta a todos los restantes (D).
El mezclador en modo grabación permite controlar las fuentes de sonido que se grabarán en
forma de ficheros .WAV, cuando activemos el programa de grabación. Como se aprecia en la
figura 4.8, las posibles fuentes son el micrófono, la entrada de línea, el CD Audio y el MIDI.
Figura 4.8. Mezclador en modo grabación
4.7.1. Trucos y consejos para el uso del mezclador
• El canal de grabación MIDI permite grabar el sonido procedente del sintetizador interno.
Esto es muy útil cuando necesitemos convertir un fichero MIDI en un fichero WAV, por
ejemplo para una aplicación multimedia.
• Si tuviésemos varias entradas de grabación activadas, el sonido grabado sería la suma de
todas las señales. Es obvio que para obtener la mejor calidad, deberá activar únicamente
las fuentes que realmente desee grabar, de lo contrario estará añadiendo ruido innecesario.
• Dependiendo de las características del mezclador original de la tarjeta, el Control de
volumen puede incluir un botón avanzado para control de tono (graves y agudos) u otras
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
prestaciones. Abra y estudie también el mezclador original y compare sus posibilidades;
puede que alguna de ellas no esté emulada en el de Windows.
• Si el mezclador de su tarjeta dispone, como es el caso de la Sound Blaster que se muestra
en la figura 4.9, de un control de ganancia de entrada y salida, configure siempre estos
valores a x1. Aunque el volumen es más intenso en x2 y x4, la grabación y la
reproducción son mucho más ruidosas. Si necesita un volumen superior ajuste el mezclador
al máximo y suba el nivel de su amplificador externo.
• La mejor relación señal/ruido se obtiene siempre con todos los niveles de salida al máximo
y controlando el volumen desde el amplificador hi-fi. Téngalo siempre en cuenta, pues la
principal desventaja de las tarjetas de sonido frente a equipos más profesionales, es
precisamente su alto nivel de ruido.
Figura 4.9. Detalle de los controles de ganancia de entrada y de salida en una
Sound Blaster
4.8. Dispositivos reproductores
Windows 95 incorpora dos programas reproductores. Las tarjetas de sonido también incluyen
programas parecidos, y existe además un montón de software de dominio público que emula
estas prestaciones (son aplicaciones relativamente fáciles de programar, como veremos en el
capítulo 16,”Programación de sonido con los comandos MCI”). Un consejo: todos hacen lo
mismo; quédese con el que más le guste pero no llene inútilmente su disco duro.
4.8.1. El reproductor multimedia
Este componente, que difiere muy poco de la versión incluida en Windows 3.1, permite
reproducir varios formatos de ficheros multimedia, como ficheros MIDI (.mid), audio digital
(.wav), Vídeo for Windows (.avi) o CDs Audio, y también es posible ir ampliando su
funcionalidad a otro tipo de ficheros como Quicktime for Windows o secuencias de 3D
Studio (.fli).
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
Dadas sus escasas posibilidades de control, guarda realmente muy pocos secretos. Utilícelo
en lugar de un programa especializado, cuando desee reproducir un fichero sin consumir
demasiados recursos (para aplicaciones multitarea, por ejemplo). Este reproductor no permite
seleccionar el dispositivo de salida utilizado, en caso de que tuviésemos varios. Si dispone de
varias tarjetas de sonido, o de una tarjeta de sonido con varios dispositivos virtuales (como es
el caso de la AWE32, que incorpora dos sintetizadores MIDI diferentes), el dispositivo
elegido será el seleccionado en el icono multimedia del panel de control (véase apartado
4.6.1).
4.8.2. El reproductor de CD Audio
Aunque el reproductor de multimedia permite escuchar también los discos compactos de
audio colocados en el CD-ROM, este pequeño programa ofrece mayor comodidad a la hora
de seleccionar fragmentos. Permite además organizar una pequeña bases de datos con los
compactos que le vayamos introduciendo (los “reconoce” en función del número de temas y
de las duraciones de cada uno).
4.9. Grabación de sonidos
Llegados a este punto, sería conveniente que probara todas las posibilidades de su sistema
antes de comenzar a grabar. Estudie las configuraciones en el panel de control. Reproduzca
ficheros de tipo .WAV y ficheros MIDI (aunque no los hayamos estudiado todavía, su disco
duro seguro que oculta unos cuantos ficheros con la extensión .mid). Introduzca CDs Audio.
Modifique opciones y juegue con todos los controles del mezclador. Cuando crea que todo
está más o menos en su sitio, habrá llegado por fin la hora de grabar.
A diferencia de los programas comentados en los anteriores apartados, las posibilidades de la
grabadora de sonidos incluida con Windows 95 son realmente limitadas, por lo que es
recomendable que utilice otro programa para esta tarea. El que acompañe la tarjeta de sonido
puede convenir, y como alternativa existen un par de excelentes aplicaciones shareware,
localizables en Internet, y de las que hablaremos en el siguiente capítulo.
De momento, los conceptos que describiremos pueden hacerse extensibles a cualquier
programa que vayamos a utilizar.
4.9.1. Consejos para la grabación
• Ajuste convenientemente el mezclador: colóquelo en modo grabación, y asegúrese de
anular toda fuente de entrada que no vaya a grabar (normalmente deseará grabar una sola
fuente a la vez).
• Si desea grabar un tema MIDI puede activarlo desde el reproductor de multimedia.
• Para un fragmento de un CD Audio será más conveniente utilizar el reproductor de CDs.
Muchos programas de grabación pueden comunicarse con el reproductor, activarlo,
desactivarlo o seleccionar la posición de inicio.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
• Ajuste los niveles de entrada del mezclador. Igual que ocurre con una pletina de casetes
convencional, es muy importante no grabar con un nivel demasiado bajo (más ruido de
fondo) ni demasiado alto (distorsión). Tenga en cuenta que la distorsión digital (ver figura
4.10) produce efectos mucho más molestos que la analógica. Para un ajuste correcto, la
mayoría de programas de grabación incluyen unos indicadores de nivel que emulan los
LEDs o los vúmetros de los grabadores analógicos (la grabadora de Windows no los
incorpora).
• Si su tarjeta permite configurar la ganancia de entrada, utilice x1 en la medida de lo posible,
tal como se apunta en el apartado 4.7.1. Utilice una ganancia superior sólo cuando la
debilidad de la señal de entrada, imposibilite alcanzar los niveles deseables.
• Al seleccionar la calidad de grabación (frecuencia de muestreo, bits de resolución,
compresión) deberá tener presente el teorema de Nyquist (véase apartados 2.3 y 2.4):
dado que no es posible configurar la frecuencia de corte del filtro de entrada de la tarjeta
de sonido, es siempre preferible muestrear a 44.100 Hz. Después siempre estaremos a
tiempo de rebajar la frecuencia del sonido final.
• No utilice compresión. Si desea crear ficheros comprimidos, es preferible hacerlo al final.
De lo contrario estaremos limitando las posibilidades de edición.
• El último consejo es bastante más difícil de seguir. Los micrófonos multimedia que
acompañan a algunas tarjetas suelen ser de muy mala calidad. Pueden utilizarse para grabar
mensajes de voz, pero su uso en aplicaciones musicales desvirtúa cualquier grabación. Se
puede adquirir un micrófono mínimamente decente a partir de las 5.000 (¡los hay de
500.000 ptas.!), pero el problema no termina aquí. Misteriosamente, ¡ciertas tarjetas no
funcionan con otro micrófono que el que incorporan! En este caso es difícil aportar una
solución. Si dispone de una mezclador externo, un preamplificador o una pletina de casete
con entrada de micro, puede conectar allí el micrófono, y la salida de este dispositivo a la
entrada de línea de la tarjeta.
Figura 4.10. La distorsión digital. La primera figura presenta una señal grabada
con un nivel correcto. La segunda corresponde a la misma señal, grabada con un
nivel excesivo. Se puede apreciar la distorsión, en los picos inferiores recortados.
4.9.3. Grabación en disco duro
La grabadora de sonidos de Windows, sólo graba en memoria, mientras que la casi totalidad
de programas dedicados a la grabación digital lo hacen a disco duro. Este segundo método
permite grabar largos ficheros de sonido, cuyo límite de tamaño vendrá dado únicamente por
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
el espacio disponible en disco. Como contrapartida, exige más potencia al ordenador, al ser el
acceso al disco mucho más lento que a la memoria.
Para grabar con la máxima calidad (16 bits, estéreo y 44.100 Hz) se necesita
aproximadamente un 486 con 8 Mb de memoria y un disco duro de menos de 15 ms de
acceso. Si hasta hace muy pocos años esto era pedir bastante, lo cierto es que actualmente la
mayoría de sistemas satisfacen sobradamente estas condiciones. Cuando la grabación de
audio con máxima calidad se puede llevar a cabo, pero al reproducir el fichero escucha clics o
pequeños ruidos molestos, significa que su sistema presenta problemas de velocidad.
No utilice programas de compresión de disco duro, pues reducen notablemente la velocidad
de transferencia (esta indicación es válida para cualquier aplicación multimedia que requiera de
una transferencia de datos importante). Es aconsejable asimismo que el disco no esté
fragmentado. Para ello, utilice el defragmentador de Windows con regularidad.
4.10. Extracción digital directa de un CD Audio
Cuando grabamos un fragmento de un CD Audio, a pesar de que si el programa de grabación
es capaz de controlar nuestro CD-ROM, el proceso será prácticamente automático, la
grabación no se produce de forma digital. El sonido digital leído por la unidad de CD-ROM
es convertido mediante el conversor D/A del CD-ROM y enviado al conector de audio
interno (analógico) de la tarjeta, que lo redirecciona hasta su propio conversor A/D.
Resultado: dos conversiones que degradan inevitablemente la calidad del sonido del CD.
¿Es posible extraer directamente la información digital de un CD Audio y evitar así
conversiones y pérdidas? A veces si. Depende de la unidad de CD-ROM, ya que no todas lo
permiten (en principios deberían ser compatibles con las normas Red Book, pero en la
práctica resulta que esta condición no es necesaria ni tampoco suficiente). Dado que existen
además diferentes estrategias de programación para solucionar este problema, no todos los
programas destinados a este cometido funcionan con los mismos modelos de CD-ROMs. La
única solución consiste en buscar por Internet e ir probando hasta encontrar uno que funcione
(o hasta que los hayamos probado todos sin éxito…). Una buena dirección para empezar a
buscarlos es http://www.cdarchive.com.
En la tabla 4.2 se incluyen algunas aplicaciones shareware o de dominio público que permiten
extraer información digital de un CD Audio. En todas ellas, el usuario indica el inicio y el final
del fragmento a extraer, que es salvado en un fichero de onda de tipo WAV.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
Nombre de la aplicación Entorno
Cdda MS-DOS línea de comandos
CDGRAB MS-DOS línea de comandos
CDGRAB Windows 16 bits
Cdinfo MS-DOS interfaz gráfico
CD Workshop Windows 32 bits
Cool Edit Windows 32 bits
DAC MS-DOS interfaz gráfico
Dido Windows 16 bits
Disk-to-Disk Windows 16 bits
Readcda MS-DOS línea de comandos
Tartaruga Windows 16 bits
Tabla 4.2. Algunos programas para la extracción digital directa de fragmentos de
CD Audio
Tenga en cuenta que:
• La extracción digital no se realiza en tiempo real (suelen tardar un poco más).
• Los programas para Windows no tienen por qué funcionar mejor que los más sencillos
para MS-DOS (frecuentemente, es más bien al revés).
4.10.1. Cuidado con los copyrights
Las grabaciones musicales comerciales están protegidas. Si la copia es para uso personal
exclusivo, nada puede pasar, pero si pretende sacarle un partido comercial, deberá ir con
cuidado. Muchos estilos musicales actuales (hip-hop, trip-hop, techno, etc.) hacen un uso
extensivo del sampler y muestrean fragmentos de otras músicas. Ante este hecho inevitable,
muchas discográficas han puesto precio a las licencias de muestreo. Los “sampleadores”
más legales, llegan a acuerdos con las discográficas o incluso comparten derechos con los
creadores del material original. Otros, simplemente disimulan el origen, procesando y
manipulando el sonido, o buscan “inspiración” en oscuras grabaciones que “nadie” conoce.
Una asociación internacional de músicos, la macos (musicians against copyright of
samples) propugna la liberalización del muestreo. Sus integrantes muestrean lo que les parece
y conceden permiso explícito para que, quien quiera, haga lo mismo con aquellos compactos
que exhiben el sello de la asociación. Existen también en el mercado grabaciones libres de
copyrights especialmente concebidas para ser muestreadas, que incluyen multitud de sonidos,
instrumentos o ritmos, pero suelen ser bastante más caras que un compacto normal.
Cada cual hará lo que le parezca, ¡pero que conste que hemos avisado!
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
5. Edición de sonido por ordenador
5.1. Introducción
Hemos visto cómo digitalizar un sonido procedente de diversas fuentes analógicas y
almacenarlo en la memoria o el disco duro del ordenador, pero el enorme potencial del audio
digital por ordenador no comienza a intuirse hasta que abrimos un potente editor gráfico de
audio. El paradigma de este tipo de aplicaciones es muy sencillo y varía muy poco de un
programa a otro. Básicamente consiste en aplicar procesos matemáticos a un sonido (o a una
porción temporal), con la ayuda de un entorno gráfico que permita seleccionar cómodamente
los fragmentos a tratar y que muestre los resultados tanto sonora como visualmente. Mediante
estos procesos se consigue corregir defectos en los sonidos originales, ensalzarlos,
modificarlos ligeramente o generar otros nuevos totalmente irreconocibles.
Todas estas posibilidades se fundamentan sobre una disciplina de investigación que combina la
ingeniería, la física y las matemáticas, y que cuenta con varias décadas de existencia: el
procesado digital de señal.
5.2. Cómo elegir un programa
Las tarjetas incorporan siempre en su software un editor gráfico de sonido. Lamentable, en
muchos casos estos programas son excesivamente sencillos. Un paquete de software que se
salva de la quema es el Sound Impressions que acompaña a muchas tarjetas de fabricantes
diversos. En cuanto a otros programas muy extendidos como el Creative Wave Studio
(distribuido con las tarjetas Sound Blaster), funcionan como ventajosos sustitutos de la
grabadora de sonidos de Windows, pero se quedan muy cortos a la hora de ofrecer
posibilidades de edición avanzadas.
El problema se resuelve rápidamente, pues existen dos excelentes aplicaciones shareware
fácilmente accesibles en Internet, que pueden competir en prestaciones con editores
comerciales. Nos referimos a Cool Edit de David Johnston y Gold Wave de Chris S.Craig,
ambas con versiones actualizadas de 32 bits. Existen otros programas de dominio público,
pero difícilmente pueden competir con estos dos gigantes.
En el terreno comercial, son tres los programas que se llevan la palma: Wave for Windows,
de Turtle Beach Systems (fabricante de las famosas tarjetas de sonido homónimas), Sound
Forge de Sonic Foundry, y el recién llegado WaveLab de Steinberg (fabricante del mítico
secuenciador MIDI, Cubase).
Wave for Windows fue el primer editor de audio profesional para PC compatibles. Uno de
sus puntos fuertes es la librería de efectos preestablecidos que incorpora. Su uso es sin
embargo algo más lento y engorroso que el de sus competidores. Sound Forge goza de un
diseño más cómodo y eficaz e incorpora casi cualquier efecto imaginable, lo que lo convierte
en el más potente de los tres. Por su parte WaveLab promete ser un programa muy completo,
pero la versión 1.0 acaba de aparecer y, como es frecuente, no incluye todavía todo lo que
uno podría esperar de un programa de su categoría.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
De momento, estos programas operan en diferido; no son capaces de realizar los efectos en
tiempo real. Sin embargo, con la inminente llegada de los sustitutos del Pentium que
incorporarán DSP en la placa, y la arquitectura abierta de algunos de estos programas (Sound
Forge y Wave Lab), posiblemente cambie en breve el panorama.
5.3. Utilización y posibilidades de un editor gráfico de audio
digital
Simplificando, la forma de trabajar con estos programas es la siguiente: se carga un fichero de
sonido digital (normalmente de tipo .wav), o se digitaliza desde el mismo programa, teniendo
en cuenta todas las consideraciones del capítulo anterior. Inmediatamente, la onda queda
representada gráficamente en una ventana. Con el ratón se selecciona un fragmento (igual que
seleccionaría unas cuantas palabras contiguas en un procesador de texto) o el fichero en su
totalidad. Mediante opciones de menú o iconos se aplican a este fragmento algunos de los
procesos de modificación incluidos en el programa.
Uno de los principales raseros con que valorar las prestaciones de estos programas es el
número, calidad y versatilidad de los efectos disponibles, pero existen otros factores
importantes. Pasemos a enumerar y describir brevemente algunos de ellos, teniendo en cuenta
que si no se indica lo contrario, los cinco programas mencionados en el apartado anterior
(Cool Edit, Gold Wave, Wave, Sound Forge y Wave Lab) incorporan la opción.
• Soporte multiventana. La posibilidad de tener varios ficheros de onda abiertos y visibles,
es fundamental para poder combinar fragmentos de diferentes procedencias. Todos los
programas citados incorporan sofisticadas formas de gestión de memoria que permiten
presentar en pantalla muchos más sonidos de los que podrían caber en la memoria RAM
del ordenador.
• Deshacer (Undo). Dado que los ficheros de sonido pueden llegar a ocupar decenas o
centenares de Mb, el guardar varios niveles de anulación puede en ocasiones ralentizar
excesivamente la ejecución, o resultar incluso inviable. En estos programas la opción de
deshaceres configurable por el usuario.
• Edición independiente de canales. Los ficheros estéreo se muestran siempre en dos
ventanas superpuestas. En ocasiones es deseable, tal como se aprecia en la figura 5.1,
poder seleccionar un fragmento de un único canal.
Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997
Figura 5.1. Selección de una única pista de un fichero estéreo en Cool Edit
• Zoom de visualización. Para trabajar los fragmentos con mayor detalle es conveniente
poder modificar la escala de visualización. El zoom se puede aplicar a dos parámetros: el
tiempo (eje horizontal) y la amplitud (eje vertical). Todos los programas soportan varios
niveles de zoom temporal, pero no todos permiten zoom de amplitud. Esta última
posibilidad es especialmente útil cuando se trabaja sobre fragmentos de muy poco nivel
(casi silenciosos), ya que de lo contrario estaremos viendo una línea recta donde en
realidad hay sonido1.
• Cambio de unidades temporales. Existen normalmente tres unidades alternativas para
medir las coordenadas temporales: tiempo (ms), muestras y compases. Esta última es útil
cuando estamos editando un fragmento musical con un tempo preciso (que el usuario
deberá indicar).
• Memoria de puntos clave. En un fichero largo es fácil perderse mientras se navega hacía
delante y hacia atrás utilizando el scroll horizontal. Por ello es muy útil poder colocar
marcas en algunos puntos importantes (inicio de un sonido, de una palabra, etc.). Sound
Forge es el programa más completo en este aspecto, ya que no sólo permite colocar
tantas marcas como deseemos, incluso de forma automática, sino que también las guarda
en el fichero, para posteriores sesiones. En la figura 5.2 se muestra una ventana de este
programa, con una lista de marcas.
• Reproducción de listas. Este punto está relacionado con el anterior: una vez colocadas
varias marcas, es posible editar una lista de reproducción para alterar el orden de
ejecución de los fragmentos, y repetir uomitir algunos de ellos. Esta es una forma rápida y
cómoda de realizar modificaciones temporales, sin necesidad de reorganizar cada vez
1 Tenga en cuenta que la máxima resolución vertical de una pantalla completa no supera nunca los 800
pixels, mientras que un sonido de 16 bits puede poseer hasta 65.535 niveles diferentes.
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig
Audio digital y MIDI - Sergi Jorda Puig

Más contenido relacionado

Similar a Audio digital y MIDI - Sergi Jorda Puig

Historia de la informática
Historia de la informáticaHistoria de la informática
Historia de la informática
Vanessa Gonzalez
 
Treabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneriaTreabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneria
yittin
 
Treabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneriaTreabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneria
yittin
 
Treabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneriaTreabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneria
yittin
 
~$Historia de la informática2
~$Historia de la   informática2~$Historia de la   informática2
~$Historia de la informática2
diandano5
 
Manual users linux
Manual users   linuxManual users   linux
Manual users linux
xavazquez
 

Similar a Audio digital y MIDI - Sergi Jorda Puig (20)

Tol82 d
Tol82 dTol82 d
Tol82 d
 
Historia de la informática
Historia de la informáticaHistoria de la informática
Historia de la informática
 
Proyecto informatica
Proyecto informaticaProyecto informatica
Proyecto informatica
 
Radio 3g
Radio 3gRadio 3g
Radio 3g
 
Treabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneriaTreabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneria
 
Treabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneriaTreabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneria
 
Treabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneriaTreabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneria
 
Treabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneriaTreabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneria
 
Treabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneriaTreabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneria
 
Treabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneriaTreabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneria
 
Treabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneriaTreabajo de intoducion ala ingieneria
Treabajo de intoducion ala ingieneria
 
Taller 4 1 investigacion_javier jara
Taller 4 1 investigacion_javier jaraTaller 4 1 investigacion_javier jara
Taller 4 1 investigacion_javier jara
 
Real
RealReal
Real
 
La importancia de la computadora
La importancia de la computadoraLa importancia de la computadora
La importancia de la computadora
 
Trabajo informatica
Trabajo informaticaTrabajo informatica
Trabajo informatica
 
Trabajo informatica
Trabajo informaticaTrabajo informatica
Trabajo informatica
 
~$Historia de la informática2
~$Historia de la   informática2~$Historia de la   informática2
~$Historia de la informática2
 
Evolución e impacto del ordenador personal en la sociedad
Evolución e impacto del ordenador personal en la sociedadEvolución e impacto del ordenador personal en la sociedad
Evolución e impacto del ordenador personal en la sociedad
 
Manual users linux
Manual users   linuxManual users   linux
Manual users linux
 
Uso de las computadoras en la actualidad
Uso de las computadoras en la actualidadUso de las computadoras en la actualidad
Uso de las computadoras en la actualidad
 

Más de Juan Sebastian Martellotta

Proyecto la educ_artística_en_el_marco_de_la_educ_especial
Proyecto la educ_artística_en_el_marco_de_la_educ_especialProyecto la educ_artística_en_el_marco_de_la_educ_especial
Proyecto la educ_artística_en_el_marco_de_la_educ_especial
Juan Sebastian Martellotta
 
Guía para la presentación del informe de la práctica 1
Guía para la presentación del informe de la práctica 1Guía para la presentación del informe de la práctica 1
Guía para la presentación del informe de la práctica 1
Juan Sebastian Martellotta
 
Historia Argentina Contemporánea - Programa 2014 - Profesorado de Música - Ni...
Historia Argentina Contemporánea - Programa 2014 - Profesorado de Música - Ni...Historia Argentina Contemporánea - Programa 2014 - Profesorado de Música - Ni...
Historia Argentina Contemporánea - Programa 2014 - Profesorado de Música - Ni...
Juan Sebastian Martellotta
 

Más de Juan Sebastian Martellotta (19)

Manual para Radialistas Analfatecnicos - Santiago Garcia Gago
Manual para Radialistas Analfatecnicos - Santiago Garcia GagoManual para Radialistas Analfatecnicos - Santiago Garcia Gago
Manual para Radialistas Analfatecnicos - Santiago Garcia Gago
 
Habilidades y competencias del docente del siglo xxi
Habilidades y competencias del docente del siglo xxiHabilidades y competencias del docente del siglo xxi
Habilidades y competencias del docente del siglo xxi
 
Nuevas tecnologías por anne marie chartie
Nuevas tecnologías por anne marie chartieNuevas tecnologías por anne marie chartie
Nuevas tecnologías por anne marie chartie
 
Glosario de términos informáticos
Glosario de términos informáticosGlosario de términos informáticos
Glosario de términos informáticos
 
La computadora portátil del estudiante prakash nair
La computadora portátil del estudiante    prakash nairLa computadora portátil del estudiante    prakash nair
La computadora portátil del estudiante prakash nair
 
Proyecto la educ_artística_en_el_marco_de_la_educ_especial
Proyecto la educ_artística_en_el_marco_de_la_educ_especialProyecto la educ_artística_en_el_marco_de_la_educ_especial
Proyecto la educ_artística_en_el_marco_de_la_educ_especial
 
Guía para la presentación del informe de la práctica 1
Guía para la presentación del informe de la práctica 1Guía para la presentación del informe de la práctica 1
Guía para la presentación del informe de la práctica 1
 
Guía para la presentación del informe de la práctica 1
Guía para la presentación del informe de la práctica 1Guía para la presentación del informe de la práctica 1
Guía para la presentación del informe de la práctica 1
 
Programa Filosofía de la Educación - año 2014
Programa Filosofía de la Educación - año 2014Programa Filosofía de la Educación - año 2014
Programa Filosofía de la Educación - año 2014
 
Monodia profana medieval
Monodia profana medievalMonodia profana medieval
Monodia profana medieval
 
Musica en la antigua roma y en la edad media
Musica en la antigua roma y en la edad mediaMusica en la antigua roma y en la edad media
Musica en la antigua roma y en la edad media
 
Contexto cultural helenistico
Contexto cultural helenisticoContexto cultural helenistico
Contexto cultural helenistico
 
Guia del trabajo practico n° 1 canciones infantiles
Guia del trabajo practico n° 1   canciones infantilesGuia del trabajo practico n° 1   canciones infantiles
Guia del trabajo practico n° 1 canciones infantiles
 
Trabajo Practico de Pedagogia General, asignatura de 1er año
Trabajo Practico de Pedagogia General, asignatura de 1er añoTrabajo Practico de Pedagogia General, asignatura de 1er año
Trabajo Practico de Pedagogia General, asignatura de 1er año
 
Historia Argentina Contemporánea - Programa 2014 - Profesorado de Música - Ni...
Historia Argentina Contemporánea - Programa 2014 - Profesorado de Música - Ni...Historia Argentina Contemporánea - Programa 2014 - Profesorado de Música - Ni...
Historia Argentina Contemporánea - Programa 2014 - Profesorado de Música - Ni...
 
Audacity menu y herramientas
Audacity menu y herramientasAudacity menu y herramientas
Audacity menu y herramientas
 
Audacity tutorial
Audacity tutorialAudacity tutorial
Audacity tutorial
 
Grabando en Casa - José Samplertini
Grabando en Casa - José SamplertiniGrabando en Casa - José Samplertini
Grabando en Casa - José Samplertini
 
Cuadernillo para alumnos y profesores 2014
Cuadernillo  para alumnos y profesores 2014Cuadernillo  para alumnos y profesores 2014
Cuadernillo para alumnos y profesores 2014
 

Último

PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docx
lupitavic
 

Último (20)

Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024
 
PIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonablesPIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonables
 
2024 KIT DE HABILIDADES SOCIOEMOCIONALES.pdf
2024 KIT DE HABILIDADES SOCIOEMOCIONALES.pdf2024 KIT DE HABILIDADES SOCIOEMOCIONALES.pdf
2024 KIT DE HABILIDADES SOCIOEMOCIONALES.pdf
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
 
Unidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la InvestigaciónUnidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la Investigación
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptx
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes d
 
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
 
PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docx
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
 
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxPLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdfTema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
 
Abril 2024 - Maestra Jardinera Ediba.pdf
Abril 2024 -  Maestra Jardinera Ediba.pdfAbril 2024 -  Maestra Jardinera Ediba.pdf
Abril 2024 - Maestra Jardinera Ediba.pdf
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJOACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
 

Audio digital y MIDI - Sergi Jorda Puig

  • 1. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 Introducción El audio digital acaba de cumplir cuarenta años. Más de uno se asombrará con semejante afirmación, pero lo cierto es que la aplicación de la informática al sonido es casi tan antigua como los propios ordenadores. Lo que tal vez no preveían aquellos visionarios pioneros era la importancia que este fenómeno iría tomando con el tiempo. Tanta, que hoy en día, el ordenador está presente en todas las facetas de la creación musical, en la composición, la interpretación, la grabación, la producción y la reproducción. Lo que durante años fue casi un “secreto” en manos de centros de investigación privados o universitarios, sufrió una primera democratización hace algo más de una década, con la llegada del MIDI y del disco compacto, dos muestras muy diferentes de las posibilidades del ordenador en el campo de la música. Desde entonces, pocos son los músicos profesionales que no aprovechan en alguna medida el enorme potencial del MIDI y, muchos menos, los aficionados que siguen reproduciendo aquel rito consistente en sacar el vinilo de su funda flexible y levantar con cuidado el brazo del tocadiscos. La segunda revolución se está produciendo ahora mismo, y su líder tiene un nombre: “multimedia”. Como todos los cambios, éste tiene su aspecto positivo y su aspecto negativo. Por un lado, ha abierto la posibilidad teórica de que cualquiera pueda participar, casi en igualdad de condiciones, en la vorágine del mercado musical y, lo que es más importante, está fomentando el surgimiento de nuevas formas de entender y de crear la música. Como contrapartida, los ordenadores se han llenado de muchas “musiquillas” totalmente prescindibles, trivializando al máximo el fenómeno de la creación musical. Y en consecuencia, han proliferado también en revistas “especializadas” en multimedia un sinfín de artículos poco claros y nada rigurosos, en muchos casos plagados incluso de incorrecciones y barbaridades, que han colaborado a enmarañar este campo y a confundir totalmente al aficionado. Para hacer música, no hay desde luego nada como saber música, pero este conocimiento (cada vez más relativo) no es ni estrictamente necesario ni siquiera suficiente. Hasta hace poco, cuando uno sentía esta necesidad y no poseía demasiados conocimientos, solía plantearse dos opciones: o ponerse a estudiar, o coger una guitarra, un micro o una batería. Y la historia más reciente nos demuestra que por este último camino también se puede llegar a obtener resultados muy loables. Ahora, puede además, coger un ordenador. Como cada medio, éste posee sus propias reglas, exigencias y peculiaridades. Desde este libro no le podemos enseñar a hacer música “interesante”, pero sí al menos a que conozca las herramientas de que dispone, las principales mejoras que podría incorporar a su sistema informático-musical, y los muchos trucos que le permitirán enriquecer cualquier resultado. Y le ayudaremos también a tener nuevas ideas, ya que éstas surgen con mayor facilidad, cuando mejor se conoce el medio con el que se trabaja. Tenga en cuenta que, en la música informática, la agilidad mental es más importante que la agilidad “digital”1 . Y si usted no siente deseos, o no se cree capacitado para componer, probablemente tiene la curiosidad de saber cómo funcionan estas cosas, de conocer más a fondo para qué sirve la tarjeta que se oculta en las entrañas de su ordenador (si no fuera así, no estaría leyendo esta 1 De “dedo” ¡no de “dígito”!
  • 2. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 introducción). En este caso, su curiosidad quedará satisfecha. Y quién sabe, tal vez incluso le acabe picando el gusanillo… Después están los programadores, que intuyen el potencial que se oculta tras el MIDI y el audio digital, pero no encuentran la información necesaria. Para ellos, dedicamos dos extensos capítulos a la programación MIDI, con ejemplos operativos en Visual Basic y en lenguaje “C”. Por último, este libro también tiene bastante que aportar a los músicos que trabajan con el MIDI desde hace tiempo, y que dominan con soltura sus aspectos más prácticos. Aquellos que acaban de cambiar de ordenador, y que se han decidido a jubilar aquel Atari que tan buenos momentos y resultados les ha proporcionado, podrán descubrir todas las prestaciones de un sistema que, como el PC de hoy en día, es mucho más potente y abre un sinfín de nuevas posibilidades (samplers económicos, grabación multipista a disco duro, etc.). Y los que deseen consolidar sus conocimientos y profundizar en los aspectos más teóricos de las tecnologías que usan a diario, también encontrarán aquí una importante fuente de conocimientos, así como una rápida referencia para muchas de las dudas que les puedan ir surgiendo. Varios cursos de informática musical, impartidos a estudiantes de cierto nivel, me han evidenciado que muchos conocimientos, supuestamente básicos, no siempre están tan claros como cabría esperar.
  • 3. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 Cómo usar este libro La idea de este libro surgió a raíz de varios cursos de informática musical y programación MIDI impartidos en el Institut Universitari de l’Audiovisual, de la universidad Pompeu Fabra de Barcelona, al observar que la bibliografía sobre el tema, sigue siendo hoy bastante reducida. La mayoría de libros interesantes están en inglés y no son además fáciles de conseguir. Los pocos publicados en castellano, son, salvo honrosas excepciones, demasiado superficiales o han quedado desfasados. La intención inicial era dar una base sólida y completa tanto para el músico que comienza, como para el que desea consolidar sus conocimientos, en el área de la informática musical. Por otro lado, es innegable que con el auge del multimedia, existen muchos nuevos usuarios con inquietudes y disposición, que no encuentran la información necesaria para comenzar a adentrarse en estos terrenos. Por ello, este libro intenta combinar los aspectos teóricos fundamentales que rigen el sonido digital y la música por ordenador, con las posibilidades prácticas que los ordenadores multimedia ofrecen hoy en día. Cuando ha habido que elegir una plataforma y un sistema en los que mostrar los ejemplos y los productos actualmente disponibles, la elección ha recaído sobre el PC y el sistema operativo Windows (especialmente la versión 95). Los productos cambian muy rápido, y es por ello peligroso aconsejar determinadas aplicaciones o dispositivos de hardware, pero creemos que el salto cuantitativo importante que se ha producido en el terreno de los ordenadores PC compatibles durante los años 1995 y 1996, dejará sus secuelas durante cierto tiempo. Material necesario Se asume que el lector dispone de un ordenador y de una tarjeta de sonido. Si no fuera así, en los capítulos 11 y 12 se estudian las tarjetas de sonido en profundidad, lo cual puede servir de ayuda a la hora de adquirir una. En los capítulos 5 y 6 es conveniente la utilización de un software editor de sonido para aplicar los conceptos tratados. El libro no sigue ninguno en particular, aunque en esos capítulos, se recomiendan varias utilidades shareware. Más adelante se estudia el software secuenciador, también de forma genérica, por lo que sería muy conveniente que el usuario dispusiera de uno, así como de un teclado MIDI. Muchos de los programas shareware o de dominio público que se mencionan a lo largo de la obra pueden obtenerse en Internet, y en un apéndice se incluyen algunas direcciones interesantes. Esquema general de la guía Como reza el título, este libro trata dos grandes temas, que en la práctica se combinan, pero que están conceptualmente separados: el audio digital y el MIDI. Nos ha parecido incuestionable comenzar por el audio digital, para pasar después al MIDI, y mostrar finalmente en el último capítulo el inmenso potencial que ofrece el uso combinado de ambas
  • 4. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 tecnologías; posibilidad que en el terreno de los ordenadores compatibles está disponible, a nivel masivo, sólo desde 1996. Aconsejamos una lectura progresiva, aunque el lector impaciente podrá saltar de un tema a otro intentando respetar los bloques que se indican a continuación. Asimismo muchos de los capítulos podrán ser utilizados para consultas posteriores, por lo que hemos dedicado un especial esfuerzo en facilitar la localización y el acceso a informaciones puntuales. El audio digital se trata en los capítulos 1 a 6. El capítulo 1 estudia principios básicos de acústica musical y el capítulo 2, los aspectos fundamentales del audio digital. Aunque en ambos se han evitado complejas fórmulas y demostraciones matemáticas, incluyen todo lo necesario para la comprensión de lo que sigue. Un lector con conocimientos en ambos campos podría tal vez saltárselos, pero un breve repaso le ayudará a refrescar la memoria y a aclarar conceptos. El capítulo 3 explica las peculiaridades y el uso del audio digital en los ordenadores, de forma totalmente independiente de cualquier plataforma. El capítulo 4, se centra en cambio en la implementación que del audio digital hace Windows 95 (indicando cuando las hubiera, las particularidades de Windows 3.1), y aunque su contenido teórico es muy escaso, ayudará a cualquier usuario de este sistema, a configurar bien el ordenador, a comprender sus peculiaridades y a realizar las operaciones más básicas (digitalización de sonido, control del mezclador, etc.) algunas de ellas fundamentales para el resto de la obra. Un usuario de otra plataforma (Apple, Unix, etc.) podrá saltarse este tema. En los capítulos 5 y 6 se explican los procesos típicos disponibles en un programa editor de sonido. En ambos se describen ejemplos con varios programas de Windows (en su mayoría de dominio público), por lo que para seguirlos sería conveniente que el lector dispusiera de algunos de ellos. Las técnicas descritas en el capítulo 5 pueden considerarse más básicas, mientras que las del capítulo 6 implican un contenido teórico superior. Por ello, se discuten también de forma sencilla algunos conceptos de proceso digital de señal. Los capítulo 7 a 14, tratan del MIDI en general. El capítulo 7 es una introducción al tema, que podrán saltarse los que lleven tiempo trabajando con él. El capítulo 8, trata en cambio todos los mensajes MIDI en profundidad, por lo que es de lectura (y relectura) obligada. En algunos puntos se asumen ciertos conocimientos informáticos básicos (sistema binario), por lo que es posible que, en el primer acercamiento, este capitulo pueda parecer un tanto denso, pero está estructurado de forma que permita una utilización como referencia rápida. Por ello, si la primera lectura se le hace excesivamente farragosa, podrá volver a él siempre que necesite reafirmar sus conocimientos. El capítulo 9 cubre la síntesis digital. En principio está enfocada a los sintetizadores MIDI y al sampler, pero también podría leerse como continuación del capítulo 6. En cualquier caso incluye muchos aspectos fundamentales que serán desarrollados en los capítulos 11 y 12, dedicados a las tarjetas de sonido. Los capítulos 10, 11 y 12 se dedican al hardware MIDI. En el 10, se tratan brevemente desde los dispositivos más frecuentes (como el teclado) a otros que no lo son tanto. No se trata de adquirirlos todos, sino de obtener una visión global de la multiplicidad de enfoques permitidos y de las posibilidades actuales. Los capítulos 11 y 12 se centran en las tarjetas de sonido. Primero de forma más teórica, estudiando los diversos tipos y sus características, para realizar, en el capítulo 12, un análisis comparativo de los modelos más aconsejables, disponibles a principios de 1997.
  • 5. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 Los capítulos 13 y 14, tratan sobre el software MIDI. El primero se dedica por completo al secuenciador, el programa más importante de todo estudio MIDI, mientras que en el segundo, se contemplan los restantes tipos de programas disponibles. En ambos casos se analizan las prestaciones de varios paquetes disponibles para Windows. Los capítulos 15, 16 y 17, cubren varios aspectos de la configuración, gestión y programación MIDI en Windows. El primero es obligado para entender las peculiaridades de este sistema operativo en lo que al MIDI se refiere. Los dos siguientes se reservan para los programadores. El capítulo 16 trata el uso de comandos MCI, mientras que el 17 se centra en la programación MIDI de bajo nivel. Ambos pueden estudiarse de forma independiente. En los dos casos puede resultar conveniente repasar previamente el capítulo 8. Finalmente, en el capítulo 18 se abordan las nuevas posibilidades de integración del MIDI y el audio digital, para finalizar con un repaso de los dispositivos analógicos imprescindibles en todo estudio de música por ordenador. Termina el libro con tres apéndices. El primero, destinado a aclarar algunos términos y conceptos musicales, está pensado para el lector con escasa formación musical. En el segundo se presentan en modo de tablas, algunas especificaciones técnicas referentes al MIDI, mientras que en el tercero se incluye una lista comentada de direcciones en Internet, relacionadas con la informática musical.
  • 6. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 Agradecimientos Me gustaría dar las gracias a todas aquellas personas que a lo largo de los últimos diez años me han ayudado o encaminado a seguir en el campo de la informática musical, y en especial a Adolfo Nuñez del Laboratorio de Informática y Electrónica Musical de Madrid y a Xavier Serra de la Fundaciò Phonos de Barcelona. También quisiera agradecer a Marisa Manchado y a Gabriel Brncic por haberme animado a seguir componiendo en algunos momentos en que no lo he tenido tan claro, a Marcel.lí Antúnez que me fuerza, con sus propuestas, a descubrir cada día nuevos horizontes informático-creativos y a Cristina Casanova que ha colaborado en las imágenes del libro y con sus apreciaciones, sugerencias y acertados comentarios. Sergi Jordà, Barcelona 1997.
  • 7. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 1. Principios de acústica 1.1. Introducción Aunque se puede hacer música sin tener demasiados conocimientos de acústica, parece imposible comprender lo que es el sonido digital si no se tiene una idea de lo que es el sonido en general. Por ello, este capítulo describe de forma básica los aspectos físicos y matemáticos de las ondas sonoras que, junto con sus consecuencias psicológicas, son la base de toda experiencia musical. Empecemos pues por el principio. 1.2. ¿Que es el sonido? Lo que entendemos por sonido es fruto de una compleja interacción entre un objeto vibrante, un medio transmisor (frecuentemente el aire), el oído, y el cerebro. Para que la vibración sea audible para un ser humano, este objeto debe oscilar aproximadamente entre 20 y 20.000 veces por segundo. Al oscilar, el objeto desplaza el aire que lo rodea, comprimiendo y descomprimiendo periódicamente las moléculas que lo integran, y modificando por consiguiente la presión del aire de forma periódica. Dado que las moléculas desplazadas van empujando a las contiguas, la variación periódica de la presión se propaga originando lo que recibe el nombre de ondas sonoras. Cuando las ondas llegan al oído, el cerebro interpreta estas variaciones de presión como sonido. Si la presión del aire que circunda el oído se mantiene constante, no oímos nada, u “oímos el silencio”. Las ondas sonoras se propagan en el espacio, formando invisibles esferas centradas en el objeto que oscila. Conforme aumenta la distancia al origen y el radio de estas ondas, aumenta también el volumen y la masa de aire que éstas deben desplazar, por lo que las oscilaciones se hacen cada vez más débiles (la presión del aire varía cada vez menos, aunque siga haciéndolo con la misma frecuencia) hasta que, a una cierta distancia, se tornan imperceptibles. Este principio es válido independientemente del objeto oscilador, que puede ser por ejemplo una cuerda (guitarras, violines, pianos, cuerdas vocales, etc.), una columna de aire semicerrada y excitada por una caña o una boquilla (saxofones, flautas, trompetas, órganos, etc.), una pieza de madera, metal, piel, piedra, etc. golpeada (percusiones), o un cono de papel (altavoces). En muchos casos, los objetos que entran en vibración son en realidad varios, como es el caso de la guitarra (o de la voz) donde lo que oímos es la suma de las vibraciones de las cuerdas y de la caja. Asimismo, cuando estas ondas encuentran un obstáculo, parte de las moléculas que las componen son absorbidas por el material, mientras que las restantes son reflejadas. Este fenómeno origina que en la mayoría de los casos, lo que nos llega al oído sea una suma del sonido directo combinado con múltiples reflexiones de este sonido, ligeramente retardadas1. 1 El tiempo de estos retardos será proporcional a la distancia adicional recorrida, teniendo en cuenta que la velocidad del sonido en el aire, es de aproximadamente 344 m/s.
  • 8. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 1.3. Características de los sonidos musicales Para describir un sonido musical se utilizan tres términos: altura, timbre e intensidad. Todo sonido tiene una duración y, a lo largo de ésta, cualquiera de estos tres parámetros puede variar (los sonidos naturales jamás son perfectamente estables o constantes). 1.3.1. La altura y la frecuencia La altura está directamente relacionada con la frecuencia de la oscilación, pero ambos términos no son sinónimos. De hecho, muchos sonidos (como los percusivos) no tienen una altura definida. El motivo de esta aparente paradoja es que, mientras la frecuencia es una propiedad física indisociable de todo aquello que, como el sonido, vibra u oscila, la altura es una cualidad subjetiva que percibimos sólo en algunos sonidos2. Si golpeamos, por ejemplo, un bombo o un platillo, podremos sin duda afirmar que el platillo suena más agudo que el bombo, pero no podremos decir si estos sonidos correspondían a un Do o a un La. ¿Que es lo que hace que un sonido posea o no una altura clara? Básicamente, su periodicidad. Es necesario que un sonido sea aproximadamente periódico, es decir que su frecuencia de oscilación no varíe (o varíe poco) dentro de un determinado lapso de tiempo, para que lleguemos a percibir una altura. En una escala temporal mayor, la frecuencia sí que puede variar, y en este caso, lo que percibiremos son alturas variables en el tiempo. Figura 1.1. Variación de la presión en función del tiempo en un sonido periódico En la figura 1.1 se muestra un sonido periódico, ya que la forma de la onda se repite claramente. La frecuencia de este sonido vendrá dada por el tiempo que dura este período, ya que ambas magnitudes son inversas. Si este período durase por ejemplo una centésima de segundo, su frecuencia sería de 100 Hz3. 2Por este motivo hemos añadido el epíteto "musicales", en el título de este apartado. Eso no significa que estos sonidos sean los únicos válidos para hacer música, y la percusión es un claro ejemplo de ello. 3El Hz o hertzio es la magnitud física que mide la frecuencia, e indica el número de veces por segundo que se repite determinado fenómeno.
  • 9. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 1.3.2. La octava y las notas Un fenómeno muy importante relacionado con la apreciación de las alturas, es el de la octava. Si escuchamos dos sonidos cuyas frecuencias guardan una relación de 2:1 (por ejemplo 400 Hz y 200 Hz), nos sonarán muy cercanos. El motivo es que entre los dos dista exactamente una octava. Dado que cada vez que se dobla la frecuencia se sube una octava, un sonido de 880 Hz estará dos octavas por encima de uno de 220 Hz. Esta idea de octava se repite en casi todas las culturas, a lo largo de la historia. Lo que sí varía enormemente de una cultura a otra es el número de subdivisiones que se aplican a la octava. En la música occidental, la octava se divide en doce alturas o semitonos, de las cuales siete tienen “nombre propio” y corresponden a las teclas blancas de un piano. Las cinco restantes (que corresponden a las teclas negras) pueden tomar el nombre de la inmediatamente anterior, en cuyo caso se les añade el símbolo # (sostenido), o de bien la posterior, en cuyo caso se les añade el símbolo b (bemol). De esta forma las doce notas de una octava pueden nombrarse de dos maneras diferentes ( “do, do#, re, re#, mi, fa, fa#, sol, sol#, la, la# y si”, o bien “do, reb, re, mib, mi, fa, solb, sol, lab, la, sib y si”). En la nomenclatura sajona las notas se designan mediante letras mayúsculas, de acuerdo con la siguiente equivalencia (que conviene tener presente, dado que, como se verá en la segunda parte de este libro, los programas MIDI la utilizan profusamente)4. Do Re Mi Fa Sol La Si C D E F G A B Conviene indicar que antes de J.S.Bach (siglo XVIII), la división de la octava se basaba en las teorías del filósofo griego Pitágoras, según la cual los intervalos formados por cada nota y la siguiente no eran siempre idénticos. Para simplificar la construcción de instrumentos, en el siglo XVIII se decidió dividir la octava en doce partes iguales, por lo que actualmente, la relación de frecuencias entre cualquier nota y la siguiente es siempre igual a 21/12 (1.05946). De esta forma, al avanzar doce semitonos (una octava), obtenemos un factor de (21/12 )12 que es efectivamente igual a 2. 1.3.3. El timbre y los armónicos El timbre podría definirse como el "color" de un sonido, y es lo que nos ayuda a caracterizar y distinguir diferentes tipos de instrumentos, o a reconocer a las personas por su voz. Un La de 440 Hz en una clarinete suena diferente que el mismo La en un saxo; aunque ambos tienen la misma altura, sus timbres no son iguales. La figura 1.2, que muestra fragmentos de estos dos sonidos, junto con un tercer fragmento correspondiente a onda sinusoidal pura de la misma altura, nos puede ayudar a comprender la naturaleza física del timbre. En los tres fragmentos, el período es el mismo (pues tienen la misma altura), pero sus formas son diferentes. 4 En el apéndice B se indican las frecuencias de todas las notas MIDI, y se puede observar como efectivamente, estas frecuencias se duplican en cada nueva octava.
  • 10. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 Figura 1.2. Fragmentos de tres sonidos de la misma altura (La de 440 Hz) en un clarinete (a), un saxofón (b) y una onda sinusoidal pura (c) El motivo de esta diferencia de forma, es que las ondas de los sonidos naturales son más complejas porque vibran con varias frecuencias simultáneas. En la naturaleza no se encuentran sonidos puros con una sola frecuencia, como el de la figura 1.2.c; éstos sólo son obtenibles por medios electrónicos. En los sonidos naturales, la frecuencia de vibración más grave es la que determina normalmente el período y la altura, y se denomina frecuencia base. Las restantes frecuencias, que suelen ser múltiplos de la frecuencia base se denominan armónicos, y cada tipo de instrumento tiene, por su construcción, una serie diferente de armónicos de amplitudes diferentes, que son los que definen su timbre y otorgan las "señas de identidad" al instrumento.
  • 11. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 Las matemáticas relacionadas con este concepto, fueron establecidas en el siglo XIX por el físico Jean-Baptiste Fourier, que descubrió que toda señal periódica, por compleja que esta sea, puede descomponerse como una suma de señales sinusoidales armónicas, es decir de frecuencias múltiplos de la original. En la figura 1.3 se muestra la descomposición de una onda periódica (d) en sus varias ondas sinusoidales simples armónicas, de amplitudes diferentes. Dicho de otro modo, la señal d es la resultante de sumar de las señales a, b y c. Figura 1.3. Descomposición de Fourier de una señal periódica en varias señales sinusoidales Cuando el sonido no es periódico, su descomposición no puede llevarse a cabo mediante frecuencias múltiplos por lo que los factores dejan de ser números enteros. En estos casos tenemos sonidos inarmónicos, en los cuales se hace difícil apreciar una altura precisa.
  • 12. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 1.3.4. La intensidad y los decibelios Si la altura viene determinada por el número de oscilaciones por unidad de tiempo, la intensidad depende del cuadrado de la amplitud de estas oscilaciones, o la diferencia entre las presiones máxima y mínima que la onda puede alcanzar. La percepción de la intensidad sonora es, en realidad, un fenómeno auditivo muy complejo, mucho más que el de la altura, y lo que sigue es una inevitable simplificación. Las intensidades de diferentes sonidos pueden variar, aunque parezca increíble, en varios millones de órdenes de magnitud (es decir, el sonido más intenso que podamos oír, lo será varios millones de veces más, que el más tenue). Por ello, la intensidad se mide en una escala logarítmica, los decibelios (dB), de acuerdo con la siguiente fórmula Nivel de intensidad en decibelios (dB) = 10 x log10 (amplitud2 /amplitud referencia2 ) Esta expresión determina un nivel o diferencia de intensidad entre dos amplitudes. El origen (0 dB) corresponde al umbral de audición (mínimo sonido audible). Por debajo de este valor tenemos el auténtico silencio, aunque en el mundo en que vivimos la experimentación del silencio se hace francamente difícil, por lo que muchos de nosotros probablemente no lleguemos a conocer nunca el significado real de esta palabra. Por encima de los 130 dB se produce una sensación dolorosa. Valores superiores prolongados llegan a destrozar el tímpano. En la tabla 1.1 siguiente se muestran algunos valores típicos. . Descripción Nivel (dB) Relación de intensidad Despegue de cohete espacial 190 1019 Despegue de un reactor 150 1015 Umbral de dolor 130 1013 Concierto de heavy metal 120 1012 Martillazos sobre una plancha metálica (a 50 cm) 110 1011 Tráfico en calle concurrida 70 10.000.000 Conversación normal (a 1 m) 60 1.000.000 Restaurante concurrido 50 100.000 Casa en la ciudad 40 10.000 Iglesia vacía 30 1.000 Estudio de grabación 20 100 Umbral de audición 0 1 Tabla 1.1. Ejemplos de niveles sonoros en dB. He aquí algunas consideraciones adicionales: • El oído no es normalmente capaz de distinguir diferencias inferiores a 3 dB. • La intensidad de un sonido decrece aproximadamente en 6 dB cada vez que se dobla la distancia.
  • 13. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 1.3.5 El rango dinámico La diferencia entre los valores mínimos y máximos en dB, que un sistema puede producir se denomina rango dinámico. En la tabla 1.2 se indican algunos valores típicos. Clarinete 86 Piano 94 Disco compacto 96 Trombón 107 Orquesta sinfónica 120 Tabla 1.2. Varios ejemplos de rangos dinámicos (en dB). En la mayoría de dispositivos de audio (amplificadores, pletinas de casete, reproductores de compactos, altavoces, etc.) este valor figura entre las especificaciones técnicas, como rango dinámico o relación señal/ruido5. En un aparato electrónico, el rango dinámico indica la diferencia entre el nivel máximo que el dispositivo puede emitir, y el nivel del ruido existente cuando no hay señal (el ruido de fondo). Cuanto mayor sea esta diferencia, más limpio será el sonido del dispositivo. En una cadena de varios dispositivos de audio (emisor, amplificador, altavoces, etc.) el valor real, es decir el máximo rango dinámico que podremos llegar a apreciar, corresponderá al del dispositivo con peores características. En aparatos de cierta calidad, este valor suele estar comprendido entre los 80 y los 95 dB. Tal como se indica en la tabla 1.2, en los reproductores de compactos, y en cualquier otro dispositivo de sonido digital de 16 bits, este valor no podrá nunca ser superior a 96 dB (en el próximo capítulo explicaremos la razón), pero incluso pocas veces se alcanza este máximo teórico, ya que la circuitería analógica presente en el dispositivo tiende a añadir ruido. 1.4. El sonido analógico Hasta la aparición de los ordenadores, el sonido se grababa siempre de forma analógica. Pero ¿qué significa exactamente este término? El término analógico se utiliza actualmente en contraposición a digital. Las señales analógicas son funciones de variables continuas (frecuentemente del voltaje) cuyas evoluciones temporales imitan (son una analogía de) las señales originales. La representación gráfica de un sonido grabado analógicamente tendrá aproximadamente la misma forma que el sonido original, pero la curva indicará variaciones de voltaje, en lugar de variaciones de presión de aire. Estas nuevas señales analógicas se obtienen por medio de transductores, término con el que se designa a todo dispositivo capaz de convertir una magnitud física en otra. El micrófono y los altavoces son los dos transductores básicos utilizados en la grabación y reproducción del sonido. En primer lugar, el micrófono convierte la variación de la presión de 5 Aunque ambos términos no son exactamente idénticos, de momento podemos obviar la diferencia.
  • 14. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 aire ejercida sobre su membrana, en una señal de voltaje variable en el tiempo. Este voltaje puede ser grabado, utilizando diferentes tecnologías, sobre una cinta magnética o en los surcos de un disco de vinilo. Cuando deseamos reproducir el sonido, la señal eléctrica generada por el cabezal de la pletina o la aguja del tocadiscos, es amplificada y enviada a los altavoces, donde un nuevo transductor la convierte en un campo magnético capaz de desplazar y de hacer oscilar (con las frecuencias originales) los conos de papel de los altavoces. Conviene resaltar que aunque la grabación se realice digitalmente, tal como se describe en el próximo capítulo, “Principios de sonido digital”, se seguirán llevando a cabo las transducciones analógicas en el micrófono y en los altavoces. En la figura 1.4 se esquematizan los dos procesos de grabación alternativos. Figura 1.4. Esquema de los procesos de grabación analógica y digital Al contrario de lo que opina la mayoría, una grabación analógica no tiene por qué sonar peor que una grabación digital (en condiciones óptimas, suena de hecho mejor). Sus inconvenientes radican en que la señal analógica se degrada mucho más rápidamente (las cintas magnéticas se desmagnetizan, y los surcos en el vinilo se desgastan), y que en cada nueva generación se produce una pequeña pero inevitable perdida, de forma que, a cada nueva copia, la señal se parece cada vez menos a la original.
  • 15. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 Por estas razones el sonido digital ha tomado definitivamente el relevo del analógico. Al margen de la discutible cuestión de la calidad, en este libro se verá porque el sonido digital aporta un sinfín de nuevas y excitantes posibilidades en la manipulación, creación y experimentación sonoras.
  • 16. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 2. Principios del sonido digital 2.1 Introducción El principio fundamental del audio digital consiste en discretizar las señales sonoras continuas (como las emitidas por un micrófono) para convertirlas en secuencias de números. La discretización de estas señales se lleva a cabo en dos niveles diferentes, el temporal y el de la amplitud. En la figura 2.1 se muestra una señal continua, discretizada sólo en el tiempo (cuadros blancos) y en el tiempo y la amplitud (puntos negros). Cuanto menor sea la cuadrícula, mayor similitud existirá entre la señal original y la señal digitalizada. Figura 2.1. Discretización de una señal continua. 2.2. Comparación con el cine y el vídeo digital Para aclarar algunos conceptos, haremos una analogía con el cine y el vídeo digital. En ambos medios, existe una discretización temporal (incluso en el caso del cine que no es un medio digital). En el cine, la unidad de discretización temporal es el fotograma (24 fotogramas/segundo), mientras que en el vídeo esta unidad se suele denominar con el término inglés frame (dependiendo del sistema, este valor suele ser de 25 ó 30 frames/segundo). Esto correspondería, en el audio, a la discretización temporal. Pero en el caso del vídeo digital se producen dos discretizaciones adicionales. La segunda convierte cada frame en una matriz de puntos (por ejemplo 800x600), y la tercera asigna un número (de entre un conjunto finito de valores) a cada punto, de forma que cada uno de estos números corresponde a un color y un brillo determinado.
  • 17. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 Es obvio que cuantos más puntos apliquemos, y cuantos más números utilicemos para cada punto, mayor será la similitud entre la señal analógica original y la señal digitalizada. Si disponemos de pocos puntos, la imagen aparecerá cuadriculada, y si el número de valores posibles para cada punto es pequeño, perderemos matices en los colores y en los brillos. En la figura 2.2 se muestran estos casos. Algo parecido sucede con el sonido. Figura 2.2. Ejemplos de imágenes deficientemente digitalizadas.
  • 18. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 2.3. Muestreo del sonido - Frecuencia de muestreo La palabra muestreo es el equivalente del término inglés sampling, y se utiliza para indicar la acción de tomar muestras a intervalos de tiempo regulares. Para digitalizar un sonido es necesario muestrearlo, pero ¿con qué frecuencia? En el apartado anterior comentábamos que para la imagen animada, la frecuencia de muestreo suele estar entre los 24 y los 30 fotogramas por segundo. Con esta frecuencia se consigue engañar a la retina, haciéndole creer que lo que recibe no son imágenes discontinuas, sino un flujo continuo de luz, pero estos valores son totalmente insuficientes en el caso del sonido. Para comprender este fenómeno observemos la figura 2.3 que representa una señal sinusoidal de 30 Hz. (el ciclo se repite 30 veces por segundo) ¿Que ocurre si la muestreamos a una frecuencia de 20 Hz? En este caso, estaremos tomando el valor de la onda original cada 0,05 segundos (corresponden a los seis cuadros de la figura). La nueva señal obtenida juntando los puntos muestreados tiene un período aparente de 0,1 segundos, ¡es decir una frecuencia de 10 Hz, lo cual no se corresponde en absoluto con la señal original! Figura 2.3. Señal muestreada incorrectamente. ¿Cual sería la mínima frecuencia de muestreo correcta? El teorema del muestreo o teorema de Nyquist, afirma que para muestrear correctamente una señal de X Hz, se requiere como mínimo una frecuencia de muestreo de 2X Hz. En nuestro ejemplo anterior, una frecuencia de 60 Hz hubiese pues bastado para muestrear correctamente la señal original. Pero tal como indicamos en el capítulo 1,”Principios de acústica”, el oído humano es capaz de detectar frecuencias sonoras de hasta aproximadamente 20.000 Hz, por lo que, para muestrear correctamente cualquier sonido se necesitará una frecuencia de muestreo superior o igual a 40.000 Hz. ¡De aquí proceden los famosos 44.100 Hz. utilizados en los discos compactos!
  • 19. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 2.4. Muestreo con frecuencias inferiores - El aliasing Si muestreamos a una frecuencia inferior, como por ejemplo a 30.000 Hz, los resultados que obtengamos podrán ser correctos para las frecuencias por debajo de los 15.000 Hz (la mitad de la frecuencia de muestreo). Para las aplicaciones que no precisen de la máxima fidelidad, esto es más que suficiente. El sonido será un poco menos brillante, pero se parecerá todavía bastante al original, pues la zona frecuencial con mayor energía suele estar aproximadamente entre los 1.000 y los 3.000 Hz. Existe, sin embargo un problema adicional, algo complicado de entender. Tal como vimos en el ejemplo gráfico anterior, al muestrear con frecuencias inferiores, surgen frecuencias “fantasmas” que realmente no están en el sonido original (como los 10 Hz que aparecían misteriosamente en nuestro ejemplo) y que alteran el sonido muestreado. Este fenómeno recibe el nombre de aliasing. Si lo que sigue le parece excesivamente complicado, no se preocupe: volveremos a tratar el tema con más detalle en el apartado 5.7. “Efectos simples aplicables a la frecuencia”, pero para los más impacientes, he aquí un pequeño adelanto. El aliasing “inventa” frecuencias de valores aproximados a la diferencia entre la frecuencia original y la frecuencia de muestreo. Para evitarlo, cuando se desee muestrear a frecuencias inferiores a 44.100 Hz, se debería filtrar previamente la señal entrante, eliminando todos sus valores por encima de la mitad de la frecuencia de muestreo. Si decidimos muestrear a 20.000 Hz, deberíamos filtrar la señal original, eliminando todos sus componentes por encima de 10.000 Hz. Esto no siempre es posible si no se dispone del hardware adecuado, ya que la mayoría de tarjetas de sonido no permiten modificar el filtro de entrada. Existe una solución para realizar todo este proceso por software, consistente en: • muestrear a 44.100 Hz • filtrar por software el sonido obtenido, a la mitad de la frecuencia deseada (e.g. 10.000 Hz) • reconvertir por software el sonido a la frecuencia deseada (e.g. 20.000 Hz) Parece muy complicado, pero no se apure; como veremos, la mayoría de editores de sonido facilitan bastante esta tarea. 2.5. Número de bits, resolución y rango dinámico Hasta aquí, hemos resuelto la primera parte teórica de la digitalización, consistente en obtener una serie de muestras a intervalos regulares. Falta todavía la segunda parte, que consiste en asignar a cada una de estas muestras un valor numérico que pueda ser manejado por un ordenador. Para ello, volveremos momentáneamente al ejemplo del vídeo digital, que para muchos lectores resultará más familiar. La resolución de color de una imagen (y de las tarjetas de vídeo) se mide en bits. Así, una imagen de 8 bits, podrá incluir 256 (28 ) colores diferentes, mientras que una de 24 bits podrá representar más de 16 millones (224 ) de colores. Con el sonido sucede algo parecido: cuantos más bits apliquemos, más niveles o escalones tendrá el
  • 20. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 sonido digitalizado y más parecido será en consecuencia al sonido analógico original (que al ser continuo, poseía un número infinito de niveles). El rango dinámico en decibelios viene dado aproximadamente por la fórmula: rango dinámico en dB = 10 x log10 (amplitud máxima2 /amplitud mínima2 ) Si en un sistema digital consideramos la amplitud máxima como 2bits y la amplitud mínima como 1, tendremos que un sistema de conversión de 8 bits posee un rango dinámico de aproximadamente 48 dB, mientras que en uno de 16 bits, el rango dinámico es de 96 dB. Dado que el umbral de dolor no se sitúa hasta alrededor de los 130 dB, sería deseable que un sistema de alta fidelidad pudiese alcanzar este rango dinámico. Para ello serían necesarios unos 22 bits de resolución. Todos sabemos que no es éste el estándar que se ha adoptado, que ha quedado establecido en 16 bits. Por ello, todo sistema digital convencional posee un rango dinámico máximo de 96 dB (valor teórico que en la práctica se ve disminuido por factores de circuitería). 2.6. La calidad del sonido digital Estos valores de 44.100 Hz y 16 bits adoptados en el disco compacto y otros dispositivos digitales, son los que nos llevan a afirmar que el sonido digital de alta fidelidad no es todo lo bueno que podría ser, ya que ciertos equipos analógicos superan estas cotas. No se puede negar sin embargo que el sonido digital ofrece muchas ventajas, entre las que hay que destacar el menor desgaste y sobretodo, la posibilidad de realizar copias idénticas, es decir, sin ninguna pérdida. El formato digital permite además, tal como iremos viendo, muchas más posibilidades de manipulación y procesado. Por otro lado, cuando no se necesite una calidad de alta fidelidad, se pueden utilizar especificaciones inferiores. En este sentido, una frecuencia de muestreo de 11.025 Hz y una resolución de 8 bits, ofrecen una calidad comparable a la de una línea telefónica convencional, por lo que serán suficientes para algunas aplicaciones de voz, donde lo que se busque sea la comprensión de un mensaje, al margen de preocupaciones estéticas. 2.7. Los conversores A/D y D/A Hasta aquí la teoría. Veamos ahora como funciona un sistema digitalizador de sonido. El sistema se compone de dos conversores: un conversor analógico/digital (a partir de ahora A/D) en la entrada, y un conversor digital/analógico (a partir de ahora D/A) en la salida. Ambos están controlados por un reloj digital que determina la frecuencia de muestreo. Para evitar el aliasing se coloca en la entrada un filtro pasa-bajo (véase apartado 6.4.3), que elimina de la señal analógica todos los componentes con frecuencias superiores a los 22.050 Hz. En el proceso de digitalización, el conversor A/D genera un número binario (de 8 ó 16 bits) a cada pulso del reloj. Este número es almacenado en la memoria o grabado en un disco duro. Para la audición de esta señal digital, es necesaria la reconversión inversa, de forma que
  • 21. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 los números almacenados son enviados a un conversor D/A que los convierte en voltajes, a la misma frecuencia de reloj. Esta señal analógica es suavizada mediante un nuevo filtro, amplificada y enviada a unos altavoces, que con su vibración, convierten finalmente los voltajes en variaciones de presión de aire. La figura 2.4 esquematiza este proceso. Figura 2.4. Esquema de un sistema de conversión A/D y D/A
  • 22. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 2.8. Breve historia del audio digital Los primeros experimentos en audio digital datan de finales de los cincuenta, cuando Max Mathews obtuvo en los laboratorios Bell los primeros sonidos generados por ordenador. En esta época, la escasa potencia de las computadoras no permitía una velocidad suficiente para digitalizar el sonido. Los experimentos consistieron en obtener sonidos sintéticos, generando los números en el ordenador. Tras muchos experimentos que ayudaron a comprender mejor la naturaleza del sonido digital, el primer grabador comercial, el Sony PCM-1, vio la luz en 1977. El conversor era de 13 bits y utilizaba como soporte cintas de vídeo Beta (al año siguiente, el modelo PCM-1600, ya utilizaba conversión de 16 bits). En 1982 apareció el disco compacto, desarrollado conjuntamente por Sony y Philips, con un éxito fulminante. A principios de los ochenta aparecieron también los primeros sintetizadores digitales y los primeros samplers, pero de ello hablaremos profusamente en el capítulo 9, “Síntesis y generación digital de sonido”. Los primeros sistemas domésticos de grabación digital no llegaron hasta finales de los ochenta, inicialmente con la cinta DAT (Digital Audio Tape), y posteriormente con el DCC (Digital Compact Cassette), el MiniDisc, la grabación a disco duro, los CD-R (grabadores de discos compactos) y varios formatos de multipistas digitales (Alesis, Tascam, etc.). Las tarjetas de sonido para ordenadores, dotadas de conversores A/D y D/A, aparecidas en los últimos años, han supuesto la definitiva democratización del sonido digital. A ellas dedicamos el próximo capítulo.
  • 23. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 3. El audio digital en el ordenador personal 3.1 Introducción Hemos visto en el capítulo anterior que para trabajar con sonido digital en un ordenador, son necesarios como mínimo dos conversores (A/D y D/A) que cumplan la función de digitalizar y reconstituir posteriormente la señal analógica. En los IBM PC compatibles esta posibilidad llegó hace unos años de la mano de las primeras tarjetas de sonido de tipo Sound Blaster, inicialmente con una calidad bastante lamentable, pero en otros ordenadores ya era posible desde años atrás. En esta obra nos centraremos básicamente en las posibilidades de los ordenadores PC compatibles actuales, dotados con una tarjeta de sonido de 16 bits, pero antes de entrar en materia repasaremos brevemente la historia del audio digital en los ordenadores. 3.2. Un poco de historia 3.2.1. Los inicios Como se comenta en el capítulo anterior, Max Mathews consiguió sintetizar sonido digital en un ordenador ¡a finales de la década de los cincuenta! Aunque se tardó unos años más en disponer de la velocidad suficiente para muestrear sonido analógico, las posibilidades abiertas por Mathews iniciaron dos largas décadas de investigaciones en el terreno de la síntesis digital, llevadas a cabo inevitablemente en ordenadores mainframes yestaciones de trabajo Unix, en centros universitarios o laboratorios de importantes empresas informáticas. Volveremos a tratar este tema en el capítulo 9, “Síntesis y generación digital de sonido”. 3.2.2. Audio digital para las masas El Commodore Amiga fue el primer ordenador doméstico que incorporó, en 1985, ciertas posibilidades de audio digital. El Amiga disponía de cuatro conversores D/A de 8 bits. Carecía de conversores A/D, por lo que si no se compraba un dispositivo muestreador adicional conectable al puerto paralelo, sólo funcionaba como reproductor. Estos primeros conversores D/A adicionales eran realmente muy económicos1 , pero tenían una limitación muy importante: por motivos de velocidad sólo permitían muestrear en memoria RAM, y no directamente al disco duro, por lo que la duración de los sonidos almacenables era muy 1 Entre 5.000 y 15.000 ptas.
  • 24. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 limitada. Aun con todas estas limitaciones, que lo hacían inviable para un trabajo profesional, el Amiga supuso para muchos la entrada al sonido digital2 . Las primeras aplicaciones serias se dieron a finales de los ochenta en dos plataformas que ya de por si, no eran nada baratas (Apple Macintosh y NeXT), mientras que el coste del hardware adicional superaba fácilmente el medio millón de pesetas. No eran productos “para las masas”, pero los estudios de grabación y algunos músicos profesionales se los pudieron ya permitir. Especialmente en el caso del Mac, el hardware y el software de Digidesign, que ofrecía cuatro canales de 16 bits, se convirtió (y sigue siendo hoy) en un estándar de la grabación y edición de audio digital en disco duro. 3.2.3. ... Y los PCs comenzaron a sonar El bautizo sonoro del PC fue realmente tímido y tardío. En 1988, una compañía canadiense, Ad Lib, fabricó las primeras tarjetas de sonido. Soportaban tan solo cuatro voces con sonidos sintéticos y, aunque muchos juegos comenzaron a tener en cuenta el nuevo hardware, los tipos de sonidos ofrecidos por el pequeño sintetizador3 permitían poco más que generar una cierta musiquilla de fondo, con una calidad sonora bastante infame. Al no disponer de sonido digitalizado, la Ad Lib no favorecía la reproducción de efectos convincentes (golpes, motores, etc.) o voces (o gritos), que el mercado de los juegos estaba esperando. Un año más tarde, Creative Labs, una empresa de Singapur que había trabajado en síntesis de voz, lanzó al mercado la primera Sound Blaster, que añadía a la compatibilidad con la Ad Lib unas pequeñas posibilidades de audio digital. Pese a que estas posibilidades eran limitadas (dos canales de 8 bits) el éxito fue tremendo y propulsó a la compañía al primer puesto del mercado multimedia internacional, lugar que sigue ocupando en la actualidad. Aunque las tarjetas de hoy han cambiado bastante desde las Sound Blaster iniciales, muchas de las mejoras y variaciones están teniendo lugar en el terreno del MIDI, que trataremos en la segunda parte de este libro. En lo referente a audio digital, casi todas las tarjetas actuales ofrecen las mismas prestaciones desde aproximadamente 1994: dos canales de audio a 16 bits y hasta 44.100 Hz de frecuencia de muestreo, con posibilidad de grabación y reproducción a disco duro. 3.3. ¿Por qué la calidad CD no es siempre calidad CD? Existe la creencia popular de que en el sonido digital no hay mejores ni peores, “como todo son ceros y unos, mientras no se confundan unos con otros …”. Sin embargo, nada más lejos de la realidad. Los fabricantes de equipos multimedia se escudan detrás de los 16 bits y 44.100 Hz, para colocar la indiscriminada etiqueta “calidad CD”. Pero, ¿se ha preguntado alguna vez por qué existen actualmente lectores de CD-ROM por 5.000 ptas., mientras que se pueden adquirir lectores de CD Audio (que, por cierto, son siempre, como veremos más adelante, de velocidad simple) por 100.000 ptas.? La respuesta está en los conversores D/A 2 Con estos sonidos almacenados en memoria, el Amiga podía funcionar como un sampler (véase apartado 9.6). 3 En el capítulo 9, “Síntesis y generación digital de sonido”, se trata a fondo el tema de los sintetizadores.
  • 25. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 comentados en el anterior capítulo, y en otros componentes electrónicos analógicos, que son los responsables finales del sonido. Es cierto que el láser no suele confundir los ceros con los unos, pero para que estos enteros binarios lleguen a sonar, tienen que pasar por un complicado proceso de conversión, que se puede realizar con muy diversos criterios de calidad. Un factor a tener en cuenta a la hora de evaluar la calidad de un dispositivo de audio digital, como una tarjeta de sonido, puede ser la relación señal/ruido comentada en el capítulo anterior. Aunque muchas tarjetas no incluyen estas especificaciones, es frecuente encontrarlas en los estudios comparativos realizados en revistas especializadas. Comentamos que el máximo teórico alcanzable con 16 bits de resolución es de 96 dB; una tarjeta con niveles inferiores a 80 dB debería ser descartada por demasiado “ruidosa”. Sin embargo, muchas otras prestaciones importantes a la hora de evaluar actualmente una tarjeta de sonido, vienen dadas por sus capacidades MIDI. Por ello, en el capítulo 11,” El ordenador MIDI y la tarjeta de sonido”, trataremos con detalle la elección de este componente tan fundamental. 3.4. Tamaños en el audio digital Cuando los ordenadores sólo manejaban texto, un megabyte (aproximadamente un millón de caracteres) parecía una cifra monstruosa. Hoy en día, con la llegada del multimedia, los sonidos y especialmente las imágenes digitales, han disparado estas cifras. ¿Cuánto ocupa un segundo de sonido digital estéreo de 16 bits y 44.100 Hz? El cálculo es sencillo: en un sonido de 16 bits, cada muestra ocupa dos bytes (un byte son ocho bits), y si la frecuencia de muestreo es de 44.100 Hz, significa que cada segundo requiere de 44.100 muestras. Si el sonido es estéreo, utiliza dos canales, por lo que estas necesidades se ven duplicadas. 2 bytes/muestra x 44.100 muestras/segundo x 2 (canales) = 176.400 bytes/segundo ó 172,2 Kb/s. Esta es forzosamente la velocidad de transferencia de los lectores de CD Audio, y es la que se designó en su día como velocidad simple. A partir de aquí, se tomó la costumbre de medir la velocidad de los lectores de CD-ROM en múltiplos de este valor (igual que la velocidad de los aviones reactores se mide a veces en múltiplos de la velocidad del sonido). Realizando una multiplicación más, se observa que un minuto de sonido digital estéreo de calidad, ocupa un valor muy cercano a los 10 Mb. Sabemos por experiencia que los CD Audio raramente superan los 70 minutos. Esta duración límite aproximada viene dada por su capacidad, que suele ser de 720 Mb. Cuando el sonido no es estéreo, estos tamaños descienden a la mitad, y lo mismo sucede si la resolución es de 8 en lugar de 16 bits, o la frecuencia de muestreo es de 22.050 Hz. Por ello, limitando la calidad al mínimo, el tamaño necesario para un minuto de sonido mono de 8 bits y 11.025 Hz, se reduce aproximadamente a 646 Kb. (estas condiciones suelen designarse como calidad telefónica).
  • 26. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 3.4.1. ¿Qué calidad seleccionar? No existe una respuesta unívoca a esta pregunta, ya que todo depende del uso que queramos dar a cada sonido. Sí que es posible indicar, a modo de guía, el orden de los pasos a seguir si necesitamos ahorrar memoria o espacio de disco duro. La reducción de calidad menos perceptible es utilizar 22.050 Hz en lugar de 44.100 Hz. Si el efecto estéreo no es importante, puede también limitar el sonido a un único canal, pero manteniendo los 16 bits de resolución. Con esto nos situamos a 42,05 Kb/segundo, y es el mínimo aconsejable para un sonido “musical”. Si lo que desea es grabar mensajes de voz, puede seguir reduciendo la frecuencia, o pasar directamente a los 8 bits. El que se indiquen valores de frecuencia de 44.100, 22.050 ó 11.025, no es casual, ya que éstos son los valores estándar que soportan la mayoría de las tarjetas (aunque algunas soporten también frecuencias intermedias). Dado que hasta hace poco la mayoría de las tarjetas eran de 8 bits, muchos CD-ROMs interactivos utilizan todavía esta resolución, más por criterios de compatibilidad que de economía a ultranza. 3.5. Formatos de sonido digital La información incluida en un fichero de sonido digital no es más que un array de bytes o de enteros de 16 bits, dependiendo de la resolución aplicada. Pero a pesar de la sencillez de su contenido, la lista de formatos existentes es inmensa, pues cada plataforma, y a veces cada programa dispone de una serie de formatos preferidos con ligeras variaciones entre uno y otro. Las diferencias pueden radicar en el tipo aplicado a las muestras (por ejemplo enteros con o sin signo), el tipo de compresión utilizado (si es que lo hubiera) y la forma en que estas muestras se ordenan. Para un sonido estéreo algunos formatos optan por guardar cada canal de forma independiente, mientras que otros eligen guardar muestras alternas de cada una de las pistas. Todos los formatos incluyen una cabecera (en la que se indica la resolución, la frecuencia de muestreo, el número de canales, etc.) cuyo tamaño, contenido y ordenación varía también de un formato a otro. En Windows, el formato estándar es el WAV, aunque algunos fabricantes disponen también de formatos nativos (como es el caso del VOC de Creative Labs, utilizado en las primeras tarjetas Sound Blaster). Esta extensión es una abreviación de la palabra inglesa wave, que significa ola u onda; por ello este tipo de ficheros se conocen también como ficheros de onda. Si sólo trabaja con PC compatibles probablemente nunca tenga que preocuparse de otros formatos, salvo si desee importar ficheros procedentes de otras plataformas. En el entorno Macintosh, uno de los formatos más extendidos es el AIF, algo que deberán tener muy en cuenta los programadores de aplicaciones multimedia multiplataforma. En Internet se utiliza mucho el formato AU, propio de los sistemas Unix. También es posible trabajar con ficheros sin cabecera (suelen venir con las extensiones PCM o RAW). Estos constituyen un caso particular, ya que a la hora de abrir un fichero de estas características, deberemos indicar nosotros la resolución, la frecuencia de muestreo y el número de canales. Si el fichero suena bien, habremos acertado. Si suena mal, habrá que volver a probar con parámetros diferentes.
  • 27. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 Los programas de edición de audio que se comentan en el capítulo 5, ofrecen normalmente opciones para cargar y salvar formatos diferentes. En cualquier caso conviene tener en cuenta que dos ficheros no comprimidos, y con la misma resolución y frecuencia de muestreo, contendrán la misma información (aunque organizada de diversas formas) y sonarán exactamente igual, independientemente del formato. En la tabla 3.1 se enumeran algunos de estos formatos más frecuentes. Extensión Plataforma - aplicaciones AU Next/Sun - Internet AIF Macintosh - Multimedia (Director, etc.) IFF Amiga PCM Cualquiera RAW Cualquiera WAV PC Tabla 3.1. Algunos formatos de ficheros de audio digital 3.6. Compresión de ficheros de audio Dado el tamaño que pueden adquirir los ficheros de audio digital es lógico que se haya buscado formas de compresión que permitan reducir esta cantidad de información. Al igual que ocurre con la imagen, existen técnicas sin perdida y técnicas con perdida. Un factor importante en los sistemas de compresión de audio es que deben ser capaces de comprimir y descomprimir en tiempo real (para comprimir y descomprimir en diferido existen ya multitud de sistemas de uso general como el ZIP o el ARJ, que también pueden ser aplicados a ficheros de audio). Las matemáticas involucradas en cualquier sistema de compresión son demasiado complejas para ser tratadas con rigor en esta obra, por lo que nos limitaremos a esbozar ciertas ideas. Muchos de estos sistemas son independientes de los formatos citados en el apartado anterior, de forma que un mismo formato de fichero puede soportar varios métodos de compresión. • Probablemente le suenen las siglas ADPCM. Corresponden a Adaptative Delta Pulse Code Modulation, una forma de compresión de la que existen múltiples variantes, en la que se reduce el número de bits de la señal (por ejemplo a 4 bits) tratando únicamente las diferencia entre una muestra y la siguiente. Es fácil intuir que esto provoca una inevitable degradación de la señal ya que el sistema es incapaz de representar saltos grandes de amplitud entre dos muestras. • Las compresiones µ-law y A-law, utilizan un sistema de compresión no lineal que permite utilizar una resolución de 8 bits, pero ofreciendo una calidad sonora y un rango dinámico próximos a los obtenidos con 14 bits. Son por lo general más rápidos que los métodos basados en ADPCM. • Otros métodos como los utilizados por los grabadores digitales en formato DCC o MiniDisc, son variantes del sistema ADPCM, que eliminan de la señal original ciertos componentes que teóricamente no son audibles por quedar enmascarados (es como si en
  • 28. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 una imagen 3D, eliminásemos toda la información de los objetos tapados por planos más próximos al observador). Algunos de estos sistemas se ven favorecidos por la presencia de hardware especializado como pueda ser la inclusión de un DSP (procesador digital de señal) en la tarjeta de sonido, mientras que otros funcionan perfectamente por software. Si abre el icono de multimedia en el panel de control de Windows 95, y selecciona la forma de visualización Avanzado, podrá ver en el apartado de Codecs4 de compresión de audio, todos los compresores instalados en su sistema, tal como se observa en figura 3.1. Figura 3.1. Comprobación de los Codecs de compresión instalados en el sistema La compresión puede plantear problemas de compatibilidad entre diferentes ordenadores, por lo que sólo debería utilizarse en aquellos casos en los que el ahorro de espacio sea un imperativo. En la medida de lo posible, tampoco debería comprimir un fichero hasta que esté 4 El término codec proviene de la contracción de las dos palabras codificador y descodificador.
  • 29. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 seguro de que no va a manipularlo más, pues aunque la pérdida pueda ser poco perceptible, siempre es preferible trabajar sobre la señal original. 3.7. Obtención de sonidos A grandes trazos, existen dos formas de obtener un fichero de sonido digital: sintetizándolo desde el propio ordenador o digitalizando el sonido de una fuente externa. El primer método fue también el que, por menores requerimientos de potencia (la máquina no necesita adquirir la información en tiempo real) se implementó primero, hace ya cerca de cuarenta años. De él hablaremos en el capítulo 9,”Síntesis y generación digital de sonido”. De momento, en el próximo capítulo “Audio digital en Windows 95”, aprenderemos a configurar correctamente el sistema, y a realizar grabaciones digitales de diferentes fuentes externas, a partir de las posibilidades que nos brinda Windows 95.
  • 30. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 4. Audio digital en Windows 95 4.1. Introducción Tenemos ya unos conocimientos básicos sobre la naturaleza del sonido digital y sus propiedades fundamentales. En este capítulo veremos las posibilidades que ofrece Windows 95 en cuanto a obtención y almacenamiento de audio digital. Dejamos para el próximo capítulo las posibilidades de edición y manipulación de sonido, que aportan los paquetes de software especializados. Si todavía tuviera instalado Windows 3.1 podrá realizar prácticamente lo mismo, aunque el acceso y el aspecto de estos programas variarán. Tenga en cuenta sin embargo, que la mayoría de los nuevos programas y posibilidades, especialmente los relacionados con el sonido y el multimedia en general, están apareciendo únicamente en versiones de 32 bits, por lo que mantener un sistema de 16 bits supone un lastre cada vez más evidente. Asumimos que tiene correctamente instalada una tarjeta de sonido. Las tarjetas actuales combinan el sonido producido por un sintetizador MIDI interno, con dos pistas de audio digital. Dado que las diferentes prestaciones de estos dispositivos se ponen más en evidencia en el terreno del MIDI que en el del audio digital, esperaremos a la segunda parte de esta obra para realizar un estudio pormenorizado (véase capítulos 11,”El ordenador MIDI y la tarjeta de sonido” y 12,”Estudio comparativo de tarjetas de sonido”). De momento, bastará con una sencilla descripción de las diferentes partes que la integran. 4.2. Estructura de una tarjeta de sonido genérica En lo que respecta a las posibilidades de audio, la mayoría de tarjetas actuales ofrecen más o menos las mismas características: 16 bits de resolución, frecuencia de muestreo configurable hasta 44,1 Khz., dos canales y posibilidad de grabación y reproducción en disco duro. Como comentábamos en el apartado 3.3, no todas garantizan la misma calidad sonora, pero ésta es una cuestión más compleja que queda también relegada a los capítulos 11 y 12 ya mencionados. 4.2.1. Entradas y salidas de audio El número de entradas y salidas de audio puede variar ligeramente de una tarjeta a otra, pero muchos modelos incorporan, tal como se muestra en la figura 4.1, dos entradas y dos salidas estéreo, todas ellas de tipo minijack como los que se utilizan en los auriculares pequeños. Disponen además de un conector al que se puede acoplar un joystick, pero que permite también, con los cables adecuados, recibir y enviar mensajes MIDI, y de un conector interno situado en la placa, destinado a recibir el audio procedente del CD-ROM.
  • 31. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 Figura 4.1. Entradas y salidas de audio de una tarjeta de sonido • La entrada de línea, permite recibir señales de audio procedentes de un amplificador, pletina de casetes, CD o sintetizador externos, etc. • El micrófono utiliza una entrada específica ya que los niveles de señal son diferentes (algunas tarjetas disponen de una única entrada micrófono/línea, conmutable por software). • La salida de línea se conecta a una entrada de amplificador o cadena hi-fi (puede utilizar indistintamente cualquier entrada del amplificador, salvo la de PHONO). Utilice esta salida si desea realizar una grabación. • A la salida de altavoz puede conectar unos auriculares o unos altavoces multimedia. Al incluir un pequeño amplificador, esta suele ser bastante más ruidosa que la de línea. • La entrada interna se utiliza para conectar la salida de audio del CD-ROM, aunque en principio es posible conectar cualquier salida de línea estándar. La conexión se realiza con un cable especial que suele estar incluido con la compra del CD-ROM. Consulte los manuales de su CD-ROM y de su tarjeta. • Por el conector de joystick no circula ninguna señal de audio, sino mensajes MIDI. Para aprovechar esta prestación fundamental se necesita un cable especial que en muchos casos debe adquirirse separadamente (véase capítulos 11 y 12). En el apartado 18.7 trataremos los dispositivos externos presentes en un estudio de audio digital (altavoces, mezclador, multipistas, grabadores, etc.). De momento un consejo: en la medida de lo posible, rehuya los altavoces multimedia autoamplificados adquiribles en las tiendas de informática. Si dispone de un equipo hi-fi a una distancia razonable del ordenador, utilice una de sus entradas (cualquiera menos de la PHONO). Si se ve obligado a utilizar altavoces multimedia, escuche de vez en cuando los fragmentos más críticos con unos auriculares de calidad (a partir de las 5.000 ptas.), y piense que unos altavoces decentes para el trabajo de sonido no se consiguen por debajo de las 20.000 ptas.
  • 32. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 4.2.2. El mezclador interno Para controlar estos diferentes canales, muchas tarjetas (todas las compatibles MPC21 ) incluyen un mezclador por software que permite activar, desactivar y mezclar las diferentes entradas y salidas para grabación y reproducción. En la figura 4.2 se esquematiza el diagrama de bloques de este mezclador, cuyo uso se detalla en el apartado 4.7. De momento, conviene tener presente que ambas salidas (línea y altavoz) pueden combinar como mínimo tres fuentes internas estéreo: los dos canales de audio, el sonido del sintetizador MIDI interno y la salida de los CD Audio (suponiendo que esté conectada a la entrada interna de la tarjeta) reproducidos desde la unidad de CD-ROM. Figura 4.2. Diagrama de bloques simplificado de una tarjeta de sonido 4.3. El CD-ROM Hemos mencionado en repetidas ocasiones la unidad de CD-ROM sin indicar nada al respecto. ¿Cuál es el cometido de este dispositivo en un sistema informático de producción musical? ¿Qué cualidades específicas debe satisfacer? Al margen de sus funciones típicas como unidad de almacenamiento masivo, que se aprovechan en interactivos multimedia o para la distribución e instalación de software, y que hacen del CD-ROM un elemento imprescindible en cualquier configuración, una unidad de CD-ROM puede también leer discos compactos de audio. Esta prestación simplifica enormemente la extracción de material sonoro incluido en discos compactos y su conversión en ficheros de audio digital de tipo WAV. Dado que la reproducción de los CD Audio se realiza siempre a velocidad simple, el CD-ROM “musical” no requiere ninguna cualidad especial. 1 En los apartados 11.6.2 y 11.7 se explican con detalle las especificaciones MPC1, MPC2 y MPC3.
  • 33. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 En realidad, sí que existe una prestación que sería muy recomendable, pero que lamentablemente los fabricantes de CD-ROM no suelen documentar: algunos lectores permiten la extracción digital directa de la información incluida en un CD Audio. En este caso la obtención de ficheros WAV se puede realizar sin ninguna conversión, con lo que obtendremos copias digitales idénticas. En el apartado 4.10 trataremos este tema en detalle. 4.4. Componentes multimedia en Windows 95 En el momento de la instalación Windows 95 pregunta al usuario muchas opciones para una configuración personalizada. Aunque los elementos que utilizaremos se incluyen en la instalación por defecto, si no dispusiera del mezclador (o control de volumen), el reproductor de CD, el reproductor multimedia o la grabadora de sonidos, puede reinstalar cualquiera de ellos. Aunque no los utilizaremos directamente también es conveniente que tenga instaladas la compresión de audio y de vídeo. El proceso a seguir es el siguiente: 1. Seleccione el icono Agregar o quitar programas en el panel de control. 2. Seleccione la opción Instalación de Windows. 3. Seleccione el componente Multimedia y haga clic en detalles. Aparecerá la ventana que se muestra en la figura 4.3. En ella puede activar o desactivar diversos componentes. 4. Compruebe que, como mínimo, tiene seleccionados el control de volumen, el reproductor de CD, el reproductor multimedia y la grabadora de sonidos. Puede también seleccionar los compresores de audio y de vídeo, y si lo desea alguna combinación de sonidos. 5. Inserte los disquetes o el CD-ROM de instalación según le solicite el sistema y espere a que la reinstalación termine. Figura 4.3. Instalación de componentes multimedia en Windows 95
  • 34. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 4.5. Información sobre el hardware en el icono de sistema del panel de control En Windows 95 toda la información sobre los componentes hardware instalados es accesible desde el panel de control y las tarjetas de sonido no son una excepción. Para comprobar su correcta instalación puede abrir el icono de Sistema y seleccionar la opción Controladores de sonido, de vídeo y de juegos. Haciendo clic sobre cualquiera de los componentes que aparecen, podrá verificar, como se aprecia en la figura 4.4, que no exista ningún conflicto de IRQs, canales DMA o direcciones de memoria. Si la previa instalación del hardware ha sido correcta todo debería aparecer en orden, sin ningún mensaje de alarma. Si apareciera algún mensaje de error, consulte nuevamente el manual de instalación de los dispositivos. En cualquier caso, la información contenida en este apartado puede ser de gran utilidad a la hora de resolver algún conflicto de hardware, pero no aporta ningún dato sobre las prestaciones de los dispositivos instalados. Para ello habrá que seleccionar el icono Multimedia dentro del mismo panel de control. Figura 4.4. La ventana de sistema permite detectar posibles conflictos de hardware Conviene que sepa por último, tal como comentaremos en el capítulo 12,”Estudio comparativo de tarjetas de sonido”, que es perfectamente posible disponer de varias tarjetas de sonido en un mismo ordenador, quedando este número limitado por las ranuras o slots disponibles en la placa base, así como por las IRQs asignables.
  • 35. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 4.6. Información multimedia en el panel de control Haciendo clic sobre el icono Multimedia se abre una ventana similar a la de la figura 4.5, que contiene cinco solapas (Audio, Vídeo, MIDI, CD de música y Avanzado). Dejando aparte el vídeo y el MIDI (que trataremos en la segunda parte de la obra), comentaremos brevemente la información contenida en las tres restantes solapas, que es realmente muy sencilla. Figura 4.5. Propiedades de Audio 4.6.1. Audio Esta solapa muestra dos apartados de aspecto similar que corresponden a las opciones de reproducción y grabación de audio digital. Cada uno de ellos incluye un nivel de volumen y una lista desplegable con los dispositivos de estas características incluidos en nuestro sistema. Si tan sólo disponemos de una tarjeta de sonido ambas listas tendrán un elemento único; si dispusiéramos de varios, el dispositivo elegido en cada uno de los dos apartados sería el utilizado por defecto, aunque, como veremos, la mayoría de programas especializados permitirán modificar esta elección.
  • 36. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 Supongamos que tenemos dos tarjetas de sonido A y B. Si seleccionamos A para grabación y B para reproducción, al utilizar un programa de grabación que no permita la elección del dispositivo, sólo se grabará el sonido procedente de la entrada de la tarjeta A. Asimismo, cuando reproduzcamos lo grabado, el programa utilizará la salida de la tarjeta B. Los niveles de reproducción y grabación se corresponden con los programa mezclador que veremos más adelante, de forma que todo cambio de nivel en cualquiera de las dos aplicaciones, se actualizará en el otro. Dado que el mezclador es más flexible, normalmente preferirá controlar los volúmenes desde este último. La calidad de grabación aparece como una lista desplegable con las tres opciones predeterminadas que se muestran en la tabla 4.1, aunque estas opciones pueden ser configuradas por el usuario e incluso salvadas con un nuevo nombre. Calidad bits frecuencia canales compresión teléfono 8 11.025 Mono NO radio 8 22.050 Mono NO CD 16 44.100 Estéreo NO Tabla 4.1. Opciones predeterminadas de grabación Además de seleccionar cualquiera de las tres frecuencias de muestreo y las dos resoluciones estándares, en la casilla formato, podremos elegir entre varios sistemas de compresión dependiendo de los que haya instalado Windows. El formato PCM no utiliza compresión. La mayoría de programas de grabación y edición de audio también permiten seleccionar directamente todas estas opciones de calidad. 4.6.2. CD de música Si dispone de un CD-ROM, el volumen de los CD Audio puede ser controlado desde esta ventana, aunque, al igual que en el caso anterior, este nivel también es controlable desde el mezclador. Este volumen afectará al sonido del CD por las salidas de la tarjeta de sonido, no al de la salida de auriculares que muchos CD-ROMs incluyen en su panel frontal. 4.6.3. Modo de visualización avanzado Activando esta ventana, aparece la lista completa de los dispositivos multimedia instalados, tanto de hardware como de software, y agrupados en varias familias. Esta es la única forma de obtener información sobre componentes como el mezclador, la entrada de línea de la tarjeta, o los compresores de audio (y de vídeo) instalados en el sistema. En lo referente a los dispositivos de audio y de MIDI la información no difiere demasiado de la observada en las ventanas anteriores. En la figura 4.6 se pueden apreciar varios componentes en los dispositivos de audio, los mezcladores y las entradas de línea, lo que significa que el ordenador incorpora más de una tarjeta de sonido.
  • 37. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 Figura 4.6. Modo de visualización avanzado 4.7. El mezclador Windows 95 incorpora un mezclador de audio por software, denominado Control de volumen, que no estaba incluido en versiones anteriores, pero que suele venir duplicado con el software de la tarjeta de sonido. Aunque ambos pueden presentar estéticas ligeramente diferentes tienen exactamente la misma funcionalidad, ya que el propio de Windows se adapta automáticamente para emular al de la tarjeta. Cuando un sistema incluye dos o más tarjetas de sonido y por consiguiente más de un mezclador, el mezclador de Windows se configura para emular a uno de ellos. Esto significa que toda modificación en uno de los dos mezcladores (el de Windows o el asociado) se visualiza inmediatamente en el otro.
  • 38. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 Estos mezcladores suelen presentar dos ventanas alternativas, la de reproducción y la de grabación. Para seleccionar una de ellas elija Propiedades en el menú de Opciones: se abrirá una caja de diálogo en la que podrá seleccionar el dispositivo asociado, el modo (grabación o reproducción) y los canales visibles (MIDI, Audio, CD-ROM, etc.). En la figura 4.7 se muestra el mezclador en modo reproducción con la caja de propiedades abierta. Figura 4.7. Mezclador en modo reproducción con ventana de configuración de propiedades abierta • A Selección del dispositivo mezclador (válido si se dispone de más de una tarjeta) • B Modo reproducción/grabación • C Selección de canales visibles en la ventana del mezclador • D Mezcla general • E Canal de audio (ficheros .WAV) • F Canal del sintetizador MIDI interno • G Canal del CD-ROM (CD Audio) • H Canal de entrada de línea • I Canal del micrófono • J Balance • K Volumen • L Canal activado/desactivado • M Dispositivo mezclador asociado
  • 39. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 • Si en el panel de propiedades elegimos visualizar menos canales (C), éstos no se desactivan, simplemente no se visualizan. • Cada canal incorpora un control de balance (J), uno de volumen (K) y una casilla de activación/desactivación (L). • Para desactivar un canal (anular totalmente su volumen) se debe marcar la casilla L. • Cuando no utilice un canal, es mejor tenerlo desactivado, pues de esta forma limita las interferencias y las posibles fuentes de ruido. • Existe además un control de volumen general que afecta a todos los restantes (D). El mezclador en modo grabación permite controlar las fuentes de sonido que se grabarán en forma de ficheros .WAV, cuando activemos el programa de grabación. Como se aprecia en la figura 4.8, las posibles fuentes son el micrófono, la entrada de línea, el CD Audio y el MIDI. Figura 4.8. Mezclador en modo grabación 4.7.1. Trucos y consejos para el uso del mezclador • El canal de grabación MIDI permite grabar el sonido procedente del sintetizador interno. Esto es muy útil cuando necesitemos convertir un fichero MIDI en un fichero WAV, por ejemplo para una aplicación multimedia. • Si tuviésemos varias entradas de grabación activadas, el sonido grabado sería la suma de todas las señales. Es obvio que para obtener la mejor calidad, deberá activar únicamente las fuentes que realmente desee grabar, de lo contrario estará añadiendo ruido innecesario. • Dependiendo de las características del mezclador original de la tarjeta, el Control de volumen puede incluir un botón avanzado para control de tono (graves y agudos) u otras
  • 40. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 prestaciones. Abra y estudie también el mezclador original y compare sus posibilidades; puede que alguna de ellas no esté emulada en el de Windows. • Si el mezclador de su tarjeta dispone, como es el caso de la Sound Blaster que se muestra en la figura 4.9, de un control de ganancia de entrada y salida, configure siempre estos valores a x1. Aunque el volumen es más intenso en x2 y x4, la grabación y la reproducción son mucho más ruidosas. Si necesita un volumen superior ajuste el mezclador al máximo y suba el nivel de su amplificador externo. • La mejor relación señal/ruido se obtiene siempre con todos los niveles de salida al máximo y controlando el volumen desde el amplificador hi-fi. Téngalo siempre en cuenta, pues la principal desventaja de las tarjetas de sonido frente a equipos más profesionales, es precisamente su alto nivel de ruido. Figura 4.9. Detalle de los controles de ganancia de entrada y de salida en una Sound Blaster 4.8. Dispositivos reproductores Windows 95 incorpora dos programas reproductores. Las tarjetas de sonido también incluyen programas parecidos, y existe además un montón de software de dominio público que emula estas prestaciones (son aplicaciones relativamente fáciles de programar, como veremos en el capítulo 16,”Programación de sonido con los comandos MCI”). Un consejo: todos hacen lo mismo; quédese con el que más le guste pero no llene inútilmente su disco duro. 4.8.1. El reproductor multimedia Este componente, que difiere muy poco de la versión incluida en Windows 3.1, permite reproducir varios formatos de ficheros multimedia, como ficheros MIDI (.mid), audio digital (.wav), Vídeo for Windows (.avi) o CDs Audio, y también es posible ir ampliando su funcionalidad a otro tipo de ficheros como Quicktime for Windows o secuencias de 3D Studio (.fli).
  • 41. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 Dadas sus escasas posibilidades de control, guarda realmente muy pocos secretos. Utilícelo en lugar de un programa especializado, cuando desee reproducir un fichero sin consumir demasiados recursos (para aplicaciones multitarea, por ejemplo). Este reproductor no permite seleccionar el dispositivo de salida utilizado, en caso de que tuviésemos varios. Si dispone de varias tarjetas de sonido, o de una tarjeta de sonido con varios dispositivos virtuales (como es el caso de la AWE32, que incorpora dos sintetizadores MIDI diferentes), el dispositivo elegido será el seleccionado en el icono multimedia del panel de control (véase apartado 4.6.1). 4.8.2. El reproductor de CD Audio Aunque el reproductor de multimedia permite escuchar también los discos compactos de audio colocados en el CD-ROM, este pequeño programa ofrece mayor comodidad a la hora de seleccionar fragmentos. Permite además organizar una pequeña bases de datos con los compactos que le vayamos introduciendo (los “reconoce” en función del número de temas y de las duraciones de cada uno). 4.9. Grabación de sonidos Llegados a este punto, sería conveniente que probara todas las posibilidades de su sistema antes de comenzar a grabar. Estudie las configuraciones en el panel de control. Reproduzca ficheros de tipo .WAV y ficheros MIDI (aunque no los hayamos estudiado todavía, su disco duro seguro que oculta unos cuantos ficheros con la extensión .mid). Introduzca CDs Audio. Modifique opciones y juegue con todos los controles del mezclador. Cuando crea que todo está más o menos en su sitio, habrá llegado por fin la hora de grabar. A diferencia de los programas comentados en los anteriores apartados, las posibilidades de la grabadora de sonidos incluida con Windows 95 son realmente limitadas, por lo que es recomendable que utilice otro programa para esta tarea. El que acompañe la tarjeta de sonido puede convenir, y como alternativa existen un par de excelentes aplicaciones shareware, localizables en Internet, y de las que hablaremos en el siguiente capítulo. De momento, los conceptos que describiremos pueden hacerse extensibles a cualquier programa que vayamos a utilizar. 4.9.1. Consejos para la grabación • Ajuste convenientemente el mezclador: colóquelo en modo grabación, y asegúrese de anular toda fuente de entrada que no vaya a grabar (normalmente deseará grabar una sola fuente a la vez). • Si desea grabar un tema MIDI puede activarlo desde el reproductor de multimedia. • Para un fragmento de un CD Audio será más conveniente utilizar el reproductor de CDs. Muchos programas de grabación pueden comunicarse con el reproductor, activarlo, desactivarlo o seleccionar la posición de inicio.
  • 42. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 • Ajuste los niveles de entrada del mezclador. Igual que ocurre con una pletina de casetes convencional, es muy importante no grabar con un nivel demasiado bajo (más ruido de fondo) ni demasiado alto (distorsión). Tenga en cuenta que la distorsión digital (ver figura 4.10) produce efectos mucho más molestos que la analógica. Para un ajuste correcto, la mayoría de programas de grabación incluyen unos indicadores de nivel que emulan los LEDs o los vúmetros de los grabadores analógicos (la grabadora de Windows no los incorpora). • Si su tarjeta permite configurar la ganancia de entrada, utilice x1 en la medida de lo posible, tal como se apunta en el apartado 4.7.1. Utilice una ganancia superior sólo cuando la debilidad de la señal de entrada, imposibilite alcanzar los niveles deseables. • Al seleccionar la calidad de grabación (frecuencia de muestreo, bits de resolución, compresión) deberá tener presente el teorema de Nyquist (véase apartados 2.3 y 2.4): dado que no es posible configurar la frecuencia de corte del filtro de entrada de la tarjeta de sonido, es siempre preferible muestrear a 44.100 Hz. Después siempre estaremos a tiempo de rebajar la frecuencia del sonido final. • No utilice compresión. Si desea crear ficheros comprimidos, es preferible hacerlo al final. De lo contrario estaremos limitando las posibilidades de edición. • El último consejo es bastante más difícil de seguir. Los micrófonos multimedia que acompañan a algunas tarjetas suelen ser de muy mala calidad. Pueden utilizarse para grabar mensajes de voz, pero su uso en aplicaciones musicales desvirtúa cualquier grabación. Se puede adquirir un micrófono mínimamente decente a partir de las 5.000 (¡los hay de 500.000 ptas.!), pero el problema no termina aquí. Misteriosamente, ¡ciertas tarjetas no funcionan con otro micrófono que el que incorporan! En este caso es difícil aportar una solución. Si dispone de una mezclador externo, un preamplificador o una pletina de casete con entrada de micro, puede conectar allí el micrófono, y la salida de este dispositivo a la entrada de línea de la tarjeta. Figura 4.10. La distorsión digital. La primera figura presenta una señal grabada con un nivel correcto. La segunda corresponde a la misma señal, grabada con un nivel excesivo. Se puede apreciar la distorsión, en los picos inferiores recortados. 4.9.3. Grabación en disco duro La grabadora de sonidos de Windows, sólo graba en memoria, mientras que la casi totalidad de programas dedicados a la grabación digital lo hacen a disco duro. Este segundo método permite grabar largos ficheros de sonido, cuyo límite de tamaño vendrá dado únicamente por
  • 43. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 el espacio disponible en disco. Como contrapartida, exige más potencia al ordenador, al ser el acceso al disco mucho más lento que a la memoria. Para grabar con la máxima calidad (16 bits, estéreo y 44.100 Hz) se necesita aproximadamente un 486 con 8 Mb de memoria y un disco duro de menos de 15 ms de acceso. Si hasta hace muy pocos años esto era pedir bastante, lo cierto es que actualmente la mayoría de sistemas satisfacen sobradamente estas condiciones. Cuando la grabación de audio con máxima calidad se puede llevar a cabo, pero al reproducir el fichero escucha clics o pequeños ruidos molestos, significa que su sistema presenta problemas de velocidad. No utilice programas de compresión de disco duro, pues reducen notablemente la velocidad de transferencia (esta indicación es válida para cualquier aplicación multimedia que requiera de una transferencia de datos importante). Es aconsejable asimismo que el disco no esté fragmentado. Para ello, utilice el defragmentador de Windows con regularidad. 4.10. Extracción digital directa de un CD Audio Cuando grabamos un fragmento de un CD Audio, a pesar de que si el programa de grabación es capaz de controlar nuestro CD-ROM, el proceso será prácticamente automático, la grabación no se produce de forma digital. El sonido digital leído por la unidad de CD-ROM es convertido mediante el conversor D/A del CD-ROM y enviado al conector de audio interno (analógico) de la tarjeta, que lo redirecciona hasta su propio conversor A/D. Resultado: dos conversiones que degradan inevitablemente la calidad del sonido del CD. ¿Es posible extraer directamente la información digital de un CD Audio y evitar así conversiones y pérdidas? A veces si. Depende de la unidad de CD-ROM, ya que no todas lo permiten (en principios deberían ser compatibles con las normas Red Book, pero en la práctica resulta que esta condición no es necesaria ni tampoco suficiente). Dado que existen además diferentes estrategias de programación para solucionar este problema, no todos los programas destinados a este cometido funcionan con los mismos modelos de CD-ROMs. La única solución consiste en buscar por Internet e ir probando hasta encontrar uno que funcione (o hasta que los hayamos probado todos sin éxito…). Una buena dirección para empezar a buscarlos es http://www.cdarchive.com. En la tabla 4.2 se incluyen algunas aplicaciones shareware o de dominio público que permiten extraer información digital de un CD Audio. En todas ellas, el usuario indica el inicio y el final del fragmento a extraer, que es salvado en un fichero de onda de tipo WAV.
  • 44. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 Nombre de la aplicación Entorno Cdda MS-DOS línea de comandos CDGRAB MS-DOS línea de comandos CDGRAB Windows 16 bits Cdinfo MS-DOS interfaz gráfico CD Workshop Windows 32 bits Cool Edit Windows 32 bits DAC MS-DOS interfaz gráfico Dido Windows 16 bits Disk-to-Disk Windows 16 bits Readcda MS-DOS línea de comandos Tartaruga Windows 16 bits Tabla 4.2. Algunos programas para la extracción digital directa de fragmentos de CD Audio Tenga en cuenta que: • La extracción digital no se realiza en tiempo real (suelen tardar un poco más). • Los programas para Windows no tienen por qué funcionar mejor que los más sencillos para MS-DOS (frecuentemente, es más bien al revés). 4.10.1. Cuidado con los copyrights Las grabaciones musicales comerciales están protegidas. Si la copia es para uso personal exclusivo, nada puede pasar, pero si pretende sacarle un partido comercial, deberá ir con cuidado. Muchos estilos musicales actuales (hip-hop, trip-hop, techno, etc.) hacen un uso extensivo del sampler y muestrean fragmentos de otras músicas. Ante este hecho inevitable, muchas discográficas han puesto precio a las licencias de muestreo. Los “sampleadores” más legales, llegan a acuerdos con las discográficas o incluso comparten derechos con los creadores del material original. Otros, simplemente disimulan el origen, procesando y manipulando el sonido, o buscan “inspiración” en oscuras grabaciones que “nadie” conoce. Una asociación internacional de músicos, la macos (musicians against copyright of samples) propugna la liberalización del muestreo. Sus integrantes muestrean lo que les parece y conceden permiso explícito para que, quien quiera, haga lo mismo con aquellos compactos que exhiben el sello de la asociación. Existen también en el mercado grabaciones libres de copyrights especialmente concebidas para ser muestreadas, que incluyen multitud de sonidos, instrumentos o ritmos, pero suelen ser bastante más caras que un compacto normal. Cada cual hará lo que le parezca, ¡pero que conste que hemos avisado!
  • 45. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 5. Edición de sonido por ordenador 5.1. Introducción Hemos visto cómo digitalizar un sonido procedente de diversas fuentes analógicas y almacenarlo en la memoria o el disco duro del ordenador, pero el enorme potencial del audio digital por ordenador no comienza a intuirse hasta que abrimos un potente editor gráfico de audio. El paradigma de este tipo de aplicaciones es muy sencillo y varía muy poco de un programa a otro. Básicamente consiste en aplicar procesos matemáticos a un sonido (o a una porción temporal), con la ayuda de un entorno gráfico que permita seleccionar cómodamente los fragmentos a tratar y que muestre los resultados tanto sonora como visualmente. Mediante estos procesos se consigue corregir defectos en los sonidos originales, ensalzarlos, modificarlos ligeramente o generar otros nuevos totalmente irreconocibles. Todas estas posibilidades se fundamentan sobre una disciplina de investigación que combina la ingeniería, la física y las matemáticas, y que cuenta con varias décadas de existencia: el procesado digital de señal. 5.2. Cómo elegir un programa Las tarjetas incorporan siempre en su software un editor gráfico de sonido. Lamentable, en muchos casos estos programas son excesivamente sencillos. Un paquete de software que se salva de la quema es el Sound Impressions que acompaña a muchas tarjetas de fabricantes diversos. En cuanto a otros programas muy extendidos como el Creative Wave Studio (distribuido con las tarjetas Sound Blaster), funcionan como ventajosos sustitutos de la grabadora de sonidos de Windows, pero se quedan muy cortos a la hora de ofrecer posibilidades de edición avanzadas. El problema se resuelve rápidamente, pues existen dos excelentes aplicaciones shareware fácilmente accesibles en Internet, que pueden competir en prestaciones con editores comerciales. Nos referimos a Cool Edit de David Johnston y Gold Wave de Chris S.Craig, ambas con versiones actualizadas de 32 bits. Existen otros programas de dominio público, pero difícilmente pueden competir con estos dos gigantes. En el terreno comercial, son tres los programas que se llevan la palma: Wave for Windows, de Turtle Beach Systems (fabricante de las famosas tarjetas de sonido homónimas), Sound Forge de Sonic Foundry, y el recién llegado WaveLab de Steinberg (fabricante del mítico secuenciador MIDI, Cubase). Wave for Windows fue el primer editor de audio profesional para PC compatibles. Uno de sus puntos fuertes es la librería de efectos preestablecidos que incorpora. Su uso es sin embargo algo más lento y engorroso que el de sus competidores. Sound Forge goza de un diseño más cómodo y eficaz e incorpora casi cualquier efecto imaginable, lo que lo convierte en el más potente de los tres. Por su parte WaveLab promete ser un programa muy completo, pero la versión 1.0 acaba de aparecer y, como es frecuente, no incluye todavía todo lo que uno podría esperar de un programa de su categoría.
  • 46. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 De momento, estos programas operan en diferido; no son capaces de realizar los efectos en tiempo real. Sin embargo, con la inminente llegada de los sustitutos del Pentium que incorporarán DSP en la placa, y la arquitectura abierta de algunos de estos programas (Sound Forge y Wave Lab), posiblemente cambie en breve el panorama. 5.3. Utilización y posibilidades de un editor gráfico de audio digital Simplificando, la forma de trabajar con estos programas es la siguiente: se carga un fichero de sonido digital (normalmente de tipo .wav), o se digitaliza desde el mismo programa, teniendo en cuenta todas las consideraciones del capítulo anterior. Inmediatamente, la onda queda representada gráficamente en una ventana. Con el ratón se selecciona un fragmento (igual que seleccionaría unas cuantas palabras contiguas en un procesador de texto) o el fichero en su totalidad. Mediante opciones de menú o iconos se aplican a este fragmento algunos de los procesos de modificación incluidos en el programa. Uno de los principales raseros con que valorar las prestaciones de estos programas es el número, calidad y versatilidad de los efectos disponibles, pero existen otros factores importantes. Pasemos a enumerar y describir brevemente algunos de ellos, teniendo en cuenta que si no se indica lo contrario, los cinco programas mencionados en el apartado anterior (Cool Edit, Gold Wave, Wave, Sound Forge y Wave Lab) incorporan la opción. • Soporte multiventana. La posibilidad de tener varios ficheros de onda abiertos y visibles, es fundamental para poder combinar fragmentos de diferentes procedencias. Todos los programas citados incorporan sofisticadas formas de gestión de memoria que permiten presentar en pantalla muchos más sonidos de los que podrían caber en la memoria RAM del ordenador. • Deshacer (Undo). Dado que los ficheros de sonido pueden llegar a ocupar decenas o centenares de Mb, el guardar varios niveles de anulación puede en ocasiones ralentizar excesivamente la ejecución, o resultar incluso inviable. En estos programas la opción de deshaceres configurable por el usuario. • Edición independiente de canales. Los ficheros estéreo se muestran siempre en dos ventanas superpuestas. En ocasiones es deseable, tal como se aprecia en la figura 5.1, poder seleccionar un fragmento de un único canal.
  • 47. Sergi Jordà Puig, Audio digital y MIDI, Guías Monográficas Anaya Multimedia, Madrid 1997 Figura 5.1. Selección de una única pista de un fichero estéreo en Cool Edit • Zoom de visualización. Para trabajar los fragmentos con mayor detalle es conveniente poder modificar la escala de visualización. El zoom se puede aplicar a dos parámetros: el tiempo (eje horizontal) y la amplitud (eje vertical). Todos los programas soportan varios niveles de zoom temporal, pero no todos permiten zoom de amplitud. Esta última posibilidad es especialmente útil cuando se trabaja sobre fragmentos de muy poco nivel (casi silenciosos), ya que de lo contrario estaremos viendo una línea recta donde en realidad hay sonido1. • Cambio de unidades temporales. Existen normalmente tres unidades alternativas para medir las coordenadas temporales: tiempo (ms), muestras y compases. Esta última es útil cuando estamos editando un fragmento musical con un tempo preciso (que el usuario deberá indicar). • Memoria de puntos clave. En un fichero largo es fácil perderse mientras se navega hacía delante y hacia atrás utilizando el scroll horizontal. Por ello es muy útil poder colocar marcas en algunos puntos importantes (inicio de un sonido, de una palabra, etc.). Sound Forge es el programa más completo en este aspecto, ya que no sólo permite colocar tantas marcas como deseemos, incluso de forma automática, sino que también las guarda en el fichero, para posteriores sesiones. En la figura 5.2 se muestra una ventana de este programa, con una lista de marcas. • Reproducción de listas. Este punto está relacionado con el anterior: una vez colocadas varias marcas, es posible editar una lista de reproducción para alterar el orden de ejecución de los fragmentos, y repetir uomitir algunos de ellos. Esta es una forma rápida y cómoda de realizar modificaciones temporales, sin necesidad de reorganizar cada vez 1 Tenga en cuenta que la máxima resolución vertical de una pantalla completa no supera nunca los 800 pixels, mientras que un sonido de 16 bits puede poseer hasta 65.535 niveles diferentes.