Digital Audio/es



El audio digital convierte los sonidos análogos a un formato donde pueden ser almacenados y manipulados en la computadora. Audacity es un programa de software para editar, mezclar, y aplicar efectos a las grabaciones de audio digital.

Muestreo Digital
Todos los sonidos que escuchamos son ondas de presión en el aire. A partir de la demostración de Thomas Edison del primer fonógrafo en 1877, ha sido posible capturar las ondas de presión dentro de un medio físico y después reproducirlas más tardes por la regeneración esas mismas ondas de presión. Las ondas de presión del audio, o forma de onda, se pueden percibir así:


 * [[Image:WaveformAbstract.png|Una onda análoga]]

Los medios de grabación análogos como los discos y las cintas de audio, representan directamente la forma de la onda, utilizando la profundidad del surco para una grabación, o la cantidad de magnetización para una cinta. Las grabaciones análogas pueden reproducir una impresionante gama de sonidos, pero puede tener problemas de ruido. Notablemente, cada vez que una grabación análoga se copia, más ruido se introduce, disminuyendo la fidelidad. Este ruido puede ser minimizado pero no completamente eliminado.

Las grabaciones digitales trabajan de diferente manera: las muestras de la forma de onda son uniformemente espaciadas en los puntos de tiempo, cada muestra se representa como un número preciso. Las grabaciones digitales, tanto si se guardan en un disco compacto (CD), cinta de audio digitales (DAT), o en una computadora personal, no se degrada con el tiempo y se puede copiar perfectamente sin introducir un ruido adicional. Las siguientes imágenes ilustran las formas de las ondas de una muestra de audio:


 * [[Image:waveform_digital.png|Una onda digital]]

El audio digital se puede editar y mezclar sin introducir algún ruido adicional. Además, muchos efectos digitales se pueden aplicar a las grabaciones de audio digitalizadas para simular la resonancia, mejorar ciertas frecuencias, o cambiar el tono, por ejemplo. Audacity es un programa de software para editar, mezclar y aplicar efectos a las grabaciones de audio digitales.

La capacidad de Audacity para reproducir o grabar audio directamente desde su computadora, depende del hardware especifico de la computadora. La mayoría de las computadoras de escritorio tienen una tarjeta de sonido con conectores de 3'5, para conectarlo a un micrófono u otro dispositivo de grabación, bocinas o auriculares para escuchar. Muchas computadoras portátiles tienen bocinas y micrófono incorporados. La tarjeta de sonido que viene con la mayoría de los computadores no es particularmente de alta calidad, en este caso usted querrá considerar usar una tarjeta de sonido externa por USB. Para información sobre como configurar Audacity para reproducción y grabación, vea Ajuste y configuración de Audacity.

Calidad de Audio Digital
La calidad de una grabación de audio digital depende en gran medida de dos factores: La frecuencia muestra y del formato muestra formato de la muestra o la profundidad de los bits. Incrementando la frecuencia de la muestra o el número de bits en cada muestra, incrementa la calidad de la grabación, pero también incrementa la cantidad de espacio utilizado por los archivos de audio en una computadora o disco.

Indices muestra
Los índices muestra son medidos en hertz (Hz), o ciclos por segundo. Este valor simplemente representa el número de muestras capturadas por segundo para representarla en forma de onda; entre más muestras por segundo, la resolución aumenta, y así la medida de la onda es más precisa. El oído humano es sensible a patrones de sonido con frecuencias de aproximadamente 20 Hz a 20000 Hz. Sonidos fuera de ese rango son esencialmente inaudibles, aunque se ha probado subjetivamente la existencia de fidelidad psicoacústica que puede ser escuchada aún sobre del supuesto límite de 20000kHz.

Capturar un sonido de una frecuencia particular requiere un índice prueba de al menos dos veces esa frecuencia (conocida como frecuencia Nyquist). Por consiguiente un índice de muestra de 4000 Hz es necesario el mínimo absoluto para reproducir sonidos dentro del rango de la audición humana, aunque los índices más altos (llamado sobremuestrear) pueden incrementar la calidad aun más allá para evitar cualquier solapamiento de artefactos alrededor de la frecuencia Nyquist. El índice muestra usado por  CDs de audio es 44100 z. El habla humana es comprensible aún si las frecuencias arriba de 4000 Hz son eliminadas; de hecho los teléfonos solamente transmiten frecuencias entre 200 Hz y 4000 Hz. Aunque el índice de una muestra común para audio grabaciones es de 8000 Hz, que es algunas veces llamados "calidad de habla". Obsérvese que filtraciones muy exageradas (llamado filtro de solapamiento) son requeridas arriba de la frecuencia Nyquist para prohibir señales mayores al limite de ser extendido en el índice audible, por el convertidor digital, y crear los artefactos de distorsión de solapamiento de ruido.

Los índices muestra más comunes medidas en Hz son 8000, 16000, 22050, 44100, 48000, 96000 y 192000. Los índices de muestra también pueden ser referidos como kHz o unidades de 1000 Hz. Así que en unidades de kHz los indices más comunes son expresados como 8 KHz, 16 KHz, 22.05 KHz, 22.25 KHz, 44.1 KHz, 48 KHz, 96 KHz y 192 KHz.

Audacity admite cualquiera de estos índices muestra, sin embargo muchas tarjetas de sonido de computadora son limitadas a 48000 Hz, 96000 Hz o algunas veces 96 192000Hz. El índice muestra más común es 44.1 KHz (44100 Hz) y muchas tarjetas predeterminaran por ello este índice, sin importar que otros soporten.

En la imagen de abajo, la mitad izquierda tiene un índice muestra bajo, y el de la derecha tiene un índice de muestra alto (p.e. alta resolución):


 * [[Image:waveform_sample_rates.png|Onda con bajo y alto indice muestra]]

Formatos de Muestra
La otra medida de calidad de audio es formato de muestra (o "poco intenso"), la cual es normalmente una medida usada en las computadoras llamada "bits" usada para representar cada medida. Los bits más usados, la representación más precisa de cada medida. Incrementando el número de bits también se incrementa el rango dinámico de la grabación, en otras palabras, la diferencia entre el sonido más fuerte y el más bajo puede ser representada.

El rango dinámico es medido en decibelios dB. El oído humano puede percibir sonidos con un rango dinámico de al menos 90 dB. Sin embargo, cuando sea posible es mejor grabar sonidos digitales con un rango dinámico mayor a 90 dB, de ésta manera, los sonidos que son muy suaves, pueden ser amplificados con mayor fidelidad. Observa que aunque las señales grabadas en los niveles generalmente bajos pueden ser amplificados (esto es, normalizado) para favorecer la disposición del rango dinámico, la grabación con señales de bajo nivel no son usadas en todas las profundidades de bit disponibles y ésta pérdida de resolución no puede ser recuperada al normalizarse los niveles generales de las ondas digitales.

Los formatos de muestra más comunes y sus respectivo rango dinámico incluidos:
 * 8-bit entero: 48 dB
 * 16-bit entero: 96 dB
 * 24-bit entero: 145 dB
 * 32-bit punto flotante: casi infinitos dB

Nótese que hay limitaciones prácticas en el rango dinámico debido a las capacidades del hardware y los conversores de entrada y salida. Estos hacen que el límite práctico sea más como 90 dB para 16-bit.

Otro formato de muestra como ADPCM aproximado a 16-bit con audio comprimido de 4-bit. Audacity puede importar muchos de estos formatos, pero no son usados con frecuencia debido a que son nuevos métodos de compresión

Los CDs de audio y la mayoría de formatos de audio digital usan 16-bits equivalentes del sonido. Audacity usa 32-bits de punto flotante de la muestra internamente, si es requerida convierte las muestras de cantidad de sonido cuando la muestra final es exportada. Las muestras de formatos de Audacity omitidas durante la grabación pueden ser configuradas en las Preferencias de Calidad o colocadas individualmente en cada pista en el menú desplegable de pista. Durante la reproducción, el audio de cualquier pista que tenga diferente formato de muestra del proyecto puede ser remuestreada en conversor en tiempo real en las Preferencias de Calidad. Los conversores de alta calidad son usados en la producción, mezcla y exportación.

En la imagen de abajo se observa que la mitad de la izquierda del formato de muestra tiene pocos bits, y la mitad derecha tiene un formato de muestra con más bits. Si tú piensas, que el índice de muestra es el espacio entre las líneas de división verticales, el formato de muestra es el espacio entre las líneas horizontales.


 * [[Image:waveform_sample_formats.png]]

El tamaño de los archivos de video
Los archivos de sonido son muy grandes, aun más grandes que muchos de los archivos que utilizas (a menos que trabajes con archivos de video). Para determinar el tamaño de un archivo de video sin comprimir, multiplica el índice de muestra (por ejemplo 44100 Hz) por la cantidad de bits del formato de muestra (por ejemplo 16-bits) por el número de canales (2 por estéreo) por el número de segundos. Un CD de audio estéreo de 74-minutos completamente lleno, tiene 6 billones de bits. Divide ésta cantidad por 8 para obtener el número de bits; un CD de audio es menos que 800 megabytes (MB). Ver el audio comprimido de abajo.

Recorte
Una limitante para el audio digital, es que para la mayoría de los propósitos no puede lidiar con ondas de presión de sonido que excedan los niveles máximos para los que fue creado. Cuando una señal grabada excede los niveles máximos de +/-1.0 lineal o 0 dB, las muestras de esta salen del rango predeterminado son cortadas al nivel máximo establecido, como se muestra en el ejemplo:


 * [[Image:WaveformClippingAbstract.png|Onda mostrando distorsión]]

Los sonidos grabados con cortes sonaran distorsionados y discordante. Aunque existen técnicas que nos permiten eliminar pequeñas cantidades de ruido causadas por el recorte, siempre es preferible evitar recortar cuando se graba. Cambie el volumen en su dispositivo de entrada (micrófono, casete, grabadora) y establezca la entrada de control de volumen en Audacity  (en el barra de herramientas del mezclador) hasta que la onda sea lo más grande posible (para máxima fidelidad) sin recortar.

Nótese que en el formato de muestreo predeterminado de Audacity de 32-bit flotante, los valores de muestra capturados legítimamente en exceso del máximo pueden ser almacenados pero incluso si son preservados en un archivo de 32-bit flotante exportado probablemente distorsionarán en cualquier equipo de reproducción convencional. Si Audacity encuentra muestras legitimas sobre el límite, el efecto Amplificar mostrará un valor de "Amplificación (dB)" predeterminado negativo y usted deberá apretar OK en este ajuste para reducir el pico de amplificación al máximo de 0dB sin perder los picos originales de la onda.

Compresor de Audio
Debido a que los archivos de audio son muy grandes, reducir la tasa de muestreo fue algo comúnmente usado, siempre que fuera posible. En 1991, el MP3 estándar (MPEG I, layer 3) revolucionó todo. El MP3 es una técnica de compresión con pérdida (lossy) que puede reducir el tamaño de un archivo de audio digital, sin generar grandes modificaciones en la calidad de este. Un segundo de calidad de audio en un CD, ocupa 1.4 megabits, mientras que la velocidad de transferencia común para un archivo MP3, es de 128 kbps, el cual es un factor de compresión de más de 10x! que trabaja desechando detalles sobre las ondas de audio a las que los seres humanos no son susceptibles. Basándose en el modelo psicoacústico de cómo nuestros oídos y cerebro procesan los sonidos. Todos los archivos en Mp3 no son creados igual; distintos modelos psicoacústicos nos darán diferentes percepciones de la distorsión en  los archivos de audio.

Audacity puede importar de por si archivos MP3, pero por favor añada la librería opcional LAME MP3 a su computador para poder exportar archivos MP3 desde Audacity.

Con unas buenas bocinas, la mayoría de las personas pueden escuchar la diferencia entre un Mp3 de 128 kbps y un archivo de audio no comprimido en un CD. Los archivos en Mp3 de 192 kbps y 256 kbps son más populares entre los audiófilos, quienes prefieren una mayor calidad de audio.

Existen muchos otros formatos reductores que nos permiten comprimir archivos de audio. Audacity es capaz de lidiar con el formato de Ogg Vorbis. El cual es similar al MP3 pero está abierto al público, ya que es gratuito. A lo largo del tiempo la calidad de los archivos de Ogg Vorbis, han sobrepasado la calidad del Mp3 ya que su formato es más extenso, por lo tanto nos permite perfeccionarlo. Ogg Vorbis, es una buena elección para tus archivos de audio, sin embargo la realidad es que muchos dispositivos como los iPods y otros audios portátiles pueden reproducir Mp3 pero Ogg Vorbis aun no.

Otros métodos conocidos para comprimir incluyen ATRAC, usado por grabadores de MiniDisc de Sony, Windows Media Audio (WMA), y AAC. Audacity soporta más formatos mediante la adición de la librería opcional FFmpeg.