Este documento es una introducción al audio comprimido. Cubre los aspectos básicos de las ondas de sonido, cómo es almacenado digitalmente el audio, por qué es necesario el audio comprimido, los aspectos básicos de la compresión con pérdidas de audio, y por qué Ogg Vorbis es una buena elección para audio comprimido. Asume una familiaridad básica con la física y terminología de las computadoras, incluyendo los términos "bit", "byte", y "archivo".
También parece ser una de las introducciones más populares a Ogg Vorbis en la web, y ha sido traducida a media docena de idiomas, teniendo más de 1.000 lectores por mes.
La música está hecha de ondas. Cuando un violinista toca una cuerda, la cuerda vibra en una cierta frecuencia y crea una onda de sonido, que viaja a través del aire, toca tu tímpano y causa que él vibre. Tu cerebro interpreta las señales que provienen de tu tímpano y "escucha" un sonido.
Del mismo modo, todo lo demás que podés escuchar es porque algo vibra y crea ondas de sonido. En una trompeta, es una columna de aire. Con una guitarra eléctrica, las cuerdas que vibran mandan una señal a través del amplificador, que causa que un parlante vibre de la misma manera que la cuerda original. Cuando hablás o cantás son tus cuerdas vocales las que vibran. Todas estas cosas generan ondas de sonido.

Las propiedades de estas ondas afectan al modo en que suenan. La frecuencia de una onda refiere a cuántas veces por segundo la onda pasa de su punto más alto a su punto más bajo y viceversa. Esto se mide típicamente en hertz (Hz), o número de ciclos por segundo. La frecuencia de una onda determina su afinación. Las ondas de alta frecuencia tienen una afinación alta, y las ondas de baja frecuencia tienen una afinación baja. El humano promedio puede escuchar frecuencias desde 15 o 20 Hz hasta aproximadamente 20.000 Hz (20 kHz).
La amplitud de una onda refiere a la mitad de la distancia entre uno de los puntos más altos de la onda y uno de los más bajos. Mientras más grande la amplitud de una onda, más alto su volumen, medido típicamente en decibeles (dB). El rango de decibeles para el oído humano es complicado y depende de la frecuencia del sonido en cuestión, pero aproximadamente va de 0 a 120 dB, donde cada cambio de 10 dB corresponde al doble del volumen percibido. (3 dB doblan la energía, pero eso no es lo mismo).
Durante la 2ª Guerra Mundial, los ingenieros experimentaban con audio digital, convirtiendo las ondas de sonido analógicas a valores discretos. Esto pudo ser realizado "muestreando" la onda de sonido muchas veces por segundo, con cada muestra grabando la amplitud de la onda en ese momento (incluyendo si la onda estaba "arriba" o "abajo"). En base al Teorema de Nyquist, la tasa de la muestra (número de muestras por segundo) debe ser al menos el doble de alto que la frecuencia grabada más alta para prevenir ruidos extraños en la grabación.
Entonces, en los '70, cuando Philips y Sony empezaron a buscar una forma de mejorar la calidad de audio para música grabada, cambiaron al muestreo digital. Eligieron una tasa de muestreo de 44.100 muestras por segundo (44,1 kHz) porque excedía la tasa de muestreo objetivo de 40 kHz (el doble de la frecuencia más alta que los humanos pueden oir, 20 kHz) y porque eso era la cantidad de información que podía ser almacenada en una cinta de video, el medio de almacenamiento elegido hasta que los pequeños discos plateados de plástico que conocemos como CDs fueron perfeccionados.

Cada "muestra" es un número de 16 bits, con un rango desde -32.768 hasta 32.767. Este número indica indica la amplitud de la onda en el instante del muestreo. Mientras que una muestra de onda oscilando entre -32.768 y 32.767 sería la onda más sonora que este formato podría representar, una onda cambiando entre -1 y 1 sería la más tranquila, y una pila de ceros en cadena indicarían silencio absoluto. Este rango de valores para la amplitud es bastante fiel, lo que permite incluso que diferencias sutiles de volumen sean representadas con precisión. El muestreo de audio en esta forma digital es conocido como Pulse Code Modulation (PCM), y es el método más popular de muestreo digital.
El audio digital PCM produce una imagen bastante precisa del sonido "en vivo", y sólo los oyentes entusiastas con buen equipamiento pueden distinguir entre él y el original.
Es posible (y bastante fácil) "extraer" los datos de audio PCM de un CD de música y almacenarlos como archivos "WAV" en una computadora, y estos archivos pueden ser reproducidos nuevamente bajo demanda. Entonces, idealmente querrías escuchar tu música en esta calidad en cualquier lugar, dado que es la calidad más alta que podés comprar comúnmente. Querrías copias de tu música, en esta calidad, en tu auto, en tu computadora, en tu reproductor de música portátil, y en tu equipo hogareño. ¿Por qué esto no es factible, en realidad? La respuesta es el tamaño.
Un poco de matemáticas puede revelar el espacio requerido para almacenar información sonora en esta calidad. Cada muestra es de 16 bits, o dos bytes. Hay 44.100 muestras en cada segundo, y como la música moderna se graba en estéreo, hay tanto un canal izquierdo como un canal derecho. Esto resulta en (2*44100*2) = 176.400 bytes para almacenar un segundo de muestras. Significa 10.584.000 bytes o aproximadamente 10 megabytes para almacenar sólo un minuto de audio en calidad CD. Esto puede no sonar demasiado alarmante, dado que varios tienen discos duros que contienen decenas e incluso cientos de gigabytes, pero suma rápidamente.
La colección de música personal del autor consiste en 1.307 canciones en 102 álbumes diferentes (un par de esos son álbumes dobles). El tiempo de reproducción total de todas las 1.307 canciones combinadas es 5.423 minutos y 23 segundos (más de tres días y dieciocho horas) y por consiguiente requeriría un espacio de disco duro estimado de 53 gigabytes para almacenarlas en perfecta calidad CD. Con un poco de plata, una computadora personal podría tener esa cantidad de espacio libre, pero la mayoría de los reproductores de música portátiles no tienen tanto espacio. E incluso con portátiles más grandes, la cantidad de tiempo que llevaría almacenar todos esos archivos en algunos casos es un factor.
Mientras los DVD de video con "sonido envolvente" se vuelven más populares, esto sólo se volverá un mayor problema: tal audio contiene típicamente 5 canales (izquierdo, derecho, izquierdo trasero, derecho trasero y central), casi triplicando los requerimientos de espacio. Y para los discos DVD de audio todavía es peor: hasta seis canales con muestras de 24 bits a 96 kHz, requiriendo casi diez veces la cantidad de espacio.
Claramente, en un futuro cercano (al menos hasta que los reproductores de música portátiles tengan cientos de gigas de almacenamiento), no vas a poder llevar tu colección de música entera.
¿O podés?
Afortunadamente, existe una solución. La compresión es la técnica de hacer que un archivo ocupe menos espacio mientras aún contiene la misma información. Existen dos categorías de compresión, sin pérdidas y con pérdidas.
Compresión sin pérdidas significa que el archivo comprimido, más pequeño, puede ser expandido de vuelta en el archivo original sin perder información alguna. Eso es: tomá un archivo, comprimilo y descomprimilo nuevamente. Si el archivo resultante es idéntico bit a bit, el 100% del tiempo, para cualquier archivo de entrada, el esquema de compresión es sin pérdidas. No se pierde información.
Desafortunadamente, comprimir audio sin pérdidas es difícil. Los programas de compresión de propósito general como WinZip y gzip sólo alcanzan el 5% en promedio. Incluso las utilidades "de última generación" como WinRAR y bzip2 sólo alcanzan porcentualmente un poco más.
Existen compresores de propósito específico (como FLAC) que se designaron solamente para compresión de audio sin pérdidas, pero aún ellos sólo alcanzan alrededor de 50% de reducción del tamaño de archivo en promedio. Mientras que esto es suficiente para algunos, para que los archivos de música sean realmente portátiles tienen que ser todavía más pequeños.
Compresión con pérdidas es cualquier compresión en la cual se pierda información. Comprimir y descomprimir un archivo resulta en algo similar, pero no idéntico al archivo original. Esto no es bueno para cosas que deban ser interpretadas por una computadora, como aplicaciones o programas ejecutables o la mayoría de los datos capaces de ser leídos por las mismas, pero a menudo está bien para cosas en las que la "interpretación" la realice un humano (como fotos o sonidos). El truco es eliminar pequeños bits de información en lugares en los que no puedan ser percibidos.
La compresión con pérdidas de audio funciona usando un modelo psicoacústico. Quiere decir, modelando cómo tus oídos (y tu cerebro) escuchan sonido, es posible encontrar lugares para eliminar información que no hubieses percibido de todos modos. El análisis completo de estas técnicas está fuera del alcance de este documento, pero he aquí dos ejemplos simples:
A pesar de que los humanos puedan escuchar técnicamente tonos de hasta 20 kHz, la mayoría no puede escuchar nada arriba de los 15 kHz, especialmente cuando están presentes otros sonidos. Sin embargo, la mayoría del audio en calidad CD contiene información para reproducir de todos modos estos tonos. Descartando tonos fuera de este rango, reducís la cantidad de información que tiene que almacenarse sin afectar la calidad de sonido percibida. (E incluso humanos que puedan escuchar tales tonos no los hubieran escuchado de todos modos, con parlantes de computadoras baratos incapaces de producir esas frecuencias).
Del mismo modo, si una pieza de música contiene un golpe de bombo sonoro (como la mayoría del rock and roll, un par de veces por segundo), el tímpano está demasiado ocupado reaccionando a los golpes percusivos de la batería para registrar cualquier otro sonido en absoluto por unos pocos milisegundos. Simplemente omitiendo las muestras inmediatamente después de tales sonidos, se puede almacenar menos información mientras se mantiene la misma calidad de sonido percibida. (Aclaración: esto es sólo un ejemplo. El autor no es conciente de que algún codificador en realidad haga esto).
Usando técnicas sofisticadas como esas, los formatos de compresión con pérdidas de audio tal como Ogg Vorbis y MP3 pueden lograr resultados que son probablemente indistinguibles del sonido calidad CD original, pero que ocupan sólo del 10% al 20% del tamaño.
Y lo que es aún mejor, siendo más agresivo con esas técnicas puede resultar en archivos que ocupen menos del 5% del tamaño original mientras siguen sonando bastante bien en equipos normales (pensá en calidad de radio FM).
El tamaño final de tales archivos es manejado por su bitrate, o tasa de bits. Es decir, cuántos bits usa el compresor (también conocido como codificador o códec) para representar cada segundo de audio. Como se indicó arriba, la calidad CD, descomprimida, usa 176.400 bytes o 1.411.200 bits para almacenar cada segundo. Esto es aproximadamente 1411 kilobits por segundo, o 1411 kbps. Los formatos con pérdidas típicamente sólo usarían cualquier espacio entre 64 y 256 kbps para almacenar la "misma" información.
El problema es que los bitrates sólo hablan del tamaño de un archivo, no de su calidad. Por ejemplo, alguien podría escribir un formato de compresión que alcance un bitrate de 256 kbps tomando sólo los primeros 256.000 de los 1.411.200 bits en cualquier segundo dado (18%). A pesar de que algunas personas ingenuas podrían asumir que una canción codificada en este formato sonaría mejor que un típico MP3 de 128 kbps, cualquier prueba de audición sería capaz de probar fácilmente la inferioridad de dicha técnica.
El formato MP3, desarrollado por Fraunhofer y Thomson, es un formato altamente patentado que fue desequilibrante en su época. Dado que fue el primer codificador de compresión con pérdidas de audio adoptado masivamente, las personas asocian ciertos bitrates con ciertos niveles de calidad.
Sin embargo, incluso dentro del viejo formato MP3, e incluso dentro de un bitrate determinado (digamos, 128 kbps), la calidad de sonido de distintos codificadores varía drásticamente. El codificador Xing es rápido pero produce archivos de sonido pobre incluso a 128 kbps. El codificador LAME es un poco más lento pero produce archivos marcadamente de mejor sonido con el mismo bitrate.
Los códecs de compresión con pérdidas de audio más nuevos, como WMA, AAC y Ogg Vorbis, usan modelos psicoacústicos distintos y mejoran notablemente la calidad de sonido en un bitrate dado, aún sobre el mejor codificador MP3.
Para hacer más oscuras las aguas, no solamente el bitrate por sí solo representa todo el asunto. Los primeros codificadores MP3 (y la mayoría hoy en dia) usaban lo que se llama un bitrate promedio (ABR, del inglés Average Bit Rate). Si, por ejemplo, codificamos un archivo a 128 kbps, el codificador va a usar 128 kilobits para codificar cada segundo de la canción, no importa qué. De este modo, la primera medida (consistiendo tal vez en dos golpes de palos) va a usar 128 kilobits y va a representar ese segundo casi exactamente. Al contrario, a mitad de la canción, cuando la guitarra principal está rasgueando un solo, el baterista se vuelve loco con los platillos y el bajo está tocando un riff movido, el codificador también va a tener que usar 128 kilobits para codificar ese segundo, cuando podría haber usado, digamos, 300. Por ende, ese segundo va a representarse de un modo bastante pobre.
Los codificadores MP3 más nuevos (como LAME) soportan lo que se llama modo "de bitrate variable" (VBR, del inglés Variable Bit Rate). Esto le da al codificador la libertad de ahorrarse bits en secciones simples que no necesitan tantos bits para representarlas correctamente, y entonces tener algunos bits "extra" para usar en secciones que realmente los necesitan. Usualmente, esto resulta en archivos que son apenas más chicos que los archivos ABR incluso en el mismo bitrate objetivo, pero que suenan mucho mejor en las secciones complejas.
En ocasiones podés ver que se menciona a MP3s como de "bitrate constante" (CBR, del inglés Constant Bit Rate). Esto significaría que cada muestra del archivo codificado debe usar exactamente la misma cantidad de bits. En realidad, MP3 usa una pequeña reserva para promediar bitrates en un período corto de tiempo, por lo que técnicamente usa ABR. No es propenso que un formato de audio comprimido use CBR real.
Desafortunadamente, a pesar de que los codificadores MP3 más nuevos soportan VBR, algunos reproductores de MP3 portátiles más viejos no pueden reproducir esos MP3s. E incluso cuando sus codificadores y reproductores soportan este modo, muchas personas no lo usan por cualquier razón (¿Hábito? ¿Ignorancia?).
Casi todos los codificadores de compresión con pérdidas de audio más nuevos que MP3 soportan VBR, aunque algunos no lo activan por defecto.
Pruebas hechas por Fraunhofer y Thomson encontraron que para MP3s, 256 kbps era "calidad CD" real; eso es, sus ingenieros de sonido podían notar raramente la diferencia entre los MP3s codificados a esa tasa y los CDs originales. Estos archivos eran de aproximadamente el 20% del tamaño de archivo original, pero virtualmente indistinguibles en calidad.
Desde ese entonces, los MP3s de 128 kbps se volvieron el "estándar". Aunque la mayoría de las personas con buen equipamiento pueden escuchar la diferencia, siguen sonando lo suficientemente bien para el oyente promedio. Estos archivos son de aproximadamente el 10% del tamaño de archivo original, y son la fuente de la regla de 1 megabyte por minuto que citan algunos negocios para determinar cuánta música podés meter en un reproductor de MP3 portátil determinado.
Las personas con oídos opacos, mal equipamiento o un deseo fuerte de meter el doble de música en un reproductor portátil codifican MP3s a 64 kbps. Estos archivos suenan no mucho peor que una radio FM, y son sólo de un 5% del tamaño de archivo original. (La mayoría, aunque no todos, de los reproductores portátiles que publicitan "almacena más de 2 horas de música" asumen el uso de MP3s de 64 kbps, mas que los MP3s más comunes de 128 kbps).
El problema con estas reglas de oro es que sólo funcionan para MP3s. Existen hoy muchos formatos más recientes que MP3 los cuales todos mejoran la calidad de sonido. Y, a medida que se desarrollan modelos psicoacústicos más sofisticados, la diferencia en la calidad de sonido entre un bitrate para MP3 y el mismo bitrate para un formato distinto va a continuar ensanchándose.
Por ejemplo, un archivo codificado en el formato Ogg Vorbis en "calidad 3" resulta típicamente en un bitrate promedio de 112 kbps pero suena mejor que un MP3 a 128 kbps y usualmente tan bien como un MP3 codificado a 160 kbps.
Por esta razón, la comunidad de Ogg Vorbis desaconseja a los usuarios de tratar de alcanzar un bitrate específico cuando codifican, y en cambio los aconseja a concentrarse en la calidad de sonido. En efecto, los codificadores del formato Ogg Vorbis normalmente no consideran al bitrate en absoluto (el modo de operación por defecto es VBR), en cambio usan un puntaje "de calidad" que va de -1 a 10 incrementándose de a 0,01. Este puntaje de calidad es una medida de cuán parecido al original debería sonar el archivo comprimido; el codificador usa tantos o tan pocos bits como sean necesarios para satisfacer el requerimiento de calidad. Cada configuración de calidad resulta en un bitrate aproximado para un tema musical promedio, aunque esto es producto de cómo se ajustó el codificador; el codificador no apunta a ningún bitrate en particular.
La configuración de calidad por defecto es 3, que debería estar bien para el usuario promedio dado que brinda una calidad de sonido mejor que un MP3 a 128 kbps pero que es un 10% más pequeño. Alguno queriendo sonido casi idéntico a un MP3 de 128 kbps usualmente puede alcanzarlo con calidad 2, que suena igual pero que es un 25% más pequeño.
El resto de este documento asume que vas a codificar música usando el formato Ogg Vorbis.
Ogg Vorbis es una buena elección porque la calidad de sonido está entre las mejores de los formatos más recientes ahí afuera. Pruebas de audición recientes ponen a Ogg Vorbis entre los de calidad más alta de todos los codificadores de audio comprimido "de segunda generación". Significa que o ahorrás espacio y obtenés la misma calidad, obtenés calidad más alta para los mismos requerimientos de espacio, o una combinación de ambas (un poco más chicos y un poco mejor sonido).
En segundo lugar, Ogg Vorbis no sólo es de Código Abierto (licencia BSD), sino que es completamente libre de patentes. Significa que los fabricantes de hardware que quieran soportar Ogg Vorbis en sus reproductores de música portátiles lo pueden hacer sin pagar costos de licencia, al contrario de la mayoría de los demás formatos. Los desarrolladores de software pueden usar el formato Ogg Vorbis para música y/o sonidos en sus juegos sin tener que obtener permiso de alguna compañía poderosa y sin pagar regalías. Y la naturaleza abierta del código para el formato significa que muchas personas tienen la libertad de portar las herramientas a muchos otros sistemas o de agregar cualidades, corregir errores y mejorar el código si así lo desean. En efecto, la licencia BSD le permite a los desarrolladores modificar el código para satisfacer sus propias necesidades, y ni siquiera tienen que publicar sus cambios. La mayoría de los otros formatos están fuertemente patentados y controlados de cerca.
Finalmente, el formato está bien diseñado para poseer varias cualidades que los demás no tienen. Aquellos familiarizados con las etiquetas id3 para archivos MP3 conocerán bien sus limitaciones; Ogg Vorbis presenta un estándar de etiquetamiento flexible que permite personalización completa de las etiquetas de un archivo dado, que incluye etiquetas definidas por el usuario (como "remixado por" o cualquiera que te guste).
Los archivos Ogg Vorbis también soportan potencialmente el "escalado de bitrate", que refiere a que podrías producir un archivo de bitrate más bajo desde un archivo de bitrate más alto sin re-codificar y en la misma calidad que si hubieses codificado al archivo en el bitrate más bajo directamente desde el archivo original. Ningún otro codificador con pérdidas de audio actualmente admite esto. (N.B. Los archivos actuales son escalables, pero no muy bien. El buen soporte para escalado requiere que el codificador sea rediseñado para almacenar los datos en un formato más amigable al escalado (aunque también compatible retroactivamente). Se está trabajando en esto, lentamente, pero no tiene actualmente una prioridad alta).
Y los archivos Ogg Vorbis no están limitados a dos canales de audio meramente (izquierdo y derecho). Soportan hasta 255 canales diferentes, y por ende son naturalmente aptos para codificar los DVD de audio de 6 canales junto a tu video DivX.
Sólo para ser claro, estrictamente hablando, el nombre "Ogg" se refiere a un formato contenedor genérico que podría contener muchos tipos de archivos multimedia (audio comprimido con pérdidas (Ogg Vorbis), audio comprimido con pérdidas diseñado para el habla (Speex), audio comprimido sin pérdidas (Ogg FLAC), video comprimido con pérdidas (Ogg Theora), etc). "Vorbis" es el codificador de compresión con pérdidas de audio que típicamente se transporta en archivos Ogg. "Ogg Vorbis" se refiere a ambas partes juntas: un formato Ogg que contiene al audio comprimido usando Vorbis. Y a lo largo de este documento, el autor usó el término "ogg" para referirse genéricamente a "un archivo que contiene audio comprimido en el formato Vorbis" dado que esa es la extensión del archivo, tal como usó "MP3" para referirse a "un archivo que contiene audio comprimido en el formato MPEG capa 3".
Existen algunos campos donde el uso de Ogg Vorbis probablemente no sea apropiado en este momento, y la mayoría se deriva de la generalidad. El soporte a MP3s está ampliamente extendido, dado que fue el primer formato de audio comprimido popular y ha estado presente por largo tiempo. Esto significa que no todos los reproductores de música portátiles soportan archivos Ogg Vorbis, especialmente los más viejos. En particular, el iPod no soporta actualmente el formato Ogg Vorbis, en mayor parte porque Apple se niega a publicar las especificaciones y los fans están teniendo que realizar ingeniería inversa manualmente.
De un modo similar, si estás planeando distribuir música en el formato Vorbis, podés tener que ayudar a tus receptores a configurar algo para reproducirlos. Evidencia anecdótica indica que la mayoría de los usuarios de Windows reproducen audio usando el Reproductor de Windows Media, que no soporta archivos Ogg Vorbis por defecto (aunque el autor entiende que es posible habilitar el soporte, al menos con versiones antiguas del reproductor). Del mismo modo, la mayoría de los usuarios de Mac reproducen audio con iTunes, que no viene con soporte para Vorbis instalado.
Personalmente, el autor no distribuye archivos de música, y los puede reproducir bien en su casa, pero tu situación puede variar, entonces al menos sé conciente del problema. Espera que iTunes eventualmente podría soportar Ogg Vorbis "fuera de la caja". Sin embargo, hacer que Microsoft soporte tal estándar abierto no parece posible en el futuro previsible.
Notá que la aceptación masiva (especialmente en hardware) resulta difícil y lenta para cualquier formato nuevo, incluyendo WMA.
Para conocer qué nivel de calidad deberías usar para codificar, vas a necesitar hacer algunas pruebas de audición. Primero, agarrá uno de tus CDs y usá un extractor de CD (como CDex o EAC) para extraer uno o dos temas dentro de un archivo WAV en el disco duro. Esto va a ocupar algo de espacio (aproximadamente 10 megabytes por minuto), como se mencionó antes. Si te sentís cómodo con las herramientas de línea de comandos, usá oggenc para codificar como se especifica más abajo. Si no, usá una gerramienta gráfica como OggDropXPd.
Codificá los mejores temas usando la configuración por defecto.
oggenc Tema01.wav
Esto será VBR, en calidad 3. Escuchá los temas codificados y decidí cuán bien suenan para vos. ¿Suenan bien? ¿Alguna queja? Si pensás que suenan bien, entonces codificá toda tu música usando la configuración por defecto y ni siquiera te preocupes por el bitrate, calidad u otra cosa. Tus oídos son la única métrica que realmente importa.
Si los archivos para vos no suenan bien, o si lo hacen y sólo sos curioso sobre cuán mejor podrían sonar, entonces tratá de codificarlos de nuevo en calidad 4. Ajustá el deslizador en OggDrop o ejecutá el siguiente comando en la línea de comandos:
oggenc -q 4 Tema01.wav
Luego escuchá esas versiones. ¿Podés notar alguna diferencia en la calidad de sonido? Si no, entonces no hay razón para no codificar con la configuración por defecto. Si no podés escuchar la diferencia, sólo estás desaprovechando espacio al codificar en una calidad más alta.
Si podés escuchar la diferencia, ¿Es el incremento de calidad suficiente para justificar el incremento del tamaño de archivo? Si lo es, entonces tal vez seguí incrementando la calidad en 0,5 o similar hasta que no puedas escuchar la mejora con respecto a la configuración anterior. Técnicamente, la calidad de sonido continúa mejorando durante todo el trayecto hasta calidad 10, pero casi nadie puede escuchar diferencias después de calidad 7.
Si realmente estás interesado en la calidad de sonido, podrías querer usar ABX para tus pruebas de audición. ABX es una metodología de audición que te permite determinar conclusiva y repetidamente si realmente estás escuchando diferencias entre dos archivos de sonido. La página web de PC ABX es un buen lugar para comenzar.
Además, estás avisado que los archivos Ogg Vorbis normales usan acoplamiento de canales con pérdidas, lo que significa que las redundancias entre los canales izquierdo y derecho se combinan para ahorrar espacio. Esto en efecto mantiene a los archivos más pequeños, aunque también significa que técnicamente la imagen estéreo de un archivo Ogg Vorbis podría no ser siempre idéntica a la imagen estéreo original. Si esto te preocupa, vas a querer codificar en calidad 6 o mayor, que es donde el acoplamiento de canales con pérdidas es desactivado y todo el acoplamiento de canales es sin pérdidas. La mayoría no puede notar la diferencia, pero tal vez vos sí.
Por otro lado, si te importa más el tamaño de archivo que la calidad de sonido, tratá de bajar la calidad hasta que la pérdida de calidad se vuelva lo suficientemente significativa para vos. Algunos usuarios de Ogg Vorbis (con oídos opacos felices) informan que no pueden notar la diferencia entre el CD y un Ogg en calidad 0. Esas personas están ahorrando un buen espacio y siguen escuchando música con una calidad de sonido aceptable para ellas.
Para aquellos que quieran escuchar su música en casa (donde el espacio en disco duro es abundante) y en un dispositivo portátil donde el espacio es de lujo, codificá en un formato más alto. Una vez que estén disponibles buenos escaladores, los archivos Ogg Vorbis siempre pueden ser "escalados" más adelante para obtener las versiones de calidad más baja desde las de calidad más alta.
Unas pocas personas usan Oggs para transmitir por la web. Para esos intentos, el bitrate variable no es aceptable porque a pesar que el bitrate promedia apropiadamente, los picos de bitrate pueden exceder los requerimientos de ancho de banda. En Ogg Vorbis existen un modo CBR e incluso una configuración de bitrate máximo y mínimo, pero no se dan detalles porque las técnicas usadas para producir tales archivos siempre resultan en archivos que suenan peor que un archivo del mismo tamaño que usa las configuraciones por defecto. Las garantías sobre el ancho de banda vienen con un precio.
Para el usuario promedio, si codificás archivos Ogg Vorbis usando cualquier otra configuración fuera de "-q n", estás obteniendo archivos de menor calidad de lo que podrías para un tamaño dado.
Algunas personas tienen un montón de música en el formato MP3, pero no tienen los CDs originales (*cof*). Otras tienen los CDs, pero pasaron meses extrayendo y codificando todos los temas en el formato MP3 y no quieren pasar por esa situación nuevamente. Tales personas usualmente se tientan a tomar sus MP3s, descomprimirlos en WAVs, y re-codificarlos en archivos Ogg Vorbis. Algunos han ido tan lejos como para crear herramientas para automatizar este proceso.
Si te preocupa la calidad de sonido, nunca, nunca deberías hacer esto. Ogg Vorbis usa técnicas similares pero diferentes para eliminar información y, al transcodificar, perdés información dos veces. Del mismo modo que faxear una fotocopia de un fax, el ogg "transcodificado" siempre sonará peor incluso que el MP3 original.
Además, para la mayoría de los usuarios esto no es necesario, dado que casi todo reproductor que soporta OGGs, soporta MP3s, y tu colección MP3 puede coexistir pacíficamente con tu creciente colección OGG. En efecto, la única razón obligatoria para desechar los MP3s existentes es ética, no técnica: o tus MP3s eran copias ilegales o tal vez porque no querés apoyar a un formato patentado.
Sin embargo, si tus MP3s son de una calidad excesivamente alta (digamos, 256 kbps o mayor), probablemente no hayas incurrido en la suficiente pérdida de calidad como para preocuparte. Probablemente podrían convertirse a Ogg Vorbis (especialmente a bitrates menores) con pérdidas de calidad adicionales pequeñas.
Este artículo es una traducción personal del escrito originalmente por Graham Mitchell el 30/08/2004. Para conocer licencia, derechos y traducciones sobre el mismo, dirigirse a la página web del autor. La traducción, al ser derivada del original y al requerirlo el mismo, queda publicada bajo la misma licencia.