Formatos de audio: todo lo que debes saber para la locución online

[my_reading_time] minutos

La calidad sonora de un trabajo, como puede ser una canción musical o una cuña de radio, se consigue a través de la suma de muchos elementos distintos. Estos elementos forman una cadena y dicha calidad se transmite de un eslabón a otro. Pero si uno de esos eslabones no es capaz de replicar la calidad del anterior, se producirá una pérdida en el siguiente, que será irreparable. Es decir: si trabajas con un nivel ‘pro’ al grabar tu sonido (locución) y quieres que se mantenga así en el momento de la escucha, deberás cuidar todos los detalles de la fase intermedia (edición).

En este blog he ido analizando todos esos elementos o ‘eslabones’ de la cadena, pertenecientes a las diferentes fases. He hablado de la acústica del home studio, de los micrófonos que convierten la señal analógica en digital, de las interfaces, de los monitores de estudio, etc. Y hoy le toca el turno a los formatos de audio, pues también son un aspecto crucial: podrás gastarte miles de euros en tu equipo y en tu sala de grabación, pero si exportas tus archivos a un formato de calidad insuficiente, habrás tirado por la borda todo tu trabajo… y todo tu dinero.

Así que en las siguientes líneas te cuento qué formatos existen, cuáles son sus características y, por supuesto, cuáles son los más adecuados para la locución profesional.

Los tres tipos de formatos de audio existentes

Hay muchísimos formatos de audio en la actualidad, pero todos ellos se pueden encuadrar en tres grupos distintos:

  • Formatos sin compresión
  • Formatos comprimidos sin pérdida
  • Formatos comprimidos con pérdida

Más adelante repasamos cada uno, pero antes no está de más acotar los siguientes términos, pues haremos mención a ellos:

  • Lossless: significa, en inglés, ‘sin pérdida’, por lo que se emplea a los formatos que mayor información sonora atesoran, es decir, los más ‘puros’, si se me permite la expresión
  • Lossy: hace referencia a los formatos en los que ha habido pérdida de información para hacer el archivo resultante más manejable, por lo que se emplea como sinónimo de ‘formatos comprimidos con pérdida’
  • Profundidad de bits: teniendo en cuenta que ‘bit’ es la unidad mínima de información que puede registrar un ordenador, este término hace referencia a la precisión para representar un sonido analógico en formato digital. Es lo que equivaldría al píxel en una foto. Y a mayor profundidad de bits, mayor precisión
  • Frecuencia de muestreo: es el otro parámetro que marca la calidad de un audio digital. Hay que tener en cuenta que, para pasar un sonido analógico al lenguaje digital, lo que se hace es tomar una serie de muestras que, una tras otra, dan como resultado el sonido. Es el equivalente a la velocidad de fotogramas por segundo en un vídeo. Y de nuevo, a mayor frecuencia, mayor fidelidad y precisión
  • Transcodificar: es el proceso de convertir un archivo sonoro de un formato a otro. Esto puede hacerse manteniendo la información y, por tanto, la calidad, o bien cambiando la cantidad de información del archivo, en dos direcciones: downsampling y upsampling
  • Downsampling: convertir un formato en otro, reduciendo su calidad
  • Upsampling: convertir un formato en otro, expandiendo su información o aumentando su calidad, pero por lo general no es posible entre un formato lossy y otro lossless. Es decir: al hacer downsampling se pierde información que luego no se puede recuperar

Formato sin compresión: qué es, pros, contras y ejemplos

Son los formatos lossless que mayor información sonora contienen y, por tanto, mayor calidad ofrecen, llegando a los 24 bits y a los 192 khz. Su principal pega es que generan archivos muy pesados, difíciles de procesar por equipos informáticos medios. Además, generan problemas de compatibilidad al compartirlos con otros usuarios, pues no todos los ordenadores o dispositivos los reconocen.

Los más famosos son WAV (Wavefile, desarrollado por IBM y Microsoft) y AIFF (Audio Interchange File Format, para Mac e iOS).

Formato comprimido sin pérdida: qué es, pros, contras y ejemplos

Son formatos que también contienen la máxima información posible, pero su ésta es compactada informáticamente para que pesen menos sus archivos. Por tanto, son más ligeros que los anteriores y, si fuera necesario, se pueden descomprimir sin pérdida de información. En cambio, siguen siendo muy pesados para la mayoría de los equipos y también pueden presentar incompatibilidades cuando se comparten con otros usuarios.

Los más comunes son FLAC (Free Lossless Audio Codec) y ALAC (Apple Lossless Audio Codec, que se presenta con extensión .m4a).

Formato comprimido con pérdida: qué es, pros, contras y ejemplos

Son los formatos que, para una mejor manejabilidad, realizan una compresión más ‘agresiva’ de la información, provocando pérdidas. Eso hace que sus archivos pesen mucho menos, que se puedan compartir fácilmente y que tengan mucha compatibilidad con los equipos y dispositivos móviles del ‘gran público’. Su inconveniente es que la calidad se ve mermada, siendo imposible recuperarla por medio de la expansión o upsampling.

Se trata de la tipología con más formatos existentes. El más famoso y común es MP3, pero también se puede citar WMA (creado por Microsoft), AAC (impulsado por Apple) y un sinfín de formatos ligados a Internet y al mundo del streaming, como OGG (usado por Spotify) y OPUS (empleado en las notas de voz de WhatsApp).

Fraunhofer (los creadores del mp3) han mejorado un codec que ya tenían desarrollado y el resultado es el xHE-AAC (la combinación de Extended HE-AAC y MPEG-D DRC) .

Logo Xhe-Aac

El formato de audio xHE-AAC (también conocido como AAC-LD) es una extensión de AAC que permite una mayor eficiencia en la codificación de audio de alta calidad. Utiliza una técnica de codificación llamada «Low Delay» (retraso bajo), que permite reducir la cantidad de retraso en el audio codificado. Esto es especialmente útil en aplicaciones de transmisión en tiempo real, como la radio y la televisión en vivo.

Además, xHE-AAC también utiliza una técnica de codificación de audio multicanal llamada «Parametric Stereo», que permite codificar audio estéreo y multicanal con un ancho de banda muy reducido en comparación con los métodos de codificación convencionales. Esto permite transmitir audio de alta calidad en canales con ancho de banda limitado, como las redes móviles y las redes inalámbricas.

Otra característica importante de xHE-AAC es que es compatible con una variedad de dispositivos, incluidos teléfonos móviles, televisores, reproductores de audio y computadoras. Además, es compatible con una variedad de contenedores de archivos, como MP4 y ADTS.

En resumen xHE-AAC es una extensión del formato de audio AAC, diseñado para mejorar la eficiencia en la codificación de audio de alta calidad, especialmente en aplicaciones de transmisión en tiempo real y en redes con ancho de banda limitado.

Que Formato De Audio Elegir Para Una Locucion Profesional

¿Qué formato de audio elegir para una locución profesional?

Un locutor profesional debe estar familiarizado con todos los tipos de formatos de audio, pues todos ellos son útiles en diferentes momentos y para distintos propósitos. Por regla general, lo ideal es trabajar siempre a la máxima calidad… dentro de unos márgenes razonables. Esto es, a 16 bits de profundidad y 48 khz de frecuencia de muestreo o, como mucho, 24 bits y 96 khz. Por encima de estos valores, estaríamos ya entrando en el terreno de la producción musical profesional, con unas exigencias muy superiores a la locución online.

Por tanto, tu DAW y la tarjeta gráfica de tu ordenador deben ser capaces de procesar formatos de audio sin compresión y formatos de audio comprimidos sin pérdidas, pues es importante trabajar a la máxima calidad para evitar el mencionado problema del upsampling.

A la hora de entregar tu trabajo al cliente, como una cuña de radio, deberás hacerlo en el formato que éste te pida, lógicamente. Pero si trabajas a máxima calidad, no habrá problema: lo normal es que solicite un archivo de calidad similar o inferior al ‘bruto’ con el que estás trabajando, por lo que solo tendrás que exportar al formato solicitado.

En resumen, lo recomendable es trabajar con un ordenador con buena tarjeta gráfica y un DAW profesional que te permita dos cosas:

  • Trabajar con un bruto de alta calidad: formatos sin comprimir o comprimidos sin pérdida
  • Exportar a otros formatos más manejables para el cliente o incluso para el oyente final: formatos comprimidos con pérdida

Cuanto mayor sea el abanico de formatos que domines, mayor versatilidad ofrecerás a la hora de interactuar con el cliente. De modo que, si tienes las habilidades innatas o adquiridas para ser un buen locutor, ¡no dejes que ningún detalle técnico lastre tu camino!