Академический Документы
Профессиональный Документы
Культура Документы
Edicin II:
Introduccin:
Este documento es el resultado de la adaptacin del contenido original en ingles de los libros
Digital Audio Editing: Correcting and Enhancing Audio in Pro Tools, Logic Pro, Cubase y Estudio
One de Simon Langford y Pro Tools 10 Advanced Music Production Techniques de Robert
Campbell al castellano y otras fuentes web adicionales como Ask.audio y Sound on Sound (SOS),
con propsitos educativos y formativos en las tcnica de edicin de audio digital para corregir,
crear y restaurar tomas de grabacin.
La edicin puede ser abordada desde 3 ngulos o filosofas, el correctivo mediante el cual, el
objetivo principal es la manipulacin del audio para reparar imperfecciones y enfatizar de manera
positiva (razonablemente) la interpretacin musical. Estas tcnicas son aplicables al entorno de la
edicin para audio de televisin e incluso radio, pero el contenido ser enfocado al audio musical,
ya que es el que posee una mayor complejidad a nivel esttico y artstico.
El ngulo o filosofa creativa, en el cual la edicin busca la creacin de nuevos patrones basados en
audios pregrabados, usando las mismas herramientas que para la edicin correctiva pero con la
diferencia de un uso de tcnicas y mtodos de trabajo diferentes.
Por ltimo el ngulo o filosofa de la restauracin del audio, el cual puede llegar a ser entendido
como una combinacin de los dos puntos de vista anteriores, ya que involucra ambas visiones
cuando lo que hay que reparada ha perdido sus propiedades.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
PARTE I:
Edicin correctiva:
Introduccin:
La intensin de la edicin correctiva es, a grandes rasgos, resolver problemas originados durante la
etapa de grabacin y lograr obtener la mejor versin de interpretacin del msico de aquellas
grabaciones.
Las herramientas ms usadas para la correccin de audio siguen siendo la opcin de cortar, copiar,
pegar y mover, desde las etapas ms tempranas de la edicin. Dichas herramientas sern
igualmente necesarias en las dos categoras restantes (edicin creativa y restaurativa) por lo que
su uso es menester para una edicin fluida.
(continuar)
Donde sea posible, debemos evitar que, el hecho de tener a nuestra disposicin las excelentes
herramientas disponibles en la actualidad, permita que el proceso de grabacin sea descuidado y
flojo. Est claro que la mayora de las veces no estaremos involucrados en la etapa de grabacin,
pero si posible estarlo, debemos mantener este principio en mente, la edicin comienza en la
grabacin. La razn es muy sencilla, si invertimos tiempo en la grabacin, nos ahorraremos mucho
tiempo en la edicin, debido a que a mejor tomas de grabacin, menor cantidad de edicin se
har.
Por esta razn, debemos evitar a toda costa la actitud de esto se arregla luego, pues, habr
oportunidades donde la entrega debe ser hecha pronto y no se dispondr del tiempo necesario.
Habr situaciones donde una edicin deber hacerse en el medio de una palabra, por lo que el
desarrollo de tcnicas de edicin muy sutiles de edicin debern ser desarrolladas para una buena
calidad de la edicin.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
En todos los casos de edicin la principal herramienta es el odo. Si algo no suena bien, no est
bien, as de simple, ya sea que este en solo o en contexto, la edicin debe funcionar para ambos
casos.
Este clip digital, es debido a la manera en la que funciona un monitos o parlante, el cono imita el
comportamiento de la seal elctrica que recibe desde la computadora, produciendo la onda
acstica equivalente, si durante este proceso de reproduccin, la seal emite un cambio muy
drstico de fase, el cono ser forzado a un movimiento muy repentino, debido a una edicin hecha
en medio de un ciclo o lejano al punto cero, lo cual genera esas imperfecciones e impurezas tpicas
de una edicin de mediana a baja calidad.
Una ltima consideracin, ser ver en qu parte o fase del ciclo o tranciente estamos realizando la
edicin, ya que uno de los aspectos ms importante del sonido son sus transientes, cada
instrumento contiene un patrn muy caracterstico de sus transientes, si removemos demasiado,
alteraremos el sonido y comportamiento de ese instrumento, por lo que debemos ser muy
cuidadosos en la eleccin del lugar de corte.
Nunca se deben tomar decisiones basadas en como se ve una edicin sino en como de hecho
suena, este es un aspecto fundamental de la edicin.
4- Edicin Multi-tracks:
Hasta ahora hemos considerado la edicin de un solo canal a la vez, pero muchas situaciones
implican una edicin de mltiples canales simultneamente. El caso por excelencia de ediciones
multicanal es el de la batera con un amplio set de micrfonos.
Las mismas consideraciones de fase y punto cero deben tomarse para los fines de la edicin multi-
tracks, aun si los puntos cero de todas las pistas no llega a coincidir, el punto es lo ms cercano
posible dentro del una edicin multi-tracks sin generar problemas de fase.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
5- Posibles Problemas:
Tal vez resulte obvio para muchos, pero el hecho de que una grabacin haya sido hecha o no,
mediante el uso de un metrnomo, puede resultar muy problemtica para propsitos de edicin,
por ejemplo al copiar una seccin de la guitarra desde el coro 1 al coro 2 si ambas secciones no se
encuentra al mismo tempo, ser aun mas difcil, por lo que es un tema para tener en
consideracin. Eso significa que si no est grabado a tempo, no hay nada que se pueda hacer?
Claro que lo hay, existe una cantidad razonable de cosas que se pueden hacer para corregirlo, la
mala noticia es que podra implicar un trabajo manual y hasta artesanal muy intenso, todo va a
depender del material raz.
Existen procesos que afirman ser capaces de hacer algunas tareas de edicin automticamente,
pero la mejor manera de editar es hacindolo uno mismo.
Pro Tools posee una cantidad muy considerable de herramientas que, en combinacin con algunos
comandos o shortcuts, permite aplicar los procesos bsicos de edicin (cortar, copiar, pegar y
mover). Las herramientas disponibles para estas tareas son:
Smart Tool es una combinacin de las primeras 3 herramientas, permitindonos manipular cada
una de ellas solo variando la posicin del mouse en la regin de audio.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
Fades y Cross-fades:
1- Diferencia entre un Fade y un Crossfade:
Los Fade y Crossfade, son muy tiles a la hora de dar una transicin suave a los inicios y finales de
una regin de audio. Las diferencias entre uno y otro son meramente funcionales. Si no hay una
sobre posicin de regiones, entonces debemos usar un Fade lineal, pero si por el caso contrario,
nos encontramos frente a una sobre posicin de regiones dentro del mismo canal debemos usar
un Crossfade. Lo mismo puede ser logrado si las regiones esta en diferentes canales mediante el
uso de Fades lineales.
Una tercera manera de lograr aplicar fades a dos regiones sobre puestas en el mismo canal podra
separar ambas regiones en canales separados, de esta forma podramos aplicar diferentes formas
de Fade o incluso de diferente duracin, lo cual no es posible con el uso de Crossfades, como
explicaremos en el punto siguiente.
Existe cierto nmero de formas que podemos encontrar un Fade, todas ellas son una referencia
visual del comportamiento sobre la ganancia de la regin mientras dure el Fade, puede que
algunos DAW ofrezcan la opcin de modificar la forma del Fade de maneras adicionales, pero los
preset sern los bsicos descritos a continuacin:
a- Fade Lineal: es el ms simple de todos, simplemente una lnea recta la cual representa
una cada uniforme a lo largo de la seccin que ocupe el Fade. Sin embargo, como ya
sabemos, un aumento o disminucin de la ganancia de forma lineal no significa una
percepcin auditiva del aumento o disminucin de volumen lineal.
En el diagrama siguiente podemos ver a la izquierda la forma del fade en cuestin y a la derecha la
grafica de la percepcin del volumen:
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
Desde el punto de vista del Crossfade, la respuesta lineal implica que, en el punto donde se
conectan las dos regiones es exactamente la mitad, a un 50%, debido a esto, al encontrarse ambas
seales se produce una suma que le devuelve lo que resulte de la suma entre ambas regiones.
Asumiendo que ambas seales contengan un nivel igual o muy cercano, la seal recuperara su
50% de disminucin por la creacin del Crossfade.
Debemos ser consientes del resultado auditivo de cada Fade, ya que estamos trabajando con un
fenmeno puramente sonoro.
b- Fade Logartmico: Tiene sentido que si la respuesta de un fade lineal tiene un efecto
logartmico en la seal, podemos decir, que un fade logartmico puede tener un efecto
lineal en la seal. Este tipo de fades pueden ser usados para fade outs de larga duracin,
como el de los finales de algunas canciones. Pueden ser muy tiles al trabajar con canales
con informacin de ambientes, donde la respuesta neutral o lineal ofrece un cambio ms
proporcional en trminos de percepcin de volumen.
A la izquierda de la siguiente grafica podemos observar la forma logartmica del Fade y a
la derecha su percepcin auditiva de volumen:
Otro uso muy til de este tipo de fade, es la de ediciones que se encuentran dentro de una
palabra o frase msica, haciendo el paso de regin aun ms suave y natural.
c- Fade Exponencial: en muchas maneras, los fades de tipo exponencial son el extremo
opuesto exacto de los fades logartmicos. En primer lugar, visto desde un punto de vista de
fade-in, incrementa el volumen de la regin muy lentamente para posteriormente
presentar un aumento sbito de la percepcin de volumen al final del fade. Desde el
punto de vista de un fade-out, parece decaer muy abruptamente mientras que en un
punto, hacia el final del fade, su cada se hace mucho ms lenta.
Analicemos un momento la naturaleza de este tipo de fade. Puede crear un efecto similar
al de un acercamiento de la seal muy rpido y resulta bastante particular. Puede ser
usado para la creacin de efectos en un contexto muy particular.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
Los Crossfade creados con este tipo de respuesta exponencial resultaran en una regin
con un vacio o disminucin muy perceptible en el centro. El grado en que estos tipos de
fade puedan ser tiles depende mucho del material a editar y el contexto de la sesin.
d- Curva-S (Curve-S): Este tipo de fade resultan ms complejos de explicar que los anteriores,
debido a que su comportamiento no es ni lineal, ni exponencial ni tampoco logartmico, lo
sino una especie de combinacin entre un fade logartmico y uno exponencial. Hay dos
tipos de Curva-s, el primer tipo se comporta en principio como lo hara un fade
exponencial y en el punto medio del fade tendras un comportamiento logartmico, lo que
producir una seal con un principio de lento inicio seguido por un aumento lineal desde
el punto de vista auditivo. El fade se comportara de forma logartmica al comienzo y
finalmente de forma exponencial.
Las curvas-s tipo 2 resultan en una inversin del tipo 1, comportndose de forma
logartmica hasta la mitad del fade y luego de forma exponencial hasta el final.
En el siguiente diagrama podemos observar del lado izquierdo la curva s tipo 1 junto a su
percepcin auditiva y del lado izquierdo la curva-s tipo 2 junto a su correspondiente percepcin de
volumen.
Las caractersticas de este tipo de fades pueden ser aprovechadas para la aplicacin de Crossfades
de larga duracin.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
3- Cancelaciones de fase:
Como sabemos, la cancelacin de fase ocurre cuando un sonido cambia la relacin en grados con
otra seal, esto ocurre todo tiempo en la naturaleza y es responsable de los cambios de timbre en
recintos y el color que producen ciertas configuraciones de reverberacin, pero en el contexto de
la edicin, debemos cuidar y mantener esta relacin en grados de todas las regiones, en la medida
de lo posible y el efecto que los fades pueden tener en la misma. Para entender como la edicin
puede alterar la fase usemos un ejemplo que involucre dos sonido que no estn relacionados.
Imaginemos que tenemos una guitarra y un bajo elctrico, ambas interpretaciones ocurren
simultneamente, pero sus fases se encuentran desalineadas, es evidente que el bajo y la guitarras
no ocupan exactamente el mismo rango del espectro de frecuencias, pero si pueden llegar a
encontrarse en algn punto, si esto ocurre, y la fase esta desalineada en esa frecuencia, se
producir una cancelacin en esas frecuencias especficamente, lo cual puede resultar muy
negativo para ambos elementos.
Otro caso para considerar es el uso de Crossfades y su relacin con la fase, ya que ambas regiones
generalmente guardan una relacin muy estrecha (puede tratarse de una misma regin cortada y
unida nuevamente) lo cual puede producir un efecto de filtro de peine en el rea que ocupe el
Crossfade si la relacin de la fase no es conservada.
A la izquierda podemos observar el efecto un Crossfade sobre dos seales que no guardan relacin de fase
(con una desalineacin de 180) y a la derecha el efecto sobre la fase perfectamente alineada.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
La mejor manera de evitar este tipo de efectos es buscar los patrones peridicos de la seal, si
estamos tratando de unir regiones con un contenido similar, lo ms probable es que seamos
capaces de encontrar un patrn repetitivo que nos indique en que ciclo de la fase se encuentra la
seal y, de esta manera evitar cancelaciones durante el Crossfade.
Podemos observar un patrn repetitivo de la seal, lo cual puede permitirnos en qu momento del ciclo se
encuentra la seal al momento de la edicin.
En el caso de regiones con ligeras diferencias en tonalidad o timbre, podramos comenzar con
duraciones muy cortas del Crossfade e ir incrementando su duracin hasta conseguir la sonoridad
correcta, este mtodo evita que se produzcan grandes cancelaciones y minimiza el riesgo de
efectos secundarios de la edicin. Si cambiar el largo del fade no corrige el cambio abrupto de
timbre, podramos probar con el cambio de forma del fade e incluso realizar una modificacin
asimtrica de la curva hasta conseguir el resultado.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
Control de Niveles:
Muchos opinan que la configuracin de los niveles de la seal debera ser dejada para la etapa de
mezcla, lo cual tiene mucho sentido, pero, en el sentido estricto de la edicin, de lo que estamos
hablando es de la correccin de problemas y anomalas en los niveles.
Existe una lnea divisoria muy delgada en cuanto a lo que se debe hacer en la edicin y lo que pudo
hacerse, esto depender de cada persona, pero existen ciertos objetivos o tareas donde la
manipulacin de los niveles de la seal es completamente necesaria durante la edicin y de no
realizarse dichas tareas, los problemas pueden ser exagerados posteriormente. Un ejemplo de
este tipo de tareas que involucran la manipulacin del nivel de ganancia son los ruidos y sonidos
de ambientes que logran introducirse en la grabacin en los espacios de silencio entre frases
musicales, golpes de cables o movimientos del msico. Antes de profundizar en este tipo de casos
debemos definir dos formas de edicin mediante el control de niveles llamadas Edicin
Destructiva y Edicin No-destructiva.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
Edicin destructiva:
La edicin destructiva bsicamente consiste en realizar cambios que afecten el archivo raz de
audio de forma permanente.
Partiendo de la idea general de balancear o equilibrar la ganancia de una seal a lo largo del
tiempo de forma destructiva existe una herramienta que permite aplicar un cambio de esta
naturaleza al audio llamada Normalizacin.
Este proceso no es muy recomendado, ya que cualquier proceso adicional que pretenda
incrementar la ganancia de la seal resultara en clip digital y distorsin.
Edicin No-Destructiva:
Este tipo de edicin consiste en cambios que no afectan de forma permanente el archivo raz.
Esttica: La forma ms simple de aplicar una edicin no-destructiva sobre una seal es
sencillamente subir o bajar la ganancia, sin embargo, se debe tener presente que, al
realizar maniobras de esta naturaleza, la respuesta de plugins que sean dependientes de la
ganancia (compresores, puertas de ruido, etc.) se ver completamente alterada mas alla
de un cambio en el volumen. Por el otro lado, puede ser esto lo que se desea, por
ejemplo, en una seccin donde la compresin es demasiado fuerte y deseamos suavizarla,
una manera de lograrlo sin alterar la configuracin del compresor ser alterar la ganancia
de la seal, otro ejemplo podra ser una regin que por su bajo nivel no logra activar la
puerta de ruido, por lo que variando el nivel de ganancia podramos lograr que la seal sea
procesada de la forma en la se necesita por la compuerta.
Una funcin que puede ser til para este tipo de variacin de ganancia es la lnea de
ganancia, que permite escribir directamente las variaciones en la lnea de tiempo, aunque
esta opcin est diseada para variaciones mucho ms sutiles, funciona bien para el
cambio de ganancia de regiones completas. En todo caso, el objetivo principal de este tipo
de modificaciones de la seal deben ser hechas con el fin nico de corregir anomalas o
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
problemas, no como parte de un proceso creativo a no ser que esta edicin forma parte
del proceso de mezcla propiamente dicho.
Variable: Este tipo de edicin es muy similar a la forma esttica, pero con un nivel mayor
de control, es decir, de una forma ms focalizada en los detalles de la interpretacin. Un
ejemplo puede ayudarnos a entender: Imaginemos que deseamos crear un canal definitivo
(Master) de la voz principal a partir de diferentes tomas y notamos que en la toma que
deseamos aadir, el cantante ejecuto una nota en el medio de una palabra con ms fuerza
que en la toma que deseamos reemplazar, por lo que la diferencia entre las dos tomas es
evidente, es por esto que debemos aplicar una alteracin de la ganancia con el fin de
homogenizar la transicin entre las tomas. Es importante darnos cuenta de la delgada
lnea entre la edicin y la mezcla que existe en este tipo de edicin, pero, debido a que
esta tcnica es usada con el fin de recolectar las mejores tomas y unirlas con la edicin
ms invisible posible, podemos considerar este proceso como parte de la edicin.
Generalmente, es en este punto, donde muchos tienen el impulso de ir ms all y realizar
cambios ms drsticos bajo un criterio creativo, pero debemos mantener una disciplina
para mantener el enfoque correcto y objetivo con respecto al trabajo que se espera del
editor y no realizar este tipo de cambios.
Automtica: En esta tipo de edicin se debe ser muy cuidadoso, ya que implica ir mucho
ms all mediante el uso de plug-in para realizar cambios en los picos excesivamente altos
de la seal, sin afectar en lo absoluto el valor promedio de la seal, solo valores puntuales.
Un ejemplo de esto es el de una batera que contienen picos puntuales a lo largo de la
seal que resultan excesivos para lo que se espera de ese material en la mezcla, por lo que
podramos usar un compresor con una configuracin muy gentil (no ms de un ratio de 4:1
y un Umbral 2 o 3 decibeles por encima del nivel de la seal promedio), este tipo de
configuracin no tendr ningn tipo de efecto sobre la seal, a excepcin de los picos de
muy alto nivel. Si observamos que el compresor acta muy frecuentemente debemos
reajustar el Umbral hasta limitar su accin. Para procesamientos de este tipo, los plugins
que son los ms adecuados son aquellos ms transparentes. Este tipo de procedimientos
depender completamente de la naturaleza del cliente y del material musical.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
direccin del mismo con respecto a la fuente. Debido a este comportamiento, es posible
que la fuente se desplace con respecto al micrfono a lo largo de las diferentes tomas. Un
ejemplo sera el de un guitarrista que se ha movido o cambiado ligeramente su posicin
durante la grabacin de las tomas. Otro ejemplo es que diferentes tomas hayan sido
grabadas con diferentes micrfonos o en diferentes habitaciones, esto no es muy comn
pero puede pasar, sobre todo si esas tomas han sido grabadas en momentos y lugares
diferentes.
Otra posibilidad es que el cantante haya ejecutado de forma ligeramente diferente (por
fatiga o estado emocional) cada toma. Un violinista puede haber tocado una cuerda de
forma diferente en varias tomas y esto produce una diferencia tonal. La naturaleza de
estos cambios puede ser sutil o por el contrario ser muy drstica.
Estas diferencias pueden ser corregidas mediante un sencillo procedimiento pero que
requiere un buen par de odos.
A pesar de no ser 100% efectivo, el EQ Matching puede ser un buen punto de partida,
desde este punto de vista, podemos aplicar un anlisis mediante el plugin para luego
intentar copiar el resultado en otro plugin de EQ mas preciso y de esta forma, usar la
opcin de Matching como un punto de partida.
AUDIOPLACE: Academia de Ingeniera y Produccin Musical
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
La recopilacin de tomas consiste en tomar las mejores tomas de una serie de grabaciones
para la creacin de una versin final o master. Es una tcnica muy comn, pero es
especialmente usada para la voz.
Es por este motivo que comnmente son realizadas repetidas tomas de una misma
seccin, esto es gracias al hecho de que ahora los discos duros son capaces de almacenar
grandes cantidad de informacin, por lo que se debe aprovechar este recurso para tener
la mayor cantidad de muestras que sean necesarias para realizar una versin final con la
mayor cantidad de recursos disponibles. Aunque no es menos cierto que puede que
veamos casos que la interpretacin resulta perfecta en unas pocas tomas, tampoco es
menos cierto que este no es un caso comn. Adicionalmente, dos tomas pueden resultar
perfectas y aun as, ser diferentes en muchos aspectos, por lo tanto podramos crear una
versin incluso mejor, si disponemos de varias tomas de buena calidad.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
En este orden de ideas, elegiremos un color para las tomas con mayor
probabilidades de pertenecer a la versin final, otro color para las que son usables
para la sustitucin de frases o palabras, otro color para aquellas de las que no
estemos realmente seguros y otro para las que presentan mayores problemas.
El procedimiento debe comenzar de macro a micro, es decir, primero debemos
elegir la mejor toma de cada parte de la cancin o secciones, por ejemplo, coro,
verso 1, puente, etc. Posteriormente realizar un separado por palabras o frases y
elegir la mejor, de esta manera, el proceso se hace de forma ms ordenada y
metdica.
Podramos considerar este paso como uno muy artstico, debido a que la eleccin
de tomas ser hecha a partir de, por un lado, un criterio objetivo de interpretacin
en cuanto a la afinacin, el tempo, pronunciacin de las palabras en el caso de la
voz y, por el otro lado, al tener dos tomas correctas, nuestra eleccin es basada en
la cualidad artstica entre ambas opciones y esta es un medida muy subjetiva.
2- El tono correcto: Puede ocurrir, que el tono de las diferentes tomas sea
ligeramente diferente, como vimos en un apartado previo de este documento.
Debemos tomar en cuenta el tono como uno de los criterios para recopilar tomas,
por lo que adems de ser una buena interpretacin, un criterio adicional ser que
posean el tono ms parecido posible, para que la aplicacin de EQ sea lo ms sutil
posible.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
Este proceso alteraba en pequeas cantidades la altura tonal del tema, si se reproducan a
una velocidad menor, el pitch bajaba y viceversa. El margen para que dicha reduccin o
aumento de altura tonal se mantuviese por debajo de un semitono es menos del 7% de la
velocidad de reproduccin, de hecho, un cambio de 5,946% en la velocidad de
reproduccin, resultara en un semitono de alteracin.
Debemos recordar, que las transientes son las que nos permiten identificar los sonidos
correctamente y, cualquier alteracin de las misma, incluso en pequeas cantidades,
puede afectar la manera en la que los sonidos son interpretados, aun si la relacin de los
armnicos no es alterada.
Con la introduccin del audio digital, fue posible separar la duracin (tempo) de la altura
tonal (pitch), pero a pesar de ser revolucionarias, las primeras versiones de Time-
Stretching no se asemejan a las opciones disponibles hoy en da en cuanto a calidad. Los
avances en la investigacin de la Psico-acstica han mejorado nuestra compresin de
cmo percibimos el sonido y a travs de ello ha mejorado la calidad y versatilidad de los
sistemas de Time-Stretching o tambin conocidos como Algoritmos.
Ahora bien, Por qu resulta tan difcil simplemente aumentar o disminuir la duracin de
una regin de audio?
Supongamos que tenemos una grabacin de una onda senoidal de 100Hz que dura 1
segundo, para alargar la duracin sin alterar el pitch, digamos un 25%, simplemente
AUDIOPLACE: Academia de Ingeniera y Produccin Musical
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
realizamos el clculo de los ciclos que haran falta para completar en un 25% la duracin
de la toma. Al duplicar los ciclos en la cantidad calculada podemos obtener la duracin
deseada.
Este sistema de clculo para alterar la duracin de una regin, solo funciona si no existen
cambios de amplitud, tono o frecuencia, como es el caso de los instrumentos musicales y
los sonidos presentes en la naturaleza.
Cada sonido tiene una firma nica, la cual, los hace reconocibles por el cerebro, esta firma
est constituida no solamente por la frecuencia fundamental y la envolvente de la
transiente sino adicionalmente sus armnicos y cambios a travs del tiempo, ya que la
frecuencia fundamental puede permanecer a lo largo del tiempo, pero sus armnicos van
desapareciendo a medida que se desarrolla el sonido. En teora, todo sonido puede ser
descompuesto en una serie finita de armnicos y si son analizados con un suficiente nivel
de detalle sus caractersticas de amplitud a travs del tiempo, podramos entender la
firma de cada sonido y con la cantidad suficientes de osciladores podramos incluso
recrear cualquier sonido existente. Esta teora no solo es la base de algunos aspectos del
Time-Stretching sino que nos recuerda a la teora de la sntesis aditiva.
A continuacin, se explican las consideraciones sobre el anlisis que debe hacerse sobre el
audio para lograr la expansin y compresin de tiempo:
Existen dos consideraciones que se deben tener presentes, la primera es que el proceso
de expansin de la duracin de un sonido en el tiempo sin alterar su timbre no debe
incluir a la transiente inicial pues, como sabemos, esta parte del audio es la que permite
reconocer los sonidos, y la segunda es que la relacin entre los armnicos cambiara si la
frecuencia fundamental es alterada, es decir, si cambia la nota fundamental de un sonido,
la relacin matemtica que hay entre los armnicos tambin cambiara.
En base a estas dos consideraciones previas, podemos decir que el anlisis de una forma
de onda para su expansin debe incluir ambos criterios, el primero es que no debe
cambiar la relacin entre los armnicos y la segunda es que el procesamiento debe dejar
intacta la transiente inicial.
Entonces, para lograr una expansin, se tienen que realizar una serie de anlisis
matemticos complejos para determinar exactamente en qu proporcin sern
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
Asumiendo que hemos realizado todos los clculos referentes a la distancia entre
armnicos, incluso si la frecuencia fundamental es alterada y, que tomamos en cuenta la
duracin de la transiente inicial, en teora, somos capaces de expandir una regin de
audio, con una duracin de 2 segundos para llevarla a 4 segundos.
Fcilmente podramos decir, que simplemente hara falta multiplicar por un factor de 2,
pero existe un problema con este mtodo, no se ha considerado el tiempo de la transiente
inicial, que podemos suponer que es de 0.2 segundos, por lo que la duracin real del audio
que deseamos expandir es de 1.8 segundos, esto altera la proporcin en la que la regin
ser expandida para alcanzar los 4 segundos de duracin, es decir, el audio debe ser
expandido de 1.8 a 3.8 segundos, el factor multiplicador ahora ser de 2,11, dicho factor
es hallado mediante la aplicacin de una regla de tres simple:
Si decimos que 1.8 multiplicado por 2 es 3.6, cul ser el nuevo factor multiplicador para
alcanzar los 3.8 que hacen falta?
3.6---------2
3.8---------X
Esto nos lleva a la conclusin, de que el algoritmo debe ser eficaz detectando las
transientes y el contenido armnico de la seal para lograr su alteracin de tiempo sin
alterar el tono del sonido ni sus caractersticas que lo hacen reconocible por el cerebro.
Otro mtodo de edicin que aplican algunos programas para la expansin y compresin
de tiempo est basado en la misma teora de la sntesis granular, la cual hace referencia a
la divisin de un audio en pequeas muestras. Digamos por ejemplo que logramos separar
un sonido en pequeas partes o granos y deseamos comprimir la regin en un 50% (la
mitad) de su duracin, en esta situacin, podemos aplicar dos mtodos bsicos:
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
2- El otro mtodo consiste en solo reproducir la mitad de las muestras, es decir, eliminar
la mitad de los ciclos para comprimir la regin, el problema es que la omisin de algunos
granos puede resultar en un cambio drstico del timbre por su contenido armnico.
Para trabajar efectivamente con la tcnica granular, necesitamos un sistema efectivo para
la deteccin de las transientes para excluirlas del proceso de compresin/expansin.
O por el otro lado, la transiente debe ser incluida en un solo grano. Si normalmente un
grano tiene una duracin de unos pocos milisegundos y la transiente tiene una duracin
de 100ms, sta no ser incluida en un solo grano, para corregir esto, simplemente
podemos aumentar la duracin de cada grano a 100ms. Adicionalmente debemos tener el
cuidado de no repetir este primer grano que involucra a la transiente inicial.
Esta tcnica es muy efectiva para la expansin y compresin de bateras, pero puede ser
usada en algunas consonantes de la voz como la T, K y D.
La ventaja de este mtodo, es que no requiere un anlisis de todo el archivo para conocer
su comportamiento en el tiempo, por eso, resulta efectivo en aplicaciones a tiempo real.
La desventaja es que depende mucho del material y podra no ser muy tan efectivo como
otros mtodos.
Lo primero que se debe considerar antes de usar cualquier tcnica o programa de Time-
Stretching es cuanta expansin o compresin se va a aplicar al audio, esto depender de
varias circunstancias:
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
1- Ajustar una cancin a una duracin de tiempo especifica. Por ejemplo, ajustar una pieza
musical a la duracin de un comercial de trece segundos a la perfeccin. Este tipo de
compresin est basada en trminos de tiempo absoluto.
2- Ajustar el tempo de un loop o frase musical al tempo de una sesin. Por ejemplo, un
loop de batera con un tempo de 110bpm a una sesin con un tempo de 120bpm. Esta
compresin est basada en trminos de tempo.
3- Ajustar un audio con una duracin de compases, a otra duracin. Por ejemplo, un audio
con una duracin de 9 compases a una duracin de 8 compases. Este tipo de compresin
est basada en trminos de duracin de compas.
Nota: Una caracterstica del Time-Stretching es que no puede hacerse a tiempo real y es
una forma destructiva de edicin, lo que significa que cualquier cambio creara un nuevo
archivo de audio y si se necesita volver a realizar otro cambio, es necesario buscar el audio
original para realizar nuevamente la expansin o compresin off-line.
La idea de Elastic Audio que es posible nicamente por los avances en la tecnologa del
procesamiento de las computadoras, pues, en esencia, se trata de otra forma de realizar
el Time-Stretching pero con dos diferencias fundamentales:
Diferentes Algoritmos:
1- Polyphonic: Este algoritmo est diseado para material con contenido tonal variable y
complejo, como por ejemplo una guitarra o una cancin completa, es considerado el
AUDIOPLACE: Academia de Ingeniera y Produccin Musical
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
El plug-in incluye dos controles que permiten calibrar el algoritmo para mejores
resultados:
La ventana de control de duracin (Window Length Control):
Este control permite asignar la duracin de las secciones de audio en la que ser dividida
la regin, tambin llamada tamao de grano o Grain Size. Permite una duracin entre
6ms y 185ms para cada porcin.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
Follow Control:
Este control activa el seguimiento de la envolvente de la seal original, lo que quiere decir
que la calidad de la dinmica original ser impuesta a la versin procesada, esta opcin
permite mantener el carcter del sonido original.
2- Rhythmic:
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
En la imagen siguiente se puede observar con un nivel mayor de detalle donde comienza
la repeticin del segundo ciclo y cuantas veces es duplicado, en color rojo el primer ciclo y
en amarillo el segundo ciclo. Este procesamiento ha sido hecho de la forma ms agresiva
posible con el objetivo de ilustrar el funcionamiento del plug-in.
4- Varispeed: Este algoritmo realiza la expansin y compresin con alteracin del pitch,
puede ser muy til para crear efectos sonoros creativos pero no funciona para tareas ms
tcnicas de correccin transparente, ya que funciona de la misma manera en la que lo
hace una maquina de cinta, si se disminuye la velocidad para que el audio aumente su
duracin, el pitch desciende y viceversa.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
5- X-Form: Este algoritmo es diferente a los dems, debido a que no puede usarse en
tiempo real. Puede ser usado para variar la duracin de un archivo de audio como una
cancin completa.
Quality Control:
Este control determina la calidad del audio y su velocidad de procesamiento, a mayor
calidad, menor velocidad en el procesamiento off-line.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
Formant Control:
Este control permite conservar las formantes ms claras del material.
Nota: La formante es la forma de una seal que resulta de la fuerza o amplitud de los
armnicos, esta fuerza es la que determina el carcter de un sonido.
Posteriormente el plug-in realiza un anlisis de la forma de onda, el mismo puede tardar
dependiendo de la duracin del clip de audio y el algoritmo aplicado.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
Para gver las marcas de evento de transiente o Event Transient Markers que ha
generado el algoritmo se debe cambiar la visualizacin del canal a su formato de anlisis.
Estas marcas denotan los picos ms altos (de mayor amplitud) de la forma de onda. Para
agregar marcas que no se hayan generado se oprime Control+Grabber tool (Mac)
Men+Grabber tool (Pc).
Deformacin (Warp):
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
Existen dos tipos de Markers, los de Evento y los de Deformacin, en la imagen superior
en rojo se resaltan los Markers de Deformacin en color rojo y en color amarillo el Marker
de Evento que es generado en el momento del anlisis del algoritmo.
Para producir lo que se conoce como deformacin o warp se debe cambiar la vista del
canal (en esta vista es posible generar Markers de Deformacin):
Esta tcnica de deformacin permite modificar una seccin del audio creando dos markers
de deformacin automticamente en los extremos del punto que ser movido, se realiza
manteniendo presionada la tecla Shift mientras se hace click en el lugar preciso del
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
Este tipo de deformacin es aplicada sobre todo el audio y no sobre una seccin
especfica. Para realizar este tipo de deformacin, simplemente debemos situar el cursor
sobre cualquier Marker de evento generada durante el anlisis (No deben de haber
Markers de Deformacin)
Este tipo de deformacin solo es posible cuando existe un solo Marker de Deformacin
dentro de la regin de audio.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
Un ejemplo de esta contaminacin podra ser una sirena de ambulancia dentro de una
grabacin de una guitarra o locucin o el sonido de un auto pasando justo en el momento
que se graba la voz. Este tipo de casos son frecuentes en lugares sin aislamiento acstico.
En los estudios tratados acsticamente, es comn que los msicos generen ruidos que
pueden afectar la grabacin y ser igualmente pasados por alto, tal es el caso del ruido que
se produce al golpear el paral que sostiene el micrfono o un sonido de telfono celular
sonando a bajo nivel, el sonido de un collar o incluso el sonido de los zapatos del msico al
moverse. Todos estos ejemplos son comunes en todos los entornos de grabacin y
pueden ser pasados por alto hasta la etapa de edicin e incluso de la mezcla.
El tratamiento para este tipo de material, debe ser capaz de extraer esos ruidos sin afectar
la seal de forma significativa o destructiva.
Para ello, existen una serie de tcnicas que implican la aplicacin de procesos
tradicionales de ecualizacin, compresin y procesos dedicados a esta clase de tareas.
Para entender esta tcnica, debemos recordar, que un sonido est compuesto por una
serie de ondas con una relacin matemtica, los armnicos, los cuales, componen el
carcter de los sonidos y los hace reconocibles. Estos armnicos nacen de una onda
fundamental.
Con ese principio en mente, para remover un sonido que esta sobre otro ruido, se debe
identificar la frecuencia fundamental del ruido y reducirla junto a sus respectivos
armnicos:
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
En la imagen, se puede apreciar una onda con su armnico justo encima, en esta
representacin la seal es representada en el tiempo por la horizontal, la frecuencia en la
vertical y la amplitud se representa en la intensidad del brillo.
Por lo tanto, se debe aplicar un anlisis espectral del audio para conocer la frecuencia
exacta y su comportamiento a travs del tiempo para eliminarla con precisin.
Con esta informacin, es posible automatizar los parmetros de un ecualizador para que
realice la limpieza. Se debe aplicar una reduccin tanto de la fundamental, como de cada
uno de los armnicos para que el sonido desaparezca por completo.
Este tipo de tratamiento puede llegar a ser complejo y muy difcil de lograr con la
precisin suficiente para que la edicin sea imperceptible, sin embargo, es posible y
algunos casos resultan ms sencillos que otros.
Debido a la complejidad y el tiempo que puede consumir esta tcnica para la edicin de
sonidos que son de caractersticas en el tiempo variables, ya sea la amplitud o la
frecuencia, es ms recomendable usarla en material con un comportamiento ms
uniforma como el sonido de un golpe o ruido de artculos como collares o ruido de
zapatos que son de naturaleza mas uniformes y momentneas ya que existen otras
herramientas disponibles para tratamientos ms complejos.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
La misma tcnica empleada en la ecualizacin para la edicin espectral puede ser aplicada
en un compresor con mltiples bandas, la diferencia fundamental entre ambas es que esta
vez se aplica un reduccin de la amplitud basada en los cambios de amplitud, es decir, si la
seal cambia su amplitud, la reduccin ser mayor y mas uniforma para sonidos con un
comportamiento variable de esta caracterstica a travs del tiempo. Sin embargo, esta
tcnica posee la misma complejidad para la automatizacin de mltiples variables como la
frecuencia y la amplitud en el tiempo simultneamente.
Esta tcnica ofrece las mismas ventajas y desventajas en cuanto a la edicin de material
ms complejo como por ejemplo una sirena de ambulancia o el ruido de fondo como la
calle o gente caminando.
Existen una gran variedad de plug-in dedicados al tratamiento de ruidos producidos tanto
por la contaminacin snica del ambiente, como para defectos puntuales como los clips
de una edicin o el sonido de un aire acondicionado, algunos funcionan creando un perfil
de ruido a cancelar o mediante el anlisis de la duracin de ciertos perfiles configurados
en el software.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
III.V. Posibilidades de edicin de los DAW:
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
Software gratuito:
Hay herramientas para la edicin espectral en software como Audacity disponible hasta su
versin 2.1.2 actualmente, es gratuito y su aplicacin est disponible para Pc y Mac.
EDICION 2 4TO TRIMESTRE AUDIOPLACE ING. RODRIGO ROBLES
El mismo procedimiento que se aplica para eliminar una conversacin lejana puede ser
usado para aislar esa misma conversacin, sin embargo, este procedimiento puede
resultar mucho ms difcil, pero ciertamente posible.
Demixing:
Dado que las frecuencias y sus armnicos en el material musical est relacionado, resulta
difcil separar elementos basados en su anlisis espectral sin alterar el tono de otros
elementos con los cuales est relacionado armnicamente, por lo tanto, si imaginamos
una guitarra que tiene una frecuencia fundamental en un momento dado de 440Hz y
resulta que la voz coincide con esta frecuencia en algn punto con la guitarra, entonces, al
extraer la voz, se afectara el tono de la guitarra en esos momentos precisos.