DiLiscia Localizacion - Espacial.de - Sonido.usando - Indicios.de - Intensidad.y.tiempo PDF

Captulo III
Tcnicas de localizacin espacial de sonido con

altoparlantes usando indicios de intensidad y tiempo
Oscar Pablo Di Liscia
Introduccin
En los captulos i y ii de este libro se han tratado los indicios (i.e., los rasgos
distintivos de la seal acstica) que utiliza el sistema auditivo para evaluar sus
caractersticas espaciales.
En este captulo se tratarn diferentes tcnicas para la simulacin de los
indicios de intensidad y tiempo en seales acsticas para ser reproducidas con
sistemas de mltiples altoparlantes. Las tcnicas que se tratarn no son todas
las existentes, pero se ha intentado cubrir los aspectos ms bsicos y corrien-
temente utilizados.1
Las aplicaciones y/o dispositivos tecnolgicos que trabajan sobre la cua-
lidad espacial del sonido intentan imitar lo mejor posible aquellos rasgos de
la realidad sonora que sirven mejor a sus propsitos. Pero dado que no nece-
sariamente la imitacin perfecta de la realidad conduce al resultado percep-
tivo ms plausible, y que deben tenerse en cuenta cuestiones de eficiencia y
recursos involucrados, parece no existir una solucin tecnolgica perfecta. Sin
embargo, se puede afirmar que los numerosos desarrollos e investigaciones en
el tema han producido un considerable progreso en la efectividad perceptiva
de las tecnologas que actualmente se usan.
Las tcnicas de dsp (Digital Signal Processing o procesamiento de seal
digital) que se emplean en la espacializacin de sonido han sido y son
extensamente investigadas desde hace tiempo. El trabajo de John Chowning
(1971), quien es el primero en desarrollar un programa de computacin para
espacializacin de sonido, constituye una referencia inicial en esta rea.
Afortunadamente existe una gran cantidad de investigacin y desarrollo tec-
1 Algunas tcnicas, como Ambisonics, no se tratarn en este captulo, porque se desarrollan

in extenso en el captulo v de este libro. Otras, como las basadas en datos espectrales binau-
rales (hrtf), tampoco se tratarn por no ser apropiadas para la simulacin de localizacin
usando altoparlantes.
99
nolgico muy bien documentados sobre el tema (vanse Moore, 1983, 1989
y 1990; Chowning, 1971; Dodge, y Jerse, 1985; Kendall et al., 1989; Moorer,
1979; Karpen, 1998 y Cetta, 2007, entre otros) a la que el lector puede recu-
rrir para ampliar lo que se expondr.
Tcnicas de espacializacin basadas en indicios de intensidad
Si se conocen la ubicacin espacial de una fuente sonora, sus caractersticas

direccionales y la ubicacin del/de los posible/s oyente/s, se puede calcular la
cantidad de energa acstica entregada por esta fuente sonora y simularla con
un sistema de sonido que tenga un nmero de canales y una ubicacin de sus
altoparlantes determinados.
Las tcnicas que se tratarn a continuacin intentan simular por medio
del escalamiento de la amplitud de la seal tres aspectos bsicos: 1) la ubica-
cin angular de la fuente; 2) la distancia entre oyente/s y fuente acstica; y 3)
las caractersticas direccionales (o directividad) de la fuente acstica.
Simulacin de la ubicacin angular en dos dimensiones

por medio del panormico de intensidad
Uno de los procedimientos ms difundidos para lograr la localizacin angu-

lar se denomina intensity panning (panormico de intensidad) y se basa en
la simulacin del indicio denominado iid2 a travs del escalamiento de la
amplitud de la seal que corresponde a cada canal de audio. Con esta estrategia
se pretende engaar al oyente intentando que crea que una fuente acstica
se encuentra en una ubicacin en la que en realidad no se encuentra, a causa
de la combinacin de la intensidad de las seales que emite cada altoparlante.
Por esta razn, se suele denominar fuente fantasma a la fuente sonora virtual
que crean los altoparlantes.
Para simular una fuente de sonido localizada en un ngulo determinado3
usando la tcnica de panormico de intensidad, la seal producida por la
fuente del sonido virtual debe ser distribuida entre pares de altoparlantes y
debe escalarse por dos valores de ganancia de manera proporcional a dicho
ngulo. La ley precisa que rige el clculo de dichos valores de ganancia todava
se sigue investigando, y hay autores (Pulkki, 2001) que piensan que no puede
2 Interaural Intensity Difference, o diferencia interaural de intensidad. Vase el captulo i de

este libro.
3 No estrictamente cualquier ngulo, dado que cada tcnica tiene sus limitaciones.
100
resolverse con una funcin simple. Algunas de las funciones ms utilizadas
para el panormico de intensidad son: la funcin lineal, la ley del seno y
la energa constante (tambin llamada ley de la tangente, o panormico de
coseno/seno).
Es sencillo conjeturar lo que la funcin lineal realiza. Calcula la ganancia de

cada uno de los dos canales de audio de acuerdo con un ngulo (expresado
en radianes) de la fuente virtual, usando las siguientes ecuaciones:
g1 = 1 - / M E. 1
g2 = / M E. 2
para M <= /2 y >=0.
La llamada ley del seno se basa en la siguiente ecuacin:
g1 - g 2 sin( s )
=
g1 + g 2 sin( 0 ) E. 3
en la que S es el ngulo de la fuente virtual y 0 es la mitad del ngulo

mximo de separacin de los altoparlantes. Por lo tanto:
g1 sin( 0 ) + sin(s )
=
g 2 sin( 0 ) sin(s) E. 4
Los valores de ganancia para cada canal que surgen de la ecuacin anterior
deben ser normalizados para su uso prctico, ya que solo se establece la rela-
cin entre ellos. Para ese propsito se usa la siguiente frmula:
p p p
g 1 + g 2 =1 E. 5
en la que es corriente que p tenga un valor de 1 (si se desea mantener la ampli-

tud constante) o de 2 (si se desea mantener la energa constante).
Una de las maneras ms sencillas de realizar el llamado panormico de energa

constante se basa en la siguiente identidad trigonomtrica:
cos () + sin () = 1 E. 6
En este caso es fcil ver que, dado que la energa acstica equivale al cuadrado
101
de la amplitud, la suma de las ganancias de ambos canales elevada al cuadrado
ser siempre igual a la unidad, conservando as la energa total entregada cons-
tante para cualquier ngulo. Es decir:
g1 () + g2 () = 1 E. 7
Por lo tanto, si asumimos que tenemos dos altoparlantes en ngulos de 0 y

/2 radianes, la ganancia para cada canal deber ser calculada de la siguiente
manera:
g1 () = cos () E. 8
g2 () = sin () E. 9
en donde es el ngulo de posicin de la fuente virtual, en el rango de 0 y

/2 radianes.
Finalmente Chowning (1971) postula otra ley para el clculo de las ganancias
de cada canal:
1 + tan( max /2)
g () =1 E. 10
1 2
g 2 () = 1 + tan( max /2) E. 11
en donde max es el ngulo mximo de separacin entre los parlantes.
En la figura 1 pueden observarse cuatro grficos de la evolucin de los valores

de ganancia para dos canales que corresponderan respectivamente a un alto-
parlante situado a 45 (derecha, canal 2) y a otro situado a 135 (izquierda,
canal 1) para un ngulo que vara entre 45 y 135. Se asume que el oyente
est situado en el origen, enfrentndolos. Los otros dos canales muestran, res-
pectivamente, la energa total entregada (g12+g22) y la amplitud total (g1+g2)
desplegada por el par de altoparlantes. Los grficos corresponden a cada una
de las funciones explicadas:
Existen muchos trabajos sobre evaluacin de la efectividad perceptiva en
la localizacin espacial de estas y otras tcnicas. En general, se puede decir que
siguen tres estrategias: 1) anlisis de la realidad fsica, modelizacin matemtica
y posterior anlisis de su correspondencia con los procedimientos (West, 1998;
Bamford, 1995); 2) implementacin de un modelo virtual de oyente mediante
la simulacin de indicios auditivos espaciales muy robustos, al que luego se ali-
menta con las seales resultantes de cada tcnica. La posterior evaluacin de la
respuesta de este sistema tiene las ventajas de que las seales no estn contami-
102
1
g(ch1)
0
1
g(ch2)
0
g(ch1)2 1
+ g(ch2)2
0
g(ch1) 1
+ g(ch2)2 0
Lineal Ley del seno (con p=1) Energa constante Chowning, 1971
Figura 1
nadas por las impresiones subjetivas de cada oyente y de que permite la experi-
mentacin extensiva sin grandes costos e infraestructura (Pulkki, 1999); y 3) test
perceptivos realizados con oyentes (Guastavino et al., 2007; West, 1998).
Una de las debilidades de la tcnica de panormico de intensidad
mediante pares de altoparlantes es la falta de homogeneidad de la imagen
sonora que produce. En efecto, cuando la fuente virtual se ubica en el mismo
ngulo que un altoparlante, se obtiene una imagen sonora puntual y precisa,
dado que la energa sonora irradia solo de este altoparlante. Por otro lado,
cuando la fuente sonora virtual se ubica entre dos altoparlantes, la imagen
sonora es difusa, porque se produce por la suma de las seales que emiten. Las
tcnicas que usan siempre todos los altoparlantes de un sistema4 poseen una
mayor homogeneidad en este sentido. Desde ya, es obvio que este problema
disminuye en la medida en que se usan ms altoparlantes.
Otra de las debilidades del panormico de intensidad, que es comn a
todas las tcnicas, es la que se deriva del efecto de precedencia.5 A causa de este
efecto, en la medida en que el/los oyente/s estn alejados del punto ideal de
audicin tienden a atribuir la ubicacin de la fuente virtual al altoparlante
ms cercano. La decorrelacin de las seales de los diferentes altoparlantes
de un sistema mediante filtros todopaso (alpass) con distribucin aleatoria de
las fases en varias bandas de frecuencia ayuda a sobrellevar este incoveniente
(Kendall, 1995).
Simulacin de la distancia mediante indicios de intensidad
Las tcnicas de panormico de intensidad no tienen en cuenta la distancia

de la fuente al oyente.6 La distancia entre fuente virtual y oyente/s se puede
4 Por ejemplo, Ambisonics. Vase el captulo v de este libro dedicado a esta tcnica.
5 Vase el captulo i de este libro.
6 En efecto, son tcnicas de localizacin angular.
103
simular sencillamente escalando la amplitud de la seal de la fuente virtual de
manera proporcional a la distancia entre esta y el/los oyentes.7 Para tener en
cuenta la distancia, las ganancias de cada canal de audio en un sistema estreo
pueden calcularse de acuerdo con las siguientes ecuaciones:
Ch1 = g1 () / (distancia + offset) E. 12

Ch2 = g2 () / (distancia + offset) E. 13
El trmino offset es necesario para prevenir los casos en que la distancia es

menor a la unidad (especialmente cuando es cero).
Investigaciones psicoacsticas (Stevens, 1970) han mostrado que la
simulacin de los indicios de distancia es ms efectiva si se usa un escalamien-
to diferente. Siendo este el caso, un exponente de escalamiento puede ser usado
para elevar el factor de distancia a una potencia mayor que uno, produciendo
as una funcin de amplitud ms pronunciada (exagerada) en la medida en
que la fuente se acerca o aleja del oyente:
factor de distancia = (distanciaexponente) + offset E. 14
Por lo tanto, la ganancia para cada altoparlante, teniendo en cuenta tanto el

ngulo que forma la fuente como su distancia al oyente, debera ser calculada
de la manera siguiente:
Ch1 = g1 () / factor de distancia E. 15

Ch2 = g2 () / factor de distancia E. 16
Es posible extender el uso de los procedimientos explicados a sistemas de

altoparlantes ubicados en ngulos diversos del plano horizontal. Si bien son
posibles varias configuraciones, es corriente elegir aquellas que ubican los
altoparlantes a ngulos iguales y en puntos equidistantes del origen. Una
configuracin tpica muy usada es la llamada cuadrafona, que consiste
en cuatro altoparlantes separados por ngulos de noventa grados (vase la
figura 2).
7Por supuesto, existen otras tcnicas para simular la distancia entre fuente y oyente/s. Entre
ellas, la utilizacin de filtros para imitar la absorcin de la humedad y el efecto de proximi-
dad. Adems, en recintos cerrados, la proporcin entre reverberacin densa y seal directa
es un indicio muy robusto para la estimacin de distancia. Tales recursos no sern tratados,
dado que exceden los objetivos de este captulo. Vase al respecto: Cetta (2007), Di Liscia
(2004, cap. 9), Moore (1990, cap. 4) y Moorer (1979).
104
Dist = x*x + y*y
amp=
amp= sin( -45) / Dist
cos( -45) / Dist
(amp= 0)
Figura 2
Por ejemplo, el procedimiento de escalamiento de intensidad en dos dimen-

siones de acuerdo con la distancia y el ngulo horizontal, trasladado a cuatro
altoparlantes, consistira en los siguientes pasos: a) determinar la distancia
entre la fuente y el oyente (generalmente se asume, por razones de simplici-
dad, que este est situado en el origen), y escalar la amplitud de la seal de
entrada de acuerdo con la distancia; b) determinar el ngulo entre la fuente
y el oyente (se asume, por razones de simplicidad, que este est situado en el
origen); c) determinar entre qu par de altoparlantes se encuentra ubicada la
fuente; d) escalar la amplitud del par de altoparlantes entre los que se encuen-
tra la fuente virtual de acuerdo con la tcnica de intensity panning ya explicada,
usando alguna de las funciones que se han comentado anteriormente (lineal,
ley del seno, ley de la tangente, etc.) y poniendo especial cuidado en man-
tener el rango adecuado de los ngulos para cada caso; y e) poner en cero la
amplitud de los restantes altoparlantes.
La figura 2 clarifica lo antedicho tomando como base un espacio bidi-
mensional y una disposicin de cuatro altoparlantes en un cuadrado con
ngulos de 45, 135, 225 y 315, y usando el panormico de coseno/seno
(energa constante):
La figura 2 tambin ilustra el clculo de amplitud para la simulacin de una
fuente sonora ubicada al frente, entre los altoparlantes i y ii (ms cerca de i, a la
derecha), simbolizada con un crculo sombreado. Puede verse cmo la ganancia
105
de la seal para los altoparlantes i y ii se calcula de acuerdo con el ngulo entre
la fuente y el oyente (), y la distancia entre la fuente y el oyente (D).8 Por otro
lado, los altoparlantes iii y iv tienen ganancia cero para el directo en este caso.
Simulacin de la ubicacin angular en tres dimensiones

por medio del panormico de intensidad
La extensin de la tcnica del panormico de intensidad a sistemas de alto-

parlantes ubicados en planos diferentes que el horizontal es perfectamente
posible. Por ejemplo, un sistema de ocho altoparlantes distribuidos unifor-
memente en tres dimensiones consistira en ubicar a cada uno de ellos en los
vrtices de un cubo imaginario. En este caso, habra que considerar cuar-
tetos de altoparlantes (en los vrtices de cada una de las caras del cubo),
determinar entre qu cuatro parlantes se encuentra la fuente sonora virtual,
y aplicar las tcnicas vistas en la seccin anterior para escalar la ganancia de
estos. La simulacin de la distancia se realiza de la misma forma ya explicada
en la seccin anterior.
Otra posibilidad es la tcnica llamada panormico de amplitud basado en
vectores (Pulkki, 2001), que corrientemente se designa con la sigla vbap.9 Esta
tcnica se puede usar tambin en arreglos bidimensionales de altoparlantes,
y su ventaja principal es que puede aplicarse con facilidad a disposiciones
irregulares de estos. Si se usa para disposiciones de altoparlantes en un solo
plano (bidimensionales), equivale a la aplicacin de la tcnica de panormico
de energa constante ya explicada.
En tres dimensiones, vbap usa ternas de altoparlantes para distribuir la
seal a espacializar. Por supuesto, la fuente virtual solo puede ser ubicada en
el denominado tringulo activo, que no es otra cosa que el tringulo esfrico
imaginario en cuyos vrtices se ubican los altoparlantes del sistema. La figura
3 (basada en Pulkki, 2001) ilustra lo antedicho. En ella se pueden ver tres
altoparlantes (designados m, n y k) ubicados en los vrtices de un tringulo
esfrico, que es el que se denomina tringulo activo (marcado con lneas pun-
teadas). La fuente virtual se ubicara en un punto de ese tringulo.
vbap trabaja con cuatro vectores-unidad cartesianos en tres dimensio-
nes. Tres de ellos apuntan a la direccin de cada uno de los altoparlantes
en tres dimensiones (ln, lm y lk , en la figura 3). La direccin de la fuente
8 Para simplificar, los ngulos se indican en grados. Dada la ubicacin de los altoparlantes,
es necesario restarle al ngulo de ubicacin de la fuente 45 para que est en el rango de 0
a 90(0 a /2 radianes).
9 Del ingls Vector Based Amplitude Panning.
106
Altoparlante k
Fuente
virtual
Altoparlante n
Altoparlante m
Oyente
Figura 3
virtual se define con un cuarto vector-unidad cartesiano (designado como p

en la figura 3). La direccin del panormico de la fuente virtual surge de la
combinacin lineal de los tres vectores correspondientes a los altoparlantes.
Presentado en forma matricial:
p = gnln + gmlm + gklk E. 17
pT = g Lnmk. E. 18
en donde gn, gm y gk son los factores de ganancia para cada altoparlante, g = [gn
gm gk] y Lnmk = [ln lm lk] T.
El vector g se puede resolver de la siguiente manera:
g = pT L-1nmk
1
l nx l ny l nz

g = [ pn pm pk ] l mx l my l mz

l kx l ky l kz
E. 19
107
Los valores del vector g deben normalizarse antes poder ser usados, esto se
realiza multiplicando cada uno de ellos por un escalar e, tal que:
1
e
g + g k2 + g m2
n
2
E. 20
Por ejemplo, tmese una configuracin de tres altoparlantes y fuente virtual

que se ilustra en la figura 3 y supngase que su ubicacin en coordenadas
esfricas expresadas en grados es la siguiente:
Altoparlantes
ngulo horizontal ngulo de elevacin
y fuente virtual
ln 45 0
lk 90 45
lm 135 0
p (fuente virtual) 90 20
La matriz Lnkm = [ln lk lm] T expresada en coordenadas cartesianas es:
Altoparlantes Coordenada x Coordenada y Coordenada z
ln 0,707107 0,707107 0
lk 0 0,707107 0,707107
lm -0,707107 0,707107 0
El vector pT(direccin de la fuente virtual), expresado en coordenadas carte-

sianas es:
Fuente virtual Coordenada x Coordenada y Coordenada z
pT 0 0,939693 0,34202
La matriz inversa de [ln lk lm] T, o sea L-1nkm, es:
108
0,707107 0 -0,707107
0,707107 0 0,707107
-0,707107 1,414214 -0,707107
Y la multiplicacin del vector pT y la matriz inversa L-1nkm da como resultado

el vector g, que contiene las ganancias para cada uno de los altoparlantes:
gn gk gm
Valores crudos 0,422618 0,48369 0,422618
Valores normalizados 0,549658 0,629088 0,549658
Al normalizar los valores de ganancia de acuerdo con la ecuacin 20, se

cumple que:
0, 49658 2 + 0,629088 2 + 0, 549658 2 1
Cuando la tcnica vbap se usa en un arreglo de muchos altoparlantes, cada

uno de ellos es tomado como un punto o nodo de una red. Se somete luego
esta red a un algoritmo de triangulacin10 para determinar ternas de alto-
parlantes de una manera eficiente y, de acuerdo con la posicin de la fuente
virtual, se aplica el procedimiento ya explicado para escalar la ganancia de
los altoparlantes que forman el tringulo activo en el que se encuentra. Por
ejemplo, la imagen que sigue muestra una aproximacin a una esfera en tres
dimensiones a partir de una red (o malla) tridimensional de 144 nodos (pun-
tos espaciales).11 La fuente virtual se ubicara en algn punto de esta esfera
terica formada por altoparlantes y dentro de la que estaran ubicados los
oyentes. Si se asume que en cada nodo hay un altoparlante, entonces se puede
considerar la aplicacin de vbap a las ternas de altoparlantes que surgen de la
triangulacin de la red. La figura 4 marca con tres puntos negros uno de los
tringulos activos (en blanco) posibles.12
10 Los mtodos de triangulacin son intensamente investigados en la geometra analtica
y las ciencias de la computacin. Segn el autor de la tcnica vbap (Pulkki, 2001), en su
implementacin se usa el mtodo de triangulacin denominado greedy triangulation.
11 Lgicamente, solo una parte de estos es visible en la imagen.
12 Rigurosamente hablando, el tringulo que se ve en la figura sera una aproximacin al
tringulo esfrico que se denomina tringulo activo.
109
Figura 4
Con el objeto de superar la no uniformidad de imagen que conllevan las

tcnicas de panormico de intensidad que usan grupos (pares o ternas) de
altoparlantes, el autor de vbap desarroll tambin un procedimiento que
permite distribuir una parte de la seal en los dems altoparlantes del sistema,
independientemente de si forman o no el tringulo activo. Esta porcin de
seal es controlada por un coeficiente de dispersin que el usuario puede graduar
(Pulkki, 2001).
Simulacin de la directividad de la fuente acstica mediante indicios

de intensidad
La directividad de una fuente acstica es la forma en la que emite o irradia

energa acstica en funcin de su orientacin. El patrn de emisin de energa
acstica de una fuente involucra tanto a la amplitud de la seal acstica que
emite como a su espectro.13 En este captulo solo trataremos las tcnicas para
simular la amplitud de la directividad de las fuentes acsticas.
Para tener en cuenta la amplitud de la directividad de la fuente acstica
en dos dimensiones, y para dos canales de audio, deben usarse las siguientes
ecuaciones:
Ch1= |r(,)| g1() / factor de distancia E. 21

Ch2= |r(,)| g2() / factor de distancia E. 22
13 Para mayores detalles sobre la percepcin de la directividad de las fuentes acsticas, vase
el captulo i de este libro.
110
en donde r(,) es la magnitud de un vector de radiacin en la direccin de
una fuente acstica con orientacin .
A pesar de que la emisin de energa acstica de las fuentes acsticas
reales posee patrones muy complicados, puede aproximarse a travs de diseos
esquemticos expresados mediante ecuaciones. Por ejemplo, un patrn muy
conocido y usado, tanto en audio como en acstica, es el denominado cardioi-
de, junto con sus derivaciones en hipercardioide. F. R. Moore, en su programa
Space (Moore, 1983, 1989), propone modelar en dos dimensiones la radiacin
hipercardioide de una fuente acstica a partir de la siguiente ecuacin:
2
(back 1)| |
r (,) = 1+
E. 23
en la que r(,) es la magnitud de la radiacin hacia la direccin de una

fuente acstica que apunta hacia , y back es el monto de radiacin en el
sentido opuesto de . Si se asigna valor cero a back, se producir un patrn de
radiacin hipercardioide, mientras que si se le asigna el valor de uno, se produ-
cir un patrn de radiacin omnidireccional. La figura 5 ilustra el pasaje de un
patrn de radiacin omnidireccional hacia un patrn de radiacin hipercardioide
a travs de la ecuacin 23 usando cinco valores para back: 1; 0,75; 0,5; 0,25 y
0. La fuente de sonido est ubicada en el origen del plano cartesiano y apunta
hacia la derecha, pero esto ltimo se puede evidenciar slo en la medida en
que su patrn de radiacin se hace direccional.
La ecuacin 23 puede usarse para calcular el monto de energa irradiada
por una fuente direccional en la direccin de un oyente o receptor hipotti-
co. En la figura 6 se puede ver un receptor situado a 90 (simbolizado con el
pequeo crculo blanco) y una fuente de sonido direccional (back = 0 en la
Back= 1 Back= 0.75 Back= 0.5 Back= 0.25 Back= 0
Figura 5
111
= 0, = 90 = 90, = 90 = 270, = 90
Figura 6
ecuacin 23) que cambia su orientacin en tres direcciones: 0 (apuntando

hacia la derecha), 90 (apuntando hacia delante) y 270 (apuntando
hacia atrs). La lnea de puntos marca la direccin de la radiacin a calcular.
La flecha seala el vector cuya magnitud se puede usar para escalar la ganancia
en la simulacin de la directividad de una fuente sonora mediante la ecuacin
23. En los dos ltimos casos, la magnitud del vector es 1 y 0 respectivamente,
correspondiendo respectivamente a la direccin de la fuente coincidente con
la del oyente y con la direccin contraria.
La aplicacin de la frmula anterior con un valor de back = 0 en la confi-
guracin de la izquierda ( = 0, = 90, = 180)14 de la figura 6 produce:
2
(back 1)| |
r (,) = 1+

2
(back 1)| 90|
r(90) = 1+

(1) 90| 2
r(90) = 1+

2
r(90) = [1+ (90 /180)]
2
r(90) = [1 0,5]
r(90) = 0,25
14 Por razones de simplicidad, los ngulos se indican en grados.
112
Para calcular la radiacin en tres dimensiones es necesario tener en cuenta
tanto el ngulo horizontal (azimut) como el ngulo de elevacin de la direc-
cin de la radiacin. En algunos casos, resulta til representar la direccio-
nalidad de las fuentes acsticas con el modelo de cuerpos rgidos, a travs de
ecuaciones que expresen las coordenadas cartesianas de los puntos que cons-
tituyen su superficie. Por ejemplo, si se construye una variante arbitraria en
tres dimensiones15 de un patrn cardioide, sus coordenadas cartesianas surgen
de las siguientes ecuaciones:
x = cos()cos() E. 24
y = sin()cos() /2 /2 E. 25
z = sin( c) c 0,5 E. 26
en las que y son respectivamente los ngulos de azimut y de elevacin que

permiten el clculo de las coordenadas cartesianas. Las ecuaciones dan como
resultado un patrn de radiacin cuyo centro se encuentra en el origen del
plano cartesiano y cuyo vrtice est orientado hacia la derecha (x positivo).
Se ilustra en la figura 7.
Figura 7
15 El patrn cardioide en dos dimensiones ya analizado se puede proyectar a tres dimen-

siones simplemente rotando la forma en dos dimensiones alrededor del eje x. Aqu se usa
deliberadamente una variacin arbitraria de este slo como ejemplo de otra posibilidad.
113
Para calcular la amplitud de la radiacin de una fuente acstica imaginaria con
las propiedades de directividad que surgen de esas ecuaciones, simplemente
basta con calcular la magnitud del vector que surge desde su centro (en este
caso, el origen) hasta un punto de su superficie indicado por los dos ngulos del
vector (azimut y elevacin). Esto se hace muy sencillamente, ya que:
r(,) = x 2 + y2 + z 2 E. 27
y conocemos los valores de x (ecuacin 24), y (ecuacin 25) y z (ecuacin 26).

Si la fuente cambia de posicin (i.e., se traslada) o de orientacin (i.e.,
rota), su nueva posicin se obtiene sumndole un vector de traslacin a las
coordenadas cartesianas del centro de la fuente, y la nueva orientacin se
obtiene multiplicando las coordenadas cartesianas de la fuente por una matriz
de rotacin.
Otro ejemplo de implementacin anlogo al anterior lo constituye el
sistema DirectX,16 en el que se imita la directividad de las fuentes de sonido
usando el modelo geomtrico del cono (Bargen y Donnelly, 1998).
En los casos que tratamos, las propiedades de radiacin se calculan con ecua-
ciones, pero si se desea representar y calcular muy variados patrones de radia-
cin, aun arbitrarios (i.e., no correspondientes con el patrn de radiacin de
ninguna fuente sonora real) y absolutamente asimtricos, se podran definir
las propiedades de directividad de una fuente acstica a travs de una serie de
puntos en un espacio tridimensional (una red o malla). Esto sera como mues-
trear un cuerpo rgido. Los valores de las coordenadas cartesianas normalizados
representaran la magnitud de la radiacin en la direccin de cada uno de los
puntos que definen. Los valores intermedios se podran aproximar por medio
de algn tipo de interpolacin. Tal estrategia tendra la ventaja de adaptarse
al uso de archivos digitales de cuerpos rgidos en tres dimensiones de formato
estndar que, adems, se pueden representar y procesar visualmente con faci-
lidad usando los programas adecuados.17
Otra posibilidad sera el modelado de la directividad de la fuente acstica
a travs de ecuaciones esfricas. Aqu se consideraran el ngulo horizontal
y el de elevacin, y el usuario podra prever una funcin de atenuacin para
cada uno de ellos. Si tales funciones retornaran la unidad, el resultado sera
16 DirectX es una api (Advanced Programming Interface) para multimedia del sistema ope-
rativo MS Windows.
17 Por ejemplo, los archivos obj de Alias Wavefront que, en su forma ms simple, definen
objetos grficos a travs de vrtices indicados en coordenadas cartesianas y superficies que

se forman a travs de la triangulacin de los vrtices.
114
una esfera (radiacin omnidireccional). Valores cambiantes de acuerdo con
los ngulos podran representar muy diversos patrones de directividad; este es
el enfoque que usa el entorno SoundScape (Wozniewski et al., 2007).
Finalmente se mencionar la posibilidad del cambio gradual de las carac-
tersticas de directividad de una fuente acstica. Si se cambia gradualmente el
parmetro back en la ecuacin 23, por ejemplo, se puede lograr el paso gradual
de una fuente omnidireccional a una fuente hipercardiode.18
Tcnicas de espacializacin basadas en indicios de tiempo
El sonido se transmite a una velocidad constante que depende de la densidad

del medio. En trminos sencillos, el tiempo t que le toma al frente de onda de
una seal acstica alcanzar un determinado punto a distancia d de la fuente
que la emite se calcula de acuerdo con la siguiente expresin:
t=d/c E. 28
en la que c es la velocidad de propagacin del sonido.

Dada una fuente de sonido, es posible calcular su distancia respecto de
un determinado punto y simular su tiempo de arribo por medio de lneas de
retardo. Hay varias estrategias de implementacin de estos datos que dan
lugar a diferentes indicios que pueden combinarse o no.
La distancia que existe entre dos puntos espaciales determinados por
medio de coordenadas cartesianas en tres dimensiones se calcula de acuerdo
con la siguiente ecuacin:
D (x a , y a , z a , x b , y b , z b ) = (x a - x b )2 + (y a - y b )2 + (z a - z b )2 E. 29
en la que D es la distancia, xa, ya, y za son las coordenadas cartesianas que

definen la posicin del primer punto, y xb, yb, y zb son las coordenadas carte-
sianas que definen la posicin del segundo punto.
Se suelen usar los datos que surgen de las dos ecuaciones anteriores (28 y 29)
para simular: 1) el tiempo de arribo del frente de onda a un solo punto global
18El efecto en el oyente, sin embargo, ser el de un cambio de intensidad, a menos que se
simulen los ecos de un recinto teniendo en cuenta la directividad de la fuente acstica y/o se
usen otros indicios espectrales. Vase la seccin Simulacin de las caractersticas de recintos
mediante indicios de intensidad y tiempo (p. 117 de este captulo).
115
en el que se asume que est el/los oyente/s (Chowning, 1971); 2) el tiempo
de arribo del frente de onda a cada uno de los odos de un oyente, denomina-
do tambin simulacin de itd; y 3) el tiempo de arribo del frente de onda a
cada uno de los altoparlantes que se ubicarn en puntos determinados de un
recinto para simular una determinada situacin de audicin. Este ltimo caso
se corresponde con el modelo realizado por F. R. Moore (1989 y 1983) en su
unidad de espacializacin Space.
La ecuacin 29 puede ser usada para calcular la distancia entre la fuente
virtual y el oyente, y la ecuacin 28 para calcular el retardo que debe efec-
tuarse en la seal a los efectos de simular el indicio temporal de distancia. En
general, muchas implementaciones asumen que el oyente est situado en el
origen (x = y = z = 0), por lo que la distancia entre este y la fuente de sonido
se calcula de forma mucho ms sencilla:
D = x 2 + y2 + z 2 E. 30
Cuando la fuente de sonido cambia de ubicacin, la distancia y el retardo

deben ser recalculados. Dado que la trayectoria debe generar valores discretos,
en general se realiza este clculo muestra por muestra y se usa algn mtodo
de interpolacin (usualmente interpolacin lineal) para calcular los valores
intermedios de retardo. Asimismo, el hecho de que la fuente est en movi-
miento produce (salvo en el caso en que la fuente se mueve con velocidad
uniforme en un crculo en cuyo centro se encuentra el oyente) diferencias de
velocidad relativa entre el oyente y la fuente y, por consiguiente, da lugar a un
cambio de frecuencia en la seal conocido como efecto Doppler.
En audio digital, para simular todos los efectos de retraso de una seal, se
usan las llamadas lneas de retardo.19 La forma ms eficiente de implementarlas
usa la tcnica que se denomina de buffer circular.
La tcnica de buffer circular consiste en ir almacenando la seal de entrada
de a bloques en una regin de memoria (buffer) con un tamao determinado.
Cada muestra de la seal de entrada se almacena en una ubicacin sucesiva
del buffer y, por medio de una variable-contador, se chequea la cantidad de
muestras entrantes. Cuando el contador llega a ser igual al tamao mximo
del buffer, se lo pone en cero nuevamente y las muestras subsiguientes vuelven
a ser ubicadas sucesivamente desde el comienzo del buffer. Ya que la seal se
va escribiendo en el buffer circular, se puede leer en l la muestra necesa-
ria retrasada por el tiempo que se necesite, pero hay que tomar la precaucin
de que el retardo no supere el tamao del buffer. Ms aun, se puede utilizar
19 Delay lines, en ingls.
116
el mismo buffer para leer la seal almacenada en l con diferentes retardos,
provistos del hecho ya mencionado de que estos no superen su longitud (vase
Moore, 1990, cap. iv).
La itd (diferencia interaural de tiempo) es un indicio que se produce por
el diferente tiempo de arribo de la seal acstica a los odos del oyente cuando
la fuente de sonido se encuentra en una ubicacin diferente del plano medio
(vase el captulo i de este libro).
Tomando como base la medida de la distancia de un odo a otro en una
cabeza promedio (aproximadamente 20 cm) es muy sencillo calcular el
tiempo de arribo a cada odo de la seal acstica de acuerdo con su ngulo de
posicin. Se trata solo de aplicar la ecuacin 29 a dos puntos situados respec-
tivamente a -0,1 m y 0,1 m de la posicin del oyente.
A pesar de ser un indicio muy contundente de ubicacin espacial de soni-
do, la itd no es apta para su utilizacin en sistemas de altoparlantes porque la
posicin de los oyentes y su propensin a mover la cabeza reducen completa-
mente su efectividad.20
Sin embargo, hay dos casos en los que la simulacin de retardos no solo es
necesaria, sino inevitable. Uno es la simulacin del efecto Doppler y el otro es
la simulacin de los ecos tempranos,21 o primeras reflexiones de un recinto.
El efecto Doppler surge, como ya se mencion (vase captulo ii de este
libro), de la modificacin dinmica de velocidad radial relativa a fuente acs-
tica y oyente. Para implementarlo se usa la misma tcnica de buffer circular
ya explicada, pero respecto de un solo punto espacial en donde se supone
que est el oyente. Debe ser mencionado, por supuesto, que tal simulacin es
rigurosa solo para el punto en donde se calcula.
Simulacin de las caractersticas de recintos mediante indicios

de intensidad y tiempo
Introduccin
Para simular las caractersticas de un recinto, es necesario tener en cuenta

su reverberacin, que es el resultado de las numerosas reflexiones de la seal
acstica directa en sus elementos fsicos. Se la suele dividir por razones prc-
ticas en dos fenmenos: primeros ecos y reverberacin densa (Di Liscia, 2004).
20 La simulacin de la itd es sumamente efectiva, sin embargo, cuando se usan auriculares

en vez de altoparlantes.
21 La simulacin de ecos tempranos se trata ms adelante en este captulo.
117
Los primeros ecos son una coleccin de reflexiones que ocurre aproximada-
mente en los primeros 80 milisegundos a partir del momento en que comienza
la seal directa. Proveen informacin sobre el recinto y, parcialmente, sobre
la localizacin relativa de fuente y oyente, siendo especialmente significativo
el lapso entre el comienzo de la seal directa y el primer eco. Pasados los 80
milisegundos, aproximadamente, la coleccin de ecos es cada vez ms densa,
y se percibe de manera estadstica. A este otro fenmeno se lo denomina
habitualmente reverberacin densa.22
En este captulo se tratar nicamente la simulacin de ecos tempra-
nos, dado que las tcnicas que involucra tienen estrecha relacin con las ya
explicadas.
Simulacin de ecos tempranos
Cuando se conocen los datos referidos a las dimensiones, la geometra y la

constitucin de un recinto, es posible calcular tanto el retardo como la ampli-
tud de las diversas reflexiones del frente de onda en sus paredes, techo y piso
respecto de un oyente ubicado en dicho recinto. Una de las estrategias para
imitar los primeros ecos se suele denominar acstica geomtrica (Begault, 2000)
y consiste en considerar las diferentes reflexiones como rayos en direcciones
determinadas, en analoga con rayos de luz.
Existen varios mtodos para el clculo de las primeras reflexiones de
acuerdo con esta concepcin. Uno de ellos es el llamado trazado de rayos.23
En el algoritmo bsico, la fuente emite rayos de sonido que se reflejan en las
superficies de la sala y el oyente sigue aquellos que le llegan como reflexiones
audibles. En general, se usa el modelo de una esfera y se toma una cantidad
predefinida de rayos en direcciones distribuidas uniformemente que se supone
que emite la fuente acstica (Savioja, 1999). Se debe recordar aqu que, para
una simulacin ms eficaz, deben tenerse en cuenta las caractersticas direc-
cionales de la fuente sonora involucrada.24
Cuando se pretende simular una cantidad considerable de reflexiones
en tres dimensiones, el mtodo de trazado de rayos es sumamente exigente
en tiempo de proceso y slo puede realizarse con sistemas muy poderosos, o en
tiempo diferido.
22 Para ms detalles sobre la acstica de recintos y su percepcin, vase el captulo ii de

este libro.
23 Ray tracing, en ingls.
24 Vase el punto referido a la simulacin de la directividad de las fuentes acsticas en este
captulo.
118
Para efectos musicales ms prcticos25 y considerando una geometra
simple del recinto, la mayora de las aplicaciones de audio para simulacin
de localizacin y movimiento de una o varias fuentes acsticas en un recinto
implementan el llamado mtodo de la imagen.26 Este mtodo consiste en el cl-
culo de las primeras reflexiones que llegan al oyente clasificadas por orden (es
decir, las de primer orden son las que rebotaron una sola vez, las de segundo
orden dos veces, y as sucesivamente). A pesar de que se sabe que este mtodo
no es completamente apto para la simulacin precisa de la respuesta a impulso
de una sala, la aproximacin que realiza es suficiente para obtener los ecos
que los oyentes utilizan para conjeturar la localizacin de la fuente acstica.
La figura 8 muestra las reflexiones de primer orden que surgen de una fuente
omnidireccional de acuerdo con el mtodo de la imagen, con respecto a un
oyente situado en el origen de un plano en dos dimensiones. En este caso, se
obtiene un rayo por cada una de las paredes del recinto.
20
20
(8,12)
(8,8)
(12,8)
(-28,8)
(0,0)
(8,-28)
Figura 8
25 A diferencia del propsito de diseo acstico de salas, que requiere de una mayor preci-
sin en la imitacin de fenmeno fsico. Vase el captulo ii de este libro.
26 Image method, en ingls. Vase Allen y Berkeley (1979).
119
El mtodo de la imagen tiene tambin la ventaja de ser simple y, por consi-
guiente, ms fcil de implementar. Consiste en rebatir la imagen de la sala
hacia la izquierda, la derecha, el frente, atrs, arriba y abajo (si se calcula en
tres dimensiones). La nueva posicin de la fuente en tales imgenes tiene
una distancia y un ngulo en relacin con el oyente que son equivalentes a
la reflexin del orden que corresponda. Si se desea calcular las reflexiones
de segundo orden, estas surgen de un nuevo rebatimiento de las imgenes de
las reflexiones de primer orden obtenidas, y as sucesivamente. En la figura
9 se muestran esquemticamente en dos dimensiones las fuentes fantasmas
que se calculan para las reflexiones de primer y segundo orden del recinto,
oyente y fuente que se encuentran en el rectngulo central. El orden de las
reflexiones se marca con la intensidad del sombreado.
Las ecuaciones que permiten calcular la posicin de las coordenadas
cartesianas de la nsima fuente virtual en tres dimensiones con el mtodo de la
imagen (McGovern, 2004) son:
1(1)i
x i = (1)i x s +[i + ]x r E. 31
2
1(1) j
y j = (1) j y s +[ j + ]y r E. 32
2
1(1)k
zk = (1)k zs +[k + ]zr E. 33
2
donde i , j y k son enteros que indican el nmero de fuente fantasma. Si algu-
no de ellos es 0, entonces las ecuaciones 31, 32 y 33 retornan la coordenada
cartesiana correspondiente de la fuente, mientras que si son negativos las
ecuaciones retornarn la coordenada cartesiana correspondiente a la fuente
fantasma en la pared opuesta. En estas ecuaciones, xs, ys, zs son las coordena-
das cartesianas de la fuente en el recinto, xr es la dimensin del recinto en la
dimensin x (ancho), yr es la dimensin del recinto en la dimensin y (largo)
y zr es la dimensin del recinto en la dimensin z (alto).
La distancia de dichas fuentes fantasmas (equivalentes a las reflexiones)
al oyente se puede calcular con la ecuacin 28 o, si se asume que el oyente
est en el centro, con la ecuacin 29.
Por supuesto, a medida que el orden de las reflexiones se incrementa, la canti-
dad de fuentes virtuales a simular crece de manera geomtrica. La cantidad k
de reflexiones a calcular en tres dimensiones con el mtodo de la imagen, en
funcin del orden n de estas surge de acuerdo a la siguiente ecuacin (Varga,
2000):
120
((4n + 6)n + 8)n
k= E. 34
3
En la tabla siguiente se muestra una lista de la cantidad de reflexiones a
calcular desde n = 1 hasta n = 10 de acuerdo a la ecuacin anterior. Puede
apreciarse claramente con el aumento de reflexiones el proceso de pasaje
progresivo desde ecos tempranos a reverberacin densa por la progresiva
acumulacin de estos. Es evidente tambin que el incremento geomtrico de
la cantidad de reflexiones en funcin del orden torna casi imposible su simu-
lacin en tiempo real ms all de un orden determinado. Por lo antedicho, la
mayora de las aplicaciones suele dar al usuario la posibilidad de establecer el
valor mximo de n (orden de los ecos a calcular), o bien un valor de amplitud
que el programa puede usar como umbral mnimo para determinar cuntas
reflexiones debe calcular y simular.27
Figura 9
27 Alternativamente, se podra establecer un lmite de tiempo mximo para los retardos de

las reflexiones, ya que, dependiendo de las dimensiones del recinto que se quiere simular,
al pasar un determinado orden de las reflexiones, sus retardos podran fcilmente superar
el umbral de eco.
121
Orden (n) Reflexiones (k)
1 6
2 24
3 62
4 128
5 230
6 376
7 574
8 832
9 1.158
10 1.560
A travs de las ecuaciones 31, 32 y 33 se pueden obtener las coordenadas

cartesianas de cada una de las fuentes fantasma que equivalen a cada una de
las reflexiones en las paredes, techo y piso de un recinto. Con los datos as
calculados, cada rayo se puede considerar una nueva fuente fantasma, y esta
se puede simular a travs de las tcnicas explicadas antes en este captulo:
localizacin angular, distancia y directividad, como as tambin tcnicas de
simulacin de la distancia a travs del retraso temporal.
Es interesante advertir que, si se simula la directividad de la fuente acs-
tica direccional, la amplitud de los ecos en funcin de su direccin se ver
significativamente afectada. Por ejemplo, en la figura siguiente se observa
una fuente hipercardioide apuntando hacia un oyente ubicado en el origen.
La radiacin del sonido directo deber calcularse en base al ngulo (el ngu-
lo entre el centro de la fuente y el oyente), pero la radiacin de la primera
reflexin sobre la pared lateral derecha se deber calcular a partir del ngulo
. Se puede comprobar que equivale a 2 - , siendo el ngulo entre el
oyente y la fuente fantasma que simula la reflexin.
Un posterior refinamiento incluira el clculo de un factor de atenuacin
extra para simular la prdida de energa inherente al material que recubre las
superficies reflejantes del recinto.28 Con este objetivo, puede establecerse un
28 Nuevamente debe advertirse que un clculo y una simulacin precisos de tal efecto debe-
ran incluir los cambios en el espectro de la seal en relacin a la respuesta en frecuencia
y fase del material que recubre las superficies reflejantes y el ngulo de incidencia de la
122
Fuente
Reflexin
Oyente
Figura 10
escalar que representa un coeficiente de absorcin. Si este escalar es igual a

la unidad, no habr atenuacin. Pero si es menor que la unidad, la seal que
corresponde a cada reflexin deber ser atenuada por un factor que, de acuerdo
con McGovern (2004), podemos calcular tomando el coeficiente de reflexin
de las superficies, rw, y elevndolo al exponente n donde n =|i|+|j|+|k|.
Si los coeficientes de absorcin de las paredes, techo y piso del recinto son
diferentes, entonces el clculo del factor de atenuacin es ms complicado,
pero perfectamente posible.29
Finalmente se debe considerar que cuando la fuente virtual est en movi-
miento, el diseo de los ecos tempranos se modifica de acuerdo a su posicin.
Esta modificacin debe, por supuesto, ser calculada con la periodicidad nece-
saria.30 Como consecuencia de esto, tanto los valores de atenuacin en ampli-
tud debidos a la distancia y direccin como aquellos debidos a la directividad
de la fuente cambiarn dinmicamente y debern ser calculados y tenidos en
cuenta. Los valores de retraso de la llegada al oyente del rayo correspondiente
a cada eco cambiarn dinmicamente tambin, y darn lugar a corrimientos
de la frecuencia de las seales que representan a cada eco, de una manera an-
loga al efecto Doppler que producen las diferentes velocidades radiales entre
fuente y oyente.31 Nuevamente, aqu habr que usar los procedimientos de
buffer circular con interpolacin que ya se explicaron para imitar los retardos
dinmicos que surgen de tal situacin.
reflexin. Vase el captulo ii del presente libro.

29 Para conocer las ecuaciones correspondientes, vase McGovern, (2004).
30 Se pueden calcular las posiciones de la fuente virtual y las correspondientes reflexiones a
cada muestra de audio, o bien a frecuencias menores y utilizar algn tipo de interpolacin
entre los valores obtenidos.
31 Si bien, rigurosamente hablando, no se trata de efecto Doppler, la manera de concebirlo
e imitarlo es exactamente igual a la que se usa para la emulacin del efecto Doppler en la
seal directa.
123
Conclusiones
Las tcnicas tratadas hasta aqu son relativamente sencillas de implementar y

constituyen la base sobre la cual se desarrollan muchos dispositivos de espacia-
lizacin. Existe fuerte evidencia cientfica y prctica de que, si tales tcnicas
se combinan adecuadamente con algunas otras que usan indicios espectrales
(tales como el filtrado dependiente de la distancia y el filtrado de las seales
reflejadas de acuerdo con los coeficientes de absorcin de los materiales refle-
jantes), es posible producir una simulacin de las caractersticas espaciales
bastante robusta. Adems de ello, los dispositivos electrnico-digitales son
cada da ms veloces y de mayor capacidad, permitiendo as el proceso de
mayor cantidad de seales y simulacin de indicios.
Particularmente, sin embargo, todava resta realizar mucha investiga-
cin y desarrollo para superar ciertas limitaciones de las tcnicas tratadas.
Entre las principales de estas limitaciones se pueden mencionar: la falta de
uniformidad de la seal acstica difundida en los altoparlantes, la dificultad
de simular correctamente una fuente acstica en una ubicacin muy prxima
al/a los oyentes, y la estrechez del punto de audicin ideal32 para audiencias
numerosas.
Bibliografa
Allen, J. y D. Berkley (1979), Image Method for Efficiently Simulating

Small Room Acoustics, Journal of the Acoustical Society of America, pp.
912-915.
Bamford, J. S. (1995), An Analysis of Ambisonic Sound Systems of First and
Second Order, tesis de maestra, Ontario, Waterloo University.
Bargen, B. y P. Donnelly (1998), DirectX a fondo, Madrid, McGraw-Hill.
Begault, D. (2000), 3D sound for Virtual Reality and Multimedia (<http://human-
factors.arc.nasa.gov/publibrary/Begault_2000_3d_Sound_Multimedia.
pdf>).
Cetta, P. (2007), Un modelo para la simulacin del espacio en msica, Buenos
Aires, Educa.
Chowning, J. (1971), The simulation of Moving Sound Sources, Journal of
the Audio Engineering Society, N 19.
Di Liscia, O. P. (2004), Sntesis y procesamiento de sonido y msica a travs del pro-
grama Csound, Bernal, Editorial de la Universidad Nacional de Quilmes.
32 Denominado comnmente sweet spot por los ingenieros de audio.
124
Dodge, Ch. y T. Jerse (1985), Computer Music Synthesis, composition and per-
formance, Nueva York, Schirmer Books.
Guastavino, C. et al. (2007), Spatial audio quality evaluation: comparing
transaural, Ambisonics and stereo, Proceedings of the 13th International
Conference on Auditory Display, Montreal.
Karpen, R. (1998), Space and Locsig Ugs, en The Csound Manual (<http://
www.csounds.com/manual/html/locsig.html>, <http://www.csounds.
com/manual/html/space.html>).
Kendall, G. et al. (1989), Spatial reverberation, discussion and demonstra-
tion, en Mattews, M. y J. Pierce, Current Directions in Computer Music
Research, Cambridge, mit Press.
Kendall, G. (1995), The decorrelation of Audio Signals and its impact on
Spatial Imaginery, Computer Music Journal, vol. 19, Cambridge, mit
Press.
McGovern, S. (2004), A model for room acoustics (<http://www.2pi.us/rir.
html>, consultado el 20 de febrero de 2008).
Moore, F. R. (1990), Elements of Computer Music, Nueva Jersey, Prentice
Hall.
(1989), Spatialisation of sounds over loudspeakers, en Mattews, M. y
J. Pierce, Current Directions in Computer Music Research, Cambridge, mit
Press.
(1983), A General Model for Spatial Processing of Sounds, Computer
Music Journal, vol. 7, N 3.
Moorer, A. (1979), About this reverberation business, Computer Music
Journal, vol. 3, N 2.
Pulkki, V. (2001), Spatial sound generation and perception by amplitude panning
techniques, Reporte N 62, Universidad Tecnolgica de Helsinki.
et al. (1999), Analyzing virtual sound source attributes using a binaural
auditory model, Journal of the Audio Engineering Society, 47 (4), pp.203-
217.
Savioja, L. (1999), Modeling Techniques for Virtual Acoustics, tesis doctoral,
Helsinki University of Technology, Finlandia (<http://www.tml.tkk.
fi/~las/publications/thesis/>, consultado el 20 de febrero de 2008).
Stevens, S. S. (1970), Neural events and Phychophisical Law, Science, 170.
Varga, I. (2000). Spat3d Unit Generator, The Csound Manual (<http://
www.csounds.com/manual/html/spat3d.html>).
West, J. (1998), Five-channel panning laws: an analytical and experimental com-
parison, tesis de maestra, Universidad de Miami.
Wozniewski, M. et al. (2007), AudioScape: A Pure Data library for manage-
ment of virtual environment and spatial audio, Pure Data Convention,
125
Montreal (<http://www.audioscape.org/twiki/pub/Audioscape/Audioscape
Publications/audioscape_pdconv07_final.pdf>).
126

DiLiscia Localizacion - Espacial.de - Sonido.usando - Indicios.de - Intensidad.y.tiempo PDF

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

DiLiscia Localizacion - Espacial.de - Sonido.usando - Indicios.de - Intensidad.y.tiempo PDF

Загружено:

Авторское право:

Доступные форматы

Captulo III

Tcnicas de localizacin espacial de sonido con

1 Algunas tcnicas, como Ambisonics, no se tratarn en este captulo, porque se desarrollan

Tcnicas de espacializacin basadas en indicios de intensidad

Si se conocen la ubicacin espacial de una fuente sonora, sus caractersticas

Simulacin de la ubicacin angular en dos dimensiones

Uno de los procedimientos ms difundidos para lograr la localizacin angu-

2 Interaural Intensity Difference, o diferencia interaural de intensidad. Vase el captulo i de

Es sencillo conjeturar lo que la funcin lineal realiza. Calcula la ganancia de

para M <= /2 y >=0.

La llamada ley del seno se basa en la siguiente ecuacin:

en la que S es el ngulo de la fuente virtual y 0 es la mitad del ngulo

en la que es corriente que p tenga un valor de 1 (si se desea mantener la ampli-

Una de las maneras ms sencillas de realizar el llamado panormico de energa

Por lo tanto, si asumimos que tenemos dos altoparlantes en ngulos de 0 y

en donde es el ngulo de posicin de la fuente virtual, en el rango de 0 y

en donde max es el ngulo mximo de separacin entre los parlantes.

En la figura 1 pueden observarse cuatro grficos de la evolucin de los valores

Simulacin de la distancia mediante indicios de intensidad

Las tcnicas de panormico de intensidad no tienen en cuenta la distancia

Ch1 = g1 () / (distancia + offset) E. 12

El trmino offset es necesario para prevenir los casos en que la distancia es

factor de distancia = (distanciaexponente) + offset E. 14

Por lo tanto, la ganancia para cada altoparlante, teniendo en cuenta tanto el

Ch1 = g1 () / factor de distancia E. 15

Es posible extender el uso de los procedimientos explicados a sistemas de

Por ejemplo, el procedimiento de escalamiento de intensidad en dos dimen-

Simulacin de la ubicacin angular en tres dimensiones

La extensin de la tcnica del panormico de intensidad a sistemas de alto-

virtual se define con un cuarto vector-unidad cartesiano (designado como p

p = gnln + gmlm + gklk E. 17

El vector g se puede resolver de la siguiente manera:

Por ejemplo, tmese una configuracin de tres altoparlantes y fuente virtual

La matriz Lnkm = [ln lk lm] T expresada en coordenadas cartesianas es:

Altoparlantes Coordenada x Coordenada y Coordenada z

El vector pT(direccin de la fuente virtual), expresado en coordenadas carte-

Fuente virtual Coordenada x Coordenada y Coordenada z

La matriz inversa de [ln lk lm] T, o sea L-1nkm, es:

-0,707107 1,414214 -0,707107

Y la multiplicacin del vector pT y la matriz inversa L-1nkm da como resultado

Valores crudos 0,422618 0,48369 0,422618

Valores normalizados 0,549658 0,629088 0,549658

Al normalizar los valores de ganancia de acuerdo con la ecuacin 20, se

Cuando la tcnica vbap se usa en un arreglo de muchos altoparlantes, cada

tringulo esfrico que se denomina tringulo activo.

Con el objeto de superar la no uniformidad de imagen que conllevan las

Simulacin de la directividad de la fuente acstica mediante indicios

La directividad de una fuente acstica es la forma en la que emite o irradia

Ch1= |r(,)| g1() / factor de distancia E. 21

en la que r(,) es la magnitud de la radiacin hacia la direccin de una

Back= 1 Back= 0.75 Back= 0.5 Back= 0.25 Back= 0

ecuacin 23) que cambia su orientacin en tres direcciones: 0 (apuntando

14 Por razones de simplicidad, los ngulos se indican en grados.

en las que y son respectivamente los ngulos de azimut y de elevacin que

15 El patrn cardioide en dos dimensiones ya analizado se puede proyectar a tres dimen-

y conocemos los valores de x (ecuacin 24), y (ecuacin 25) y z (ecuacin 26).

objetos grficos a travs de vrtices indicados en coordenadas cartesianas y superficies que

Tcnicas de espacializacin basadas en indicios de tiempo

El sonido se transmite a una velocidad constante que depende de la densidad

en la que c es la velocidad de propagacin del sonido.

en la que D es la distancia, xa, ya, y za son las coordenadas cartesianas que

Cuando la fuente de sonido cambia de ubicacin, la distancia y el retardo

19 Delay lines, en ingls.