El Manual para El Ingeniero de Sonido Parte 2

EL MANUAL PARA EL INGENIERO DE SONIDO
Parte 2
Psicoacstica
Psicoacstica y Cantidades Subjetivas
A diferencia de otros sentidos, es sorprendente lo limitado que nuestro vocabulario es
cuando se habla de or. Especialmente en la industria del audio, no se discrimina a
menudo entre cantidades subjetivas y objetivas. Por ejemplo, las cantidades de
frecuencia, nivel, espectro, etc. son todas objetivas, en el sentido de que pueden medirse
con un contador o un dispositivo electrnico; Mientras que los conceptos de tono,
sonoridad, timbre, etc. son subjetivos, y son percepciones auditivas en nuestras cabezas.
La psicoacstica investiga estas cantidades subjetivas (es decir, nuestra percepcin del
odo) y su relacin con las cantidades objetivas en la acstica. La psicoacstica recibe su
nombre de un campo dentro de la psicologa -es decir, la ciencia del reconocimiento- que
trata con todo tipo de percepciones humanas, y es un campo interdisciplinario de muchas
reas, incluyendo la psicologa, la acstica, la ingeniera electrnica, la fsica, la biologa, la
fisiologa, la informtica , etc.
Aunque existen relaciones claras y fuertes entre ciertas magnitudes subjetivas y objetivas
-por ejemplo, tono versus frecuencia-, otras cantidades objetivas tambin tienen
influencias. Por ejemplo, los cambios en el nivel de sonido pueden afectar la percepcin
del tono. Adems, como no hay dos personas idnticas, cuando se trata de percepciones
como en la psicoacstica, hay grandes diferencias individuales, que pueden ser crticas en
reas como la localizacin del sonido. En la psicoacstica, los investigadores tienen que
considerar tanto los rendimientos medios de la poblacin como las variaciones
individuales. Por lo tanto, los experimentos psicofsicos y los mtodos estadsticos se
utilizan ampliamente en este campo.
En comparacin con otros campos de la acstica, la psicoacstica es relativamente nueva
y se ha desarrollado mucho. Aunque muchos de los efectos se conocen desde hace algn
tiempo (por ejemplo, efecto Hass), se han encontrado continuamente nuevos
descubrimientos. Para explicar estos efectos, se han propuesto modelos. Los nuevos
hallazgos experimentales podran invalidar o modificar modelos antiguos o hacer que
ciertos modelos sean ms o menos populares. Este proceso es slo una representacin de
cmo desarrollamos nuestro conocimiento. A los efectos de este manual, nos centraremos
en resumir los conocidos efectos psicoacsticos en lugar de discutir los modelos en
desarrollo.
Anatoma y funcin del odo
Antes de discutir diversos efectos psicoacsticos, es necesario introducir las bases
fisiolgicas de esos efectos, a saber, la estructura y la funcin de nuestro sistema auditivo.
El odo humano se considera comnmente en tres partes: el odo externo, el odo medio y
Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica
el odo interno. El sonido se recoge (y como veremos ms adelante, modificado) por el
odo externo llamado pabelln auricular y dirigido hacia el conducto auditivo (conducto
auditivo). Este canal es terminado por la membrana timpnica (tmpano). Estas partes
constituyen el odo externo, como se muestra en Figs. 1-1 y 2-1. El otro lado del
tmpano hace frente al odo medio. El odo medio est lleno de aire, y la ecualizacin de la
presin tiene lugar a travs de la abertura de la trompa de Eustaquio en la faringe para
mantener la presin atmosfrica normal en ambos lados del tmpano. Sujeta al tmpano es
uno de los tres osculos, el malleus que, a su vez, est conectado con el inco y el estribo. A
travs de la accin oscilante de estos tres pequeos huesos las vibraciones del tmpano se
transmiten a la ventana oval de la cclea con una eficiencia admirable. La presin sonora
en el lquido de la cclea se incrementa unos 30-40 dB sobre la presin del aire que acta
sobre el tmpano a travs de la accin mecnica de este notable sistema de odo medio. El
lquido claro que llena la cclea es incompresible, como el agua. La ventana redonda es
una liberacin de presin relativamente flexible que permite que la energa sonora sea
transmitida al fluido de la cclea a travs de la ventana oval. En el odo interno las ondas
itinerantes instaladas en la membrana basilar por vibraciones de la ventana oval estimulan
las clulas capilares que envan impulsos nerviosos al cerebro.
Figura 1-1: Una seccin transversal del odo humano que muestra la relacin de las diversas partes.
El pabelln de la oreja, o el auricular humano, es la parte ms lateral (es decir, externa)

de nuestro sistema auditivo. La belleza de estas aletas a ambos lados de nuestra cabeza
puede ser cuestionada, pero no la importancia de la funcin acstica que sirven. La Fig.
1-3. muestra una ilustracin de varias partes del pabelln humano. La entrada al
conducto auditivo, o caracol, es lo ms importante acsticamente para filtrar porque
contiene el volumen de aire ms grande en el pabelln de la oreja.
Figura 1-2: Representacin altamente idealizada del odo externo, del odo medio y del odo interno.

Figura 1-3: El odo externo humano, el pabelln, con identificacin de algunos de los pliegues, cavidades y crestas que tienen un
efecto acstico significativo.
Supongamos por el momento que no tenemos el pabelln de la oreja, slo agujeros en la

cabeza, que es en realidad un modelo ms simple para el odo humano, llamado el modelo
de cabeza esfrica. Colocar nuestras manos alrededor de los agujeros hara que los
sonidos fueran ms fuertes a medida que se dirigiera ms energa sonora hacia la
abertura. Cunto ayuda el pabelln de la oreja a dirigir la energa del sonido hacia el
conducto auditivo? Podemos tener una idea de esto midiendo la presin del sonido en la
abertura del canal del odo con y sin la mano detrs de la oreja. Wiener y Ross hicieron
esto y encontraron una ganancia de 3 a 5 dB en la mayora de las frecuencias, pero un
pico de alrededor de 20 dB en la cercana de 1500 Hz. La Fig. 1-4 muestra la funcin de
transferencia medida por Shaw, y las curvas numeradas 3 y 4 son para concha y brida del
pabelln de la oreja, respectivamente. La forma irregular y asimtrica del pabelln de la
oreja no es slo por razones estticas. Ms adelante, veremos que es realmente
importante para nuestra habilidad de localizar sonidos y para ayudar en el filtrado espacial
de conversaciones no deseadas.
Figura 1-4: La ganancia de presin promedio aportada por los diferentes componentes de la oreja externa en los seres humanos. La
fuente sonora est en el plano horizontal, 45 desde la derecha. (Despus de Shaw, Referencia 5.)
El hueso temporal
En cada uno de los lados izquierdo y derecho de nuestro crneo, detrs del pabelln, hay
un hueso fino y en forma de abanico, llamado, el hueso temporal que cubre todo el odo

humano, excepto el pabelln. Este hueso puede dividirse adicionalmente en cuatro
porciones, es decir, las porciones escamosa, mastoidea, timpnica y petrosa. La funcin
obvia para el hueso temporal es proteger nuestro sistema auditivo. Aparte de los
pacientes con implante coclear, cuyo hueso temporal tiene que ser parcialmente eliminado
durante una ciruga, la gente podra no prestar mucha atencin a ella, especialmente con
respecto a la acstica. Sin embargo, la energa de sonido que se propaga a travs del
hueso en nuestro odo interno, a diferencia de a travs del canal auditivo y el odo medio,
es en realidad bastante significativo. Para los pacientes con prdida auditiva conductiva,
por ejemplo, dao del odo medio, actualmente existen dispositivos disponibles en el
mercado, que se parecen a auriculares y se colocan en el hueso temporal. Las personas
con audicin normal pueden probarlo tapando los odos mientras usan el dispositivo.
Aunque los timbres suenan bastante diferentes de la audicin normal, el discurso filtrado
es bastante claro entender. Tambin debido a esta conduccin sea, junto con otros
efectos como el reflejo acstico, que sern discutidos en la seccin Reflejo acstico,
Uno oye su propia voz de manera diferente a como otras personas oyen la voz. Aunque no
reciben mucha atencin en la vida cotidiana, a veces puede ser muy importante. Por
ejemplo, un profesor de voz experimentado pide a menudo a un estudiante de canto que
grabe su propio canto y lo reproduzca en un sistema de audio. La grabacin sonar poco
natural para el cantante, pero ser una representacin ms precisa de lo que el pblico
oye.
Canal auditivo
El canal auditivo tiene un dimetro de aproximadamente 5 a 9 mm y tiene
aproximadamente 2,5 cm de longitud. Est abierto al ambiente exterior en el caracol
(concha), y est cerrado en la membrana timpnica. Acsticamente, puede considerarse
como un tubo cerrado cuya forma y rea de seccin transversal varan a lo largo de su
longitud. Aunque est doblado y de forma irregular, el conducto auditivo demuestra la
caracterstica modal de un tubo cerrado. Tiene una frecuencia fundamental de
aproximadamente 3 kHz, que corresponde a un cuarto de longitud de onda cerca de la
longitud del canal auditivo. Debido a esta frecuencia de resonancia, nuestra audicin es
ms sensible a una banda de frecuencia alrededor de 3 kHz, que es, no slo por
coincidencia, la banda de frecuencia ms importante del habla humana. En la Fig.1-4, la
curva nmero 5 muestra el efecto del conducto auditivo, teniendo tambin en cuenta el
tmpano. Como puede verse, hay una ganancia de aproximadamente 11 dB a alrededor de
2,5 kHz. Despus de combinar todos los efectos de la cabeza, el torso y el cuello, pabelln
de la oreja, conducto auditivo y el tmpano, la funcin de transferencia total es la curva
marcada con una letra T en la Fig.1-4. Se ajusta de forma relativamente amplia entre 2 y
7 kHz, con hasta 20 dB de ganancia. Desafortunadamente, debido a esta resonancia, en
ambientes ruidosos muy ruidosos con sonido de banda ancha, el dao auditivo
usualmente ocurre primero alrededor de 4 kHz.
Odo medio
El odo externo, incluyendo el pabelln de la oreja y el canal auditivo, termina en el
tmpano. Es un ambiente de aire con baja impedancia. Por otra parte, el odo interno,

donde estn las clulas sensitivas, es un ambiente fluido con alta impedancia. Cuando el
sonido (o cualquier onda) viaja de un medio a otro, si las impedancias de los dos medios
no coinciden, gran parte de la energa se reflejara en la superficie, sin propagarse al
segundo medio. Por la misma razn, utilizamos micrfonos para grabar en el aire e
hidrfonos para grabar bajo el agua. Para que nuestro sistema auditivo sea eficiente, la
funcin ms importante del odo medio es igualar las impedancias de los odos externo e
interno. Sin el odo medio, sufriramos una prdida auditiva de unos 30 dB (esto deducido
por anlisis mecnico y experimentos con gatos).
Un odo medio sano (sin infeccin del odo medio) es un espacio lleno de aire. Al tragar, la
trompa de Eustaquio est abierta para equilibrar la presin del aire dentro del odo medio
y la del mundo exterior. La mayor parte del tiempo, sin embargo, el odo medio est
sellado del ambiente exterior. Los principales componentes del odo medio son los tres
huesos, que son los huesos ms pequeos de nuestro cuerpo: el malleus, incus, y
estribos. Estos osculos forman una cadena ossiclar, que se fija firmemente en el tmpano
y la ventana oval en cada lado. A travs de tres tipos de movimientos mecnicos, a saber,
el movimiento del pistn, el movimiento de la palanca y el movimiento de pandeo, la
energa acstica se transfiere eficazmente al odo interno. El odo medio puede ser daado
temporalmente por infeccin del odo medio, o permanentemente por enfermedad
gentica. Afortunadamente, con la tecnologa actual, los mdicos pueden reconstruir los
osculos con titanio, el resultado es una recuperacin total de la audicin.
Alternativamente, se pueden usar dispositivos que dependen de la conduccin sea.
Reflejo acstico
Hay dos msculos en el odo medio: el tensor del tmpano que est unido al malolo, y el
msculo estapedio que est unido al estribo. A diferencia de otros msculos de nuestro
cuerpo, estos msculos forman un ngulo con respecto al hueso, en lugar de a lo largo del
hueso, lo que los hace muy ineficaces para el movimiento. En realidad la funcin de estos
msculos es para cambiar la rigidez de la cadena ossicular. Cuando omos un sonido muy
fuerte, es decir, al menos 75 dB ms alto que el umbral auditivo, cuando hablamos o
cantamos, cuando se toca la cabeza o cuando el cuerpo se mueve, estos msculos del
odo medio se contraen para aumentar la rigidez de la cadena ossicular, lo que hace que
sea menos eficaz, de modo que nuestro odo interno est protegido de la exposicin al
sonido fuerte. Sin embargo, debido a que este proceso implica una etapa ms alta de
procesamiento de la seal, y debido a las caractersticas de filtrado, esta proteccin slo
funciona para el sonido de inicio lento y de baja frecuencia (hasta 1,2 kHz) y no es eficaz
para ruidos como un impulso o ruido con altas frecuencias (por ejemplo, la mayora de las
grabaciones musicales de hoy).
Odo interno
El odo interno, o el laberinto, se compone de dos sistemas: el sistema vestibular, que es
crtico para nuestro sentido del equilibrio, y el sistema auditivo que se utiliza para or. Los
dos sistemas comparten fluido, que est separado del espacio lleno de aire en el odo
medio por la ventana oval y la ventana redonda. La porcin auditiva del odo interno es la
cclea en forma de caracol. Es un transductor mecnico-elctrico y un analizador selectivo

de frecuencia, que enva impulsos nerviosos codificados al cerebro. Esto se representa
crudamente en la Fig. 1-5. Un dibujo aproximado de la seccin transversal de la cclea se
muestra en la Fig. 1-6. La cclea, a lo largo de su longitud (aproximadamente 35 mm si
est estirada en lnea recta), se divide por la membrana de Reissner y la membrana
basilar en tres compartimientos separados: la scala vestibuli, la scala media y la scala
tympani. El scala vestibuli y el scala tympani comparten el mismo fluido, perilinfa, a
travs de un pequeo agujero, el helicotrema, en el pice; mientras que la escala media
contiene otro fluido, la endolinfa, que contiene una mayor densidad de iones de potasio
que facilita la funcin de las clulas ciliadas. La membrana basilar apoya el rgano de
Corti, que contiene las clulas capilares que convierten el movimiento relativo entre la
membrana basilar y la membrana tectorial en pulsos nerviosos al nervio auditivo.
Figura 1-5: El sistema mecnico del odo medio
Figura 1-6: Esbozo transversal de la cclea.
Cuando un sonido incidente llega al odo interno, la vibracin del estribo es transportada a
la escala vestibuli a travs de la ventana oval. Debido a que el fluido coclear es
incompresible, la ventana redonda conectada a la escala tympani vibra en consecuencia.
Por lo tanto, la vibracin comienza desde la base de la cclea, viaja a lo largo de la escala
vestimbuli, hasta el pice, y luego a travs del helicotrema hacia la escala tympani, de
regreso a la base, y finalmente termina en la ventana redonda. Esto establece una onda
de desplazamiento en la membrana basilar para el anlisis de frecuencia. Cada localizacin
en la membrana basilar es ms sensible a una frecuencia p a r t i c u lar, es decir, a la
frecuencia caracterstica, aunque tambin responde a una banda de frecuencia
relativamente amplia a una amplitud ms pequea. La membrana basilar es ms estrecha
(0,04 mm) y ms rgida cerca de la base, y ms ancha (0,5 mm) y ms suelta cerca del
pice. (Por el contrario, cuando se observa desde fuera, la cclea es ms ancha en la base

y ms pequea en el pice.) Por lo tanto, la frecuencia caracterstica disminuye
gradualmente y montonamente desde la base hasta el pice, como se indica en la Fig.
1-5. El fenmeno de onda de desplazamiento ilustrado en las Figs. 1-7 y 1-8 muestra los
patrones de vibracin, es decir, la amplitud frente a la ubicacin, para los tonos puros
incidentes de diferentes frecuencias. Un punto interesante en la Fig. 1-8 es que el patrn
de vibracin es asimtrico, con una cola lenta cerca de la base (para altas frecuencias) y
un borde empinado cerca del pice (para frecuencias bajas). Debido a esta asimetra, es
ms fcil para las frecuencias bajas enmascarar las altas frecuencias que viceversa.
Dentro del rgano de Corti en la membrana basilar, hay una hilera de clulas ciliadas
internas (IHC), y de tres a cinco filas de clulas ciliadas externas (OHC), dependiendo de
la ubicacin. Hay alrededor de 1500 IHCs y aproximadamente 3500 OHCs. Cada clula del
pelo contiene los estreociliae (pelos) que vibran que corresponden a la vibracin
mecnica en el lquido alrededor de ellos. Debido a que cada localizacin en la membrana
basilar es ms sensible a su propia frecuencia caracterstica, las clulas ciliadas en el lugar
tambin responden ms a su frecuencia caracterstica. Los IHC son clulas sensoriales,
como micrfonos, que convierten la vibracin mecnica en seales elctricas, es decir,
disparos neuronales. Las OHC, por otra parte, cambian sus formas segn la seal de
control recibida de los nervios eferentes. Su funcin es dar una ganancia o atenuacin
adicional, de modo que la salida del IHC est sintonizada a la frecuencia caracterstica
mucho ms agudamente que el propio IHC. Fig. 1-9 muestra la curva de sintona (nivel
de salida frente a frecuencia) para una ubicacin particular en la membrana basilar con y
sin OHC en funcionamiento. La curva de sintonizacin es mucho ms amplia con una
selectividad de frecuencia pobre cuando las OHC no funcionan. Las OHC hacen que
nuestro sistema auditivo sea un dispositivo activo, en lugar de un micrfono pasivo.
Debido a que las OHCs son activas y consumen mucha energa y nutricin, por lo general
son daadas primero debido a sonidos fuertes o medicamentos ototxicos (es decir,
medicamentos que son dainos para el sistema auditivo). No slo este tipo de prdida
auditiva hace que nuestra audicin sea menos sensible, sino que tambin hace que
nuestra audicin sea menos ntida. Por lo tanto, como es fcilmente confirmado con
pacientes con prdida auditiva, simplemente agregar una ganancia extra con audfonos no
resolvera totalmente el problema.

Figura 1-7: Una onda que viaja sobre la membrana basilar del odo interno. La amplitud exagerada de la membrana basilar para una
onda de 200 Hz que se desplaza de izquierda a derecha se muestra en A. La misma onda de 1,25 ms ms tarde se muestra en B. Estas
ondas de 200 Hz de desplazamiento estn todas dentro de la envolvente en C.
Figura 1-8: Una ilustracin de los patrones de vibracin de las clulas ciliadas en la membrana basilar para diversos tonos puros
incidentes. Hay una respuesta de pico localizada para cada frecuencia audible.
Selectividad de Frecuencia
Sintonizacin de Frecuencia

Como se analiz previamente, las clulas ciliadas internas se sintonizan con precisin a las
frecuencias caractersticas con ayuda de las clulas ciliadas externas. Este carcter de
afinacin tambin se conserva por las neuronas auditivas que se conectan a las clulas
ciliadas internas. Sin embargo, esta caracterstica de ajuste vara con el nivel. Fig. 1-10
muestra un diagrama caracterstico de curvas de sintonizacin desde una posicin
particular en la membrana basilar a varios niveles. Como puede verse en este grfico, a
medida que aumenta el nivel, la curva de sintonizacin se hace ms amplia, indicando una
menor selectividad de frecuencia. As, para or msica ms agudamente, uno debe
reproducirla a un nivel relativamente bajo. Adems, por encima de 60 dB, a medida que
aumenta el nivel, la frecuencia caracterstica disminuye. Por lo tanto, cuando uno escucha
un tono a un nivel alto, una neurona que normalmente se sintoniza a una frecuencia
caracterstica ms alta ahora est mejor sintonizada con el tono. Porque eventualmente el
cerebro percibe el tono basado en la entrada de la neurona, en niveles altos, sin saber que
la frecuencia caracterstica ha disminuido, el cerebro oye el tono para ser formado.
Armado con este conocimiento, uno pensara que alguien que estaba ocupado en la
escucha crtica -un ingeniero de grabacin, por ejemplo- elegira escuchar a niveles
moderados a bajos. Por qu entonces muchos profesionales de audio eligen monitorear a
muy alto niveles? Podra haber muchas razones. Los niveles altos pueden ser ms
emocionantes. Puede ser simplemente una cuestin de hbito. Por ejemplo, un ingeniero
de audio normalmente convierte el volumen a su nivel habitual con bastante precisin.
Adems, debido a que la selectividad de frecuencia es diferente en diferentes niveles, un
ingeniero de audio puede optar por hacer una grabacin mientras escucha a un nivel
"realista" o "performance" en lugar de supervisar a un nivel que es ms preciso. Por
ltimo, por supuesto, hay algunos profesionales de audio que han perdido algo de
audiencia ya, y con el fin de recoger ciertas bandas de frecuencia siguen aumentando el
nivel, que lamentablemente daa an ms su audiencia.
Figura 1-9: Curva de afinacin con (slida) y sin (discontinua) clulas de pelo externas funcionales.

Curva de ajuste a varios niveles en una localizacin particular de la membrana basilar de una chinchilla.
Figura 1-10: Curva de ajuste a varios niveles en una localizacin particular de la membrana basilar de una chinchilla.
Enmascaramiento y su aplicacin en codificacin de audio

Supongamos que un oyente apenas puede or una seal acstica dada en condiciones de
silencio. Cuando la seal est sonando en presencia de otro sonido (llamada "Masker"), la
seal normalmente tiene que ser ms fuerte para que el oyente pueda orla. El masker no
tiene que incluir los componentes de frecuencia de la seal original para que el efecto de
enmascaramiento tenga lugar, y una seal enmascarada ya puede ser oda cuando todava
es ms dbil que el masker.
El enmascaramiento puede ocurrir cuando una seal y un masker se reproducen
simultneamente (enmascaramiento simultneo), pero tambin puede ocurrir cuando un
masker comienza y termina antes de que se reproduzca una seal. Esto se conoce como
enmascaramiento directo. Aunque es difcil de creer, el enmascaramiento tambin puede
suceder cuando un masker comienza despus de que una seal deje de tocar! En general,
el efecto de este enmascaramiento hacia atrs es mucho ms dbil que el
enmascaramiento hacia adelante. El enmascaramiento directo puede ocurrir incluso
cuando la seal comienza ms de 100 ms despus de que el masker se detenga, pero el
enmascaramiento hacia atrs desaparece cuando el enmascarador comienza 20 ms
despus de la seal. El efecto de enmascaramiento ha sido ampliamente utilizado en la
investigacin psicoacstica. Por ejemplo, la fig. 1-10 muestra la curva de sintonizacin de
una chinchilla. Por razones de seguridad, no se permite realizar experimentos con sujetos
humanos. Sin embargo, con efecto de enmascaramiento, se puede variar el nivel de un
masker, medir el umbral (es decir, el sonido mnimo que el oyente puede escuchar) y
crear un diagrama de una curva de afinacin psicofsica que revela caractersticas
similares.
Adems de la investigacin cientfica, los efectos de enmascaramiento tambin son
ampliamente utilizados en reas como la codificacin de audio. Ahora, con la distribucin
de grabaciones digitales, es conveniente reducir el tamao de los archivos de audio. Hay
codificadores sin prdidas, que es un algoritmo para codificar el archivo de audio en un
archivo ms pequeo que puede ser reconstruido completamente con otro algoritmo
(decodificador). Sin embargo, los tamaos de archivo de los codificadores sin prdida son
todava relativamente grandes. Para reducir an ms el tamao, hay que eliminar alguna
informacin menos importante. Por ejemplo, uno podra eliminar las frecuencias altas, que

no es demasiado malo para la comunicacin del habla. Sin embargo, para la msica, una
cierta calidad importante se podra perder. Afortunadamente, debido al efecto de
enmascaramiento, uno puede eliminar algunos sonidos dbiles que estn enmascarados
para que los oyentes apenas noten la diferencia. Esta tcnica ha sido ampliamente
utilizada en codificadores de audio, como MP3.
Filtros auditivos y bandas crticas
Los experimentos muestran que nuestra capacidad de detectar una seal depende del
ancho de banda de la seal. Fletcher (1940) encontr que, al reproducir un tono en
presencia de un masker de paso de banda, a medida que aumentaba el ancho de banda
del masker mientras se mantena inalterado el nivel global del masker, el umbral
aumentaba a medida que el ancho de banda aumentaba hasta cierto lmite. El umbral
permaneci constante. Uno puede confirmar fcilmente que, cuando se escucha un sonido
de paso de banda con un ancho de banda de ampliacin y un nivel global constante, la
sonoridad permanece inalterada, hasta que se alcanza un cierto ancho de banda y ms
all de ese ancho de banda la sonoridad aumenta a medida que aumenta el ancho de
banda, Es constante. Una explicacin para explicar estos efectos es el concepto de filtros
auditivos. Fletcher propuso que, en lugar de escuchar directamente cada clula capilar,
escuchamos a travs de un conjunto de filtros auditivos, cuyas frecuencias centrales
pueden variar o superponerse, y cuyo ancho de banda vara segn la frecuencia central.
Estas bandas se denominan bandas crticas (CB). Desde entonces, la forma y el ancho de
banda de los filtros auditivos han sido cuidadosamente estudiados. Debido a que la forma
de los filtros auditivos no es simplemente rectangular, es ms conveniente usar el ancho
de banda rectangular equivalente (ERB), que es el ancho de banda de un filtro rectangular
que da la misma potencia de transmisin que el filtro auditivo real. Un estudio reciente de
Glasberg y Moore (1990) da una frmula para ERB para los oyentes jvenes con audicin
normal bajo niveles moderados de presin acstica.
ERB = 24.7 (4.37 F + 1)
dnde,
la frecuencia central del filtro F es en kHz,
ERB est en Hz.
A veces, es ms conveniente usar un nmero ERB como en la Ec. 1-11, similar a la escala
de corteza propuesta por Zwicker et al:
ERB Nmero = 21.4log(4,37F + 1 (3-1)
dnde,
la frecuencia central del filtro F es en kHz.
La Tabla 3-1 muestra la ERB y la escala Bark en funcin de la frecuencia central del filtro
auditivo. La escala Bark tambin aparece como un porcentaje de la frecuencia central, que
puede compararse a los filtros utilizados comnmente en las mediciones acsticas: octava
(70,7%), media octava (34,8%), una tercera octava (23,2%) y una - octava octava

(11,6%). El ERB se muestra en la Fig. 1-11 en funcin de la frecuencia. Un tercio de los
filtros de octava que son populares en audio y han sido ampliamente utilizados en
medidas acsticas en ltima instancia, tienen sus races en el estudio de la respuesta
auditiva humana. Sin embargo, como muestra la Fig. 1-11 muestra, que el ERB es ms
ancho que 1/3 de octava para frecuencias por debajo de 200 Hz; y es menor que 1/3 de
octava para frecuencias superiores a 200 Hz; y, por encima de 1 kHz, se aproxima a 1/6
de octava.
Figura 1-11: Una grfica de anchos de banda crticos (ERBs calculados) del sistema auditivo humano en comparacin con anchos de
banda de porcentaje constante de conjuntos de filtros comnmente utilizados en mediciones acsticas.
No linealidad del odo

Cuando se introduce un conjunto de frecuencias en un sistema lineal, la salida contendr
solamente el mismo conjunto de frecuencias, aunque las amplitudes y fases relativas
pueden ajustarse debido al filtrado. Sin embargo, para un sistema no lineal, la salida
incluir nuevas frecuencias que no estn presentes en la entrada. Debido a que nuestro
sistema auditivo ha desarrollado mecanismos como el reflejo acstico en el odo medio y
los procesos activos en el odo interno, es no lineal. Existen dos tipos de no linealidad: la
distorsin armnica y la combinacin de tonos. La distorsin armnica se puede lograr
fcilmente distorsionando un tono senoidal. Los nuevos componentes aadidos son
armnicos de la seal original. Un tono de combinacin ocurre cuando hay al menos dos
frecuencias en la entrada. La salida puede incluir tonos de combinacin segn:
donde,
Por ejemplo, cuando se introducen dos tonos a 600 y 700 Hz, la salida puede tener
frecuencias tales como 100 Hz (= 700 600 Hz), 500 Hz (= 2 600 700 Hz) y 400 Hz
(= 3 600 2 700 Hz), etc.
Debido a que la distorsin armnica no cambia la percepcin del tono, no sera
sorprendente si somos menos tolerantes con los tonos de combinacin.
Adems, debido a que el sistema auditivo est activo, incluso en un entorno
completamente silencioso, el odo interno puede generar tonos. Estas emisiones
otoacsticas son un signo de un odo interno sano y funcional, y muy diferente del
tinnitus resultante de la exposicin a niveles peligrosamente altos de presin acstica.
Percepcin de fase
La descripcin completa de un sonido dado incluye tanto un espectro de amplitud como
un espectro de fase. La gente normalmente presta mucha atencin al espectro de la
amplitud, mientras que cuida menos para el espectro de la fase. Sin embargo, los
investigadores acadmicos, los entusiastas de la alta fidelidad y los ingenieros de audio
han preguntado: "Es la oreja capaz de detectar las diferencias de fase?" A mediados del
siglo pasado, GS Ohm escribi: "La percepcin auditiva depende slo del espectro de
amplitud de un Sonido y es independiente de los ngulos de fase de los diversos
componentes contenidos en el espectro. Muchas confirmaciones aparentes de la ley de
Ohm de la acstica han sido ms tarde rastreados a las tcnicas de medicin cruda de
equipos.
En realidad, el espectro de fase a veces puede ser muy importante para la percepcin del
timbre. Por ejemplo, un impulso y un ruido blanco son bastante diferentes, pero tienen un
espectro de amplitud idntico. La nica diferencia ocurre en el espectro de fase. Otro
ejemplo comn es el habla: si uno codifica las fases relativas en el espectro de una seal
de voz, no ser inteligible. Ahora, con evidencia experimental, podemos confirmar que
nuestro odo es capaz de detectar la informacin de la fase. Por ejemplo, el disparo
neuronal del nervio auditivo ocurre en una cierta fase, que se denomina bloqueo de fase,
hasta aproximadamente 5 kHz. El bloqueo de fase es importante para la percepcin del
tono. En el tronco enceflico, la informacin de las orejas izquierda y derecha est
integrada, y la diferencia de fase interaural puede ser detectada, lo que es importante
para el odo espacial.
rea auditiva y Umbrales
El rea auditiva representada en la Fig. 1-12 describe, en un sentido tcnico, los lmites de
nuestra percepcin auditiva. Esta rea est limitada a bajos niveles de sonido por nuestro
umbral de audicin. Los sonidos ms suaves que se pueden escuchar caen en el umbral
de la curva auditiva. Por encima de esta lnea el movimiento de la molcula de aire es
suficiente para provocar una respuesta. Si, a una frecuencia dada, el nivel de presin
acstica se eleva suficientemente, se alcanza un punto en el que se siente una sensacin
de cosquilleo en los odos. Si el nivel se incrementa sustancialmente por encima de este
umbral de sensacin, se vuelve doloroso. Estos son los lmites inferior y superior del rea
auditiva. Tambin hay limitaciones de frecuencia por debajo de unos 20 Hz y superiores a
unos 16 kHz, limitaciones que (como los dos umbrales) varan considerablemente de
individuo a individuo. Estamos menos preocupados aqu por nmeros especficos que por
principios. En el rea auditiva de la fig. 1-12, se reproducen todos los sonidos de la vida:
baja frecuencia o alta, muy suave o muy intensa. El habla no utiliza todo el rea auditiva.
Su rango dinmico y rango de frecuencia son bastante limitados. La msica tiene un
mayor rango dinmico que el habla y un mayor rango de frecuencia. Pero incluso la
msica no utiliza todo el rea auditiva.
Figura 1-12: Todos los sonidos percibidos por los seres humanos de agudeza auditiva promedio caen dentro del rea auditiva. Esta
rea se define por el umbral de la audicin y el umbral del sentimiento (dolor) y por los lmites de la audicin de baja y alta frecuencia.
La msica y el habla no utilizan todo el rea auditiva disponible, pero la msica tiene el mayor rango dinmico (vertical) y las demandas
de frecuencia (horizontal).
Audicin sobre el tiempo

Si nuestro odo fuese como un analizador de Fourier ideal, para traducir una forma de
onda a un espectro, el odo tendra que integrarse en todo el dominio del tiempo, lo cual
no es prctico y, por supuesto, no es el caso. En realidad, nuestro odo slo se integra a
travs de una ventana de tiempo limitada (es decir, un filtro en el eje del tiempo), y as
podemos escuchar cambios de tono, timbre y dinmica a lo largo del tiempo, lo que puede
ser mostrado en un espectrograma en lugar de un espectro simple. Matemticamente, es
un anlisis wavelet en lugar de un anlisis de Fourier. Los experimentos de deteccin de
huecos entre tonos a diferentes frecuencias indican que nuestra resolucin temporal es del
orden de 100 ms, lo cual es una buena estimacin de la ventana de tiempo de nuestro
sistema auditivo. Para muchas perspectivas (por ejemplo, percepciones sobre sonoridad,
afinacin, timbre), nuestro sistema auditivo integra informacin acstica dentro de esta
ventana de tiempo.
Volumen
A diferencia del nivel o intensidad, que son cantidades fsicas o objetivas, la sonoridad es
la percepcin subjetiva del oyente. Como se ha visto en ejemplos anteriores, aunque el
medidor SPL lea el mismo nivel, un sonido con un ancho de banda ms amplio podra
sonar mucho ms alto que un sonido con un ancho de banda ms pequeo. Incluso para
un tono puro, aunque la sonoridad sigue algo con el nivel, es realmente una funcin
bastante complicada, dependiendo de la frecuencia. Un tono a 40 dB SPL no es
necesariamente el doble de alto que otro sonido a 20 dB SPL. Adems, la sonoridad
tambin vara entre los oyentes. Por ejemplo, un oyente que ha perdido una cierta
sensibilidad en una cierta banda crtica percibir cualquier seal en esa banda para estar
en un nivel ms bajo con respecto a alguien con la audiencia normal.
Aunque no hay medidor para medir directamente una cantidad subjetiva, como la
sonoridad, la escala psicofsica puede utilizarse para investigar la sonoridad entre los
sujetos. A los sujetos se les pueden asignar tareas, donde se les pide que ajusten el nivel
de las seales hasta que coincidan, o tareas comparativas, donde se les pide comparar
dos seales y estimar las escalas de sonoridad.
Contornos iguales de sonoridad y nivel de sonoridad
Al realizar experimentos usando tonos puros con una gran poblacin, Fletcher y Munson
en Bell Labs (1933) obtuvieron contornos de sonoridad iguales, tambin conocidos como
las curvas de Fletcher-Munson. Fig. 1-13 muestra los contornos de intensidad iguales
refinados posteriormente por Robinson y Dadson, que han sido reconocidos como un
estndar internacional. En la figura, los puntos de cada curva corresponden a tonos puros,
dando la misma intensidad a un oyente promedio. Por ejemplo, un tono puro a 50 Hz a 60
dB SPL est en la misma curva que un tono a 1 kHz a 30 dB. Esto significa que estos dos
tonos tienen intensidad idntica a un oyente promedio. Obviamente, el nivel para el tono
de 50 Hz es 30 dB ms alto que el nivel del tono de 60 Hz, lo que significa que somos
mucho menos sensibles al tono de 50 Hz. Sobre la base de los contornos de sonoridad
igual, se introduce el nivel de sonoridad, en fonos. Siempre se hace referencia a un tono
puro a 1 kHz. El nivel de sonoridad de un tono puro (a cualquier frecuencia) se define
como el nivel de un tono de 1 kHz que tiene sonoridad idntica al tono dado para un
oyente promedio. Para el ejemplo anterior, la sonoridad del tono puro de 50 Hz es de 30
phones, lo que significa que es tan fuerte como un tono puro de 30 dB a 1 kHz. La curva
ms baja marcada con "mnimo audible" es el umbral auditivo. Aunque muchos oyentes
normales pueden escuchar tonos ms dbiles que este umbral en algunas frecuencias, en

promedio, es una buena estimacin de un lmite audible mnimo. Los tonos ms altos que
la curva de 120 phons causarn dolor y dao auditivo.
Figura 1-13: Contornos de sonoridad iguales para tonos puros en un campo de sonido frontal para humanos de agudeza auditiva
promedio determinada por Robinson y Dadson. Los niveles de sonoridad en fonos corresponden a los niveles de presin sonora a 1000
Hz. (Recomendacin ISO 226).
Los contornos de intensidad igual tambin muestran que el odo humano es ms sensible
alrededor de 4 kHz (que es donde ocurre el dao auditivo debido a sonidos fuertes),
menos sensible a altas frecuencias y mucho menos sensible a frecuencias muy bajas (por
lo que un subwoofer tiene que ser muy potente para producir graves fuertes, cuyo precio
es el enmascaramiento de las medias y altas frecuencias y posibles daos auditivos). Un
estudio de esta familia de curvas nos dice por qu las frecuencias de agudos y bajos
parecen faltar o bajar de nivel cuando las grabaciones favoritas se reproducen a niveles
bajos.
Se puede notar que para frecuencias altas por encima de 10 kHz, las curvas no son
monotnicas para niveles bajos. Esto se debe al segundo modo resonante del canal
auditivo. Adems, a bajas frecuencias por debajo de 100 Hz, las curvas estn prximas
entre s, y el cambio de unos pocos dB puede darle la sensacin de ms de 10 dB de
cambio dinmico a 1 kHz. Adems, las curvas son mucho ms lisas a niveles altos, lo que
desafortunadamente alent a muchos a escuchar msica reproducida a niveles
anormalmente altos, causando de nuevo daos auditivos. En realidad, incluso si se quera
tener una audicin plana o lineal, escuchar a niveles anormalmente altos podra no ser
sabio, porque la selectividad de frecuencia de nuestro sistema auditivo ser mucho ms
pobre, lo que conduce a una interaccin mucho mayor entre varias frecuencias. Por
supuesto, una limitacin de la escucha en un nivel ms bajo es que, si algunos
componentes de la frecuencia caen debajo del umbral auditivo, entonces no son audibles.
Este problema es especialmente importante para las personas que ya han perdido cierta
agudeza en una cierta frecuencia, donde su umbral auditivo es mucho mayor de lo
normal. Sin embargo, con el fin de evitar ms dao de la audiencia, y con el fin de evitar
el efecto de enmascaramiento innecesario, uno podra considerar la posibilidad de
escuchar a niveles moderados.
El nivel de sonoridad considera la respuesta de frecuencia de nuestro sistema auditivo, y
por lo tanto es una escala mejor que el nivel de presin acstica para tener en cuenta la
sonoridad. Sin embargo, al igual que el nivel de presin acstica no es una escala de

sonoridad, el nivel de sonoridad no representa directamente la sonoridad. Simplemente
hace referencia al nivel de presin acstica de tonos puros en otras frecuencias a la de un
tono puro de 1 kHz. Adems, los contornos de sonoridad iguales se lograron slo con
tonos puros, sin tener en cuenta la interaccin entre componentes de frecuencia, por
ejemplo, la compresin dentro de cada filtro auditivo. Uno debe ser consciente de este
lmite cuando se trata de seales de banda ancha, como la msica.
Mediciones de nivel con ponderaciones A, B y C
Aunque los experimentos psicoacsticos dan mejores resultados en sonoridad,
prcticamente, la medicin de nivel es ms conveniente. Debido a que los contornos de
sonoridad iguales son ms planos en niveles altos, con el fin de hacer que las mediciones
de nivel representen algo nuestra percepcin de sonoridad, es necesario ponderar
frecuencias de manera diferente para mediciones en diferentes niveles. Fig. 1-14 muestra
las tres funciones de ponderacin ampliamente utilizadas. El nivel de ponderacin A es
similar a nuestra audicin a 40 dB, y se usa en niveles bajos; El nivel de ponderacin B
representa nuestra audicin a unos 70 dB; Y el nivel de ponderacin C es ms plano,
representando nuestra audicin a 100 dB, y por lo tanto se utiliza en niveles altos. Para las
preocupaciones sobre la prdida auditiva, el nivel de ponderacin A es un buen indicador,
a pesar de la prdida de audicin ocurre a menudo en niveles altos.
Figura 1-14: Niveles con ponderaciones A, B y C
Sonoridad en Sones
Nuestra audicin para la sonoridad es definitivamente una funcin comprimida (menos
sensible para niveles ms altos), que nos da sensibilidad para sonidos dbiles y gran rango
dinmico para sonidos fuertes. Sin embargo, a diferencia de la escala logartmica (dB) que
es ampliamente utilizada en el nivel de presin acstica, la evidencia experimental
muestra que la sonoridad es en realidad una funcin de ley de potencia de intensidad y
presin como se muestra en la Ec. 3-3.

La unidad de sonoridad es sones. Por definicin, un sone es la sonoridad de un tono de 1
kHz a un nivel de sonoridad de 40 phons, el nico punto donde se combinan phons y SPL.
Si otro sonido suena dos veces ms fuerte que el tono de 1 kHz en 40 phons, se clasifica
como 2 sones, etc. La sonoridad de tonos puros en sones se compara con la SPL en dB en
la Fig. 1-15. La figura muestra que por encima de 40 dB, la curva es una lnea recta, que
corresponde a un exponente de aproximadamente 0,3 para la intensidad del sonido y un
exponente de 0,6 para la presin acstica como en la Ec. 3-3. El exponente es mucho
mayor para los niveles inferiores a 40 dB y para las frecuencias inferiores a 200 Hz (lo que
se puede confirmar por el hecho de que los contornos iguales de sonoridad son compactos
para las frecuencias inferiores a 200 Hz en la figura 1-13).
e debe observar que la Ec. 3-3 no slo es para tonos puros, sino tambin para seales de
paso de banda dentro de un filtro auditivo (banda crtica). El exponente de 0,3 (<1) indica
compresin dentro del filtro. Sin embargo, para una seal de banda ancha que es ms
ancha que un ancho de banda crtico, la ec. 3-3 se mantiene para cada banda crtica, y la
sonoridad total es simplemente la suma de volumen en cada banda (sin compresin a
travs de bandas crticas).
Figura 1-15: Comparacin entre la sonoridad en sones y el nivel en phons para un tono de 1 kHz.
Sonoridad vs. Ancho de banda

Debido a la menor compresin en bandas crticas, los sonidos de banda ancha, como el
lanzamiento de un cohete o el despegue de un avin de reaccin, parecen ser mucho ms
fuertes que los tonos puros o bandas estrechas de ruido del mismo nivel de presin
acstica. De hecho, el aumento del ancho de banda no aumenta la sonoridad hasta que se
excede el ancho de banda crtico. Ms all de ese punto se excitan mltiples bandas
crticas, y el volumen aumenta notablemente con el aumento en el ancho de banda debido
a una menor compresin a travs de bandas crticas. Por esta razn, el clculo de la
sonoridad para un sonido de banda ancha debe basarse en la distribucin espectral de la
energa. No se requieren filtros ms estrechos que las bandas crticas y se utilizan
comnmente filtros de octava.

Sonoridad de Impulsos
La vida est llena de sonidos de tipo impulso: broches de presin, estallidos, crepitaciones,
golpes, sonajas. Para impulsos o rfagas de tono con duracin superior a 100 ms, la
sonoridad es independiente del ancho de pulso. El efecto sobre la sonoridad de los
impulsos de menos de 200 ms se muestra en la Fig. 1-16. Esta curva muestra cunto ms
alto el nivel de impulsos cortos de ruido y tonos puros debe sonar tan fuerte como ruido
continuo o tonos puros. Los pulsos de ms de 200 ms son percibidos como tan fuertes
como el ruido continuo o los tonos del mismo nivel. Para los impulsos ms cortos, el nivel
del pulso debe ser aumentado para mantener la misma intensidad que para los impulsos
ms largos. El ruido y los pulsos tonales son similares en el nivel de aumento requerido
para mantener la misma intensidad. Fig. 1-16 indica que el odo tiene una constante de
tiempo de aproximadamente 200 ms, confirmando la ventana de tiempo en el orden de
100 ms. Esto significa que los niveles de banda deben medirse con detectores RMS con
tiempos de integracin de aproximadamente 200 ms. Esto corresponde al ajuste RPIDO
en un medidor de nivel de sonido mientras que el ajuste LENTO corresponde a un tiempo
de integracin de 500 ms.
Figura 1-16: Los impulsos cortos de sonido deben ser aumentados en el nivel de sonido tan fuerte como pulsos ms largos.
Percepcin de Cambios Dinmicos

Qu tan sensible es nuestra audicin a los cambios dinmicos? En otras palabras,
cunta intensidad o cambio de nivel conducir a una percepcin de cambio de sonoridad?
Para discutir este tipo de problema, necesitamos el concepto de la diferencia apenas-
perceptible (JND), que se define como el cambio mnimo que se puede detectar. La Ley de
Weber establece que el JND en intensidad, en general y no necesariamente para or, es
proporcional a la intensidad global. Si la ley de Weber es vlida, la fraccin de Weber en
dB como se define en la Ec. 3-4 sera una constante, independiente de la intensidad
general y del nivel general.

Fig. 1-17 muestra la medicin de la fraccin de Weber para seales de banda ancha de
hasta 110 dB SPL. Por encima de 30 dB, la fraccin de Weber en dB es realmente una
constante de aproximadamente -10 dB, correspondiente a un JND de 0,4 dB. Sin
embargo, para los sonidos dbiles por debajo de 30 dB, la fraccin de Weber en dB es
ms alta, y puede ser tan alta como 0 dB, lo que corresponde a un JND de 3 dB. En
otras palabras, nuestra audicin es menos sensible (en el nivel) para cambios dinmicos
de sonidos menores de 30 dB. Curiosamente, al medir con tonos puros, se encontr que la
fraccin de Weber es ligeramente diferente de las seales de banda ancha. Este fenmeno
se conoce como la Ley de Weber, que casi se pierde. Fig. 1-17 incluye una medicin ms
reciente para tonos puros, lo que demuestra que la fraccin de Weber disminuye
gradualmente hasta 85 dB SPL y puede ser inferior a -12 dB, lo que corresponde a un JND
menos que 0.3 dB. Se cree que la Ley de Weber para tonos puros, que se aproxima a
la falta, est asociada con los patrones de excitacin amplios a travs de la frecuencia a
niveles altos.
Fig.1-17: Diferencia apenas perceptible (JND) para un ruido de banda ancha y para un tono de 1 kHz.
Tono
Tono parece ser un concepto muy claro, y sin embargo es muy difcil dar una definicin
precisa. La definicin del American National Standards Institute (ANSI) es la siguiente: "El
tono es el atributo de la sensacin auditiva en trminos de qu sonidos pueden ordenarse
en una escala que se extiende de bajo a alto". Al igual que la sonoridad, el tono es una
cantidad subjetiva. El estndar ANSI tambin establece: "El tono depende principalmente
del contenido de frecuencia del estmulo de sonido, pero tambin depende de la presin
del sonido y la forma de onda del estmulo".

A grandes rasgos, los sonidos que percibimos como tono son tonos musicales producidos
por un instrumento musical (excepto instrumentos de percusin) y voz humana. Es un
tono puro a una cierta frecuencia, o un tono complejo con ciertos fundamentos y una
serie de armnicos cuyas frecuencias son mltiplos de la frecuencia fundamental. Por
ejemplo, cuando un violn est tocando un tono de concierto A (440 Hz), el espectro
incluye no slo la frecuencia de 440 Hz sino tambin las frecuencias de 880 (2 440) Hz,
1320 (3 440) Hz, y 1760 (4 440) Hz, etc.
Para percibir un tono, el sonido debe ser capaz de emparejar con un tono puro, es decir,
un oyente debe ser capaz de ajustar la frecuencia de un tono puro para producir un tono
idntico al sonido dado. Un ejemplo opuesto es el siguiente. Cuando uno golpea un
tambor pequeo, puede sonar ms alto que un tambor ms grande. Sin embargo,
normalmente uno no puede igualar el sonido que produce un tambor con un tono puro. La
excepcin, por supuesto, sera un timbal o un tambor de acero. Por lo tanto, el sonido que
hacen la mayora de los tambores no da lugar a la percepcin del tono. Otro atributo del
tono es que, si un sonido tiene tono, se puede utilizar para hacer una meloda. Uno podra
utilizar un generador de frecuencia para producir un tono puro a una frecuencia de 10
kHz, y uno podra emparejarlo con otro tono escuchando los latidos. Sin embargo, no sera
percibido como un tono, y no podra ser utilizado como parte de una meloda; Por lo tanto,
no se podra pensar que tenga tono.
La unidad de Tono
La unidad de mel se propone como una medida de la cantidad subjetiva de tono. Siempre
se hace referencia a un tono puro a 1 kHz a 40 dB por encima del umbral del oyente, que
se define como 1000 mels. Si otro sonido produce un tono que suena dos veces ms alto
que esta referencia, se considera que es de 2000 mels, etc. La Fig. 1-18 muestra la
relacin entre el tono en mels y la frecuencia en Hz. El eje de frecuencia en la Fig. 1-18
est en escala logartmica. Sin embargo, la curva no es una lnea recta, lo que indica que
nuestra percepcin de tono no es una escala logartmica ideal con respecto a la frecuencia
en Hz. Esta relacin es probablemente ms importante para los intervalos meldicos
(cuando las notas se ejecutan secuencialmente) que para los acordes (cuando las notas se
tocan simultneamente). En un acorde, para producir una armona limpia, las notas tienen
que coincidir con los armnicos de la nota de raz; de lo contrario, se producirn beats,
sonando fuera de tono. En la industria de la msica y el audio, es mucho ms conveniente
usar la frecuencia en Hz o la unidad de centsima basada en la cantidad objetivo de
frecuencia.
Debido a que nuestra audicin es aproximadamente una escala logartmica en la
frecuencia -por ejemplo, la frecuencia de duplicacin transpone una nota musical a una
octava-, los intervalos musicales superiores entre dos tonos pueden ser descritos
objetivamente en la unidad de centsima como se define en la Ec. 3-7.

Fig.1-18: La relacin entre la frecuencia, un parmetro puramente fsico, y el tono, una reaccin subjetiva al estmulo fsico.
As, un semitono en un piano (temperamento igual) es 100 centsimas, y un intervalo de

una octava es de 1200 centsimas. Usando la unidad de centsima, uno puede describir
fcilmente las diferencias entre diversos temperamentos (por ejemplo, temperamento
igual, escala pitagrica, Just-tuning, etc.).
Percepcin de tonos puros y complejos
Cmo percibe nuestro cerebro el tono? La membrana basilar en el odo interno funciona
como un analizador de frecuencia: tonos puros a varias frecuencias excitarn
localizaciones especficas en la membrana basilar. Esto parecera sugerir que la
localizacin de la excitacin mxima en la membrana basilar determina el tono. En
realidad, el proceso es mucho ms complicado: adems de la codificacin de lugar,
tambin hay codificacin temporal, que explica el intervalo de tiempo entre dos puntos
neuronales adyacentes. La codificacin temporal es necesaria para percibir el tono de los
tonos complejos, el tono virtual con las fundamentales que faltan, etc. Las teoras basadas
en la codificacin de lugar y codificacin temporal se han propuesto para explicar el origen
de la percepcin de los tonos puros y complejos. Para la teora del lugar o la teora
temporal, hay evidencia experimental que lo apoya y desfavorece. A medida que
desarrollamos nuestro conocimiento, probablemente entenderemos ms acerca de cundo
se lleva a cabo cada codificacin.
Cuando escuchamos un tono complejo, somos tolerantes con los armnicos ligeramente
desarmados. Por ejemplo, si tres frecuencias de 800, 1000 y 1200 Hz (es decir, el 4, 5 y
6 armnicos de un fundamental de 200 Hz) se combinan y se presentan a un oyente, el
tono percibido es de 200 Hz. Si todos ellos son desplazados hacia arriba por 30 Hz -es
decir, 830, 1030 y 1230 Hz- el fundamental, tericamente, es ahora de 10 Hz, y esos tres
componentes son ahora los armnicos 83, 103 y 123 del fundamental de 10 Hz. Sin
embargo, al reproducir este tono complejo desaconsejado, los oyentes pueden or un tono
claro a 206 Hz, que coincide con la frecuencia media, es decir, 1030 Hz, el cuarto
armnico del fundamental. Aunque las otras dos frecuencias estn ligeramente
desarmadas (en direcciones opuestas) como armnicos, el tono es muy fuerte.
Vale la pena mencionar que el reconocimiento de tono es un proceso integrado entre las
dos orejas, es decir, es un proceso binaural. Cuando dos armnicos del mismo
fundamental se presentan a cada odo independientemente, el oyente oir el tono en la
frecuencia fundamental, no como dos tono, uno en cada odo
Fase de bloqueo y Rango de sensacin de Tono
Cul es el rango de la frecuencia fundamental que produce un tono? Es igual al rango
audible de 20 Hz a 20 kHz? La nota ms baja en un piano es 27.5 Hz, no demasiado lejos
del lmite ms bajo. Sin embargo, para el lmite alto, es solamente cerca de 5 kHz. Debido
a que la percepcin de tono requiere codificacin temporal, las neuronas auditivas tienen
que disparar en una cierta fase de cada ciclo, que se llama bloqueo de fase.
Desafortunadamente, el sistema auditivo no es capaz de bloquear fases a frecuencias por
encima de 5 kHz. Esta es la razn por la que la nota ms alta en un piccolo, que es el tono
ms alto en una orquesta, es de 4,5 kHz, ligeramente inferior a 5 kHz. Notas con
fundamentos superiores a 5 kHz no se perciben como de tono y no pueden utilizarse para
melodas musicales. Uno puede confirmar fcilmente esta afirmacin mediante la
transposicin de una meloda familiar por octavas: cuando la fundamental es superior a 5
kHz, aunque se puede or algo cambiante, la meloda no puede ser reconocida ms.
Diferencia de Frecuencia Limen
La diferencia de frecuencia limen es otra manera de decir "la diferencia apenas perceptible
en frecuencia." Es la diferencia de frecuencia ms pequea que un oyente puede
discriminar. Los experimentos con tonos puros de duracin de 500 ms muestran que, para
niveles superiores a 10 dB por encima del umbral, entre 200 Hz y 5 kHz, la diferencia de
frecuencia es inferior al 0,5% de la frecuencia dada, correspondiente a 9 centsimas(cerca
de 1/10 de un semitono).
Dependencia del tono en el nivel
El tono puede verse afectado por el nivel, sin embargo, la influencia no es universal a
travs de la frecuencia. A frecuencias inferiores a 1 kHz, el tono disminuye a medida que
aumenta el nivel; mientras que a frecuencias superiores a 3 kHz, el tono aumenta con el
nivel creciente; Y en las frecuencias entre 1 y 3 kHz, variando el nivel tiene poco efecto
sobre el tono. Esto se conoce como regla de Stevens. Terhardt et al. Resumi varios
estudios de la dependencia de nivel de tonos puros y vino para arriba con la siguiente
ecuacin para un oyente promedio.

Tono Perfecto
Algunas personas, especialmente algunos msicos, desarrollan el tono perfecto, tambin
conocido como tono absoluto. Pueden identificar el tono de un tono musical sin ayuda de
una referencia externa como un sintonizador, es decir, han establecido una escala
absoluta de tono en sus cabezas. Algunos de ellos describen el sentimiento de cierta nota
anloga a un cierto color. Algunos creen que se puede establecer una sensacin de tono
perfecto si l o ella tiene mucha experiencia escuchando msica en ciertas tonalidades
(que normalmente se debe a la formacin musical) antes de los 4 aos de edad. Es justo
afirmar que tener un tono perfecto no es un requisito para un buen msico. Aparte de la
ventaja de afinar instrumentos musicales o cantar sin un dispositivo de sintonizacin, no
hay evidencia de que una persona con afinacin perfecta cante con ms precisin en
sintona. Con la ayuda de un sintonizador o acompaamiento, un buen msico sin tono
perfecto lo hara igual de bien. Hay, sin embargo, una desventaja debido al efecto de
edad. Para las personas mayores (especialmente aquellas mayores de 65 aos), las
escalas de tono se desplazan a menudo para que escuchen msica que se est
reproduciendo normalmente para sonar fuera de tono. Esto puede no ser notorio para una
persona sin tono perfecto. Sin embargo, para un msico mayor con el tono perfecto, l o
ella podran encontrar que sea molesto al percibir a todos los dems en la orquesta
tocando fuera de tono. l o ella tienen que vivir con ella, porque l o ella puede ser el
nico en la orquesta que toca fuera de tono.
Otros efectos de tono
El tono depende principalmente de la frecuencia fundamental, y normalmente la
frecuencia fundamental es uno de los armnicos ms fuertes. Sin embargo, la
fundamental de un tono complejo puede faltar o enmascararse con un ruido de banda
estrecha, mientras que todava produce un tono claro. El tono producido sin fundamental
se llama tono virtual, y es evidencia que favorece la teora temporal sobre la teora del
lugar. La forma de onda de un tono virtual lleva un perodo idntico como un tono
complejo normal que incluye la fundamental a la misma frecuencia.
Al escuchar una seal de banda ancha con una determinada relacin de fase interaural,
aunque escuchar con un odo no produce un tono, al escuchar con ambos odos, se puede
or un tono sobre el ruido de fondo. Este tipo de lanzamientos se llaman "lanzamientos
binaurales."
Timbre
Timbre es nuestra percepcin del color del sonido. Es esa dimensin subjetiva que nos
permite distinguir entre el sonido de un violn y un piano tocando la misma nota. La

definicin de la American Standards Association establece que el timbre es "ese atributo
de la sensacin en trminos de que un oyente puede juzgar que dos sonidos que tienen la
misma intensidad y tono son diferentes", y "el timbre no solo depende principalmente del
espectro del estmulo, sino que tambin depende de la forma de onda, la presin sonora,
la frecuencia de localizacin del espectro y las caractersticas temporales del estmulo.
Cada sonido tiene su espectro nico. Para los instrumentos musicales, el espectro podra
ser muy diferente para las notas diferentes, aunque todos sonidos como los tonos
producidos por el mismo instrumento. El timbre de un sonido producido en una sala de
conciertos puede incluso variar con la posicin del oyente debido a los efectos de la
absorcin de aire y debido a las caractersticas de absorcin dependientes de la frecuencia
de las superficies de la habitacin.
Vale la pena sealar que, para describir ms completamente el timbre, tanto el espectro
de amplitud como el de fase son necesarios. Aunque un ruido blanco y un impulso tienen
un espectro de amplitud idntico, suenan de forma muy diferente debido a la diferencia en
los espectros de fase. A veces, el inicio y el desplazamiento de un tono pueden ser
importantes para el timbre (por ejemplo, el decay de un tono de piano). As, junto con la
consideracin de la ventana de tiempo de la audicin humana (del orden de 100 ms), la
descripcin ms exacta de un timbre sera un espectrograma (es decir, el espectro de
desarrollo con el tiempo), como se muestra en la Fig. 1-19.
Fig. 1-19: El eje vertical es la frecuencia, el eje horizontal es el tiempo y la oscuridad de un punto representa el nivel de una
componente de frecuencia particular en un momento dado.
Audicin binaural y espacial

Cul es la ventaja de tener dos odos? Una ventaja obvia es una copia de seguridad: si
una oreja est daada de alguna manera, hay otra que usar, una razn similar para tener
dos riones. Esta explicacin es definitivamente incompleta. Al or, tener dos orejas nos da
muchas ms ventajas. Debido a tener dos orejas, podemos localizar fuentes de sonido,
discriminar los sonidos originados de diferentes lugares, escuchar conversaciones mucho
ms claramente y ser ms inmune a los ruidos de fondo.
Cuestiones de localizacin para izquierda y derecha
Cuando una fuente de sonido est a la izquierda con respecto a un oyente, est ms cerca
de la oreja izquierda que de la oreja derecha. Por lo tanto, el nivel de sonido es mayor en
la oreja izquierda que en la oreja derecha, lo que lleva a una diferencia de nivel interaural
(ILD). A veces, la gente tambin usa la diferencia de intensidad interaural (IID) para
describir la misma cantidad. Adems, debido a que la onda sonora alcanza el odo
izquierdo antes que la oreja derecha, hay una diferencia de tiempo interaural (ITD) entre
las dos orejas. Sin embargo, las neuronas auditivas no comparan directamente ITD, y en
su lugar, comparan la diferencia de fase interaural (IPD). Para un tono puro, el ITD y el
IPD estn relacionados linealmente. El ITD y el IPD tambin se conocen como la diferencia
temporal interaural. En resumen, para la localizacin de izquierda y derecha, hay dos
seales, es decir, las seales ILD y ITD.
El ajuste de las seales ILD o ITD puede afectar la localizacin del sonido de izquierda y
derecha. En realidad, ambas seales varan. Hay lmites para ambas seales. Con el fin de
localizar mejor utilizando las seales ILD, las diferencias interaurales deben ser mayores.
Debido a la difraccin alrededor de la cabeza, a frecuencias por debajo de 1 kHz, los
niveles en ambos odos son similares, dando lugar a pequeas seales ILD. Por lo tanto,
las seales ILD se utilizan a altas frecuencias, cuando la sombra de la cabeza tiene un
gran efecto bloqueando el odo contralateral (el que no apunta a la fuente). Por otro lado,
tambin hay un lmite para las seales ITD. A frecuencias superiores a 700 Hz, el IPD de
una fuente a la izquierda oa la derecha superior a 180. Para un tono puro, esto dara
lugar a confusin: un tono muy a la derecha podra sonar a la izquierda, Fig. 1-20. Dado
que nos preocupamos ms por las fuentes de sonido frente a nosotros, este lmite de 700
Hz se puede extender un poco hacia arriba. Adems, con una seal compleja con amplio
ancho de banda, tambin podemos usar el retardo de tiempo (o diferencia de fase) de la
modulacin de baja frecuencia. En general, la frecuencia de 1,2 kHz (o un rango de
frecuencia entre 1 y 1,5 kHz) es una buena estimacin para un lmite, por debajo del cual
las seales de ITD son importantes y por encima de las cuales las seales de ILD son
dominantes.
Fig. 1-20: Confusin de seales de diferencia de fase interaural (IPD) a altas frecuencias. La curva discontinua para el odo izquierdo
est retrasando la curva slida para la oreja derecha en 270, pero se confunde cuando el odo izquierdo est llevando la oreja derecha
90
En la grabacin, el ajuste de las seales ILD se consigue fcilmente desplazando entre los
canales izquierdo y derecho. Aunque el ajuste de las seales ITD tambin mueve la
imagen del sonido a travs de los auriculares, cuando se escucha a travs de altavoces,
las seales ILD son ms fiables que las indicaciones ITD con respecto a las posiciones del
altavoz.
Localizacin en planos sagitales

Considere dos fuentes de sonido, una directamente delante y otra directamente detrs de
la cabeza. Debido a la simetra, el ILD y el ITD son ambos cero para esas fuentes. Por lo
tanto, parecera que, al usar slo seales ILD e ITD, un oyente no sera capaz de
discriminar las fuentes anterior y posterior. Si consideramos que la cabeza es una esfera
con dos agujeros en las posiciones del odo (el modelo de cabeza esfrica), las fuentes
que producen un ITD dado se localizan en la superficie de un cono como se muestra en la
Fig. 1-21. Este cono se llama el cono de la confusin. Si slo las seales de ITD estn
disponibles para un oyente con una cabeza esfrica, l o ella no sera capaz de discriminar
las fuentes de sonido en un cono de confusin. Por supuesto, la forma de una cabeza real
con el pabelln de la oreja es diferente de la cabeza esfrica, que cambia la forma del
cono de la confusin, pero la conclusin general todava se sostiene. Cuando las seales
ILD tambin estn disponibles, debido a la difraccin de la cabeza (es decir, la sombra de
la cabeza), el oyente puede limitar an ms la confusin en una determinada seccin
transversal del cono (es decir, el "circulo" oscuro en la figura 1 -21). Eso es lo mejor que
se puede hacer con pistas ILD y ITD . Sin embargo, en realidad, la mayora de las
personas pueden localizar fcilmente fuentes de sonido en el frente, en la espalda, y por
encima de la cabeza, etc, incluso con los ojos cerrados. Podemos localizar las fuentes en
un plano sagital (un plano vertical que separa el cuerpo en partes, no necesariamente
iguales, izquierda y derecha) con la contribucin de la forma asimtrica de nuestro
pabelln de la oreja, cabeza y torso de nuestra parte superior del cuerpo. Los pabellones
de la oreja son asimtricos cuando se mira desde cualquier direccin. El papel principal del
pabelln de la oreja es filtrar o crear seales espectrales que son virtualmente nicas para
cada ngulo de incidencia. Diferentes lugares en el cono de confusin se filtrarn de
manera diferente, produciendo seales espectrales nicas en cada ubicacin.
La forma comn de describir la seal espectral para la localizacin es la funcin de
transferencia relacionada con la cabeza (HRTF), un ejemplo de la cual se muestra en la
Fig. 1-22. Es la funcin de transferencia (ganancia versus frecuencia), que ilustra la
caracterstica de filtrado del odo externo, para cada lugar en el espacio (o, ms a
menudo, para cada ngulo de incidencia). Hoy en da, con los micrfonos de la sonda
insertados cerca del tmpano, HRTF se puede medir con alta exactitud. Una vez que se
obtiene para un oyente dado, al escuchar una grabacin realizada en una cmara
anecoica convolucionada con la HRTF adecuada, se puede "engaar" el sistema auditivo y
hacer que el oyente crea que la grabacin se est tocando desde la ubicacin
correspondiente a la HRTF.

Fig.1-21: Cono de confusin para una cabeza esfrica con dos agujeros en las posiciones de la oreja. Si slo estn disponibles seales
de ITD, el oyente no puede discriminar posiciones en la superficie del cono de confusin, que corresponde a un ITD dado. Si las seales
ILD tambin estn disponibles, debido a la difraccin de la cabeza, el oyente puede limitar an ms el rango de confusin en un crculo
(el "circulo" oscuro en la figura).
Fig.1-22: Funciones de transferencia relacionadas con la cabeza. Cada curva muestra la caracterstica de filtrado (es decir, la ganancia
aadida por el odo externo en cada frecuencia) de un ngulo incidente. Esta figura muestra las orientaciones en el plano horizontal.
Los ngulos se refieren al plano sagital mediano, ipsilateral al odo. El ngulo de 0 est justo delante del sujeto.
Hay dos desafos cuando se usan seales espectrales. La primera es la discriminacin

entre la caracterstica de filtrado y el espectro de la fuente. Por ejemplo, si uno oye un
corte alrededor de 9 kHz, puede ser debido a una HRTF, o que el espectro original de la
fuente podra tener un corte alrededor de 9 kHz. Desafortunadamente no hay una manera
simple de discriminar entre ellos. Sin embargo, para un sonido familiar (voz, instrumentos,
etc.) con un espectro conocido por el sistema auditivo, es ms fcil descubrir las HRTF y,
por lo tanto, localizar la fuente ms fcilmente que un sonido desconocido. Si uno tiene
problemas para discriminar los sonidos a lo largo del cono de confusin, uno puede usar
las seales de movimiento de la cabeza. Por ejemplo, supongamos que un oyente gira la
cabeza hacia la izquierda. Si la fuente se mueve hacia la derecha, la fuente est delante;
Mientras que si la fuente se mueve ms lejos a la izquierda, debe estar en la parte
posterior. El segundo desafo es la individualidad de las HRTF. No hay dos personas que
compartan el mismo pabelln de la oreja y la forma de la cabeza, y hemos aprendido
nuestro propio pabelln de la oreja y el tamao de la cabeza / forma a lo largo de aos de
experiencia. Si uno escucha los sonidos convolucionados con los HRTFs de otra persona,
aunque la localizacin izquierda-derecha ser buena, habr mucha confusin en el frente,
a menos que la cabeza y los odos del oyente sean similares en tamao y forma a aquellos
cuya HRTF se mide. El sistema binaural humano es notablemente adaptable. Los
experimentos con moldes de oreja muestran que si un sujeto escucha exclusivamente a
travs de otro conjunto de orejas, aunque originalmente hay mucha confusin en el frente
hacia atrs, en aproximadamente 3 semanas, el sujeto aprender las orejas nuevas y
localizar casi tan bien como con su Orejas originales. En lugar de olvidar las orejas
nuevas o viejas, el sujeto memoriza los dos conjuntos de odos y se convierte en un
sentido bilinge, y es capaz de cambiar entre los dos conjuntos de odos.
Externalizacin
Muchos oyentes prefieren escuchar msica a travs de altavoces en lugar de a travs de
auriculares. Una de las razones es que al escuchar a travs de auriculares,el pabelln de la
oreja es efectivamente puenteado, y el sistema auditivo no est recibiendo ninguna de las
seales que produce el pabelln de la oreja. Sobre los auriculares, los instrumentos y las
voces de los cantantes son todos percibidos o localizados dentro de la cabeza. Cuando se
escucha a travs de altavoces, aunque las seales de localizacin no son perfectas, los

sonidos se exteriorizan si no se localizan, algo ms natural. Sin embargo, si la msica que
se reproduce a travs de los auriculares incluye las HRTF del oyente, ellos deberan ser
capaz de externalizar el sonido perfectamente. Los algoritmos estn disponibles para
simular fuentes de sonido 3D en cualquier lugar en campo libre y en una habitacin
normal con reverberacin. La simulacin es precisa hasta 16 kHz, y los oyentes no pueden
discriminar entre la fuente real y el sonido virtual (simulado). Un inconveniente, sin
embargo, es que el sistema tiene que ser calibrado para cada oyente y cada habitacin.
En 1985, Jones et Al ideo una prueba para las imgenes estreas que utilizaban un
reverberador desarrollado en el estudio dentro de una computadora de la universidad del
noroeste. El reverberador utiliz HRTF para crear simulaciones muy convincentes de
espacio 3D y mover fuentes de sonido dentro del espacio 3D. La prueba de Jones et Al,
denominada LEDR (NU ), contena ejemplos de sonido que se movan en rutas de sonido
muy especficas. Cuando se reproducan en sistemas de altavoces que estaban libres de
distorsiones de fase o temporales y en entornos libres de reflexiones tempranas, los
caminos se perciban tal como estaban destinados. En presencia de reflexin temprana o
de crossovers o conductores desalineados, los caminos son corrompidos audiblemente.
Precedencia (Haas) Efecto
Cuando dos clics se presentan simultneamente a un oyente, uno a la izquierda y otro a la
derecha, el oyente percibira un clic en frente, es decir, medir las seales de localizacin
de los dos clics. Sin embargo, si uno de los clics se retrasa (hasta 5 ms) en comparacin
con el otro, el oyente todava los percibe como un clic fusionado, pero localizar la imagen
fusionada con las claves del primer clic e ignorar el cue de localizacin del ltimo. Para
los delays superiores a 5 ms, el oyente escuchar dos clics distintos en lugar de un clic
fusionado. Para el habla, la msica u otras seales complejas, este lmite superior puede
aumentarse a unos 40 ms. Este fenmeno que el sistema auditivo localiza en la primera
llegada se llama efecto de precedencia, o efecto de Haas.
El efecto de precedencia tiene usos muy prcticos en audio. Por ejemplo, en una iglesia
grande, puede no ser posible o prctico cubrir toda la iglesia desde un lugar de altavoz.
Una solucin es colocar un altavoz primario en la parte delantera de la iglesia, con
altavoces secundarios a lo largo de las paredes laterales. Debido al efecto de precedencia,
si la seal a los altavoces a lo largo de las paredes se retrasa de modo que el sonido
directo desde el frente llega primero a un oyente, el oyente localizar el altavoz delantero
como fuente del sonido, aunque la mayor parte del sonido, el contenido realmente llegar
desde el altavoz al lado, que est mucho ms cerca del oyente, e incluso puede estar
operando a un nivel superior. Cuando estos sistemas estn configurados correctamente,
sonar como si los altavoces secundarios no estuvieran encendidos. En realidad, apagarlos
demuestra exactamente lo importante que son, ya que sin ellos el sonido es inaceptable, y
el habla puede ser incluso ininteligible.
Efecto Franssen
El Efecto Franssen puede ser una demostracin muy impresionante en una sala en directo.
Un tono puro se reproduce a travs de dos altavoces en dos lugares diferentes. Un altavoz
reproduce el tono primero y se atena inmediatamente, mientras que el mismo tono puro

se alza en el otro altavoz, de modo que el nivel general no cambia significativamente.
Fig.1-23. Aunque el altavoz original no est sonando en absoluto, la mayora de la
audiencia seguir creyendo que el sonido viene del primer altavoz. Este efecto puede
durar un par de minutos. Uno puede hacer esta demostracin ms eficazmente
desconectando el cable al primer altavoz, y la audiencia todava localizar el sonido a ese
altavoz. El efecto Franssen revela el nivel de nuestra memoria auditiva de las
localizaciones de la fuente en una sala viva.
Fig.1-23: Efecto Franssen. La figura muestra el nivel de dos altavoces en dos lugares de diferencia en una sala en vivo. Altavoz Uno
toca un tono puro en primer lugar, y se desvanece inmediatamente. Mientras tanto, el mismo tono tocado por el altavoz dos se alza, de
modo que el nivel total en el cuarto no se cambie perceptiblemente. Despus el altavoz Uno detiene la reproduccin, los oyentes
todava perciben el sonido originado desde el Altavoz Uno, hasta un par de minutos.
Efecto de cctel y mejora de la deteccin de seal

En un ambiente ruidoso, como un cctel, muchas personas estn hablando
simultneamente. Sin embargo, la mayora de la gente tiene la capacidad de escuchar una
conversacin a la vez, mientras que no hace caso de otras conversaciones que van
alrededor de ellos. Uno puede incluso hacer esto sin girar su cabeza al altavoz. Como
mencionamos anteriormente, un beneficio de la audicin binaural es la capacidad de filtrar
espacialmente. Debido a que los hablantes estn espacialmente separados, nuestro
sistema auditivo puede filtrar el sonido no deseado espacialmente. Los pacientes con
dificultades auditivas suelen sufrir mucho en un ambiente ruidoso porque son incapaces
de captar la conversacin de un individuo fuera del contexto.
Debido a que el ruido de fondo est normalmente en fase entre las dos orejas, en la
comunicacin electrnica, se puede invertir la fase de una seal en una oreja y hacer un
fuera de fase entre las orejas. Entonces la deteccin de la seal es mucho mejor debido al
filtrado espacial. Por lo tanto, en general, el odo binaural no slo nos da capacidad de
localizacin, sino que tambin mejora nuestra capacidad de detectar una seal acstica,
especialmente en un ambiente ruidoso o reverberante.
Percepcin a Distancia
Las seales de distancia son bastante difciles de replicar. En condiciones de campo libre,
el nivel de presin acstica disminuir 6 dB con cada duplicacin de la distancia entre una
fuente puntual y un observador. As, reducir el volumen debera hacernos sentir que la
fuente est ms lejos. En la prctica, sin embargo, tendemos a subestimar la distancia: el
nivel tiene que ser atenuado por 20 dB para darnos la percepcin de una distancia
doblada. Por supuesto, si no sabemos cun alto es la fuente original, no tenemos una
escala absoluta basada en el nivel.
Cuando una fuente de sonido est muy lejos, porque el aire absorbe altas frecuencias ms
que las frecuencias bajas, el sonido percibido contendra ms energa de baja frecuencia,
con un timbre ms oscuro. Esta es la razn por la que el trueno lejos es slo un retumbe
mientras que el trueno cerca tiene una grieta en si mismo. Sin embargo, este es un efecto
muy dbil y por lo tanto es relativamente insignificante para los acontecimientos cercanos,
que es sobre todo el caso en la vida cotidiana. Una seal ms convincente para replicar y
percibir la distancia es ajustar la relacin entre el sonido directo y el reverberante. En
espacios reales, un sonido cercano no slo ser ms fuerte, sino que tambin tendr una
relacin relativamente alta de reverberacin directa. A medida que el sonido se aleja, se
vuelve ms silencioso, y la relacin directa-reverberante se reduce hasta alcanzar la
distancia crtica. A una distancia crtica, los niveles directo y reverberante son iguales.
Mover una fuente de sonido ms all de la distancia crtica no dar lugar a una mayor
sensacin de distancia.
Bibliografia:
B. C. J. Moore, An introduction to the psychology of hearing.
C. J. Plack, The sense of hearing.
J. D. Durrant and J. H. Lovrinic, Bases of hearing science.
W. M. Hartmann, Signals, sound and sensation.

El Manual para El Ingeniero de Sonido Parte 2

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

El Manual para El Ingeniero de Sonido Parte 2

Загружено:

Авторское право:

Доступные форматы

EL MANUAL PARA EL INGENIERO DE SONIDO

El pabelln de la oreja, o el auricular humano, es la parte ms lateral (es decir, externa)

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Supongamos por el momento que no tenemos el pabelln de la oreja, slo agujeros en la

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Figura 1-5: El sistema mecnico del odo medio

Figura 1-6: Esbozo transversal de la cclea.

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Enmascaramiento y su aplicacin en codificacin de audio

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

No linealidad del odo

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Audicin sobre el tiempo

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Figura 1-14: Niveles con ponderaciones A, B y C

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Sonoridad vs. Ancho de banda

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Percepcin de Cambios Dinmicos

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

As, un semitono en un piano (temperamento igual) es 100 centsimas, y un intervalo de

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Audicin binaural y espacial

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Hay dos desafos cuando se usan seales espectrales. La primera es la discriminacin

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Efecto de cctel y mejora de la deteccin de seal

Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica

Вам также может понравиться