Академический Документы
Профессиональный Документы
Культура Документы
Parte 2
Psicoacstica
Psicoacstica y Cantidades Subjetivas
A diferencia de otros sentidos, es sorprendente lo limitado que nuestro vocabulario es
cuando se habla de or. Especialmente en la industria del audio, no se discrimina a
menudo entre cantidades subjetivas y objetivas. Por ejemplo, las cantidades de
frecuencia, nivel, espectro, etc. son todas objetivas, en el sentido de que pueden medirse
con un contador o un dispositivo electrnico; Mientras que los conceptos de tono,
sonoridad, timbre, etc. son subjetivos, y son percepciones auditivas en nuestras cabezas.
La psicoacstica investiga estas cantidades subjetivas (es decir, nuestra percepcin del
odo) y su relacin con las cantidades objetivas en la acstica. La psicoacstica recibe su
nombre de un campo dentro de la psicologa -es decir, la ciencia del reconocimiento- que
trata con todo tipo de percepciones humanas, y es un campo interdisciplinario de muchas
reas, incluyendo la psicologa, la acstica, la ingeniera electrnica, la fsica, la biologa, la
fisiologa, la informtica , etc.
Aunque existen relaciones claras y fuertes entre ciertas magnitudes subjetivas y objetivas
-por ejemplo, tono versus frecuencia-, otras cantidades objetivas tambin tienen
influencias. Por ejemplo, los cambios en el nivel de sonido pueden afectar la percepcin
del tono. Adems, como no hay dos personas idnticas, cuando se trata de percepciones
como en la psicoacstica, hay grandes diferencias individuales, que pueden ser crticas en
reas como la localizacin del sonido. En la psicoacstica, los investigadores tienen que
considerar tanto los rendimientos medios de la poblacin como las variaciones
individuales. Por lo tanto, los experimentos psicofsicos y los mtodos estadsticos se
utilizan ampliamente en este campo.
En comparacin con otros campos de la acstica, la psicoacstica es relativamente nueva
y se ha desarrollado mucho. Aunque muchos de los efectos se conocen desde hace algn
tiempo (por ejemplo, efecto Hass), se han encontrado continuamente nuevos
descubrimientos. Para explicar estos efectos, se han propuesto modelos. Los nuevos
hallazgos experimentales podran invalidar o modificar modelos antiguos o hacer que
ciertos modelos sean ms o menos populares. Este proceso es slo una representacin de
cmo desarrollamos nuestro conocimiento. A los efectos de este manual, nos centraremos
en resumir los conocidos efectos psicoacsticos en lugar de discutir los modelos en
desarrollo.
Anatoma y funcin del odo
Antes de discutir diversos efectos psicoacsticos, es necesario introducir las bases
fisiolgicas de esos efectos, a saber, la estructura y la funcin de nuestro sistema auditivo.
El odo humano se considera comnmente en tres partes: el odo externo, el odo medio y
Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica
el odo interno. El sonido se recoge (y como veremos ms adelante, modificado) por el
odo externo llamado pabelln auricular y dirigido hacia el conducto auditivo (conducto
auditivo). Este canal es terminado por la membrana timpnica (tmpano). Estas partes
constituyen el odo externo, como se muestra en Figs. 1-1 y 2-1. El otro lado del
tmpano hace frente al odo medio. El odo medio est lleno de aire, y la ecualizacin de la
presin tiene lugar a travs de la abertura de la trompa de Eustaquio en la faringe para
mantener la presin atmosfrica normal en ambos lados del tmpano. Sujeta al tmpano es
uno de los tres osculos, el malleus que, a su vez, est conectado con el inco y el estribo. A
travs de la accin oscilante de estos tres pequeos huesos las vibraciones del tmpano se
transmiten a la ventana oval de la cclea con una eficiencia admirable. La presin sonora
en el lquido de la cclea se incrementa unos 30-40 dB sobre la presin del aire que acta
sobre el tmpano a travs de la accin mecnica de este notable sistema de odo medio. El
lquido claro que llena la cclea es incompresible, como el agua. La ventana redonda es
una liberacin de presin relativamente flexible que permite que la energa sonora sea
transmitida al fluido de la cclea a travs de la ventana oval. En el odo interno las ondas
itinerantes instaladas en la membrana basilar por vibraciones de la ventana oval estimulan
las clulas capilares que envan impulsos nerviosos al cerebro.
Figura 1-1: Una seccin transversal del odo humano que muestra la relacin de las diversas partes.
Figura 1-2: Representacin altamente idealizada del odo externo, del odo medio y del odo interno.
Figura 1-4: La ganancia de presin promedio aportada por los diferentes componentes de la oreja externa en los seres humanos. La
fuente sonora est en el plano horizontal, 45 desde la derecha. (Despus de Shaw, Referencia 5.)
El hueso temporal
En cada uno de los lados izquierdo y derecho de nuestro crneo, detrs del pabelln, hay
un hueso fino y en forma de abanico, llamado, el hueso temporal que cubre todo el odo
Cuando un sonido incidente llega al odo interno, la vibracin del estribo es transportada a
la escala vestibuli a travs de la ventana oval. Debido a que el fluido coclear es
incompresible, la ventana redonda conectada a la escala tympani vibra en consecuencia.
Por lo tanto, la vibracin comienza desde la base de la cclea, viaja a lo largo de la escala
vestimbuli, hasta el pice, y luego a travs del helicotrema hacia la escala tympani, de
regreso a la base, y finalmente termina en la ventana redonda. Esto establece una onda
de desplazamiento en la membrana basilar para el anlisis de frecuencia. Cada localizacin
en la membrana basilar es ms sensible a una frecuencia p a r t i c u lar, es decir, a la
frecuencia caracterstica, aunque tambin responde a una banda de frecuencia
relativamente amplia a una amplitud ms pequea. La membrana basilar es ms estrecha
(0,04 mm) y ms rgida cerca de la base, y ms ancha (0,5 mm) y ms suelta cerca del
pice. (Por el contrario, cuando se observa desde fuera, la cclea es ms ancha en la base
Figura 1-8: Una ilustracin de los patrones de vibracin de las clulas ciliadas en la membrana basilar para diversos tonos puros
incidentes. Hay una respuesta de pico localizada para cada frecuencia audible.
Selectividad de Frecuencia
Sintonizacin de Frecuencia
Figura 1-9: Curva de afinacin con (slida) y sin (discontinua) clulas de pelo externas funcionales.
Figura 1-10: Curva de ajuste a varios niveles en una localizacin particular de la membrana basilar de una chinchilla.
Figura 1-11: Una grfica de anchos de banda crticos (ERBs calculados) del sistema auditivo humano en comparacin con anchos de
banda de porcentaje constante de conjuntos de filtros comnmente utilizados en mediciones acsticas.
donde,
Por ejemplo, cuando se introducen dos tonos a 600 y 700 Hz, la salida puede tener
frecuencias tales como 100 Hz (= 700 600 Hz), 500 Hz (= 2 600 700 Hz) y 400 Hz
(= 3 600 2 700 Hz), etc.
Debido a que la distorsin armnica no cambia la percepcin del tono, no sera
sorprendente si somos menos tolerantes con los tonos de combinacin.
Adems, debido a que el sistema auditivo est activo, incluso en un entorno
completamente silencioso, el odo interno puede generar tonos. Estas emisiones
otoacsticas son un signo de un odo interno sano y funcional, y muy diferente del
tinnitus resultante de la exposicin a niveles peligrosamente altos de presin acstica.
Percepcin de fase
La descripcin completa de un sonido dado incluye tanto un espectro de amplitud como
un espectro de fase. La gente normalmente presta mucha atencin al espectro de la
amplitud, mientras que cuida menos para el espectro de la fase. Sin embargo, los
investigadores acadmicos, los entusiastas de la alta fidelidad y los ingenieros de audio
han preguntado: "Es la oreja capaz de detectar las diferencias de fase?" A mediados del
siglo pasado, GS Ohm escribi: "La percepcin auditiva depende slo del espectro de
amplitud de un Sonido y es independiente de los ngulos de fase de los diversos
componentes contenidos en el espectro. Muchas confirmaciones aparentes de la ley de
Ohm de la acstica han sido ms tarde rastreados a las tcnicas de medicin cruda de
equipos.
En realidad, el espectro de fase a veces puede ser muy importante para la percepcin del
timbre. Por ejemplo, un impulso y un ruido blanco son bastante diferentes, pero tienen un
espectro de amplitud idntico. La nica diferencia ocurre en el espectro de fase. Otro
ejemplo comn es el habla: si uno codifica las fases relativas en el espectro de una seal
de voz, no ser inteligible. Ahora, con evidencia experimental, podemos confirmar que
Ars Novo Record2017 www.facebook.com/groups/Cursosdegrabacionytallerdemusica
nuestro odo es capaz de detectar la informacin de la fase. Por ejemplo, el disparo
neuronal del nervio auditivo ocurre en una cierta fase, que se denomina bloqueo de fase,
hasta aproximadamente 5 kHz. El bloqueo de fase es importante para la percepcin del
tono. En el tronco enceflico, la informacin de las orejas izquierda y derecha est
integrada, y la diferencia de fase interaural puede ser detectada, lo que es importante
para el odo espacial.
rea auditiva y Umbrales
El rea auditiva representada en la Fig. 1-12 describe, en un sentido tcnico, los lmites de
nuestra percepcin auditiva. Esta rea est limitada a bajos niveles de sonido por nuestro
umbral de audicin. Los sonidos ms suaves que se pueden escuchar caen en el umbral
de la curva auditiva. Por encima de esta lnea el movimiento de la molcula de aire es
suficiente para provocar una respuesta. Si, a una frecuencia dada, el nivel de presin
acstica se eleva suficientemente, se alcanza un punto en el que se siente una sensacin
de cosquilleo en los odos. Si el nivel se incrementa sustancialmente por encima de este
umbral de sensacin, se vuelve doloroso. Estos son los lmites inferior y superior del rea
auditiva. Tambin hay limitaciones de frecuencia por debajo de unos 20 Hz y superiores a
unos 16 kHz, limitaciones que (como los dos umbrales) varan considerablemente de
individuo a individuo. Estamos menos preocupados aqu por nmeros especficos que por
principios. En el rea auditiva de la fig. 1-12, se reproducen todos los sonidos de la vida:
baja frecuencia o alta, muy suave o muy intensa. El habla no utiliza todo el rea auditiva.
Su rango dinmico y rango de frecuencia son bastante limitados. La msica tiene un
mayor rango dinmico que el habla y un mayor rango de frecuencia. Pero incluso la
msica no utiliza todo el rea auditiva.
Figura 1-12: Todos los sonidos percibidos por los seres humanos de agudeza auditiva promedio caen dentro del rea auditiva. Esta
rea se define por el umbral de la audicin y el umbral del sentimiento (dolor) y por los lmites de la audicin de baja y alta frecuencia.
La msica y el habla no utilizan todo el rea auditiva disponible, pero la msica tiene el mayor rango dinmico (vertical) y las demandas
de frecuencia (horizontal).
Figura 1-13: Contornos de sonoridad iguales para tonos puros en un campo de sonido frontal para humanos de agudeza auditiva
promedio determinada por Robinson y Dadson. Los niveles de sonoridad en fonos corresponden a los niveles de presin sonora a 1000
Hz. (Recomendacin ISO 226).
Los contornos de intensidad igual tambin muestran que el odo humano es ms sensible
alrededor de 4 kHz (que es donde ocurre el dao auditivo debido a sonidos fuertes),
menos sensible a altas frecuencias y mucho menos sensible a frecuencias muy bajas (por
lo que un subwoofer tiene que ser muy potente para producir graves fuertes, cuyo precio
es el enmascaramiento de las medias y altas frecuencias y posibles daos auditivos). Un
estudio de esta familia de curvas nos dice por qu las frecuencias de agudos y bajos
parecen faltar o bajar de nivel cuando las grabaciones favoritas se reproducen a niveles
bajos.
Se puede notar que para frecuencias altas por encima de 10 kHz, las curvas no son
monotnicas para niveles bajos. Esto se debe al segundo modo resonante del canal
auditivo. Adems, a bajas frecuencias por debajo de 100 Hz, las curvas estn prximas
entre s, y el cambio de unos pocos dB puede darle la sensacin de ms de 10 dB de
cambio dinmico a 1 kHz. Adems, las curvas son mucho ms lisas a niveles altos, lo que
desafortunadamente alent a muchos a escuchar msica reproducida a niveles
anormalmente altos, causando de nuevo daos auditivos. En realidad, incluso si se quera
tener una audicin plana o lineal, escuchar a niveles anormalmente altos podra no ser
sabio, porque la selectividad de frecuencia de nuestro sistema auditivo ser mucho ms
pobre, lo que conduce a una interaccin mucho mayor entre varias frecuencias. Por
supuesto, una limitacin de la escucha en un nivel ms bajo es que, si algunos
componentes de la frecuencia caen debajo del umbral auditivo, entonces no son audibles.
Este problema es especialmente importante para las personas que ya han perdido cierta
agudeza en una cierta frecuencia, donde su umbral auditivo es mucho mayor de lo
normal. Sin embargo, con el fin de evitar ms dao de la audiencia, y con el fin de evitar
el efecto de enmascaramiento innecesario, uno podra considerar la posibilidad de
escuchar a niveles moderados.
El nivel de sonoridad considera la respuesta de frecuencia de nuestro sistema auditivo, y
por lo tanto es una escala mejor que el nivel de presin acstica para tener en cuenta la
sonoridad. Sin embargo, al igual que el nivel de presin acstica no es una escala de
Sonoridad en Sones
Nuestra audicin para la sonoridad es definitivamente una funcin comprimida (menos
sensible para niveles ms altos), que nos da sensibilidad para sonidos dbiles y gran rango
dinmico para sonidos fuertes. Sin embargo, a diferencia de la escala logartmica (dB) que
es ampliamente utilizada en el nivel de presin acstica, la evidencia experimental
muestra que la sonoridad es en realidad una funcin de ley de potencia de intensidad y
presin como se muestra en la Ec. 3-3.
Figura 1-15: Comparacin entre la sonoridad en sones y el nivel en phons para un tono de 1 kHz.
La vida est llena de sonidos de tipo impulso: broches de presin, estallidos, crepitaciones,
golpes, sonajas. Para impulsos o rfagas de tono con duracin superior a 100 ms, la
sonoridad es independiente del ancho de pulso. El efecto sobre la sonoridad de los
impulsos de menos de 200 ms se muestra en la Fig. 1-16. Esta curva muestra cunto ms
alto el nivel de impulsos cortos de ruido y tonos puros debe sonar tan fuerte como ruido
continuo o tonos puros. Los pulsos de ms de 200 ms son percibidos como tan fuertes
como el ruido continuo o los tonos del mismo nivel. Para los impulsos ms cortos, el nivel
del pulso debe ser aumentado para mantener la misma intensidad que para los impulsos
ms largos. El ruido y los pulsos tonales son similares en el nivel de aumento requerido
para mantener la misma intensidad. Fig. 1-16 indica que el odo tiene una constante de
tiempo de aproximadamente 200 ms, confirmando la ventana de tiempo en el orden de
100 ms. Esto significa que los niveles de banda deben medirse con detectores RMS con
tiempos de integracin de aproximadamente 200 ms. Esto corresponde al ajuste RPIDO
en un medidor de nivel de sonido mientras que el ajuste LENTO corresponde a un tiempo
de integracin de 500 ms.
Figura 1-16: Los impulsos cortos de sonido deben ser aumentados en el nivel de sonido tan fuerte como pulsos ms largos.
Fig.1-17: Diferencia apenas perceptible (JND) para un ruido de banda ancha y para un tono de 1 kHz.
Tono
Tono parece ser un concepto muy claro, y sin embargo es muy difcil dar una definicin
precisa. La definicin del American National Standards Institute (ANSI) es la siguiente: "El
tono es el atributo de la sensacin auditiva en trminos de qu sonidos pueden ordenarse
en una escala que se extiende de bajo a alto". Al igual que la sonoridad, el tono es una
cantidad subjetiva. El estndar ANSI tambin establece: "El tono depende principalmente
del contenido de frecuencia del estmulo de sonido, pero tambin depende de la presin
del sonido y la forma de onda del estmulo".
Fig. 1-19: El eje vertical es la frecuencia, el eje horizontal es el tiempo y la oscuridad de un punto representa el nivel de una
componente de frecuencia particular en un momento dado.
Fig. 1-20: Confusin de seales de diferencia de fase interaural (IPD) a altas frecuencias. La curva discontinua para el odo izquierdo
est retrasando la curva slida para la oreja derecha en 270, pero se confunde cuando el odo izquierdo est llevando la oreja derecha
90
En la grabacin, el ajuste de las seales ILD se consigue fcilmente desplazando entre los
canales izquierdo y derecho. Aunque el ajuste de las seales ITD tambin mueve la
imagen del sonido a travs de los auriculares, cuando se escucha a travs de altavoces,
las seales ILD son ms fiables que las indicaciones ITD con respecto a las posiciones del
altavoz.
Localizacin en planos sagitales
Fig.1-22: Funciones de transferencia relacionadas con la cabeza. Cada curva muestra la caracterstica de filtrado (es decir, la ganancia
aadida por el odo externo en cada frecuencia) de un ngulo incidente. Esta figura muestra las orientaciones en el plano horizontal.
Los ngulos se refieren al plano sagital mediano, ipsilateral al odo. El ngulo de 0 est justo delante del sujeto.
Fig.1-23: Efecto Franssen. La figura muestra el nivel de dos altavoces en dos lugares de diferencia en una sala en vivo. Altavoz Uno
toca un tono puro en primer lugar, y se desvanece inmediatamente. Mientras tanto, el mismo tono tocado por el altavoz dos se alza, de
modo que el nivel total en el cuarto no se cambie perceptiblemente. Despus el altavoz Uno detiene la reproduccin, los oyentes
todava perciben el sonido originado desde el Altavoz Uno, hasta un par de minutos.