Seminario

“diseño de un test de escucha para preferencia de usuario de material musical con audio
binaural”
Camilo Carmona Londoño

Mateo Cardona Quintero
Seminario de investigación
Docente Felipe Arbeláez
Universidad san buenaventura sede san Benito

Facultad de ingenierías
Medellín Antioquia
2019
Introducción
Desde 1877 con la creación del sonógrafo (primer dispositivo comercial que permitía grabar y
reproducir sonido) inventado por Tomas Alba Edison se marcó un ítem en la historia de la
música, creando la posibilidad de grabar y reproducir sonidos de una manera digital. En las
últimas décadas hemos sido testigos de las múltiples facetas que se han creado en la música,
con tendencias desde la producción hasta la masterización.
La presente investigación trata los temas relacionados con el audio binaural, aplicándolo al
campo de la producción musical.
Objetivo general
Desarrollar un método para ejecutar pruebas subjetivas sobre calidad de audio, preferencia de
usuario, localización binaural y Estandarización Estadística.
Objetivos específicos
 Estudiar las diferentes grabaciones binaurales, evaluaciones de cabezas binaurales, test

de escucha con audio binaural que se tengan.
 Diseñar test de escucha junto con una herramienta de software que ayude a ejecutarlo.
 Identificar los posibles problemas a la hora de cuantificar las respuestas subjetivas de

los usuarios.
 Ejecutar el test con audios provistos (los que estamos grabando en el semillero SIPAB).
 Evaluar la confiabilidad de la información levantada a través de un análisis de datos.

Antecedentes
Recommendation ITU-R BS.1284-2 (01/2019). General methods for the subjective assessment
of sound quality.
Perceptual Audio Evaluation – Theory, Method and Application Søren Bech and Nick Zacharov
c 2006 John Wiley & Sons, Ltd. ISBN: 0-470-86923-2
Recommendation ITU-R BS.1534-3 (10/2015). Method for the subjective assessment of
intermediate quality level of audio systems.
Perceptual Evaluation of a Coherence Suppressing Down-Mix Method. Alexander Adami,
Emanuel A. P. Habets, Jurgen Herre, (agosto 2014).
Acoustic and Subjective Evaluation of 22.2- and 2-Channel Reproduced Sound Fields in Three
Studios. Madhu Ashok, Richard King, Toru Kamekawa, and Sungyoung Kim, (2018).
D5.6: Report on Audio subjective tests and User tests. W. Bleisteiner (BR), A. Silzle (FHG), R.
Schmidt (FHG), T. Liebl (IRT), O. Warusfel (IRCAM), M. Ragot & N. Epain (b<>com), (2015).
An Examination of the Influence of Musical Selection on Listener Preferences for Multichannel
Microphone Technique. Kim, Sungyoung; Martha de Francisco; Kent Walker; Marui, Atsushi;
and William L. Martens.
An Examination of the Influence of Musical Selection on Listener Preferences for Multichannel
Microphone Technique. Kim, Sungyoung; Martha de Francisco; Kent Walker; Marui, Atsushi;
and William L. Martens.
MARCO TEÓRICO
La psicofísica, al tratar el problema de la localización espacial del sonido, se ha concentrado
principalmente en las modificaciones que ocurren en las señales que llegan a nuestros oídos
en relación a la dirección y a la distancia del evento sonoro. Los pabellones auditivos, la cabeza,
el cuello y el torso actúan de forma combinada, recibiendo los estímulos del campo acústico y
transformándolos en su recorrido al oído medio a través de los tímpanos. Cualquier
modificación de las características de la señal acústica, relacionada con la posición de la fuente,
se convierte en un indicio potencial para la localización.[1]
La localización define la capacidad del individuo de determinar la ubicación de una fuente
sonora en el espacio.
La localización sólo es posible a partir de la audición binaural. Con un solo oído no es posible
localizar fuentes sonoras.
El sistema auditivo utiliza un conjunto de pistas para determinar la ubicación de la fuente
sonora en el espacio.
Por lo general se establecen tres planos característicos en los experimentos destinados a
estudiar la localización por parte del ser humano.
Figura 1. modelo de ejes para estudio de percepción binaural.

Se establecen 3 planos: el horizontal, el frontal y un plano medio que simula el azimutal.
DIRECCIÓN
La dirección de una fuente sonora, a su vez, se establece a partir de la determinación de un
ángulo lateral y de un ángulo de elevación.
Lateralización
Para la ubicación lateral de una fuente sonora el sistema auditivo utiliza pistas provenientes
principalmente de las diferencias de intensidad y tiempo con que las ondas sonoras llegan a
cada uno de nuestros oídos.
Unas y otras son más efectivas para distintos rangos de frecuencia.
Audibilidad
Umbrales
Rango de frecuencias audibles:
Infrasonido < 15 Hz a 20.000 Hz < Ultrasonido. o
Rango de presión sonora audible:
-3,9 dB a 120 dB.
0 dB: umbral absoluto para una frecuencia estándar de 1000Hz.
Estos límites se establecen para determinar el umbral de audición del ser humano tanto
frecuencialmente como de nivel de presión sonora [dB].
Diferencias interaurales de intensidad (DII)
Las DII se dan principalmente a partir de las diferentes distancias que deben recorrer las ondas
para llegar a uno y otro oído, pero también por la sombra acústica producida por la cabeza del
individuo (difracción de la onda)
Los sonidos de bajas frecuencias tienen longitudes de onda relativamente grandes con
respecto a las dimensiones de la cabeza. El estudio de la difracción determina que cuando la
longitud de la onda es suficientemente grande con respecto al obstáculo que encuentra la
onda, ésta se difracta fácilmente y no se genera una "sombra acústica" (o, al menos, se produce
una sombra acústica pequeña). Por el contrario, cuando las longitudes de onda son pequeñas,
se produce poca difracción y por lo tanto existe una sombra acústica mayor.
Para frecuencias de 500 Hz la longitud de onda del sonido es de unos 69 cm, unas tres veces
el diámetro promedio de una cabeza humana. La difracción es poca. Para frecuencias de 4 kHz
(longitud de onda del orden de los 8.5 cm) la sombra acústica es importante.
Las DII son prácticamente despreciables para frecuencias inferiores a los 500 Hz, pero pueden
ser de hasta 20 dB para frecuencias mayores de 5 kHz.
Diferencias interaurales de tiempo (DIT)
Las DIT pueden calcularse a partir de las diferencias en las distancias que deben recorrer las ondas.
Figura 2. relación de señales con respecto a un plano, y su respectivo Angulo de incidencia.

Figura 3. s = 0 para fuentes sonoras con un ángulo de 0º
Para sonidos sinodales las diferencias de tiempo son equivalentes a diferencias de fase
entre las ondas que arriban a cada uno de los dos oídos.
Marco Normativo
Una de las normas con las que el proyecto se fundamenta es la “ITU R BS 1284 –2 Métodos
generales para la evaluación subjetiva de la calidad de sonido”. La presente Recomendación
describe métodos generales para la evaluación subjetiva de la calidad de sonido con una señal
de referencia, o sin ella.
Este Anexo se divide en los siguientes puntos, en los que se detallan los requisitos referentes
a los diferentes aspectos de las pruebas:
1- Consideraciones generales
2- Diseño del experimento
3- Selección de los oyentes
4- Método de prueba
5 -atributos
6- Material de programa
7- Dispositivos de reproducción
8- Condiciones de escucha
9- Tratamiento estadístico de los datos
10- Presentación de los resultados
11- contenido de los informes de prueba
“La idea es que esta Recomendación sirva de guía a la evaluación general de la calidad del
sonido. La Recomendación se basa en la Recomendación UIT-R BS.1116 – Métodos para la
evaluación subjetiva de pequeñas degradaciones en los sistemas de audio incluyendo los
sistemas de sonido multicanal. No obstante, los requisitos de esta última Recomendación son
estrictos, ya que se concibieron pensando en la evaluación de pequeñas degradaciones. Las
evaluaciones más generales suelen entrañar diferencias mayores y, en consecuencia, no suelen
obligar a controlar tan ajustadamente los parámetros de prueba. La Recomendación UIT-R
BS.1116 contiene un glosario de términos, algunos de los cuales se utilizan en esta
Recomendación. En la Recomendación UIT-R BS.1283 – Guía de las Recomendaciones UIT-R
sobre la evaluación subjetiva de la calidad de sonido.”
Diseño del experimento
En general, se requieren conocimientos especializados de estadística para diseñar la prueba.
Esto incluye la determinación del número de observaciones requeridas, los métodos
estadísticos para analizar los datos y la interpretación correcta de los resultados del análisis
estadístico, lo que entraña, a su vez, la verificación de la validez de las hipótesis del modelo.
[3]
Selección de los oyentes
Resulta preferible recurrir a oyentes expertos. Se ha señalado que los oyentes no expertos
pueden ser representativos de la población general y que es posible que los expertos sean
demasiado críticos. En todo caso, los oyentes no expertos se convertirán a la larga en expertos
si se los familiariza con los aparatos. Por consiguiente, las pruebas con expertos indican más
adecuada y rápidamente cuáles serán los resultados probables a largo plazo. En caso de duda,
debe investigarse la relación entre las opiniones de los expertos y de los no expertos. El número
mínimo de oyentes expertos debe ser, por lo general diez, mientras que el número mínimo de
oyentes no expertos debe ser veinte. Siempre que el sistema se trate de radiodifusión o
reproducción sonora de elevada calidad, debe recurrirse a oyentes expertos. En general, debe
adiestrarse a los oyentes para familiarizarlos con los procedimientos, los materiales y los
entornos de prueba. [3]
Escalas de apreciación
Deben utilizarse las siguientes escalas discretas unipolares de cinco notas para la evaluación
subjetiva de la calidad o la degradación de sonido. La naturaleza y objetivo de las pruebas
determinarán cuál de las escalas es la más apropiada.
Figura 4. escala unipolar

También se utiliza una escala continua de calidad (CQS; Continuous Quality Scales), por
ejemplo, en la Recomendación UIT-R BS.1534 y UIT-R BT.500. La CQS consiste en una escala
lineal de 100 puntos dividida en cinco intervalos con las cinco referencias textuales de
valoración utilizadas en la escala de cinco notas. [3]
Figura 5. Escala unipolar de calidad continua de 100 puntos con cinco intervalos con referencias textuales [3].
Para realizar las pruebas de comparación, puede aplicarse un método basado en la siguiente
escala de comparación bipolar discreta de siete notas o un método basado en diferencias
numéricas en el que se utilicen las escalas de cinco notas mencionadas. En general, estos dos
métodos no son equivalentes y es posible que arrojen resultados distintos. Resulta esencial
indicar claramente la dirección prevista de la comparación. [3]
Figura 6. Escala bipolar discreta de siete notas [3]

Atributos
Dependiendo de los objetivos de la prueba, pueden utilizarse diferentes números y tipos de
atributos para describir la calidad percibida. Deben definirse claramente los atributos que se
utilicen.
Calidad de audio básica
El atributo de calidad de audio básica abarca todos los aspectos de la calidad del sonido que se
evalúen, e incluye de manera no exhaustiva lo siguiente: timbre, transparencia, imagen
estereofónica, presentación espacial, reverberación, ecos, distorsiones de armónicos, ruido de
cuantificación, «pops», «clics» y ruido de fondo. [3]
Material de programa
Dependiendo del objetivo preciso de las pruebas y, en particular, de la categoría del sistema
de transmisión o reproducción de programas de radiodifusión sonora que se esté probando,
el material de prueba puede seleccionarse deliberadamente atendiendo a su comportamiento
muy crítico con respecto a las deficiencias introducidas por el sistema que se esté probando.
En otros casos, puede utilizarse material menos crítico.[3]
Tratamiento estadístico de los datos
Los datos subjetivos deben evaluarse para obtener los valores medios y los intervalos de
confianza. Esta operación describirá los datos y, si la discriminación resultante es inadecuada
para satisfacer los objetivos de la prueba, debe realizarse un tratamiento posterior. Cabe la
posibilidad de utilizar los métodos del § 9 de la Recomendación UIT-R BS.1116. En general, será
necesario contar con conocimientos especializados de estadística para analizar los datos. Es
posible mejorar el valor global de la prueba si los datos se vuelven a analizar para verificar las
hipótesis básicas de la prueba y evaluar la fiabilidad del participante.
Presentación de los resultados
Consideraciones generales: La presentación debe realizarse de forma que tanto los lectores
expertos como los inexpertos puedan evaluar la información correspondiente. En principio,
todo lector desea conocer los resultados globales del experimento, preferiblemente en forma
gráfica. Tal presentación puede sustentarse en información cuantitativa más precisa, si bien
los análisis numéricos detallados deben figurar en apéndices. Los resultados obtenidos a partir
de los grupos de oyentes expertos deben presentarse por separado de los resultados logrados
con grupos de no expertos. Debe aportarse información sobre las condiciones de escucha y los
niveles sonoros; deben describirse todos los métodos estadísticos utilizados para analizar los
resultados de las pruebas. En la medida de lo posible, la presentación de los resultados debe
estar en consonancia con el § 10 de la Recomendación UIT-R BS.1116. [3]
Valor medio
La presentación de los valores medios puede proporcionar un buen panorama inicial de los
datos.
Nivel de significación e intervalo de confianza
Deben señalarse los niveles de significación, así como otras informaciones sobre los métodos
y los resultados estadísticos que facilitarán la comprensión del lector. Esta información podría
incluir los intervalos de confianza o las barras de errores en gráficos. Evidentemente, no existe
un nivel de significación «correcto». Sin embargo, tradicionalmente se elige el valor de 0,05.
En principio, es posible utilizar una prueba de una cola o de dos colas según las hipótesis que
se estén verificando. [3]
Contenido de los informes de prueba
En la medida de lo posible habría que informar sobre todos los aspectos de las pruebas, aun
cuando no se lleven a la práctica o controlen todos los aspectos.
Por ejemplo, aunque no se imparta adiestramiento, el informe debe dar constancia de este
hecho.
Los informes de prueba deben indicar, de la manera más clara posible, los motivos
fundamentales del estudio, los métodos utilizados y las conclusiones extraídas. Deben
presentarse detalles suficientes como para que, en principio, una persona con ciertos
conocimientos pueda repetir el estudio a fin de verificar de forma empírica los resultados. Un
lector informado debe ser capaz de entender e interpretar los detalles más importantes de la
prueba, así como las razones fundamentales para el estudio, los métodos de diseño del
experimento y su ejecución, y los análisis y sus conclusiones. Debe prestarse especial atención
a los puntos siguientes:
– la especificación y selección de los participantes y pasajes;
– los detalles físicos de los equipos y del entorno de escucha, incluidas las dimensiones de la
sala y las características acústicas, los tipos y emplazamiento de los transductores y la
especificación de los equipos eléctricos;
– el diseño del experimento, el adiestramiento, las instrucciones, las secuencias y
procedimientos de prueba y la generación de datos;
– el procesamiento de los datos, incluyendo los detalles de las estadísticas inferenciales
descriptivas y analíticas;
– las bases detalladas de todas las conclusiones extraídas. [3]
Justificación
El audio binaural se ha intentado aplicar en producción musical sin mucho éxito, la idea es
desarrollar y validar una metodología que nos ayude a saber qué ventajas y desventajas
presenta una producción musical en la que se utilizó audio binaural. Estas ventajas y
desventajas deben ser perceptibles, pues es así como un consumidor juzga la calidad de la
música, con base en su percepción subjetiva. Es por esto que dichas ventajas y desventajas se
deben encontrar a través de tests de escucha o pruebas subjetivas.
Referencias
[1]] https://www.rivel.com.es/sonido3d/documentos-audio-
3d/espacializacion_psicoacustica.pdf
[2] http://liceu.uab.es/~joaquim/phonetics/fon_percept/psicoacustica/psicoacustica.html
[3 ]https://www.itu.int/dms_pubrec/itu-r/rec/bs/R-REC-BS.1284-2-201901-I!!PDF-S.pdf

Seminario

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Seminario

Загружено:

Авторское право:

Доступные форматы

“diseño de un test de escucha para preferencia de usuario de material musical con audio

Camilo Carmona Londoño

Universidad san buenaventura sede san Benito

 Estudiar las diferentes grabaciones binaurales, evaluaciones de cabezas binaurales, test

 Identificar los posibles problemas a la hora de cuantificar las respuestas subjetivas de

 Evaluar la confiabilidad de la información levantada a través de un análisis de datos.

Figura 1. modelo de ejes para estudio de percepción binaural.

Figura 2. relación de señales con respecto a un plano, y su respectivo Angulo de incidencia.

Figura 4. escala unipolar

Figura 6. Escala bipolar discreta de siete notas [3]

Вам также может понравиться