Вы находитесь на странице: 1из 32

¿DIFERENCIAS ENTRE FORMATOS?

PROYECTO K622

Introducción al proyecto:

El debate sobre los distintos formatos de grabación/reproducción musical es un asunto recurrente en el mundo de la
Alta Fidelidad. Tanto en los ámbitos aficionado y profesional como en las revistas del sector cada poco tiempo
aparecen defensores, o detractores, de algún formato en particular. Por ejemplo, los viniloadictos forman un grupo
relevante en el sector audiófilo y es habitual escucharles argumentar que el agrado con el que escuchan sus LP's no lo
proporciona de ninguna manera la misma música presentada en formato digital. En torno a este mundo se ha formado
toda una especialidad hermética: el ajuste mecánico de todos los elementos tocadiscos, la selección de capsula, el
análisis del caracter distintivo de cada previo de phono.

Otra tribu la componen los amantes de la cinta analógica, especialmente como medio de grabación. Nunca dejan de
recordarnos que, bien cuidados los soportes magnéticos y los aparatos, tanto la grabación como la reproducción
pueden proporcionar un sonido de calidad superior a la que comunmente se reconoce.

Y luego interviene la industria electrónica promocionando los formatos más recientes, digitales por supuesto: el SACD y
DVD-A. Ambos sistemas en guerra entre si y en lucha desigual frente al rey de los formatos: el CD-Audio y sus dos
pistas PCM/44100 Hz/16 bits. El CD suele ser el formato abandonado a su suerte en los debates audiófilos, sin grupo
especial que lo apadrine; aunque es lógico que esto sea así, realmente su papel dominante en el mercado discográfico
le permite defenderse por si solo.

Queda por último el grupo de los formatos "comprimidos" (con o sin perdidas de información): toda la plétora de codecs
digitales abanderados por el nuevo soberano del almacenamiento de música grabada, el mp3. Realmente, cuando se
debate sobre la calidad sonora de estos formatos, pasamos a un mundo diferente del de los anteriores: su flexibilidad,
su calidad "a la carta", la disponibilidad de codificadores/decodificadores, son los criterios dominantes a la hora de
decantarse por ellos. Aspectos ajenos al mundo del vinilo, de la cinta magnética, del PCM y del DSD.

En los debates en defensa del formato favorito de cada uno suelen aparecer dos tipos de argumentaciones:

• La subjetiva: "Me suena mejor", "me gusta más". Indiscutible. Básicamente este tipo de ideas permite la
reafirmación grupal (¿A tí también te gusta más?). Es empleada habitualmente por los viniloadictos porque
es muy dificil disponer de otro tipo de estudios comparativos.

• La de los fundamentos teóricos del formato: "mayor margén dinámico", "mayor rango de frecuencias". Suele
aparecer en los debates DSD vs. PCM y suele dar lugar a espectaculares tratados matemáticos sobre
filtrados digitales, teoremas de Shannon y criterios de Nyquist.

¿Existe alguna otra manera de aportar razonamientos diferentes al debate? Pues una posibilidad sería comparar, por
análisis aplicando diferentes técnicas matemáticas, una misma grabación presentada en distintos formatos. Encontrar
una candidata adecuada para ello no es algo sencillo; suele ocurrir que para una misma grabación se hacen mezclas
particulares para cada formato comercial, imposibilitando la comparación directa.

EN 2004 la revista Stereophile apadrinó una grabación del Concierto para clarinete K-622 de W.A. Mozart con el
objetivo de comercializarla en distintas presentaciones.

http://www.stereophile.com/musicrecordings/804k622/index.html

Uno de sus objetivos era:

But he did note that the SACD would be a hybrid. Not only would it carry the DSD recording, its hi-rez layer would
include a DSD dub from the analog master tape, while the "Red Book" layer would contain two versions of the
recording: a 16-bit/44.1kHz PCM version downsampled from the DSD master, and a straight PCM transfer from the
analog master. That way, audiophiles would be able to compare all four formats and reach their own conclusions about
which best preserved the musical message."
"La edición SACD sería de capa-hibrida. No solo incluiría la propia señal DSD grabada directamente, incluyendo una
versión DSD generada a partir de una transferencia de la cinta master analógica, sino que además contaría con una
capa CD-Red Book con dos versiones: una obtenida a partir de la conversión del master DSD a PCM 16-bit/44.1 kHz y
otra señal PCM obtenida a partir de master analógico. De esta manera, el audiófilo podría estar en disposición de
comparar los cuatro formatos y establecer sus propias conclusiones acerca de cuál de ellos preserva mejor el mensaje
musical."

Siendo una opción idónea para el objetivo buscado, a continuación presentamos dos estudios complementarios
(aunque en algunos puntos se solapen, de forma coherente) basados en el análisis de esta grabación. Las
conclusiones que de estos estudios se extraen no pretenden ser concluyentes, sino fomentar el debate y ayudar al
aficionado a formarse una opinión.

Primer estudio.

Segundo estudio: primera parte.

Segundo estudio: segunda parte.

Segundo estudio: tercera parte.

VOLVER A MATRIX-HIFI
PROYECTO K622
Primer estudio.

Objetivos.

El objetivo de este estudio es tratar de averiguar cuales pueden ser las posibles diferencias “básicas entre distinos
formatos en los que se puede presentar una misma grabación/masterización, a partir de su examen en el ámbito
métrico por medio de análisis FFT de pequeñas muestras de cada formato.
Métodos: Aquellos que permiten representar gráficamente la señal tanto en el dominio del tiempo como en el de la
frecuencia, comparando niveles de señal y energías instantaneas e integradas:

• Cross-correlación.
• Análisis FFT (Fast Fourier Transform).
• Espectrogramas.
• ETC (Energy-Time Curve).
• Diferencia de nivel RMS.
• Convolución de muestras y relación entre ellas.

Material seleccionado para sus estudio. Uno de los requisitos fundamentales para poder efectuar este estudio es contar
con versiones en variados formatos de una misma grabación original, incluyendo que el master originario de estas
versiones fuese el mismo en todos los casos. Con ello se intenta eliminar factores diferenciadores que sean ajenos a
los propios formatos y sus diferentes medios de reproducción: distintos masterizados realizados por distintas personas,
procesos de mezcla de la señal grabada que generen de modo consciente sonidos diferentes (ecualización,
tratamiento dinámico).

Información musical y datos técnicos de la grabación.


La información sobre la grabación es la siguiente:

K622: Mozart Concierto para clarinete MFSACD017/MFLP017

Antony Michaelson, clarinete, con la Michaelangelo Chamber Orchestra dirigida por Robert Bailey.

Musicos:

• Flute: Andy Findon,Helen Keen


• Bassoon: Brian Sewell, Francesca Carpos
• Horn: Richard Watkins, David Wythe
• Violin: Adrian Levine (concertmaster), Kathy Andrew, Alex Balanescu, Sue Briscoe, Gordon Buchan, Beverly
Davison, Ruth Erlich, Jonathan Evans-Jones, Alison Kelly, Pauline Lowbury, Rona Murray, David Ogden,
Julian Tear, Paul Willey
• Viola: Marina Ascherson, Rachel Bolt, Tim Grant, Rusen Gunes
• Cello: Naomi Butterworth, Mike Hurwitz, Judith Serkin, Jonathan Williams
• Double bass: Paddy Lannigan, Steve Williams

Formato vinilo:

1. LP cara 1: Allegro (12:38)


2. LP cara 2: Adagio (7:58), Rondo (Allegro) (8:51)

SACD. Capa de alta resolución:


1. Allegro (puro DSD) 12:38
2. Adagio (puro DSD) 7:58
3. Rondo (Allegro) (pure DSD) 8:51
4. Allegro (DSD a partir de cinta analógica) 12:38
5. Adagio (DSD a partir de cinta analógica) 7:58
6. Rondo (Allegro) (a partir de cinta analógica) 8:51

SACD. Capa CD Red Book:

1. Allegro (PCM downsampled desde DSD) 12:38


2. Adagio (PCM downsampled desde DSD) 7:58
3. Rondo (Allegro) (PCM downsampled desde DSD) 8:51
4. Allegro (PCM a partir de cinta analogica) 12:38
5. Adagio (PCM a partir de cinta analogica) 7:58
6. Rondo (Allegro) (PCM a partir de cinta analogica) 8:51

Grabación a cargo de Tony Faulkner en los estudios Henry Wood, Londres, el 19 de noviembre de 2003. Vinilo
masterizado por Stan Ricker y prensado por RTI, Camarillo, California.

Datos técnicos de la sesión de grabación:

• Productor: John Atkinson


• Ingeniero, edición en analógico:Tony Faulkner
• Edición en DSD:Finesplice
• Vinilo, master:Stan Ricker

• Microfonos: dos Neumann M50c onmidireccionales en disposición array DECA, estéreo. Un AKG C24
configurado en figura de 8(clarinete solo) y tres Schoeps CMC6-5 http://www.schoeps.de/E-2004/specs-mk-
ccm5.html (sección de vientos)
• Preamplificadores de micrófono: EAR 824M
• Consola de mezcla: Tim de Paravicini, con un diseño “a medida”/li>
• Cables: Mogami (micro a consola), Belden 11-way "snake" (preamp a consola), van den Hul carbon-fiber
(consola a grabador)
• DSD, convertidor: dCS 904
• DSD, almacenamiento: Genex GX8500 disco duro y almacenado en discos Panasonic, SCSI DVD-RAM.
• PCM, conversión de muestreo para "Red Book" capa SA-CD: Sonoma digital audio workstation
• Grabador analógico de cinta: Studer A80RC, dos pistas modificadas por Tim de Paravicini, utilizando para
ello cinta de ¼ a 15ips de velocidad y con proceso reductor de ruido, Dolby-A
• Monitorado de escucha/sala: Quad ESL-989 amplificados por dos EAR monobloques y utilizando cables para
altavoces de Naim. Sennheiser HD600 para el monitorado con auriculares y amplificación de Musical Fidelity.

Realización del estudio.


Partiremos de las dos versiones: disco de vinilo y CD híbrido SA-CD. Se etiquetarán las muestras según la relación de
formatos siguientes.

• N1: Audio analógico del la capa DSD convertido a PCM 96khz, 24 bits.
• N2: DSD a partir del original en cinta de ¼”.
• N3: PCM a partir del original en DSD. 44,100 Khz. 16 bits
• N4: PCM a partir del original en cinta. 44,100 Khz. 16 bits
• N5: PCM a partir del original en vinilo. 44,100 Khz. 16 bits

El tema escogido para el presente análisis es el Allegro K622 de Mozart. De él se extraerán los diversos fragmentos en
función de la naturaleza tímbrica y dinámica musical presente. Esta selección tiene por objeto el suponer que, en
función del numero de componentes espectrales alojadas en la zona media y alta del espectro sonoro, contribuirán en
mayor o menor medida a la rápida diferenciación por parte del oído, el cual, basa su mayor “precisión” a la zona de
medias-altas frecuencias. Convendría remarcar la ausencia de información en las frecuencias mas bajas (40hz a
150hz), por tanto, no nos merece una valoración o apreciación significativa a tomar en cuenta en el estudio. También
hemos creído conveniente obviar del presente análisis la versión N2, fundamentalmente, por creer que no aporta nada
de información musical con respecto de la N4. El motivo fundamental es porque creemos, que el partir de una
información acotada por el formato cinta, no es significativo desde el punto de vista de resolución de frecuencias el
producir una trama DSD. El puro DSD una vez convertido del analógico (salida del reproductor SA-CD/Dvd Sony DVP-
9000 ES) al digital (conversor AD/DA, ESI, Firewire 400), nos servirá para realizar un análisis FFT y por ver, si
realmente existen componentes espectrales mas allá de los 20 Khz. No se efectúa comparación alguna por el resto de
la metodología y con el resto de las muestras por tratarse de diferentes frecuencias de muestreo propias del formato.
En cualquier caso con un muestreo a 96 Khz y con un valor de FFT de 32.768 pts, se extiende el ancho de banda de la
medida hasta los 48 Khz obteniéndose una resolución en cada línea espectral de tan solo 2,9 hz. Dato más que
suficiente para evaluar y representar las posibles informaciones “asociadas” al formato SA-CD.
A continuación, se mostraran los diversos análisis de espectros para después centrar las medidas principalmente entre
tres bandas espectrales: bajas, medias y altas frecuencias. Se realizará sobre las versiones, N1, N3, N4 y N5. El
tamaño de la FFT es de 32768 pts lo que da una resolución en frecuencia de 1,43 Hz. La frecuencia de muestreo es de
44,1khz a 16 bits. En el ejemplo de la versión N1, gráfica 1, se mostrará un ancho espectral que irá desde los 10hz
hasta 48 khz con motivo de representar todo el ancho de banda del formato DSD. Recordemos que la frecuencia de
muestreo es de 96khz.

Gráfica 1. Análisis espectral de la versión N1.


Gráfica 2. Representación nivel vs frecuencia de la versión N1 hasta 48khz.

Gráfica 3. FFT zona de bajas frecuencias.

La versión N5 muestra un ligerísimo aumento (+3dbs) del canal izquierdo zona de bajas frecuencias con respecto de la
versión N3 y N4. El resto es prácticamente de idéntica información. *Traza azul corresponde a la versión N3, en rosa la
versión N4 y en blanco la N5.
Gráfica 4. FFT zona de medias frecuencias.

Zona espectral de medias frecuencias no se observan diferencias espectrales, tan solo, diferencias en amplitud que, en
ningún caso, superan los 1,5 dBr entre ellas.

Gráfica 5. FFT zona de altas frecuencias

En esta gráfica se muestra el espacio espectral comprendido entre los 5khz y 22 Kh, y también podemos observar una
diferencia de nivel considerable por parte de la grabación N5, concretamente, en la zona de muy altas frecuencias.
Por tanto, podemos afirmar que aquí se cumple aquello de ... en los disco de vinilo se tiene poca y pobre información
en altas frecuencias . Así mismo, el margen dinámico del ruido disminuye en aproximadamente 12dBs con respecto de
los otros dos formatos, por tanto, estamos ante una reducción drástica de la dinámica musical en esta franja espectral.
Al efectuar una ampliación (zoom) sobre la forma de onda de la versión N5 podemos observar un mayor ruido
modulado a la señal principalmente por la menor relación señal ruido del propio formato. En la escucha musical
también se observa este ruido con respecto del resto de los formatos.
A continuación, analizaremos aproximadamente nueve segundos de la composición musical “Allegro” en la que se
busca predominen únicamente los instrumentos de cuerda. Principalmente se elige este fragmento por dos
características: el bajo nivel RMS de la señal y el complejo contenido armónico en comparación al resto de temas.
Este análisis será en representación de la energía en función del tiempo (ETC).

Gráfica 6. Representación ETC para N4.

Representación gráfica de la energía en la versión N4 (PCM del origen en cinta de ¼”). En la traza azul se representa
el nivel RMS y corresponde aproximadamente al tiempo de grabación musical 0:00:54.

Gráfica 7. Representación ETC para N7.

La misma gráfica pero esta vez de la versión N5. La contaminación en los extremos de la gráfica obedece a un mayor
ruido de fondo de la grabación y coincide, con los silencios entre pasajes musicales. Se puede observar como
prácticamente coinciden ambas gráficas en lo que respecta a la información musical (contenido de energía / tiempo).
La diferencia de nivel RMS entre las dos grabaciones es de tan solo 1,5 dB (gráfica azul). Cabría anotar que, en el
proceso de grabación de la versión N5 (PCM a partir del origen en vinilo), el nivel de grabación tomado fue
exclusivamente en función de la mayor ganancia posible que nos permitía la grabadora de CD y, en ningún caso, se
produjo una saturación (overclip) de la grabación. El material empleado para el cambio del formato fue el siguiente:

• Giradiscos: SME 10
• Cápsula marca: Vandenhull, Colibri
• Grabadora de CD-R: Pioneer PDR-609
Gráfica 8. Representación ETC para N3.

En esta gráfica se muestra la versión N3. Se puede observar que es prácticamente igual a la gráfica de la versión N4.
No existe ninguna “contaminación” en los extremos de la misma, el nivel RMS es prácticamente igual a la versión N4.
A continuación, se muestran los Espectrogramas de las versiones N1, N3, N4 y N5. Las muestras se corresponden
aproximadamente al intervalo de tiempo, 0:00:48 a 0:00:58, del tema Allegro. En las versiones N3, N4 y N5, se centra
la medida en las zonas de medias frecuencias.

Gráfica 9. Espectrograma de la versión N1.


Gráfica 10. Espectrograma de la versión N3.

Gráfica 11. Espectrograma de la versión N5.


Gráfica 12.Espectrograma de la versión N4.

Los espectrogramas son muy útiles pues podemos observar por medio de los diferentes colores la distribución de la
energía en función de las frecuencias. Seria algo así como el D.N.I de la música. En las cuatro gráficase pueden
apreciar diferencias en la franja comprendida entre los 200 hz y 500 hz, de la versión N4 con respecto del resto.
Aunque cabría anotar que las diferencias son minúsculas en términos de diferencias de amplitud.

Gráfica 13. FFT de la correlación entre N3 y N5.

Gráfica que representa el calculo FFT de la correlación matemática entre los fragmentos de la versión N3 y la versión
PCM del vinilo N5. Esta gráfica es puramente estadística pero nos da una idea de las diferencias. A partir de 1khz, las
diferencias, son pura anécdota.
Gráfica 14. Representación FFT de la función de computación cross-correlation.

Gráfica 15. Gráfica cross-correlation.

Correlación entre las versiones N3 y N4. El eje X se normaliza al valor 1, el cual, se corresponde con el 100% de
igualdad entre muestras. O sea, cuanto más se acerquen las componentes espectrales a este valor, más se
aproximará la información entre las dos versiones.
Gráfica 16. Correlación entre la versión N5 y N3.

Gráfica 17. Cross-correlación entre versión N5 y N4.


Gráfica 18. Coherencia entre la versión N3 y N4.

Gráfica 19. Gráfica de coherencia entre N4 y N5.


Gráfica 20. Gráfica de coherencia entre N3 y N5 Estas gráficas muestran lo coherentes que son dos señales en
función de su frecuencia y amplitud. Cuanto más se aproximen al valor 1 (coordenada X) más iguales serán.

Conclusiones.
Del presente examen, tan solo, hemos pretendido el representar y comparar por medio de las herramientas analíticas y
estadísticas un posible veredicto que se pretende obtener a la hora de una escucha musical y, tan solo, por ver las
posibles diferencias entre varios formatos que, a priori, deberían de ser relativamente dispares entre si. Por tanto, y a la
vista de ello, podemos pensar que solamente existen claras diferencias en la versión extraída de vinilo y puede, que
se minimizaran si utilizáramos otra variante (Léase; el binomio cápsula-previo) en la reproducción del vinilo para su
posterior conversión al formato digital de la versión N1. En la gráfica 1 se observa y sólo durante un instante de tiempo
muy corto abundante información en el espectro de muy alta frecuencia. Pensemos que dadas las componentes
espectrales (su relación armónica) se podría vislumbrar que es una señal fruto de una distorsión singular en un instante
dado, la cual, coincide con la máxima expresión musical de la dinámica en la obra. Seria algo así como ver la
saturación de cualquier micrófono de la sala en un instante dado. Solamente es posible capturar información mas allá
de los 20 khz, en el caso de la información musical por parte del set de violines, contrabajos y chelos ya que, la
microfonía empleada (Schoeps CMC6-5) permite el extenderse hasta los 30 khz. En el resto de la captación sonora es
prácticamente imposible registrar frecuencias mas allá de los 20khz con plenas garantías de fidelidad.

Vuelta a la introducción.
Segundo estudio. Primera parte.

VOLVER A MATRIX-HIFI

PROYECTO K622
Segundo estudio. Primera parte.

ESTUDIO DINÁMICO COMPARADO PARA LAS VERSIONES DSD, CD, VINILO Y CINTA.

Este segundo estudio se va a concentrar en analizar las diferencias entre formatos desde el punto de vista de dinámica
de cada muestra. Para ello se ha empleado el método ya descrito en el artículo "El Sonido Rudy Van Gelder" . Las
comparaciones se van a presentar emparejadas, siendo la referencia entre ellas la muestra de sonido PCM-44.1 KHz-
16 bits de la capa CD.

COMPARACIÓN DINÁMICA ENTRE LA CAPA CD Y LA GRABACIÓN A PCM DE LA CAPA DSD.


El primer par a comparar es el de la extracción directa de la capa CD del disco SACD y la grabación a PCM-96 KHz de
la capa DSD del mismo disco. Se ha tomado, de uno de los dos canales de la señal estereo, una muestra de alrededor
de 67 segundos y se ha alineado visualmente tras calcular las envolventes energéticas por transformada de Hilbert. El
tiempo de integración en el cálculo de los valores RMS ha sido 50 ms y el salto entre integraciones ha sido de otros 50
ms (0% de solapamiento). A continuación se muestran las evoluciones dinámicas de ambas pistas y su diferencia.

Figura 1. Curvas ETC de 0 a 20 segundos.


Figura 2. Curvas ETC de 20 a 40 segundos.

Figura 3. Curvas ETC de 40 a 60 segundos.


Figura 4. Curvas ETC de 60 a 67 segundos.

A la vista de estas curvas se puede comprobar que, aparte de la pequeña diferencia de niveles (lógica por haberse
grabado el DSD por salida analógica y por haberse ajustado manualmente el nivel de la grabación) a favor de la capa
CD, las zonas donde destacan las diferencias entre pistas coinciden con los momentos de menor nivel de señal de la
música. Los picos de la capa CD y de la capa DSD están a niveles parejos pero los valles de la curva RMS llegan más
abajo en la capa CD que en la DSD. Es decir, el rango dinámico de la capa CD es mayor que en la capa DSD.

Para acotar más claramente estás diferencias vamos a representar la curva dinámica comparada[*], con el siguiente
resultado:
Figura 5. Representación dinámica comparada. El eje X representa los niveles de la capa CD y el eje Y el valor
dinámico que la capa DSD presenta en el mismo instante de tiempo. Click en la imagen para agrandar.

El ajuste por regresión lineal de la representación de puntos nos indica que, efectivamente, la capa DSD está casi 1 dB
(termino A de la regresión) por debajo de la capa CD. Además vemos que la relación dinámica de ambas señales es
practicamente 1:1 (termino B del ajuste), salvo cuando la señal desciende a niveles RMS de menos de 40 dB. En ese
momento la capa DSD presenta compresión de nivel frente a la capa CD. El rango dinámico RMS de la capa CD es de
unos 40 dB y en la capa DSD de unos 4 dB menos.

Si queremos progresar en este análisis, el siguiente paso es representar las curvas dinámicas comparadas filtradas por
bandas de frecuencia. En este caso se han elegido bandas que abarcan una octava cada una (doble de frecuencia),
salvo una última curva que va desde 22050 Hz hasta 44100 Hz y que se comentará en detalle más adelante.

Figura 6a Figura 6b

Figura 6c Figura 6d
Figura 6e Figura 6f

Figura 6g Figura 6h

Figura 6i Figura 6j
Figuras 6a a 6j. Representaciones dinámicas comparadas para las señales filtradas en diez bandas de frecuencia.
Click en cada imagen para agrandar.

Del estudio de las Figuras 6x, se puede concluir que salvo en la última octava, donde la capa CD está comprimida en
nivel con respecto a la capa DSD, en el resto ambas pistas son dinámicamente muy semejantes, con diferencias lejos
de lo audible. La diferencia de niveles en el agudo de 10 KHz a 22 KHz quizás podría ser audible, aunque habría que
comprobarlo mediante prueba de escucha.

La Figura 7 merece una explicación aparte. En este caso estamos filtrando de 22.5 KHz a 44.1 Hz. Este filtro aplicado a
la capa CD y según demuestra el Teorema de Shannon, lo que produce es un filtrado por aliasing desde 44.1-22.05 =
22.05 KHz hasta 44.1-44.1 = 0 KHz. Es decir, filtramos la pista completa. Por lo tanto la curva dinámica comparada en
el caso de la Figura 7 representa el contenido energético RMS en aproximadamente la octava más alta de la capa
DSD-96 KHz frente a la dinámica completa de la capa CD.

Figura 7. Representación dinámicas comparada para las señales filtradas entre 22.05 KHz y 44.1 KHz. Click en cada
imagen para agrandar.

La Figura 7 nos muestra donde está el responsable del recorte dinámico de bajo nivel de la capa DSD. Presenta un
contenido RMS en esta banda que constante a unos -53 dB y que es independiente de la dinámica musical (que está
entre los -10 dB y los -53 dB). Es básicamente un ruido de fondo que hace que en la Figura 5 se vea esa compresión
final a bajo nivel y que compensa sobradamente la expansión que aparece en la anterior banda de agudos (Figura 6j).

Como conclusión, queda mostrado que en este caso hay diferencias dinámicas entre ambas capas y que se
concentran en los agudos extremos. De estas diferencias no creemos que puedan extraerse valoraciones cualitativas,
más allá del descubrimiento del ruido de fondo de alta frecuencia de la capa DSD.

Vuelta a la introducción.
Segundo estudio. Segunda parte.

VOLVER A MATRIX-HIFI
PROYECTO K622
Segundo estudio. Segunda parte.

COMPARACIÓN DINÁMICA ENTRE LA CAPA CD Y LA GRABACIÓN A PCM DE LA VERSIÓN EN VINILO.

En este caso se va a comparar el comportamiento dinámico de la versión CD frente a la grabación a PCM del LP
efectuada con el equipamiento descrito en el primer estudio. Las evoluciones dinámicas de ambas pistas y sus
diferencias se muestran a continuación:

Figura 1. Curvas ETC de 0 a 20 segundos.

Figura 2. Curvas ETC de 20 a 40 segundos.


Figura 3. Curvas ETC de 40 a 60 segundos.

Figura 4. Curvas ETC de 60 a 80 segundos.

La grabación de la versión en vinilo tiene un nivel más alto que el PCM 44.1 KHz-16 bits del CD, y estás diferencias se
acentuan con las caidas dinámicas de la música. El rango dinámico de la capa CD es mayor que el del vinilo.
Para este caso la curva dinámica comparada es la que sigue:
Figura 6a Figura 6b

Figura 6c Figura 6d

Figura 6e Figura 6f
Figura 5. Representación dinámica comparada. El eje X representa los niveles RMS del CD y el eje Y el valor
dinámico que el vinilo presenta en el mismo instante de tiempo. Click en la imagen para agrandar.

El ajuste por regresión lineal de la representación de puntos nos indica que hay 1 dB (termino A de la regresión) más
de nivel a 0 dB-FS en el caso del vinilo sobre el CD. La relación dinámica de ambas señales es 0.92 (termino B del
ajuste), indicación de que el sonido del vinilo tiene compresión dinámica frente al del CD. El rango dinámico RMS de la
capa CD es de unos 40 dB y en la capa DSD de unos 35 dB.

Las representaciones dinámicas comparadas para las diferentes bandas de frecuencia resultan ser:

Figuras 6a a 6j. Representaciones dinámicas comparadas para las señales filtradas en diez bandas de frecuencia.
Click en cada imagen para agrandar.

En este caso nos encontramos con que la grabación del vinilo presenta compresión y que además esta compresión es
más acentuada en los extremos de la banda de audio (factor 0.78 para 10 KHz a 20 KHz y factor 0.90 de 40 Hz a 80
Hz). Básicamente estamos ante la aplicación de un contorno dinámico que es un ejemplo típico de lo que se conoce
como "loudness control", con el añadido característico de que tiende más al brillo en agudos que al oscuro en graves.

En este caso las diferencias dinámicas son destacables y sería extraño que no fuesen audibles. Al fin y al cabo este es
el objetivo del "loudness", hacer más presentes mediante ecualización las frecuencias que menos excitan al oido.

Vuelta a la introducción.
Segundo estudio. Tercera parte.

VOLVER A MATRIX-HIFI
PROYECTO K622
Segundo estudio.Tercera parte.

COMPARACIÓN DINÁMICA ENTRE LA CAPA CD Y LA GRABACIÓN A PCM DE LA VERSIÓN EN CINTA.

En este caso se va a comparar el comportamiento dinámico de la versión CD frente a la grabación a PCM de la cinta.
Las evoluciones dinámicas de ambas pistas y sus diferencias se muestran a continuación:

Figura 1. Curvas ETC de 0 a 20 segundos.


Figura 2. Curvas ETC de 20 a 40 segundos.

Figura 3. Curvas ETC de 40 a 60 segundos.


Figura 4. Curvas ETC de 60 a 80 segundos.

En este caso las curvas son muy similares, hasta extremos llamativos. Y además, curiosamente, ocurre que hay zonas
(Figura 4- de 62 s a 80 s) donde las semejanzas son más altas y otras donde hay mayor dispersión de las diferencias
(Figura 3- de 55 s a 60 s). Y estás diferencias no son debidas a cambios dinámicos de la señal musical.

Para este caso la curva dinámica comparada es la que sigue:


Figura 5. Representación dinámica comparada. El eje X representa los niveles RMS del CD y el eje Y el valor
dinámico que la cinta presenta en el mismo instante de tiempo. Click en la imagen para agrandar.

El ajuste por regresión lineal de la representación de puntos nos indica que hay 1 dB (termino A de la regresión) menos
de nivel a 0 dB-FS en el caso del vinilo sobre el CD. La relación dinámica de ambas señales es 0.96 (termino B del
ajuste), lo cual es indicativo de una pequeña compresión de nivel de la cinta frente al CD. Los rango dinámicos RMS
son semejantes, de unos 40 dB.

Las representaciones dinámicas comparadas para las diferentes bandas de frecuencia resultan ser:

Figura 6a Figura 6b

Figura 6c Figura 6d
Figura 6e Figura 6f

Figura 6g Figura 6h

Figura 6i Figura 6j
Figuras 6a a 6j. Representaciones dinámicas comparadas para las señales filtradas en diez bandas de frecuencia.
Click en cada imagen para agrandar.
Las diferencias dinámicas entre ambas pistas son muy pequeñas. Basicamente lo que hay es una dispersión de punto
en torno a la recta equidinámica (A=1, B=1). Los rangos dinámicos que manejan ambas pistas en cada banda son muy
semejantes.

Aqui las conclusiones son extrañas: parecería que en algunos momentos la cinta debería ser indistinguible
dinámicamente del CD, pero hay otros momentos en los que pueden surgir diferencias que podrían ser apreciables.
Quizás sea un caso para analizar más en detalle especificamente, como por ejemplo con más pares de muestras, o
intervalos de analisis más cortos. O quizás sea un problema del propio medio de reproducción en el caso de la cinta.

Vuelta a la introducción.

Вам также может понравиться