Академический Документы
Профессиональный Документы
Культура Документы
Págs.
I ÍNDICE 2
II RESUMEN 5
III INTRODUCCIÓN 6
IV PARTE TEÓRICA O MARCO TEÓRICO 11
Y PROPIEDADES 26
4.4.3 TRANSFORMADA DE COSENO 32
4.4.7 CONVOLUCIÓN 39
4.4.8 INTERPRETACIÓN DE LA CONVOLUCIÓN
2
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
Págs.
4.4.14 CONVOLUCIÓN NO PERIÓDICA 49
4.4.15 MODULACIÓN 50
V MATERIALES Y MÉTODOS 52
VI RESULTADOS 53
6.1. TRANSFORMADA DE SEÑALES DISCRETAS Y ALGORITMO
FFT
6.1.1 ALGORITMO FFT PARA MP3 54
6.1.2 DIFERENCIAS CON OTROS FORMATOS 55
6.1.3 CONVERSIÓN ANALÓGICO DIGITAL 56
6.1.4 MUESTREO DE LA SEÑAL ANALÓGICA
6.1.5 CONDICIÓN DE NYSQUIST 58
6.1.6 MULTIRESOLUCIÓN Y FIRTROS
6.1.7 PROPIEDAD DE LA FUNCIÓN SCALING 60
6.1.8 CUANTIFICACIÓN DE LA SEÑAL ANALÓGICA
6.1.9 CODIFICACIÓN DE LA SEÑAL EN CÓDIGO BINARIO 61
6.1.10 COMPRESIÓN DE VOZ 63
6.1.11 COMPRESIÓN DE AUDIO GENÉRICO
6.1.12 DETALLES TÉCNICOS 64
6.1.13 BANCO DE FILTROS 65
6.2 EL MODELO PSICOACÚSTICO 66
6.2.1 CODIFICACIÓN Y CUANTIFICACIÓN 67
6.2.2 CICLO INTERNO
6.2.3 CICLO EXTERNO
6.2.4 EMPAQUETADO FORMATEADOR DE BITSTREAM 68
6.2.5 ESTRUCTURA DE FICHERO MP3
6.2.6 TRANSFORMADA DE FOURIER DISCRETA Y FICHERO 69
MP3
6.2.7 CODEC DE AUDIO Y TIPO DE CODEC
6.2.8 CODEC DE AUDIO CON PÉRDIDAS
6.2.9 CODEC DE AUDIO SIN PÉRDIDAS 70
3
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
Págs.
71
6.3 ESPECTROS SONOROS
6.3.1 TRANSFORMADA RAPIDA DE FOURIER Y COMPRESIÓN DE AUDIO 74
6.3.2 EJEMPLO DE COMPRESIÓN DE VOZ POR MEDIO TRANSFORMADA
DE FOURIER EN MATLAB 76
VII. DISCUSIÓN
7.1. CONCLUSIONES
7.2. RECOMENDACIONES
77
VIII REFERENCIAS
APÉNDICE 79
ANEXO 88
4
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
II RESUMEN
El presente trabajo de investigación consiste en plasmar la utilidad de la
Transformada de Fourier en la compresión de audio y los MP3, para lo cual es
fundamental la teoría de señales y las herramientas matemáticas que se disponen a
fin de comprimir una señal de audio usando la Transformada de Fourier, la señal
sonora no necesariamente es periódica, por lo que es necesario presentar un
enfoque teórico de la Transformada de Fourier para señales analógicas y
digitales , se hace un enfoque intuitivo e histórico de la compre sión de audio,se
plasma la Transformada de Fourier Discreta en la compresión de audio mediante
algoritmos de la Transformada Rápida de Fourier, para la cual se muestra un
ejemplo de comprensión de voz mediante la Transformada de Fourier y se utiliza
un software elaborado en MATLAB.
5
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
III INTRODUCCIÓN
6
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
7
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
8
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
9
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
10
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
11
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
hasta el cerebro donde son interpretados. Las ondas sonoras son de tipo
longitudinal y consisten en una serie de compresiones y enrarecimientos
sucesivos. Para poner esto de manifiesto podemos considerar el caso de un
diapasón que vibra. Cada uno de los golpes de sus varillas produce al golpear
hacia afuera una compresión, para acto seguido dar lugar a un enrarecimiento al
batir hacia dentro, seguido de nuevo por una compresión, etc. De este modo se
dice que un ciclo está compuesto en esta oscilación por una compresión y un
enrarecimiento y la longitud de onda de dicha perturbación es la distancia que
separa dos compresiones, o dos enrarecimientos sucesivos [7].
Para caracterizar el sonido se emplean dos nociones que, si bien no son
propiamente científicas, permiten describirlo con una cierta aproximación. Dichas
nociones son las de altura, relacionada con la frecuencia y la de volumen que está
vinculada con la intensidad. Sin embargo, una descripción precisa de las ondas
sonoras debe basarse en los conceptos de frecuencia e intensidad de la
perturbación. La frecuencia de las ondas sonoras se define como el número de
oscilaciones que se producen en un segundo y se mide mediante la unidad llamada
que equivale a un ciclo por segundo. La intensidad, por su parte, es la potencia
que atraviesa en un segundo una superficie unidad perpendicular a la dirección de
propagación de la perturbación sonora. La unidad en la que se expresa es el
decibelio (dB), si bien no existe una escala absoluta de medida, ya que la escala
existente toma como nivel o la intensidad mínima audible, que es un concepto
relativo. Existe asimismo una relación entre la intensidad del sonido, la amplitud
y la frecuencia de la perturbación y el medio que le sirve de soporte, siendo así
que cuanto mayor es la densidad del medio tanto menor es la intensidad sonora y
cuanto mayor es la amplitud menor es la frecuencia[7].
12
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
13
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vida l 2012
14
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vida l 2012
FI G. N° 4 Frecuencia de Nyquist.
15
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vida l 2012
16
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
17
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
18
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
FIG. N°9RadioCaset.
EL WALKMAN
El primero en su tipo fue un aparato llamado Stereobelt, y fue inventado en 1972
por un brasileño -alemán llamado Andreas Pavel.
Era un reproductor portátil de casetes, con audífonos que emitían sonido estéreo.
El gran agregado aquí son los cascos, que “privatizan” la experiencia musical y le
ponen banda sonora a lo que sea que uno esté haciendo, como se aprecia en la
Fig.Nº 10.
19
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
FIG. N° 12Minidisc
REPRODUCTOR MP3
Apareció en 1998, y fue una idea de la empresa surcore ana
SaeHanInformationSystems. Almacena y reproduce música en form ato digital
(Fig. Nº 13).
Sus primeras versiones sólo disponían de una memoria de 32MB. O sea, só lo
cabían unas 8 canciones. Pero su capacidad de almacenaje ha crecido
rápidamente. Hoy lo habitual es tener uno de 2GB, con espacio para 500
canciones. Lo importante es que con este aparato nace una época en la cual los
20
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
CD van en baja y la descarga de mús ica por Internet es gratis y disponible para
todos.
IPOD CLÁSICO
La primera versión se lanzó en septiembre de 2001. Funciona como un MP3, pero
con mayor capacidad de almacenaje y un diseño más sofisticado (Fig. Nº 14)
Apple saca al mercado este reproductor de música consciente del boom de los
MP3 y el declive de los CD, pero sumando un cuidadísimo diseño. Y además,
nuevas versiones, como Mini, Nano, Shuffle y el increíble Touch. Son más caros
que un MP3 convencional, pero vale la pena.
21
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
22
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
23
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
MP3 fue desarrollado por el Moving Picture ExpertsGroup (MPEG) para formar
parte del estándar MPEG-1 y del posterior y más extendido MPEG-2. Un MP3
creado usando una compresión de 128kbit/s tendrá un tamaño de
aproximadamente unas 11 veces menor que su homónimo en CD. Un MP3
también puede comprimirse usando una mayor o menor tasa de bits por segundo,
resultando directamente en su mayor o menor calidad de audio final, así como en
el tamaño del archivo resultante.
4.3.1UTILIDAD DEL FORMATO MP3
El formato de audio usado en los discos compactos (CD) usa 44.1 Khz y 16 bit, es
decir, que graba 44.100 muestras de 16 bit (2 bytes) cada segundo. Esta ingente
cantidad de datos es la que permite obtener un sonido de muy alta fidelidad.
Si multiplicamos 2 bytes * 44.100 obtenemos que se necesitan 88.200 bytes por
segundo en cada canal del estéreo. Así pues, necesitamos 176.400 bytes por
segundo en una grabación estereofónica.
Multiplicando por 60, veremos que un só lo minuto de grabación en c alidad CD
ocupa la friolera de 10.584.000 bytes, es decir, 10.09 Mb por minuto.
Una pieza de 4 minutos ocuparía, por lo tanto, unos 40 Mb. Y comprimido al
formato MP3 a razón de 10 a 1 serían 4Mb por canción.
4.3.2ESTRUCTURA DE UN FICHERO MP3
Un fichero Mp3 se constituye de diferentes framesMP3 que a su vez se componen
de una cabecera Mp3 y los datos MP3. Esta secuencia de datos es la denominada
"stream elemental". Cada uno de los Frames son independientes, es decir, una
persona puede cortar los frames de un fichero MP3 y después reproducirlos en
cualquier reproductor MP3 del Mercado. La cabecera consta de una palabra de
sincronismo que es utilizada para indicar el principio de un frame válido. A
continuación siguen una serie de bits que indican que el fich ero analizado es un
24
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
fichero Standard MPEG y si usa o no la capa 3. Después de todo esto, los valores
difieren dependiendo del tipo de archivo MP3. Los rangos de valores quedan
definidos en la ISO/IEC 11172-3.11
4.4.1Definición formal
( )= () (1)
25
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
( ) = ℱ[ ( )] = () ℱ (2)
Se conoce como la integral de Fourier o transformada de Fourier de , y la
()
operación de integración se simboliza frecuentemente por : esto es,
( )
( )=ℱ [ ( )
( )] = 21 ( ) (3)
ℱ
o sea, obtener cuando está dado; esto es,
() ( )
y
Y se denomina transformada inversa de Fourier de . Las ecuaciones (1)
(2) se conocen a menudo como par de transformadas de Fourier.
| ( )| < ∞ (4)
Demostración
De donde = cos − sin
| |= cos + sin =1
() = | ( )|,
Se sigue que si
()
Es finita, entonces | ( )| = ()
26
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
Es finita, es decir ℱ[ ( )] . | ( )| ∅( )
L a función
( ) () ()
fase de
|
( )| = + () ∅( )
se denomina espectro
Donde =
de magnitud de , ,y , espectro de
( ).
Ahora si es real, demostraremos que las partes real e imaginaria de son
( )= ( ) cos , (5)
(5) y (6).
()
dadas en
()
( )= (− ), (7)
( )=− (−
), (8)
(− ) = ∗( ), (9)
=cos − sin
Es posible expresar la relación (1) como sigue:
() = ()
27
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
= ( ) cos − ( ) sin
= () + ( ),
Igualando las partes real e imaginaria (10)
se tienen:
( )= ( ) cos
( )=− ( ) sin
.
( ) es real, se tiene
Puesto que
(− )= ( ) cos(−
) = ( ) cos = ( ),
(− ) = − ( ) sin(− ) = ( ) sin =− ( ).
Por lo tanto, ( )
es la función par de y ( )
es una función impar de .
Por (7) y (8),
) ) ( ) ∗( )
se tiene
( ) ( )
=(− + (− = − =
El hecho de que relación (9), es una condición necesaria para .
que sea real,
no quiere decir que sea suficiente; por ende, demostraremos que
dicha ecuación
()
( ), (11)
Sea () = ()+
()= () + ()
1
()= 2 ( )
1
2
= [ ( )+ ( )](cos + sin )
21 [ ( ) cos − ( ) sin ]
=
1
2
+ [ ( ) sin + ( ) cos ] . (12)
Por tanto ( ) = 2
1
[ ( ) cos − ( ) sin ] . (13)
(− ) = ( )) ( ) ) ( )
∗
Ahora, si , entonces
(− = −
(− =y don funciones
En consecuencia, impares de , y el
es una función impar de . Por consiguiente de los
integrando de (14)
(
) ( )
coeficientes de Fourier de
sin
(sabemos que una función periódica
ondas simétricas
cos
Entonces se tiene. ( ) = 0,
Es decir ( ) es real.
Entonces si par de
es real, demostraremos que su espectro de magnitud es , y que su espectro de fase es una función impar de
es una función
()
|( )|
En efecto, se tiene: ∅( )
29
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
Ahora bien por
(−
(4),
)=
se tiene
().
(15)
∗( )= |( )| ∅( ). (16)
)| .
Y por tanto,
(−
) = | (−
∅( )
∅( ) (17)
| (− )| =
|( )| (18)
Por consiguiente, ∅( )
() ()
()
imaginaria pura, entonces ( ) es una función par de .
Sea
( )= ( ) cos , (22)
( )= ( )
Si y ( )=0 , entonces integrando de (23) debe ser impar con
respecto a , puesto que es un función impar de , debe ser un
función par de . sin ()
( ) = 0, se tiene
Por (13), con
30
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
( ) = 21 ( ) cos
=1 ( ) cos , (24)
)
Según (24), es obvio que .
(−
Análogamente si
(22) debe ser impar con respecto a
( )= (
=
,es (decir,)
)
. Como
(
)= 0
, entonces el integrando de es una función par de ,
(
O, utilizando nuevamente (13) y si ) = 0, entonces
() =− 21 ( ) sin
1
tiene
Donde por 6), se ()=− ( ) sin , (26)
( ) = −2 ( ) sin . (27)
(− ) = − ( ).
Según (26), también es obvio que
ℱ[ ( )] = ( )= ( )+ ( ),
Entonces
ℱ[ ( )] = ( ), (28)
ℱ[ ( )] = ( ), (29)
31
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
Donde ( )= ( )+ ( ), siendo y las componentes par e impar de ( ), respectivamente.
() 0< <∞ ()
4.4.3Transformada Coseno
( )= ( ) cos
, (31)
0< <∞
() ()
par. ) ()
En efecto:
Si está definida solo para se puede definir para valores
()
Si ahora de
( )= ( ) cos ,
Entonces, por (24) y (25), se tiene
ℱ[ ( )] = ( ( ) =2 ( ) cos (32)
)= ( ) cos ,
4.4.4Transformada Seno
() ( )= ( ) sin<∞
, (35)
Veamos si se cumple la relación (34) , en efecto:
0< ()
impar. (− ) = − ( )
( )= ( ) sin ,
Si ahora de define
() = 2 ( ) sin
ℱ [ ( )] = ( )= ( ) sin , (36)
()= =1 , =2 , (38)
Donde () . (39)
()= , (40)
( ∆ )
=∆ (∆ ) . (41)
()
() = 1 [ ( ) ]
límite, en vez de ∆ → 0, →∞ ∆ →
tiene ∆lim ∆
= () = ( ). (42)
34
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
( ) = ( ), (43)
= 2 , se tiene
O, puesto que
1
2
( ) = ( ) () =
1 ( ) (44)
Entonces (40) se convierte en
2
1
2
= ( ) . (45)
Esta ecuación muestra que representa la magnitud infinitesimal de
angular .
un armónico a la frecuencia |( )|
|( )| |(
)|
()
La representación anterior de la función no periódica como suma de
exponenciales con la frecuencia fundamental teniendo a cero, no es un proceso
fácil de aceptar. A veces la interpretación que sigue el par de transformadas de
Fourier (1) y (2) será más directa y de mayor significado:
( ) = ℱ[ ( )] = ()
1
2
()=ℱ [ ( )] = ( )
35
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
Es decir, se supone() que cualquier función dada( tiene) dos modos() equivalentes de
representación: uno es el dominio del(tiempo,) , y el otro es en el dominio de la
frecuencia, . La ecuación (1) transforma la función , en el dominio del
tiempo, a su función equivalente , en el dominio del la frecuencia, y la
ecuación (2) invierte el proceso. La ecuación (1) analiza la función del tiempo en
un espectro de frecuencia y la ecuación (2) sintetiza el espectro de frecuencia para
obtener nuevamente la función en términos del tiempo.
36
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
f´(t)
ℱ[ ′()]= ℱ[ ( )] (48)
Efecto verificamos si se cumple integrando por partes se obtiene
(48),
ℱ[ ( )] = ()
=
() | + () . (49)
ℱ[ ( )] = () =
( ) = ℱ[ ( )].
En el problema anterior se demuestra que la diferenciación en el dominio del
tiempo corresponde a la multiplicación de la transformada de Fourier por ,
dado que cuando .
entonces contiene
()
()
de
este caso, debe contener la transformada de Fourier de los impulsos
()
, en
en ℱ[
Se debe observar
()]=
que
(
()
, lo cual se ve en transformadas de Fourier de funciones especiales.
)(
(50) no
)
garantiza
=() ℱ
la existencia
[()], = 1, 2,
de
…
latransformada
(50 )
deFourier
()
.
( )
( )
Si ℱ[ ( )] = ( ), ≠ 0, y
37
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
() = (0) = 0. (51)
Demostremos que la relación (52)
ℱ ( ) = 1 ( ) = 1 ℱ[ ( )]. (52)
En efecto:
∅( ) =
( ) ; (53)
Considerar la función
ℱ [∅′( )]
Con tal que = ℱ[ ( )] = ∅( ). (54)
consiguiente,→
ℱ () =1 ( ) = 1 ℱ[ ( )]
Esto es,
≠ 0. Cuando = 0,
Observar que (52) solo se aplica cuando
ℱ[∅( )] = ∅( ) .
(57)
Cuando (0) = ∫ ( )
≠ 0, se tiene
38
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
ℱ () = 1 ( )= 1 ( )+ (0) ( ). (58)
4.4.7 CONVOLUCIÓ N
Sean las funciones
Entonces la convolución de funciones dadas está definida mediante:
() ()
=
()(− ) ∗
Sin embargo como todo en las matemáticas, la mejor y más confiable manera de
aprender nuevos conceptos es mediante la interpretación de modelos; donde se
puede explayar el mismo hasta obtener una manera general y totalizada del
análisis del problema. Es por este motivo que empezaremos este capítulo
mediante la Interpretación de la Convolución.
39
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
Podemos apreciar que para este tipo de entrada (P(t)) existe un tipo de respuesta
(Q(t)); como se aprecia en la Fig. Nº 17, en este caso asumamos que sea de la
siguiente manera:
40
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
∗( )= ( − ) ( )
41
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
)= ∗( ( − ) ( )
Cuando llevamos al límite T0
lim → ∗( ) = lim → (− ) ( )= (− )( )
= ()(− ) → : = ()(− )
∴ = ∗ = () ( − )
decir: ∗
( )= () , ( )=
()
Entonces:
( ) ( )= ()()
()
Si hacemos el cambio de variable: ( ; en la integral doble, la cual
) a las variables (). Por cálculo
deseamos transformar de variables u+v=x
u, v u, x
diferencial conocemos:
42
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
= ( , )
está dado por:
(
Entonces hallando el Jacobiano, el cual , )
(, ) 1 0
= = =1
(, ) 0 1
De donde:
( ) ( )= ( ) ( − )
= ( ) ( − )
[ ]
=ℱ ) ( − )
(
Como: ∗ = ( ) ( − )
( ) ( ) = ℱ{ }
Entonces: ∗
∴ ( ) ( ) = ℱ{ ∗ }
Y como cumple la transformada de Fourier, realizamos el proceso inverso y
también será válida para la Transformada Inversa de Fourier.
O sea:
ℱ{ ∗ } = ( ) ( )
ℱ ℱ{ ∗ } =ℱ { ( ) ( )}
43
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
1
2
∗ = ( ) ( )
4.4.10PROPIEDADES DE LA CONVOLUCIÓN
=
La convolución es CONMUTATIVA .
∗ ∗
Demostración:
Sea: t - x=y de donde dx = -dy.
→ −∞ ; → ∞
Además:
→∞; → −∞
∗ = ()(− ) =
( − ) ( )(− )
=− ( ) ( − )( ) = ()(− )
∗ =( ) ( − )
∴ ∗ = ∗
La convolución es ASOCIATIVA.
∗ ∗
DISTRIBUTIVA.
∗ ∗
[ ]ℎ=
La convolución es [ ℎ]
( )∗ ()= ()
nos resulta:
∗(
La siguientes convoluciones
+ ℎ) = ∗ + ∗ℎ
44
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
( )∗ (− )= (− )
)∗ (− )= (−
(− − )
4.4.11TEOREMA DE CONVOLUCIÓN EN EL TIEMPO
:
Sea: ℱ{ ( )} = ( ) ℱ{ ( )} = ( ),
ℱ ∗
() () = ℱ{ ( )}ℱ{ ( )} = ( ) ( )
Demostración: ()
∗
( )
ℱℱ ( )
∗
( )
: = [ () ( − ) ]
= ( )[ ( − ) ]
ℱ{ ( )} = ( − )
−
Por Propiedad:
ℱ{ ( − )} = ( )
Sustituyendo en (*)
∗
ℱ () ( ) =
( ) ( ) = ( )( )
ℱ ∗
() ( ) )
()
= (
∴ℱ ()
∗
() = ( )
( )
4.4.12TEOREMA DE CONVOLUCIÓN EN LA FRECUENCIA.
Sea: ℱ { ( )} = ( ) ℱ { ( )} = ( ),
45
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
: ℱ { ( )∗ ( )} = 2 ()()
( ) ( − )
=−= +=
Demostración: ℱ { ( )∗ ( )} = ℱ ( ) ( − ) ]
( ) ( ) ] ( ) ( )
ℎ :
( ) ]
( ) (59)
21
ℱ { ( )∗ ( )} = [
ℱ { ( )∗ ( )} =2
1
[
= 21 [
= 21 ()
Pero:
1
()=2 () − −−→ 2 ()= ()
1
=2 ( )[2 ( )]
Reemplazando en (59)
22()
Pero: = () − − − −(60)
46
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vida l 2012
Reemplazando en (60)
, .
47
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vida l 2012
48
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
x(t - ) = ( ) (62)
Ahora se
sustituye esta expresión en la integral de convolución para obtener
∫ ( )
∫ ∫ ( )
y(t) = h( )
) (63)
y (t) =∫
h( ) ∫
( ) )
(64)
h( )
( )
FT
49
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
4.4.15 Modulación
Si x(t) y z(t) son señales no periódicas, entonces deseamos expresar la
transformada de Fourier del producto y(t) = x(t) z(t) en términos de la
transformada de Fourier de x(t) y z(t)
Sea x(t) y z(t) en términos de sus FT
El ∫ ( )
X(t) = (66)
∫ ( )
Z(t) = ∫ (67)
termino del producto y(t) puede consecuentemente escribirse en la forma
∫
( ) ()
Y(t) = ∫ ( ) ( (68)
Y(t) = ∫ (w − v))
cambio de variable en n sustituyendo n= w-v para obtener
Efectuando ahora el ( ) ( )
50
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
para y(t). Por consiguiente identificamos esta convolución escalada por como
Y(jw) según indica
FT
y(t) = x(t)z(t) Y(jw) = X(jw)*Z(jw)
∫ ))
Donde (( −
X(jw)*Z(jw) = (69)
el dominio del tiempo conduce a la convolución en el
La multiplicación en ( )
dominio de la frecuencia
Aplicación
Una aplicación importante de la propiedad de modulación es comprender los
efectos de truncar una señal en su representación en el dominio de la frecuencia.
El proceso de truncar una señal se conoce también como ventaneo ya que
corresponde a ver la señal atreves de una ventana. La parte de la señal que es
visible a través de la ventana se trunca. Esta operación de ventaneo se representa
matemáticamente multiplicando la señal, digamos X(t) por una función ventana
W(t) que es cero fuera del intervalo de interés. Al denotar la señal con ventaneo
mediante Y(t), tenemos. Y(t) = X(t)W(t)
1 si t 0,T
h (t)
0 en otro caso
51
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
V. MATERIALES Y MÉTODOS
52
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
VI. RESULTADOS
Para dar resultados de la Investigación se da a partir de la T ransformada de
señales discretas y Algoritmo FFT. En las secciones 4.3 y 4.4se ha desarrollado la
teoría de la Transformada de Fourier para funciones o señales continuas. Si las
funciones continuas son reemplazados en todas las fó rmulas dadas por funciones
discretas o señales discretas se tiene la Teoría de Transformada de Fourier de
funciones o señales discretas, basado en ese enfoque se dará el resultado de la
investigación en la sección 6.1
6.1TRANSFORMADA DE FOURIER DE SEÑALES DISCRETAS Y
ALGORIMO PARA MP3
En la sección 4.4 se ha desarrollado la Teoría de Transformada de Fourier para
funciones continuas y que cumplen la condición de convergencia absoluta, la
Transformada de señales discretas es en realidad una particularidad donde la
función continua se reemplaza por una función discreta. El algoritmo para hallar
la Transformada de Fourier de funciones discretas está dada por el algoritmo FFT,
los detalle de este algoritmo están en el anexo del presente trabajo, el estudio del
orden de la complejidad de este algoritmo se ajusta a algoritmos rápidos, por eso
es una herramienta muy poderosa en tratamiento de señales, se puede obtener
mayor información y detalles en [12]. Se muestra en la Fig.Nº21 el esquema FFT.
53
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
()= () ( )
( )( )
()= ( ) ( )() ( )
54
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
= 1.048.576log operaciones complejas.
Con FFT = 10.240 operaciones complejas
Con una reducción de 102.4:1, el tiempo de cómputo, empleando máquinas
equivalentes, se reduce a menos del 1% [12] y[15].
6.1.2 DIFERENCIAS CON OTROS FORMATOS
MP3 es un formato patentado por Thompson (por el que cobran importantes
sumas en concepto de derechos de reproductores) y utiliza la transformada rápida
de Fourier para codificar el sonido. Los formatos digitales de sonido tales como
MOD, MID, WAV y CMF donde los inconvenientes en el almacenamiento de
los archivos de sonido, velocidad y conversión eran ineficientes, el MP3 es un
formato de sonido que cambio el concepto de compresión de audio ya que
mantiene la calidad del sonido aprovechando la deficiencias en la percepción del
audio por el oído del ser humano.
En cambio, OGG (formato libre) utiliza la transformada de cosenos discreta
modificada y se espera que pronto pueda usar Wavelets, en forma mucho más
sofisticada de codificación y análisis, basada en armónicos.
La combinación de alta calidad y formato li bre del OGG está produciendo una
pequeña ventaja respecto al formato MP 3, si bien es lenta por la enorme
extensión de uso del mp3 y el desbordamiento de la existencia del OGG. Sin
embargo la vigencia de los formatos MP3 están popular que predomina en el
mercado del mundo musical [15].
En el proceso de compresión de audio se sigue un proceso y para mantener la
calidad del sonido se sigue las recomendaciones dadas por ISO/IEC 11172-3 [11].
55
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
56
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
57
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
transmitir una señal digital, requiriendo también un espacio mucho mayor para
almacenarla en un CD o un DVD.
En la grabación de CDs de música, los estudios de sonido utilizan un estándar de
muestreo de 44,1 kHz a 16 bits. Esos son los dos parámetros requeridos para que
una grabación digital cualquiera posea lo que se conoce como “calidad de CD”.
[11].
6.1.5CONDICIÓN DE NYQUIST
El ingeniero sueco Harry Nyquist formuló el siguiente teorema para obtener una
grabación digital de calidad:
“La frecuencia de muestreo mínima requerida para realizar una grabación
digital de calidad, debe ser igual al doble de la frecuencia de audio de la señal
analógica que se pretenda digitalizar y grabar”.
Este teorema recibe también el nombre de “Condición de Nyquist”. Es decir, que
la tasa de muestreo se debe realizar, al menos, al doble de la frecuencia de los
sonidos más agudos que puede captar el oído humano que son 20 mil Hertz por
segundo (20 kHz). Por ese motivo se escogió la frecuencia de 44,1 kHz como ta
sa de muestreo para obtener “calidad de CD”, pues al ser un poco más del doble
de 20 kHz, incluye las frecuencias más altas que el sentido del oído puede captar.
Tasa de muestreo = doble de la frecuencia
∑ ( )ℎ ( − )
función original. 7
6.1.6 MULTIRESOLUCIONES Y FILTROS
En teoría de señales las funciones ortonormales son importantes para expresar una
señal como combinación lineal de elementos de la base ortonormal, esta idea
expande las series y la transformada de Fourier.
58
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
(. ) consideramos una
Sea ∈
colección de subespacios cerrados y anidados
2.⋃ ∈ V = L (R)
1.
4. Si ( ) ∈ => −2 ∈
5. Si ( ) ∈ => ∈
en general:
∅ ( ) = 2 ∅( 2 )∈
V
f 2
constantes en n , n 1
1 L
2 2
Cumplen las 4 primeras condiciones de manera bastante obvia y tiene como función scaling:
ˆ ˆ
b) w 2 w
t
c) ˆ w 2 2 k 1 ˆ
ˆ
d) S o p w
ˆ k
Cumpliéndose la igualdad, e.d Sop w 2 t t.q. k 2
ˆ
ˆ
e)Si w e s c o n tin u a 0
60
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
61
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
62
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
6.1.10Compresión de voz
Se ha realizado desde hace bastantes años, sobre todo para aplicaciones en
comunicaciones telefónicas (300 -3400 Hz) y el modelo psicoacústico se basó más
en las características del tracto vocal humano que en las características
perceptuales, es decir, las propiedades del sistema auditivo.
6.1.11Compresión de audio genérico:
El objetivo es la compresión de audio de “alta fidelidad”, en principio con un
ancho de banda de 20 Hz a 20 kHz. El primer estándar internacional fue MPEG
(Motion Picture ExpertsGroup).
El modelo psicoacústico se basa principalmente en las características perceptuales
del sistema auditivo humano.
63
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
64
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
6.1.13BANCO DE FILTROS
El banco de filtros utilizado en esta capa es el llamado banco de filtros híbrido
polifase/MDCT. Se encarga de realizar el mapeado del dominio del tiempo al de
la frecuencia tanto para el codificador como para los filtros de reconstrucción del
decodificador. Las muestras de salida del banco están cuantizadas y proporcionan
una resolución en frecuencia v ariable, 6x32 o 18x32 subbandas, ajustándose
mucho mejor a las bandas críticas de las diferentes frecuencias. Usando 18
puntos, el número máximo de componentes frecuenciales es: 32 x 18 = 576.
Dando lugar a una resolución frecuencial de: 24000/576 = 41,67 H z (si
fs = 48 Khz.). Si se usan 6 líneas de frecuencia la resolución frecuencial es menor,
pero la temporal es mayor, y se aplica en aquellas zonas en las que se espera
efectos de preeco (transiciones bruscas de silencio a altos niveles energéticos).
65
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
Filtro elimina banda: Este filtro elimina en su salida todas las señales que tengan
una frecuencia comprendida entre una frecuencia de corte inferior y otra de corte
superior. Por tanto, estos filtros eliminan una banda completa de frecuencias de
las introducidas en su entrada, tal como se muestra en la Fig. N° 27.
66
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
que tienenexperiencia en la parte auditiva,desde 192 o 256 kbps basta para oír
bien. La música que circula por Internet, en su mayoría, está codificada entre 128
y 192 kbps.[6].
6.2.1 CODIFICACIÓN Y CUANTIFICACIÓN
La solución que propone este está ndar en cuanto a la repartición de bits o ruido,
se hace en un ciclo de iteración que consiste de un ciclo interno y uno externo.
Examina tanto las muestras de salida del banco de filtros como el SMR (signal-to-
mask ratio) proporcionado por el modelo psicoacústico, y ajusta la asignación de
bits o ruido, según el esquema utilizado, para satisfacer simultáneamente los
requisitos de tasa de bits y de enmascaramiento. Dichos ciclos consisten en:
6.2.2 CICLO INTERNO
El ciclo interno realiza la cuantización no -uniforme de acuerdo con el sistema de
punto flotante (cada valor espectral MDCT: ModifiedDiscreteCosineTransform se
eleva a la potencia 3/4). El ciclo escoge un determinado intervalo de cuantización
y, a los datos cuantizados, se les aplica codificación d e Huffman en el siguiente
bloque. El ciclo termina cuando los valores cuantizados que han sido codificados
con Huffman usan menor o igual número de bits que la máxima cantidad de bits
permitida [16].
6.2.3CICLO EXTERNO
Ahora el ciclo externo se encarga de verificar si el factor de escala para cada
subbanda tiene más distorsión de la permitida (ruido en la señal codificada),
comparando cada banda del factor de escala con los datos previamente calculados
en el análisis psicoacústico. El ciclo externo termin a cuando una de las siguientes
condiciones se cumple:
* Ninguna de las bandas del factor de escala tiene mucho ruido.
* Si la siguiente iteración amplifica una de las bandas más de lo permitido.
67
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
68
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
Después de todo esto, los valores difieren dependiendo del tipo de archivo MP3.
Los rangos de valores quedan definidos en la ISO/IEC 11172-3 [11].
6.2.6TRANSFORMADA DE FOURIER DISCRETA Y FICHERO MP3
En matemáticas, la transformada de Fourier discreta, designada con frecuencia
por la abreviatura DFT , y a la que en ocasiones se denomina transformada de
Fourier finita, es una transformada de Fourier ampliamente empleada en
tratamiento de señales y en campos afines para analizar las frecuencias presentes
en una señal muestreada, resolver ecuaciones diferenciales parciales y realizar
otras operaciones, como convoluciones. Es utilizada en el proceso de elaboración
de un fichero MP3.
6.2.7 CÓDEC DE AUDIO Y TIPO DE CÓDEC.
Un códec de audio es un códec que incluye un conjunto de algoritmos que
permiten codificar y decodificar los datos auditivos, lo cual significa reducir la
cantidad de bits que ocupa el fichero de audio. Sirve para comprimir señales o
ficheros de audio con un flujo de datos (stream) con el objetivo de que ocupan el
menor espacio posible, consiguiendo una buena calidad final, y
descomprimiéndolos para reproducirlos o manipularlos en un formato más
apropiado. Se implementa en software, hardware o una combinación de ambos.
Si obviamos las pérdidas producidas por el error de cuantificación, que en
muchos casos son inapreciables, los códecs pueden ser, según el tipo de
compresión, con pérdidas (lossy) o sin pérdidas (lossless).
6.2.8 CÓDECS DE AUDIO CON PÉRDIDAS
En audio se aprovechan las limitaciones del sistema auditivo humano (margen
frecuencial, umbral de audición, enmascaramiento temporal y/o enmascaramiento
frecuencial para comprimir los datos de audio. Se usan diferentes métodos para
eliminar los datos inaudibles:
69
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
70
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
Usualmente los patrones repetitivos de señal son más evidentes en otro dominio
(temporal, frecuencial...), es por esto que la transformación de la señal en función
de éstos patrones permitirá reducir o eliminar la redundancia.
En audio, igual que en vídeo, imagen o datos, la eliminación de la redundancia se
implementa:
Transformaciones en otro dominio donde los patrones repetitivos sean más
evidentes.
Predicción.
Codificación entrópica: codificación de Huffman, codificación aritmética,
RunLengthCoding (RLE).
6.3 ESPECTROS SONOROS
La información acerca de qué frecuencias integran un sonido y cuáles son las
respectivas amplitudes y fases constituye lo que se denomina espectro del sonido.
Se suele representar con un par de gráficos con la frecuencia en las abscisas, y en
las ordenadas la amplitud o energía en uno y la fase en el otro. En este artículo se
definirán los cuatro tipos de espectros que existen.
Existen cuatro tipos de espectros. El primero de ellos (Fig.N° 28) corresponde a
los sonidos periódicos. El espectro en este caso está forma do por líneas verticales
equiespaciadas, siendo la primera la correspondiente a la frecuencia fundamental
o primer armónico, la segunda al segundo armónico, y así siguiendo. La altura de
cada línea espectral es la amplitud del armónico respectivo. Un caso particular lo
constituye un tono puro de frecuencia f0. Los tonos puros se encuentran rara vez
en la naturaleza, pero son de extraordinaria importancia como herramienta de
análisis, ya que todo sonido puede considerarse como formado por la
superposición de tonos puros de diversas frecuencias.
71
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
72
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
73
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
74
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vida l 2012
75
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
VIIDISCUSION
7.1Conclusiones
1La Transformada de Fourier es una herramienta matemática eficiente para
el tratamiento de señales continuas y discretas, siendo el algoritmo FFT que
muestra la potencia de compresión de una señal continua en un archivo
MP3.
2El formato MP3 es un formato de compresión de audio estándar en el
mundo de la música que proporciona un sonido de calidad muy cerca al
formato WAV del CD, pero con relaciones de compresiones de tasa más
altasque hacen que este formato sea preferido en el mundo de la música.
7.2Recomendaciones
Se debe de aplicar otros algoritmos de la TFF a fin de minimizar el tiempo
de proceso y mejorar la calidad comprensión de audio.
El estudio de la Transformada de Fourier se debe extender a la
Transformada de Wavelets que constituye actualmente un campo de
investigación muy requerida en tratamiento de señales.
En la EAP de Ingeniería Electrónica de la FIEE-UNAC se debe
implementar el curso de PDS (PDS: Procesamiento Digital de Señales),
que permita implementar aplicaciones a la ingeniería de sonido y video.
76
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
VIII REFERENCIAS
[1]Berkhout,P.J.yEggermontL.D.J."DigitalAudioSystemas",IEEEASSP
Magazine,vol.2,Octubre1985,( pgs.45-69)
8
E.KREYSZIG.Matem´aticasAvanzadasparaingenier´ıa,volumenII.LimusaWiley,3 ra
edición,2000.( Pgs.86-102).
9H.F.DAVIS.Fourier SeriesandOrthogonalFunctions.DoverPublications,nc.,
1963.(Pgs. 67-129)
10LINDERD. Introducciónalas señales ylossistemas. McGrawHill,2002.
[11] MARCELO JUAN F., EVA MARTIN, MP3, MADRID, Ed. Anaya
Multimedia, 2000.(Pgs. 2-27)
77
14Proakis
15
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
SoriaOlivasE.,Mart´ınezSober M
,J.V.Franc´esVillora,andG.CampsValls.TratamientoDigitaldeSen˜ales.Problemasy
ejerciciosresueltos. PrenticeHall,Madrid, 2003.( P g s . 1,233)
[16]Zwicker,E.yFastl,H.Psychoacoustics:FactsandModels,Springer,Berlín,1990,( Pgs.
5-43)
78
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
APÉNDICE
1 Código fuente de Comprensión de voz por medio de Transformada de
Fourier.
79
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
80
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
81
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
82
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
83
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
84
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
85
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
86
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
87
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vida l 2012
88
Transformada de Fourier y los MP3 Lic. Raúl P. Castro Vidal 2012
ANEXO
1 TRANSFORMADA DE FOURIER Y EL ALGORITMO FFT(FCEF Y N UNIVERSIDAD
NACIONAL DE CORDOVA )
89