Вы находитесь на странице: 1из 4

UNIVERSIDAD DE LAS FUERZAS ARMADAS “ESPE”

NOMBRES: ANDREA GARCIA // KARINA GUTIERREZ // DAVID VARELA

DIGITALIZACIONES Y ANÁLISIS DE HISTOGRAMAS DE LAS VOCALES

GRAFICO SEÑAL “A”


CODIGO VOCAL “A” 0.3
0.01 50

45
clear all 0.2

clc 0.005 40
a=audioread('Vocal 0.1
A.wav'); 35

figure; 0 0 30
plot(a);
for i=16370:1:19290 -0.1 25
b(i-16369)=a(i);
-0.005 20
end -0.2
figure; 15
plot(b); -0.3 -0.01
figure; 10

hist(b,15); 5
-0.4
0 1 2 3 4 5 6 7 8 9
x 10
4 -0.015 0
0 50 100 150 200 250 300 350 400 -0.015 -0.01 -0.005 0 0.005 0.01

Fig. 1.- Señal de audio correspondiente Fig. N.2.- Señal ampliada de la vocal Fig. N.3.- Histograma de la vocal “a”
a la vocal “a” “a”

.
0.01 50
0.3
45

CODIGO VOCAL “E” 0.2 0.005 40

35
clear all 0.1
clc 0 30
e=audioread('Vocal 0
25
E.wav');
figure; -0.1
-0.005 20
plot(e);
15
for i=17900:1:21800
-0.2
b(i-17899)=e(i); -0.01
10
end
figure; -0.3 5
plot(b); -0.015
0 50 100 150 200 250 300 350 400 0
figure; -0.4
0 1 2 3 4 5 6 7 8 9
-0.015 -0.01 -0.005 0 0.005 0.01
hist(b,15); 4
x 10
Fig. N.5.- Señal ampliada de la vocal Fig. N.6.- Histograma de la vocal “e”
“e”
Fig. N.4.- Señal de audio
correspondiente a la vocal “e”

GRAFICO SEÑAL “E”


GRAFICO SEÑAL “I”

0.3 0.01 50

CODIGO “I” 45
0.2
0.005 40
clear all
0.1
clc 35
i=audioread('Vocal 0 30
0
I.wav');
figure; 25
-0.1
plot(i); -0.005 20
for k=16150:1:19380
-0.2
b(k-16149)=i(k); 15

end -0.01 10
figure; -0.3
5
plot(b);
figure; -0.4
0 1 2 3 4 5 6 7 8 9
-0.015
0 50 100 150 200 250 300 350 400
0
-0.015 -0.01 -0.005 0 0.005 0.01
hist(b,15); x 10
4

Fig. 7.-Señal audio correspondiente Fig. N.8.- Señal ampliada de la Fig. N.9.- Histograma de la vocal
a la vocal “i” vocal “i” “i”

0.3
GRAFICO SEÑAL “O”
CODIGO “O”
0.2 0.01 50

clear all 45
0.1
clc
0.005 40
o=audioread('Vocal 0
O.wav'); 35
figure; -0.1 0 30
plot(o);
for i=14690:1:18110 -0.2
25
b(i-14689)=o(i); -0.005 20
end -0.3
figure; 15
plot(b); -0.4 -0.01 10
figure; 0 1 2 3 4 5 6 7 8 9
4
hist(b,15); x 10 5

-0.015 0
Fig. 10.- Señal audio correspondiente a 0 50 100 150 200 250 300 350 400
-0.015 -0.01 -0.005 0 0.005 0.01
la vocal “o”
Fig. N.11- Señal ampliada de la vocal Fig. N.12.- Histograma de la vocal “o”
“o”

Fig. N.14.- Señal ampliada de la vocal


0.3 GRAFICO SEÑAL “U” “u”
CODIGO “U”
0.2 0.01

clear all 0.1


clc
0.005
u=audioread('Vocal 0
U.wav');
figure; -0.1 0
plot(u);
for i=20930:1:23880 -0.2
b(i-20929)=u(i); -0.005
end -0.3
figure;
plot(b); -0.4 -0.01
0 1 2 3 4 5 6 7 8 9
figure; 4
x 10
hist(b,15);
-0.015
Fig. 13.- Señal audio correspondiente a 0 50 100 150 200 250 300 350 400

la vocal “u”
Fig. N.15.- Histograma de la vocal “u”
50

45

40

35

30

25

20

15

10

0
-0.015 -0.01 -0.005 0 0.005 0.01

GRAFICO SEÑAL “CASA”


CODIGO “CASA”
0.3 0.01 50

clear all 45
clc 0.2

z=audioread('Casa.wav') 0.005 40

; 0.1
35
figure;
plot(z); 0 0 30

25
-0.1
-0.005 20

-0.2
15

-0.3 -0.01 10

5
-0.4
0 1 2 3 4 5 6 7 8 9 0
-0.015
4
0 50 100 150 200 250 300 350 400 -0.015 -0.01 -0.005 0 0.005 0.01
x 10

Fig. N.16.- Señal de audio Fig. N.17.- Señal ampliada de la palabra Fig. N.18.- Histograma de la palabra
correspondiente a la palabra “casa” “casa” “casa”

INTRODUCCIÓN CÁLCULO Y ANÁLISIS DEL PITCH EN SEÑALES SONORAS DE VOZ HUMANA


Las ondas audibles son producidas por cuerdas en vibración (violín y las
cuerdas vocales), por columnas de aire en vibración (el piano y el El análisis del pitch involucra diferentes tópicos dentro del estudio de
clarinete) y por placas y membranas en vibración (tambor) [Resnick, señales sonoras aún no explorados completamente. En virtud de la
Halliday. 1965] imprecisión en su propia definición se pueden implementar una gran variedad
de algoritmos para su adquisición. Históricamente se ha definido al pitch
Las ondas sonoras se reducen a los límites de frecuencia que pueden como la frecuencia fundamental de espectro de frecuencias del habla
estimular el oído humano para ser percibidas en el cerebro como una [Casacuberta. 1987] y se lo ha asociado al movimiento que realiza la glotis
sensación acústica. Estos límites de frecuencia se extienden desde en la generación del sonido [Husson. 1962]. Desafortunadamente cualquiera
aproximadamente 20 Hz hasta aproximadamente de 20 KHz. El tono se define sea la forma en la que se lo defina no se ajustará a la realidad, porque
como la altura o elevación de la voz que resulta de la frecuencia de las la oscilación glotal es una función cuasi-periódica [Klatt. 1987]
vibraciones de las cuerdas vocales. Las vibraciones de un sonido agudo
son, dentro de la unidad de tiempo, más numerosas que las de un sonido HISTOGRAMA
grave. En consecuencia, el tono es la propiedad de la voz que permite En estadística, un histograma es una representación gráfica de una variable
clasificar el sonido en una escala de frecuencia tonal, de más agudo a más en forma de barras, donde la superficie de cada barra es proporcional a
grave. la frecuencia de los valores representados. Un histograma ofrece una
visión de grupo permitiendo observar una preferencia, o tendencia, por
El tono depende de la longitud que presenten los pliegues vocales, cuanto parte de la muestra o población por ubicarse hacia una determinada región
mayor sea, más grave será la voz. Al contrario, cuanto más cortas sean las de valores dentro del espectro de valores posibles.
cuerdas vocales, las voces serán más agudas.
[Le Huche y Allali. 1993] Unificando las cifras que ofrecen los diferentes PROCEDIMIENTO:
autores, podemos acotar la frecuencia de la voz masculina entre 50 y 200 Utilizando la aplicación WavePad grabamos los sonidos de las vocales: a,
Hz y la femenina entre 150 y 350 Hz. Aunque las voces puedan moverse en e, i, o, u; y la palabra “casa”. Utilizando la función audioread y plot
estos tonos o registros, existe uno medio u óptimo. en MatLab, graficamos la señal de cada vocal. En el primer gráfico
visualizamos cada señal con ruido, en el segundo gráfico se encuentran las
señales ampliadas. Utilizando la función hist en MatLab, obtuvimos el  Se observo claramente en los gráficos de las señales que las cinco
tercer gráfico, el histograma de cada señal. vocales son de naturaleza periódica, mientras que las consonantes; como
las letras “c” y “s” de la palabra “casa” son de naturaleza aperiódica.
CONCLUSIONES:
 El tono de la voz se mide por la frecuencia vibratoria de las cuerdas BIBLIOGRAFÍA:
vocales. La frecuencia es el  Wainschenker R.S., Doorn J.H., Legrottaglie C. F., Castro M.
 número de vibraciones por segundo, y se contabiliza en hercios.  INTIA, Facultad de Ciencias Exactas, Universidad Nacional del Centro de
 El análisis del pitch es de fundamental importancia en el estudio de la Provincia de Buenos Aires, Paraje Arroyo
señales sonoras tanto para musicales como de voz humana. En el caso del  Seco, Campus Universitario (7000) Tandil Argentin
análisis de la voz humana se relaciona tanto al reconocimiento de voz en
forma computacional como a la síntesis robusta.