Академический Документы
Профессиональный Документы
Культура Документы
Systme Vocal
Le systme vocal se compose:
poumons
d'une soufflerie
du larynx
conduit trachobronchique
du conduit vocal
2
Systme Vocal
Systme phonatoire
3
Systme Vocal
Appareil phonatoire
4
sources acoustiques
source
laryngienne
onde quasi-priodique
cavits
supraglottiques
bruits
d'occlusion
Parole
5
Pitch
Le pitch est la frquence de vibration des cordes
vocales. Il est aussi appel frquence fondamentale
Cette frquence varie :
de 80 200hz pour une voix masculine.
de 150 450 hz pour une voix fminine
de 200 600 hz pour une voix denfant
Le Pitch est un paramtre trs important pour la
synthse de la parole. Loreille est en effet, trs sensible
ses variations.
10
Perception
L'oreille de l'tre humain est capable de
percevoir des sons ayant des frquences
comprises entre 20 et 20 000 Hz.
L'aire d'audition de l'homme est comprise
entre le seuil d'audition (qui varie entre 0
et 40 dB suivant la frquence) et le seuil
de douleur (autour de 120 dB),
11
Perception
12
14
Codeurs temporels
Codeurs paramtriques (vocodeurs)
Codeurs hybrides (mixtes)
15
16
17
18
Prdiction linaire
x(n)
e(n)
u(n)
~
x (n)
Modle
E(e(n) )
Identification Paramtrique dun signal
m
e( n ) x ( n ) ak x ( n k )
k 1
~
x (n) ai x(n i )
i 1
19
Prdiction linaire
H (Z )
1
1 a1Z 1 a2 Z 2 .... am Z m
B( Z )
20
Prdiction linaire
Le critre de minimisation implique:
Pour que la fonction soit minimale, ses drivs par
rapport aux coefficients ak doivent sannuler en ces
points.
d
0 (1 k p)
dak
P
d
de(n)
) 2 E (e(n) x(n k )) 2.E ( ai x(n i) x(n k ))
2.E (e(n)
dak
dak
i 0
P
i 0
i 0
21
R xx ( ) E ( x ( t ). x ( t ))
x ( ) * x ( )
1 N
Rxx ( )
x(t).x(t )
2N 1t N
R xy ( ) E ( x ( t ). y ( t ))
x ( ) * y ( )
N
1
R xy ( )
x ( t ). y ( t )
2 N 1 t N
22
p
2
i0
i0
A
R
r
Rxx (1)
.
. . Rxx ( p) 1 2
Rxx (0)
R (1)
a 0
R
(
0
)
R
(
p
1
)
xx
xx
xx
1
.
Rxx (0)
.
.
Rxx ( p 1)
.
a
R
(
p
)
R
(
p
1
)
.
.
.
R
(
0
)
xx
p 0
xx
xx
xx
xe
Ap Rxx .rex
Cette quation peut tre rsolu grace lalgoritme de Levinson
23
Algorithme de LEVINSON
Lalgorithme de LEVINSON est une
procdure itrative
Il permet de rsoudre itrativement
lquation A=r. R-1.
Il consiste construire un filtre de prdiction
dordre p+1 partir du filtre de prdiction
dordre p.
A chaque tape p, le filtre est tabli de
manire minimiser lerreur quadratique
moyenne.
ep(n) x(n) ~
x(n) x(n) ap,1x(n1) ap,1x(n2).........
..ap,px(n p)
24
25
27
a p 1 ,i R ( p i )
K
i0
E p 1
E p 1 E (e p 1 (n) )
2
2
29
1 k j
LAR( j) log(
)
1 k j
30
P(Z) Ap(Z)Z
( p1)
Q(Z) Ap(Z)Z
Ap(Z )
1
Ap(Z )
LSP
P(Z ) (1 2cos(w2i1)Z Z )
i0
m
0 w1 w2 ....wp
Cette relation est la condition ncessaire et suffisante pour la
stabilit du filtre de synthse.
Une erreur dans un seul coefficient LSP ne se propage pas plus
loin, son effet spectral est limit dans la rgion troite autour de la
frquence correspondant ce coefficient. Cette proprit permet une
robustesse intrinsque vis--vis des erreurs de transmission et une
vrification simple de stabilit du filtre.
32
33
34
36
200
100
0
0.5
1.5
2.5
3.5
4.5
5
4
x 10
100
0.5
1.5
2.5
3.5
4.5
5
4
x 10
37
Codeurs Hybrides
Les codeurs mixtes mettent en jeu les techniques
temporelles et paramtriques.
Ce type de codage consiste modliser le conduit vocal
sur des tranches de 10 30 ms par un filtre
autoregressif 1/A(Z).
Dans une premire gnration de codeurs hybrides,
lentre idale du filtre de synthse est lerreur rsiduelle
obtenue par filtrage du signal de parole original par le
filtre A(Z).
Du fait quune grande partie du signal est concentre
dans les coefficients du filtre de synthse, lerreur
rsiduelle a donc moins dimportance et sera prsent
par un nombre rduit de bit.
Ce systme est appel approche LPC excit par le
rsidu (Rsiduel Excited Linear Predictor, RELP).
Le RELP est caractris par un dbit aux alentours de
10 kbits/s.
39
Codeurs Hybrides
Codeurs CELP (Code Excited Linear Prediction)
Dans une nouvelle gnration de codeurs
hybrides, le signal d'excitation optimal est
dtermin par une mthode d'analyse par
synthse:
on cherche dans un ensemble de M formes
d'ondes stockes dans un dictionnaire, connu
priori par lmetteur et le rcepteur, le signal
d'excitation qui rend minimale l'nergie de la
diffrence entre le signal coder et le signal de
synthse.
40
Codeurs Hybrides
CELP
Signal Original
m1
B(Z) 1bkZ(Pk)
A( Z )
W (Z )
A( Z / )
k0
Dictionnaire
dexcitation
gain
Prdicteur
Long-terme
(LTP)
Prdicteur
court-terme
+
-
Filtre
perceptuel
Slection de la forme
donde
Codeurs Hybrides
Le codeur CELP est bas sur le principe
de la prdiction linaire.
Il est form par trois filtres :
un filtre prdicteur court terme 1/A(Z),
un filtre long terme (LTP) 1/B(Z)
un filtre perceptuel W(Z)
42
Codeurs Hybrides
Analyse LPC
Le filtre prdicteur court terme consiste
modliser le conduit vocal par un filtre
autoregressif 1/A(z).
Le filtre LPC ne permet pas dextraire toute la
redondance du signal.
si lon filtre le signal de parole original par le filtre
A(Z), lerreur rsiduelle obtenue pour les sons
voiss prsente encore une certaine priodicit
qui correspond la priode de vibration des
cordes vocales .
Pour liminer cette priodicit on introduit un
filtre LTP dans la structure du CELP
43
Codeurs Hybrides
5
(a)
-5
0
10
12
14
(b)
-5
0
10
12
14
(c)
-5
0
10
12
14
t(ms)
Codeurs Hybrides
Analyse LTP
m1
B(Z) 1 bk Z
k0
P est le PITCH
Un filtre LTP dordre lev permet une modlisation
plus fine de la structure priodique mais augmente le
dbit binaire.
Gnralement, un filtre LTP du premier ordre permet
dobtenir des rsultats satisfaisants.
45
Codeurs Hybrides
Le Filtre LTP:
B ( Z ) 1 bZ
E (b , p ) [ e ( n ) b e ( n p )]
n0
2
46
Codeurs Hybrides
Pour une valeur donne de p, la valeur
optimale de b est celle pour laquelle la drive
de lnergie E(b,p) par rapport b est nulle.
Elle est donne par lexpression:
N 1
e(n )e(n p )
b
n0
N 1
( e ( n p ))
n0
47
Codeurs Hybrides
La mthode CPP ( Correlation Peak
Picking) consiste dterminer la valeur P,
comprise entre 16 et 160, qui maximise
lexpression E(P) telle que:
N 1
E(P) e(n)e(n P)
n0
48
Codeurs Hybrides
Le filtre perceptuel W(z) permet, lors de la recherche du
meilleur code dexcitation dans le dictionnaire, dattribuer
moins dimportance aux zones frquentielles
nergtiques.
En effet, la diffrence entre le signal originale et le signal
synthtique est moins perceptible dans les zones
formantiques o le signal a beaucoup dnergie.
A la sortie du filtre perceptuel, nous avons un signal
rsiduel de nature plus alatoire et de dynamique plus
faible que le signal original.
Dans le dictionnaire, on cherche la forme la plus
ressemblante ce signal rsiduel.
Son indice dans le dictionnaire sera transmis avec les
coefficients des filtres de prdiction court terme et long
terme au dcodeur
49
Exercice 1 :
Dterminer les coefficients de prdiction linaire et les coefficients PARCOR du
filtre AR dordre 4 modlisant un signal de coefficient de correlation : { R(0), R(1),
R(2),R(3), R(4)}={128,-64,80,89}
Dterminer lnergie des erreurs de prdiction
Exercice 2
Soit le signal dfinie par :
y(n)+a1y(n-1)+a2y(n-2)+a3y(n-3)+a4y(n-4)=(n) (bruit aleatoire)
Dterminer les coefficients du filtre AR si ses ples sont :0.2 et 0.4
retrouver ces coefficients en utilisant une analyse LPC ?
Exercice 3
10 chantillons dun signal alatoires sont :4,503 ; -10.841, -24.183 ; -25.662 ; 14.390 ; 1.453 ; 10.980 ; 13.679 ; 15.517 ; 15.037
a- Dterminer les coefficients du filtre de prdiction dordre 4 ;
b- dterminer les coefficients PARCOR
C- dterminer lnergie de lerreur
50