2007 PHD Thesis: Adaptive Wave Field Synthesis

Facult de Gnie
Dpartement de Gnie Mcanique

SYNTHSE DE CHAMPS SONORES
ADAPTATIVE
Thse de doctorat es sciences appliques
Spcialit : gnie mcanique
Philippe-Aubert GAUTHIER
Sherbrooke (Qubec), CANADA Septembre 2007
La prolifration des thories est bnque la science, tandis que
luniformit affaiblit son pouvoir critique.
Paul Feyerabend
i
RSUM
La reproduction de champs acoustiques est une approche physique au problme technolo-
gique de la spatialisation sonore. Cette thse concerne laspect physique de la reproduction de
champs acoustiques. Lobjectif principal est lamlioration de la reproduction de champs acous-
tiques par synthse de champs acoustiques (Wave Field Synthesis, WFS), une approche
connue, base sur des hypothses de champ libre, laide du contrle actif par lajout de cap-
teurs de lerreur de reproduction et dune boucle ferme.
Un premier chapitre technique (chapitre 4) expose les rsultats dapprciation objective de la
WFS par simulations et mesures exprimentales. Leffet indsirable de la salle de reproduction
sur les qualits objectives de la WFS fut illustr. Une premire question de recherche fut ensuite
aborde (chapitre 5), savoir sil est possible de reproduire des champs progressifs en salle dans
un paradigme physique de contrle actif : cette possibilit fut prouve.
Lapproche technique privilgie, synthse de champs adaptative (Adaptive Wave Field
Synthesis [AWFS]), fut dnie, puis simule (chapitre 6). Cette approche dAWFS comporte
une originalit en contrle actif et en reproduction de champs acoustiques : la fonction cot
quadratique reprsentant la minimisation des erreurs de reproduction inclut une rgularisation
de Tikhonov avec solution a priori qui vient de la WFS. Ltude de lAWFS laide de la d-
composition en valeurs singulires (chapitre 7) a permis de comprendre les mcanismes propres
lAWFS. Cest la deuxime principale originalit de la thse.
Lalgorithme FXLMS (LMS et rfrence ltre) est modi pour lAWFS (chapitre 8). Le
dcouplage du systme par dcomposition en valeurs singulires est illustr dans le domaine du
traitement de signal et lAWFS base sur le contrle indpendant des modes de rayonnement est
simule (chapitre 8). Ce qui constitue la troisime originalit principale de cette thse. Ces si-
mulations du traitement de signal montrent lefcacit des algorithmes et la capacit de lAWFS
attnuer les erreurs attribuables des rexions acoustiques.
Le neuvime chapitre prsente des rsultats exprimentaux dAWFS. Lobjectif tait de va-
lider la mthode et dvaluer les performances de lAWFS. Un autre algorithme prometteur
est aussi test. Les rsultats dmontrent la bonne marche de lAWFS et des algorithmes tests.
Autant dans le cas de la reproduction de champs harmoniques que dans le cas de la reproduc-
tion de champs large bande, lAWFS rduit lerreur de reproduction de la WFS et les effets
indsirables causs par les lieux de reproduction.
ii
REMERCIEMENTS
Au terme de mes tudes doctorales, je tiens remercier ceux et celles qui ont support cette
dmarche dimportance. Ainsi, je souligne dabord le support dAlain Berry, mon directeur de
recherche qui, de par ses remarquables qualits scientiques et humaines a su transformer cette
exprience en aventure stimulante et formatrice. Je le remercie plus spcialement pour avoir su
tenir compte de mes propres objectifs de carrire tout en me guidant efcacement pour latteinte
des objectifs du doctorat.
Au-del du travail quotidien impliqu par la ralisation de cette thse, je tiens remercier
ma compagne, Tanya St-Pierre, pour son support moral : passant de lencouragament lors des
temps sombres et de lincitation au divertissement et au dtachement lors des moments de travail
intenses, parfois trop. Pour cela, je la remercie inniement et je suis immensment reconnaissant
de sa tolrance envers les exigences doctorales qui dbordent frquemment sur la dnition
courante dune vie quilibre.
Je tiens remercier ma mre, Marcelle Fournier, et mon pre, Jean-Marie Gauthier, qui,
aprs avoir corrig les crits dun mmoire de matrise, ont tent cette exprience une seconde
fois. Un travail de correction grandement apprci, voire ncessaire. Je remercie aussi mes pa-
rents pour leur support moral ; mon pre, qui sait toujours offrir de laide et du support, et ma
mre, pour son perptuel encouragement.
Tout au long de mes tudes doctorales, de nombreuses discussions avec des collgues et
amis tudiants au GAUS ont aussi contribu rendre lexprience agrable par la cration dun
environnement de travail stimulant, autant sur le plan technique quhumain. Cest ainsi que je
remercie tous les tudiants avec qui jai pass ces annes au sein du GAUS. Je prote aussi
de loccasion pour remercier tous les membres du GAUS qui directement ou indirectement ont
contribus ces travaux.
Cette thse et tous les travaux quelle rsume ici nauraient pu tre faits sans le support nan-
cier du CRSNG (Conseil de Recherche en Sciences Naturelles et en Gnie), du FQRNT (Fonds
Qubecois de Recherche sur la Nature et les Technologiques) et lUniversit de Sherbrooke que
je remercie pour le support nancier apport au projet.
iii
TABLE DES MATIRES
1 Introduction 1
1.1 Structure de la thse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2 Notions prliminaires et tat de la situation 7
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Notions prliminaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2.1 La perception spatiale du sonore . . . . . . . . . . . . . . . . . . . . . 7
2.2.2 Deux approches distinctes pour la reproduction spatiale du son . . . . . 10
2.3 Aperu de lhistorique de la reproduction audio . . . . . . . . . . . . . . . . . 12
2.4 Les techniques rcentes et novatrices . . . . . . . . . . . . . . . . . . . . . . . 16
2.4.1 Techniques binaurales et rduction de la diaphonie . . . . . . . . . . . 16
2.4.2 Reproduction de champs acoustiques par synthse de champs acous-
tiques (WFS) pour le problme intrieur . . . . . . . . . . . . . . . . . 17
2.4.3 Applications issues du contrle actif et du ltrage adaptatif . . . . . . . 20
2.4.4 Ambisonie, quelques autres mthodes et hybridations possibles . . . . 27
2.5 Les travaux rcents les plus rvlateurs par rapport aux objectifs de recherche . 29
2.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3 Objectifs et mthodes 36
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.2 Contexte de ralisation de la recherche . . . . . . . . . . . . . . . . . . . . . . 36
3.3 Objectifs de la recherche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.4 Mthodologie propose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4 Exprimentations prliminaires avec un systme de WFS conventionnel 42
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.2 Rseau de sources acoustiques en phase . . . . . . . . . . . . . . . . . . . . . 43
4.2.1 Distribution de la rponse en frquence dans un espace inni . . . . . . 44
4.2.2 Multi-tracs des rponses limpulsion dans lespace . . . . . . . . . . 49
4.3 Simulations et tudes de la WFS en champ libre . . . . . . . . . . . . . . . . . 51
iv
4.3.1 Distribution de la rponse en frquence dans lespace et effet de la po-
sition de la source virtuelle pour un rseau linaire de sources de repro-
duction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.3.2 Multi-tracs des rponses impulsionnelles dans lespace inni . . . . . 55
4.4 Attnuation des effets de bord en WFS et choix de la ligne de rfrence . . . . 59
4.5 valuation objective de la WFS en situation exprimentale . . . . . . . . . . . 63
4.5.1 La procdure exprimentale en rsum . . . . . . . . . . . . . . . . . 63
4.5.2 Congurations tudies . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.5.3 Au sujet de la cohrence et de la validit des mesures . . . . . . . . . . 66
4.5.4 Rponses en frquence . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.5.5 Rponses limpulsion . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5 Modlisation acoustique de la reproduction de champs acoustiques en salle : ana-
lyses thoriques et simulations 79
5.1 Rsum franais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.2 Sound eld reproduction in-room using optimal control techniques : Simula-
tions in the frequency domain . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.3 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.3.1 Recent advances in spatial sound reproduction . . . . . . . . . . . . . 82
5.4 Theoretical model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
5.4.1 Radiation modelling . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
5.4.2 Control modelling . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
5.5 Results of numerical simulations . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.5.1 Feasibility study . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.5.2 Comparison with WFS in free eld . . . . . . . . . . . . . . . . . . . 95
5.5.3 In-room reproduction, comparison with WFS and control mechanisms . 96
5.5.4 Investigation of practical sensing conguration . . . . . . . . . . . . . 101
5.5.5 Conditioning of the reproduction system . . . . . . . . . . . . . . . . . 105
5.6 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
5.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
6 tude comparative de la WFS, de la minimisation rgularise de lerreur et de
lAWFS 113
6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.2 Formulation thorique dune approche dAWFS . . . . . . . . . . . . . . . . . 115
v
6.3 Comparaisons en champ libre entre WFS, AWFS et minimisation rgularise
des erreurs de reproduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
6.3.1 Conguration circulaire des sources et congurations centres pour les
capteurs de lerreur . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
6.4 Effet de la distance de sparation des capteurs . . . . . . . . . . . . . . . . . . 129
6.5 Antenne de sources en U . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
6.6 Effet dune seule rexion cause par une surface rigide innie . . . . . . . . . 133
6.7 Discussion et conguration choisie . . . . . . . . . . . . . . . . . . . . . . . . 136
6.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
7 WFS adaptative avec contrle indpendent des modes de rayonnement 139
7.1 Rsum franais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
7.2 Adaptive wave eld synthesis with independent radiation mode control for ac-
tive sound eld reproduction : Theory . . . . . . . . . . . . . . . . . . . . . . 140
7.3 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
7.4 Radiation, WFS and control models for AWFS . . . . . . . . . . . . . . . . . 142
7.4.1 WFS operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
7.4.2 Denition of AWFS . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
7.5 Interpretation of AWFS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
7.6 Simulation results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
7.7 AWFS and singular value decomposition of Z . . . . . . . . . . . . . . . . . . 152
7.7.1 Nature of the under-determined set of equations Zq = p
(im)
. . . . . . 154
7.7.2 Independent radiation mode control for AWFS . . . . . . . . . . . . . 155
7.8 Analysis of simulation results with SVD . . . . . . . . . . . . . . . . . . . . . 157
7.8.1 AWFS and Ambisonics . . . . . . . . . . . . . . . . . . . . . . . . . 160
7.8.2 Including reections and room effects . . . . . . . . . . . . . . . . . . 164
7.9 Implementation of AWFS by independent feedforward control of radiation modes165
7.10 Conclusion and perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
7.11 Acknowledgments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
7.12 APPENDIX : Ambisonics review . . . . . . . . . . . . . . . . . . . . . . . 170
8 Traitement de signal numrique pour la WFS adaptative 173
8.1 Rsum franais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
8.2 Adaptive wave eld synthesis and independent radiation mode control for broad-
band active sound eld reproduction : Signal processing . . . . . . . . . . . . . 174
8.3 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
8.3.1 Sound eld reproduction . . . . . . . . . . . . . . . . . . . . . . . . . 176
vi
8.3.2 Multichannel lters for adaptive sound reproduction . . . . . . . . . . 177
8.3.3 Wave Field Synthesis (WFS) . . . . . . . . . . . . . . . . . . . . . . . 177
8.3.4 Adaptive wave eld synthesis (AWFS) . . . . . . . . . . . . . . . . . . 179
8.4 Signal processing for adaptive wave eld synthesis . . . . . . . . . . . . . . . 179
8.4.1 Review of WFS operators for AWFS . . . . . . . . . . . . . . . . . . . 180
8.4.2 FXLMS for AWFS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
8.4.3 AWFS with independent radiation mode control using singular value
decomposition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
8.5 Simulations results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
8.5.1 Free eld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
8.5.2 Semi-innite space delimited by a rigid oor and two hard walls . . . . 202
8.6 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
8.7 Conclusion and perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
8.8 Acknowledgments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
9 Rsultats dexprimentations de synthse de champs sonores adaptative 212
9.1 Adaptive wave eld synthesis and independent radiation mode control for active
sound eld reproduction : Experimental results . . . . . . . . . . . . . . . . . 213
9.2 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
9.2.1 Sound eld reproduction . . . . . . . . . . . . . . . . . . . . . . . . . 215
9.2.2 Wave eld synthesis (WFS) . . . . . . . . . . . . . . . . . . . . . . . 216
9.2.3 Adaptive wave eld synthesis (AWFS) and independent radiation mode
control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
9.3 Signal processing for AWFS . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
9.3.1 Broadband AWFS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
9.3.2 Harmonic AWFS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
9.4 Experimental protocol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
9.4.1 Experimental setups . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
9.4.2 Methods of experiments . . . . . . . . . . . . . . . . . . . . . . . . . 224
9.5 AWFS experiments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
9.5.1 Acoustical characteristics of the reproduction rooms . . . . . . . . . . 225
9.5.2 Hemi-anechoic space . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
9.5.3 Standard laboratory space and reverberation chamber . . . . . . . . . . 237
9.5.4 Importance of the higher order radiation modes . . . . . . . . . . . . . 244
9.5.5 Modication of the FXLMS algorihtm for AWFS . . . . . . . . . . . . 244
9.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
vii
Conclusion 251
10.1 Structure de la conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
10.2 Discussion et rappel des rsultats . . . . . . . . . . . . . . . . . . . . . . . . . 254
10.3 Rsum du processus et des originalits de la recherche . . . . . . . . . . . . . 260
10.4 Intgration des rsultats de recherche aux pratiques actuelles en reproduction
spatiale du son, considrations pratiques et ouvertures diverses . . . . . . . . . 261
10.4.1 De la WFS vers la AWFS . . . . . . . . . . . . . . . . . . . . . . . . 261
10.4.2 Utilisation de plusieurs antennes de microphones compactes en AWFS
et encombrement de la zone dcoute . . . . . . . . . . . . . . . . . . 262
10.4.3 Murs de haut-parleurs et acoustique des salles variable . . . . . . . . . 264
10.4.4 Reproduction de champs acoustiques par rduction de la diaphonie et
modication de lAWFS . . . . . . . . . . . . . . . . . . . . . . . . . 265
10.4.5 Simplications pour des usages Ambisoniques courants . . . . . . . . 265
10.4.6 Type de sources de reproduction . . . . . . . . . . . . . . . . . . . . . 266
10.4.7 Application la strophonie et la rduction de la diaphonie . . . . . 266
10.4.8 Aspects de recherche divers . . . . . . . . . . . . . . . . . . . . . . . 267
10.5 Perspectives de recherches futures . . . . . . . . . . . . . . . . . . . . . . . . 269
10.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
A Dveloppements thoriques complmentaires 298
A.1 Modes propres dune salle lgrement amortie aux surfaces . . . . . . . . . . . 298
A.2 Signication du nombre de conditionnement . . . . . . . . . . . . . . . . . . . 301
A.3 Contrle optimal et AWFS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302
A.3.1 Interprtation mathmatique du problme physique de lAWFS partir
dun problme inverse . . . . . . . . . . . . . . . . . . . . . . . . . . 305
A.3.2 Dmonstration de lquivalence de lAWFS et dun problme classique
des moindres-carrs . . . . . . . . . . . . . . . . . . . . . . . . . . . 308
A.3.3 AWFS base sur le contrle indpendant des modes de rayonnement par
dcomposition en valeurs singulires . . . . . . . . . . . . . . . . . . 308
A.3.4 Facteurs de ltrage pour lAWFS . . . . . . . . . . . . . . . . . . . . 311
A.4 La thorie derrire lambisonie . . . . . . . . . . . . . . . . . . . . . . . . . . 313
A.4.1 Ambisonie comme un cas particulier du contrle optimal de la repro-
duction spatiale du son . . . . . . . . . . . . . . . . . . . . . . . . . . 325
A.5 Dveloppement des oprateurs de synthse de la WFS dans le domaine frquentiel327
A.5.1 Reproduction dondes planes . . . . . . . . . . . . . . . . . . . . . . . 342
A.6 Lambisonie partir des quations gnrales de la WFS . . . . . . . . . . . . . 343
A.7 Les oprateurs de synthse de la WFS dans le domaine temporel . . . . . . . . 347
viii
A.7.1 Passage du domaine frquentiel au domaine temporel pour un systme
incluant un retard temporel fractionnaire . . . . . . . . . . . . . . . . . 348
A.7.2 Les oprateurs de synthse en pratique pour lAWFS . . . . . . . . . . 351
A.8 Dcomposition en valeurs singulires : aspects thoriques, considrations nu-
mriques et algorithmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354
A.8.1 Proprits numriques de la SVD . . . . . . . . . . . . . . . . . . . . 355
A.8.2 Algorithmes de la SVD . . . . . . . . . . . . . . . . . . . . . . . . . . 356
A.8.3 Relation thorique entre la dcomposition en valeurs singulires (SVD)
et lexpansion en valeurs singulires (SVE) . . . . . . . . . . . . . . . 358
A.9 Traitement du signal pour lAWFS . . . . . . . . . . . . . . . . . . . . . . . . 360
A.9.1 AWFS pour des tons purs . . . . . . . . . . . . . . . . . . . . . . . . . 360
A.9.2 AWFS base sur le contrle indpendant des modes de rayonnement et
les algorithmes FXLMS et de Newton modis . . . . . . . . . . . . . 361
B Complments de simulations 364
B.1 Recommandations de lAES quant aux salles dcoute pour systmes plusieurs
voies. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364
B.2 Importance des modes de rayonnement dordre suprieur sur la taille de la zone
de contrle effective de lAWFS. . . . . . . . . . . . . . . . . . . . . . . . . . 365
B.2.1 Reproduction de champs harmoniques . . . . . . . . . . . . . . . . . . 366
B.2.2 Reproduction dimpulsions . . . . . . . . . . . . . . . . . . . . . . . . 369
C Complments dexprimentations 374
C.1 Exprimentations prliminaires avec un systme de WFS conventionnel : me-
sures de champs reproduits . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374
C.1.1 Informations complmentaires sur la salle de reproduction . . . . . . . 374
C.1.2 Informations complmentaires sur le systme de WFS . . . . . . . . . 376
C.1.3 Informations complmentaires au sujet du montage exprimental . . . . 379
C.1.4 Informations et preuves supplmentaires au sujet de la rcupration et
de la manipulation des donnes exprimentales . . . . . . . . . . . . . 380
C.2 Identication des rponses en frquences de huit microphones en situation semi-
anchoque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 381
C.3 Construction dun systme de WFS approximatif . . . . . . . . . . . . . . . . 386
C.3.1 Description du systme . . . . . . . . . . . . . . . . . . . . . . . . . . 387
C.3.2 Rsum des observations . . . . . . . . . . . . . . . . . . . . . . . . . 388
C.4 Description du systme exprimental dAWFS et des lieux utiliss pour les ex-
primentations avec un systme dAWFS complet . . . . . . . . . . . . . . . . 390
ix
C.4.1 Conception et construction du systme dAWFS . . . . . . . . . . . . 390
C.4.2 Caractrisation des haut-parleurs DX4 . . . . . . . . . . . . . . . . . . 394
C.4.3 Caractrisation et description acoustiques des lieux utiliss pour les es-
sais en AWFS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401
C.5 Compensation en phase des microphones de lerreur pour lAWFS harmonique 413
C.5.1 Filtres de compensation de phase . . . . . . . . . . . . . . . . . . . . 414
C.6 Rsultats supplmentaires dAWFS harmonique . . . . . . . . . . . . . . . . . 414
C.6.1 Effet de la position de la source virtuelle en salle semi-anchoque . . . 415
C.6.2 Champs acoustiques reproduits . . . . . . . . . . . . . . . . . . . . . . 417
x
LISTE DES TABLEAUX
2.1 Taxonomie des approches et des technologies de reproduction du caractre spa-
tial de laudition. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
6.1 Points distinctifs pour les antennes de sources circulaires et celles en U. . . . 131
9.1 Convergence coefcients and regularization parameters for harmonic AWFS ba-
sed on independent radiation mode control in hemi-anechoic space. . . . . . . 234
9.2 Convergence coefcients and regularization parameters for harmonic AWFS ba-
sed on independent radiation mode control in laboratory space. . . . . . . . . . 242
A.1 Oprateurs de synthse de la WFS dans le domaine des frquences . . . . . . . 338
A.2 Variation de lalgorithme de PC-LMS pour lAWFS selon les coefcients de
convergence et les paramtres de pnalisation. . . . . . . . . . . . . . . . . . . 363
B.1 Caractristiques de la salle utilise pour les simulations . . . . . . . . . . . . . 365
C.1 Spcications techniques pour les moniteurs de studio DX4. . . . . . . . . . . 390
C.2 Spcications techniques pour les supports ES-300. . . . . . . . . . . . . . . . 391
C.3 Spcications techniques pour les microphones 130D10. . . . . . . . . . . . . 391
C.4 Spcications techniques pour les pramplicateurs 130P10. . . . . . . . . . . 391
C.5 Spcications techniques pour la carte de son 24IO. . . . . . . . . . . . . . . . 394
xi
LISTE DES FIGURES
2.1 Schma fonctionnel gnrique dun systme de reproduction audio adaptif . . . 21
4.1 Conguration en champ libre utilise pour la simulation du ltre en peigne. . . 45
4.2 Deuxime conguration en champ libre utilise pour la simulation du ltre en
peigne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.3 Gains des rponses en frquence pour la conguration prsente la gure 4.1
(p. 45) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.4 Gain des rponses en frquence pour la conguration prsente la gure 4.2
(p. 45) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.5 Gain de la rponse en frquence du capteur central pour la conguration de la
gure 4.2 (p. 45). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.6 Gain de la rponse en frquence du capteur central pour une conguration sem-
blable celle de la gure 4.2 (p. 45) avec 100 sources. . . . . . . . . . . . . . 47
4.7 ponse impulsionnelle value pour le capteur central. . . . . . . . . . . . . . 50
4.8 Rponses impulsionnelles values pour tous les capteurs et les sources de la
conguration prsente la gure 4.2 (p. 45) . . . . . . . . . . . . . . . . . . 50
4.9 Conguration utilise pour la simulation de la WFS en champ libre avec trois
positions de sources virtuelles. . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.10 Gain de la rponse en frquence aux capteurs pour la conguration de la gure
4.9 (p. 52) avec une source virtuelle en (a). . . . . . . . . . . . . . . . . . . . . 52
4.9 (p. 52) avec une source virtuelle en (b). . . . . . . . . . . . . . . . . . . . 53
4.9 (p. 52) avec une source virtuelle en (c). . . . . . . . . . . . . . . . . . . . . 54
4.13 Gain de la rponse en frquence au capteur central pour la conguration de la
gure 4.9 (p. 52) avec des sources virtuelles en (a), (b), (c) et (0,2.025,0) [m]. . 54
4.14 Rponses impulsionnelles virtuelles (de la source monopolaire virtuelle, posi-
tion virtuelle (a) la gure 4.9 (p. 52). . . . . . . . . . . . . . . . . . . . . . . 54
4.15 Rponses impulsionnelles pour la WFS lors de la reproduction du front donde
de la gure 4.14 (p. 54). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
xii
4.16 Comparaison des rponses impulsionnelles (dans la plage de frquences de 0
976 Hz environ) reproduites et virtuelles. . . . . . . . . . . . . . . . . . . . . . 56
4.17 Rponses impulsionnelles pour la WFS lors de la reproduction du front donde
de la gure 4.14 (p. 54). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.18 Comparaison des rponses impulsionnelles (dans la plage de frquences de 0
940 Hz) reproduites et virtuelles. . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.19 Comparaison des rponses en frquence sans (en haut) et avec fentre (en bas)
dattnuation des effets de bord . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.20 Amplitudes des sources de reproduction et amplitude de la pondration spatiale. 61
4.21 Conguration dun systme de WFS avec une ligne de rfrence linaire. . . . 62
4.22 Conguration dun systme de WFS avec une ligne de rfrence circulaire. . . 62
4.23 Photographie principale du systme de WFS install lUniversit McGill. . . 64
4.24 Conguration dans le plan horizontal des haut-parleurs et des microphones uti-
liss pour la mesure objective de la reproduction de champs acoustiques par
WFS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.25 Conguration des sources virtuelles tudies dans le plan horizontal. . . . . . . 65
4.26 Estimations des fonctions de cohrence pour diffrents nombres de moyennes. . 65
4.27 FRF mesures et simules pour la position virtuelle (a). . . . . . . . . . . . . . 69
4.28 FRF mesures et simules pour la position virtuelle (b). . . . . . . . . . . . . . 69
4.29 FRF mesures et simules pour la position virtuelle (c). . . . . . . . . . . . . . 71
4.30 FRF mesures et simules pour la position virtuelle (a) avec une part des rideaux
acoustiques en moins. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.31 RI mesures et simules pour la position virtuelle (a). . . . . . . . . . . . . . . 73
4.32 RI mesures et simules pour la position virtuelle (b). . . . . . . . . . . . . . . 73
4.33 RI mesures et simules pour la position virtuelle (c). . . . . . . . . . . . . . . 74
4.34 RI mesures pour la position virtuelle (a) avec une part des rideaux acoustiques
en moins. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.35 Rponses impulsionnelles mesures pour la WFS en fonction du temps et de
lespace. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.36 Zoom sur les rponses impulsionnelles mesures pour la WFS en fonction du
temps et de lespace. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.1 Signs and symbols convention for the rectangular room. . . . . . . . . . . . . . 86
5.2 First investigated conguration in free eld. . . . . . . . . . . . . . . . . . . . 86
5.3 E
LS
and [q
opt
[ variation as a function of for the free-eld case of Fig. 5.2 (p. 86). 91
5.4 Relation between [q
opt
[ and E
LS
. . . . . . . . . . . . . . . . . . . . . . . . . . 91
xiii
5.5 Variation of E
LS
and [q
opt
[ =
_
q
H
opt
q
opt
. . . . . . . . . . . . . . . . . . . . . . 93
5.6 On left, real part of the target wave eld (plane wave) and, on right, the repro-
duced wave eld at 220 Hz in free eld. . . . . . . . . . . . . . . . . . . . . . 93
5.7 Variation of E
LS
(a) and [q
opt
[ (b) with frequency and angle , for plane wave
reproduction in free eld. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.8 Variation of E
LS
with frequency and angle , for plane wave reproduction in
free eld. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.9 Variation of E
LS
and [q
opt
[ for spherical wave reproduction in free eld, see
conguration on Fig. 5.2 (p. 86). . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.10 (a) Real part of the target wave eld at 220 Hz in free eld. (b) Real part of the
reproduced wave eld at 220 Hz in free eld using optimal control and using
WFS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.11 Acoustical power output for : (a) optimal control and (b) WFS while reprodu-
cing a spherical wave at 220 Hz in free eld, see Fig. 5.9 (p. 96) and 5.10 (p.
97). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.12 Second investigated conguration : a room of 139 m
3
with a reverberation time
of 0.28 s. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.13 Variation of E
LS
and [q
opt
[ for spherical wave reproduction in room. . . . . . . 98
5.14 Real and imaginary part of : (a) the target wave eld at 220 Hz in room (T
60

0.28 s), (b) the corresponding reproduced wave eld using optimal control, (c)
the reproduced wave eld in room using WFS, and (d) the reproduced wave
eld using optimal control in room for a larger sensor array. . . . . . . . . . . . 99
cing a spherical wave at 220 Hz, in room (T
60
0.28 s). . . . . . . . . . . . . . 100
cing a spherical wave at 70.5 Hz, in room (T
60
0.28 s). (c) Acoustical power
output for optimal control while reproducing a spherical wave at 220 Hz, in
room with a lower admittance (T
60
2.8 s). . . . . . . . . . . . . . . . . . . . 100
5.17 (a) A linear sensor array in free eld superposed to the real part of the target
wave eld at 220 Hz. (b) Real part of the corresponding reproduced wave elds
in free eld with optimal control and WFS. . . . . . . . . . . . . . . . . . . . 103
5.18 Acoustical power output while reproducing a spherical wave at 220 Hz, in free
eld with (a) optimal control and (b) WFS. . . . . . . . . . . . . . . . . . . . 103
5.19 Condition number of [Z
(m)H
Z
(m)
+ I] (see congurations in Figs. 5.2 (p. 86),
5.14(d) and 5.12 (p. 98)). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
5.20 Condition number of Z
(m)
for various congurations. . . . . . . . . . . . . . . 106
xiv
5.21 E
LS
values for the various cases presented in Fig. 5.20 (p. 106) while reprodu-
cing a spherical wave originating from x
o
= [2, 2, 1.2]
T
expressed in meters. 109
5.22 [q
opt
[ values for the various cases presented in Fig. 5.20 (p. 106). . . . . . . . . 109
6.1 Conguration pour le cas (a). . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
6.2 E
LS
et [q
opt
[ par WFS pour le cas (a) . . . . . . . . . . . . . . . . . . . . . . . 117
6.3 Pression acoustique relle reproduite pour le cas (a) par WFS 220 Hz. . . . . 117
6.4 Pression acoustique imaginaire reproduite pour le cas (a) par WFS 220 Hz. . . 117
6.5 Puissance acoustique acoustique de sortie pour le cas (a) par WFS 220 Hz. . . 118
6.6 E
LS
et [q
opt
[ par minimisation rgularise de lerreur pour le cas (a) . . . . . . 118
6.7 Pression acoustique relle reproduite pour le cas (a) par minimisation rgulari-
se de lerreur 220 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.8 Pression acoustique imaginaire reproduite pour le cas (a) par minimisation r-
gularise de lerreur 220 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.9 Puissance acoustique de sortie pour le cas (a) par minimisation rgularise de
lerreur 220 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
6.10 E
LS
et [q
opt
[ avec lAWFS pour le cas (a) . . . . . . . . . . . . . . . . . . . . 120
6.11 Pression acoustique relle reproduite pour le cas (a) par AWFS 220 Hz. . . . . 120
6.12 Pression acoustique imaginaire reproduite pour le cas (a) par AWFS 220 Hz. . 120
6.13 Puissance acoustique de sortie pour le cas (a) par AWFS 220 Hz. . . . . . . . 121
6.14 E
LS
et [q
opt
[ pour la minimisation rgularise de lerreur pour le cas (b) . . . . 121
6.15 Pression acoustique relle reproduite pour le cas (b) par minimisation rgulari-
se de lerreur 220 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
6.16 Pression acoustique imaginaire reproduite pour le cas (b) par minimisation r-
gularise 220 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
6.17 E
LS
et [q
opt
[ pour lAWFS le cas (b) . . . . . . . . . . . . . . . . . . . . . . . 122
6.18 Pression acoustique relle reproduite pour le cas (b) par AWFS 220 Hz. . . . 123
6.19 Pression acoustique imaginaire reproduite pour le cas (b) par par minimisation
rgularise de lerreur 220 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . 123
6.20 Pression acoustique relle reproduite pour le cas (c) par minimisation rgulari-
se de lerreur 220 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
6.21 Pression acoustique imaginaire reproduite pour le cas (c) par minimisation r-
6.22 Pression acoustique relle reproduite pour le cas (c) par minimisation rgulari-
se de lerreur 600 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
xv
6.23 Pression acoustique imaginaire reproduite pour le cas (c) par minimisation r-
6.24 E
LS
et [q
opt
[ pour lAWFS pour le cas (c) . . . . . . . . . . . . . . . . . . . . 125
6.25 E
LS
et [q
opt
[ pour la minimisation rgularise de lerreur pour le cas (d) . . . . 126
6.26 E
LS
et [q
opt
[ pour lAWFS pour le cas (d) . . . . . . . . . . . . . . . . . . . . 126
6.27 Pression acoustique relle reproduite pour le cas (d) par contrle. . . . . . . . . 127
6.28 Pression acoustique imaginaire reproduite pour le cas (d) par minimisation r-
6.29 Pression acoustique relle reproduite pour le cas (d) par AWFS 220 Hz. . . . 127
6.30 Pression acoustique imaginaire reproduite pour le cas (d) par AWFS 220 Hz. . 127
6.31 E
LS
aux capteurs de lerreur pour les quatre cas. . . . . . . . . . . . . . . . . . 129
6.32 E
LS
aux moniteurs de lerreur pour les quatre cas. . . . . . . . . . . . . . . . . 129
6.33 E
LS
aux capteurs de lerreur pour le cas (b) avec un variation de la distance
entre les capteurs selon les deux axes. . . . . . . . . . . . . . . . . . . . . . . 130
6.34 E
LS
aux moniteurs de lerreur pour le cas (b) avec un variation de la distance
entre les capteurs selon les deux axes. . . . . . . . . . . . . . . . . . . . . . . 130
6.35 Pression acoustique relle reproduite pour le cas (b) par AWFS avec une con-
guration de sources en U 220 Hz. . . . . . . . . . . . . . . . . . . . . . . 132
6.36 Pression acoustique imaginaire reproduite pour le cas (b) par AWFS avec une
conguration de sources en U 220 Hz. . . . . . . . . . . . . . . . . . . . . 132
6.37 E
LS
aux capteurs de lerreur par WFS, AWFS et minimisation rgularise de
lerreur pour le cas (b) avec des congurations de sources circulaires et en U. 132
6.38 E
LS
et [q
opt
[ par AWFS pour le cas (b) avec une conguration de sources en U. 132
6.39 E
LS
par WFS pour le cas (b) avec une conguration de sources circulaire avec
une surface rigide forme par le plan x
1
x
3
. . . . . . . . . . . . . . . . . . . 135
6.40 E
LS
par minimisation rgularise de lerreur pour le cas (b) avec une congu-
ration de sources circulaire avec une surface rigide forme par le plan x
1
x
3
. . 135
6.41 E
LS
par AWFS pour le cas (b) avec une conguration de sources circulaire et
avec une surface rigide forme par le plan x
1
x
3
. . . . . . . . . . . . . . . . 135
6.42 Pression acoustique reproduite 220 Hz par WFS pour le cas (b) avec une con-
guration de sources circulaire et avec une surface rigide forme par le plan x
1
x
3
.136
6.43 Pression acoustique reproduite 220 Hz par AWFS pour le cas (b) avec une
conguration de sources circulaire et avec une surface rigide forme par le plan
x
1
x
3
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
6.44 RI des sources pour la reproduction avec une surface rigide forme par le plan
x
1
x
3
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
xvi
6.45 E
LS
par WFS pour le cas (b) avec une conguration de sources circulaire avec
une surface rigide forme par un plan horizontal deux mtres au-dessus de
x
1
x
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
6.46 E
LS
par AWFS pour le cas (b) avec une conguration de sources circulaire avec
une surface rigide forme par un plan horizontal deux mtres au-dessus de
x
1
x
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
7.1 Symbol convention for the WFS operators denition. . . . . . . . . . . . . . . 144
7.2 System conguration in free eld and real part of the target wave eld at 220 Hz. 148
7.3 E
LS
at the error sensors for various approaches (WFS and AWFS) and error
sensor congurations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
7.4 E
LS
at the monitoring sensors. . . . . . . . . . . . . . . . . . . . . . . . . . . 150
7.5 Reproduced sound eld at 220 Hz in free eld by WFS. . . . . . . . . . . . . . 151
7.6 Reproduced sound eld at 220 Hz in free eld by AWFS with = 50. . . . . . 151
7.7 Reproduced sound eld in free eld at 220 Hz by reproduction error minimiza-
tion with = 50 and q
WFS
=
0. . . . . . . . . . . . . . . . . . . . . . . . . . 153
7.8 E
LS
at the error sensors (thick line) and at the monitoring sensors (thin line) and
[q
(opt)
[ =
_
q
(opt)
H
q
(opt)
(dashed line) at 220 Hz as a function of the regulariza-
tion parameter . E
LS
values for =
2
i
are shown as circles. . . . . . . . . . . 153
7.9 Source modes v
i
at 220 Hz on the left-hand side and corresponding pressure
modes u
i
on the right-hand side right. . . . . . . . . . . . . . . . . . . . . . . 157
7.10 The null space source modes v
i
at 220 Hz. . . . . . . . . . . . . . . . . . . . . 157
7.11 Sound eld radiated by the rst six source modes. Source modes (a)-(d) generate
the range of the transfer impedance matrix. . . . . . . . . . . . . . . . . . . . 159
7.12 Multipole representations of the rst M = 4 pressure modes and corresponding
free eld directivity. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
7.13 Complex source strengths for (a) WFS and (b) AWFS. . . . . . . . . . . . . . 161
7.14 Complex source strengths for optimal control (a) q
(opt)
with = 1 10
4
and
q
WFS
=
0, (b) q
(opt)
with = 1 10
4
and q
WFS
,= 0). . . . . . . . . . . . . 161
7.15 Reproduction source amplitudes for plane wave reproduction with rst order
Ambisonics and truncated modied AWFS. . . . . . . . . . . . . . . . . . . 164
7.16 First four source modes and singular values. (a) with a rigid plane in x
2
x
3
.
(b) in a room of 6.05 5.2 2m with a reverberation time of approximately
0.28 s. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
free eld directivity for the source modes in Fig. 7.16 (a). . . . . . . . . . . . . 166
xvii
free eld directivity for the source modes in Fig. 7.16 (b). . . . . . . . . . . . . 166
7.19 Block diagram of a possible AWFS least-mean-square adaptive digital proces-
sing implementation using FXLMS multichannel algorithm. . . . . . . . . . . 167
7.20 Block diagram of a possible AWFS least-mean-square adaptive digital proces-
sing implementation based on independent radiation mode control. . . . . . . . 167
8.1 Generalized cross-talk system using adaptive ltering. . . . . . . . . . . . . . . 178
8.2 Generalized sound eld reproduction using adaptive ltering. . . . . . . . . . . 178
8.4 Block diagram of the AWFS least-mean-square adaptive digital processing im-
plementation based on independent radiation mode control. . . . . . . . . . . . 187
8.5 Plant decoupling with rst and second synthesis lter matrices, and with analy-
sis lter matrix. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
8.6 Conguration of the reproduction source, error sensor and monitor sensor arrays. 192
8.7 Free-eld theoretical synthesis lters in the time domain for the source modes 1
to 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
8.8 Free-eld theoretical analysis lters in the time domain for the pressure modes
1 to 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
8.9 Impulse responses of individual components of the 44 matrix
(a)
G(e
j
)G(e
j
)
(s)
G
(e
j
)
using the synthesis and analysis lters shown in Figs. 8.7 and 8.8. . . . . . . . 194
8.10 Figure 8.9 (p. 194) continued. . . . . . . . . . . . . . . . . . . . . . . . . . . 194
8.11 Learning curves for the error sensors and for the monitor sensors using FXLMS
and independent radiation mode control algorithms in free eld. . . . . . . . . 201
8.12 Examples of the L resulting control lters for AWFS by FXLMS and by inde-
pendent radiation mode control in free eld. . . . . . . . . . . . . . . . . . . . 201
8.13 Circular reproduction source array in three dimensional semi-innite space. . . 203
8.14 Left : Spectrum of the singular values (
i
, i = 1...4) for the system with a rigid
oor (at x
3
= 0 [m]) and two hard walls (at x
2
= 2 [m] and x
3
= 6 [m]).
Right : FRF gain from source #1 to sensor #1. . . . . . . . . . . . . . . . . . . 203
8.15 Synthesis lters in the time domain for the source modes 1 to 4 for the system
with a rigid oor and two hard walls. . . . . . . . . . . . . . . . . . . . . . . . 204
8.16 Analysis lters in the time domain for the pressure modes 1 to 4 for the system
with a rigid oor and two hard walls. . . . . . . . . . . . . . . . . . . . . . . . 204
xviii
8.17 Learning curves for the error sensors and for the monitor sensors using FXLMS
and independent radiation mode control algorithms with the system with a rigid
oor and two hard walls. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
8.18 Reproduced and virtual impulse responses at the monitor sensor array for WFS
with the system with a rigid oor and two hard walls. . . . . . . . . . . . . . . 205
8.19 Reproduced and virtual impulse responses at the monitor sensor array for AWFS
by FXLMS with the system with a rigid oor and two hard walls. . . . . . . . . 206
8.20 Reproduced and virtual impulse responses at the monitor sensor array for AWFS
based on independent radiation mode control with the system with a rigid oor
and two hard walls. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
8.21 Reproduced sound eld at different times by WFS for the system with a rigid
oor and two hard walls. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
8.22 Reproduced sound eld at different times by AWFS based on modied FXLMS
for the system with a rigid oor and two hard walls. . . . . . . . . . . . . . . . 207
8.23 Reproduced sound eld at different times by AWFS based on independent ra-
diation mode control for the system with a rigid oor and two hard walls. . . . 208
plementation based on independent radiation mode control. . . . . . . . . . . . 221
plementation based on the modication of the FXLMS algorithm for AWFS. . . 222
9.4 Schematic AWFS setup made of 24 reproduction sources, 4 reproduction error
sensors and 8 monitoring sensors. . . . . . . . . . . . . . . . . . . . . . . . . 224
9.5 Schematic representation of the AWFS instrumentations, (a) : broadband, (b) :
harmonic. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
9.6 Experimental AWFS setup in the hemi-anechoic chamber. . . . . . . . . . . . 226
9.7 Typical identied FRFs (from a reproduction source to an error microphone) in
the hemi-anechoic chamber, standard laboratory space and reverberant chamber. 226
9.8 First synthesis lters
(s)
G
(z) in the time domain for the source modes #1 to

#4 in the hemi-anechoic chamber. . . . . . . . . . . . . . . . . . . . . . . . . 229
9.9 Analysis lters
(a)
G
(z) in the time domain for the pressure modes #1 to #4 in

the hemi-anechoic chamber. . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
9.10 Reproduced and virtual impulse responses at the monitoring sensor array (shown
in Fig. 9.4) for WFS with the system in the hemi-anechoic chamber. . . . . . . 230
xix
9.11 Learning curves for the error sensors using FXLMS and independent radiation
mode control algorithms with the system in the hemi-anechoic chamber. . . . . 230
9.12 Reproduced and virtual impulse responses at the monitoring sensor array for
AWFS ((a) : FXLMS algorithm with = 20, (b) : independent radiation mode
control) with the system in the hemi-anechoic chamber. . . . . . . . . . . . . . 231
9.13 Normalized energies of the error signals at each monitoring microphone for four
virtual source positions in the hemi-anechoic chamber. . . . . . . . . . . . . . 231
9.14 First four measured source modes at 220Hz in the the hemi-anechoic chamber. 234
9.15 Measured pressure modes at 220Hz in the hemi-anechoic chamber. . . . . . . 234
9.16 Normalized E
LS
criterion at the monitoring sensors for various frequencies
and harmonic reproduction algorithms after convergence in the hemi-anechoic
chamber. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
9.17 Experimental AWFS setup in the laboratory space. . . . . . . . . . . . . . . . 236
9.18 First synthesis lters
(s)
G
(z) in the time domain for the source modes #1 to

#4 in the laboratory space. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
9.19 Analysis lters
(a)
G(z) in the time domain for the pressure modes #1 to #4 in
the laboratory space. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
WFS with the system in the laboratory space. . . . . . . . . . . . . . . . . . . 239
WFS with the system in the reverberant chamber. . . . . . . . . . . . . . . . . 239
AWFS in the laboratory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
AWFS in the reverberant chamber. . . . . . . . . . . . . . . . . . . . . . . . . 240
virtual source positions in the laboratory space. . . . . . . . . . . . . . . . . . 241
virtual source positions in the reverberant chamber. . . . . . . . . . . . . . . . 241
9.26 Measured pressure modes at 220Hz in the laboratory. . . . . . . . . . . . . . . 243
9.27 Normalized E
LS
criterion at the monitoring sensors for various frequencies and
harmonic algorithms after convergence in the laboratory. . . . . . . . . . . . . 243
9.28 Normalized energies of the error signals at each monitoring microphone for
different AWFS realizations. . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
9.29 Normalized E
LS
criterion at the monitoring sensors for harmonic algorithms at
400Hz after convergence in the laboratory space using AWFS. . . . . . . . . . 245
xx
9.30 Normalized energies of the error signals for the modied FXLMS in the rever-
berant chamber. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
10.31Modle dynamique du couplage entre recherche, dveloppement technologique
et innovation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
A.1 Facteur de ltrage f
i
gnrique en fonction de a
i
=
i
/
2
i
. . . . . . . . . . . . 313
A.2 Motifs de directivit attribuables aux cinq premiers harmoniques cylindriques
de lambisonie en deux dimensions. . . . . . . . . . . . . . . . . . . . . . . . 319
A.3 Partie relle et partie imaginaire dune onde progressive plane reprsente par
une srie de Fourier-Bessel limite N = 4. . . . . . . . . . . . . . . . . . . . 319
A.4 Partie relle et partie imaginaire dune onde progressive plane reprsente par
une srie de Fourier-Bessel limite N = 8. . . . . . . . . . . . . . . . . . . . 320
A.5 Partie relle et partie imaginaire dune onde progressive plane. . . . . . . . . . 320
A.6 Gains panoramiques, champ acoustique reproduire et champ reproduit pour
un systme ambisonique du premier ordre avec 12 sources de reproduction. . . 322
un systme ambisonique du second ordre avec 12 sources de reproduction. . . . 323
un systme ambisonique du troisime ordre avec 12 sources de reproduction. . 324
A.9 Notation utilise pour lquation (A.100). . . . . . . . . . . . . . . . . . . . . 328
A.10 Notation utilise pour lobtention des intgrales de Rayleigh. . . . . . . . . . . 328
A.11 Notation prcise pour lobtention des oprateurs de synthse de la WFS. . . . 332
A.12 Simulation de la reproduction par WFS en champ libre (selon le dveloppement
de la section A.5). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337
A.13 Notation prcise pour lobtention des oprateurs de synthse de la WFS dans le
cas dune image reproduire qui inclut une source virtuelle lavant des sources
de reproduction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339
A.14 Notation prcise pour lobtention des oprateurs de synthse de la WFS dans
le cas dune ligne de sources (monoples ou diples quelconques). . . . . . . . 339
A.15 Simulation de la reproduction par WFS en champ libre avec lutilisation de di-
ples comme sources de reproduction. . . . . . . . . . . . . . . . . . . . . . . 340
A.16 Simulation de la reproduction par WFS en champ libre avec lutilisation de mo-
noples pour la cration dune source virtuelle devant les sources de reproduction.340
noples (distribus sur une ligne quelconque) comme sources de reproduction. . 341
xxi
A.18 Simulation de la reproduction par WFS en champ libre avec lutilisation de di-
ples (distribus sur une ligne quelconque) comme sources de reproduction. . . 341
noples (distribus sur une ligne) comme sources de reproduction dondes planes.344
A.20 Simulation de la reproduction par WFS en champ libre avec lutilisation de
diples (distribus sur une ligne quelconque) comme sources de reproduction
dondes planes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344
A.21 Notation modie pour lobtention de la solution ambisonique partir de la
formulation de Kirchhoff-Helmholtz lorigine de la WFS. . . . . . . . . . . . 345
A.22 Rponses limpulsion par transformes de Fourier rapides inverses pour diff-
rents retards temporels. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 349
A.23 Rponses limpulsion pour diffrents retards temporels (128, 128.25, 125.5,
128.66, 128.9 et 129 chantillons). . . . . . . . . . . . . . . . . . . . . . . . . 351
A.24 RI dun oprateur de synthse typique selon quatre approches possibles. . . . . 353
A.25 FRF dun oprateur de synthse typique selon quatre approches possibles. . . . 353
A.26 RI reproduites par la WFS selon les quatre approches possibles de la gure A.24
(p. 353). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354
B.1 Charte graphique des contraintes imposes sur la gomtrie dune salle dcoute. 366
B.2 Charte graphique des contraintes imposes sur la gomtrie dune salle dcoute,
un autre exemple. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 366
B.3 Erreur rsiduelle moyenne pour lAWFS en champ libre alors quun seul mode
de rayonnement est inclus dans la solution. . . . . . . . . . . . . . . . . . . . . 367
B.4 Erreur rsiduelle moyenne pour lAWFS en champ libre alors que les deux pre-
miers modes de rayonnement sont inclus dans la solution. . . . . . . . . . . . . 367
B.5 Erreur rsiduelle moyenne pour lAWFS en champ libre alors que les trois pre-
miers modes de rayonnement sont inclus dans la solution. . . . . . . . . . . . . 368
B.6 Erreur rsiduelle moyenne pour lAWFS en champ libre alors que les quatre
premiers modes de rayonnement sont inclus dans la solution. . . . . . . . . . . 368
B.7 Erreur rsiduelle moyenne pour lAWFS en prsence de deux plans rigides alors
quun seul mode de rayonnement est inclus dans la solution. . . . . . . . . . . 369
que les deux premiers modes de rayonnement sont inclus dans la solution. . . . 369
que les trois premiers modes de rayonnement sont inclus dans la solution. . . . 370
xxii
que les quatre premiers modes de rayonnement sont inclus dans la solution. . . 370
B.11 Erreur rsiduelle moyenne pour lAWFS 400 Hz en champ libre alors quun
seul mode de rayonnement est inclus dans la solution. . . . . . . . . . . . . . . 371
B.12 Erreur rsiduelle moyenne pour lAWFS 400 Hz en champ libre alors que les
deux premiers modes de rayonnement sont inclus dans la solution. . . . . . . . 371
trois premiers modes de rayonnement sont inclus dans la solution. . . . . . . . 372
quatre premiers modes de rayonnement sont inclus dans la solution. . . . . . . 372
B.15 Champ acoustique reproduit par AWFS base sur le FXLMS. . . . . . . . . . . 373
B.16 Champ acoustique reproduit par AWFS base sur le contrle indpendant des
modes de rayonnement. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373
B.17 Courbes dapprentissage pour les champs reproduits prsents aux gures B.15
(p. 373) et B.16 (p. 373). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373
C.1 Gomtrie du lieu o les mesures objectives de la WFS ont pris place. . . . . . 375
C.2 Les haut-parleurs deux voies utiliss pour la WFS. . . . . . . . . . . . . . . . 375
C.3 Le systme informatique derrire la WFS. . . . . . . . . . . . . . . . . . . . . 377
C.4 Lantenne de micophones utilise pour les mesures de champs acoustiques. . . 378
C.5 Un microphone de lantenne de capteurs. . . . . . . . . . . . . . . . . . . . . . 378
C.6 Lantenne de micophones est positionne par rapport au centre du rseau de
sources par le biais de marques au sol. . . . . . . . . . . . . . . . . . . . . . . 378
C.7 Enregistreur DAT et oscilloscope dans lentre isole de la pice (voir la gure
C.1 (p. 375)). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379
C.8 Reprsentation schmatique de la chane dacquisition utilise pour les mesures
de champs acoustiques reproduits par WFS. . . . . . . . . . . . . . . . . . . . 379
C.9 Convergence de lerreur rsiduelle de lidentication de rponses impulsion-
nelles par ltrage adaptatif pour lidentication dun microphone. . . . . . . . 382
C.10 Validation de lidentication des microphones. . . . . . . . . . . . . . . . . . . 383
C.11 Erreurs de validation de la gure C.10 (p. 383). . . . . . . . . . . . . . . . . . 383
C.12 Fonctions de rponse en frquence des microphones. . . . . . . . . . . . . . . 384
C.13 Rponses impulsionnelles des huit microphones de mesure. . . . . . . . . . . . 385
C.14 Rponses impulsionnelles corriges des huit microphones de mesure. . . . . . 385
C.15 Fonctions de rponse en frquence corriges des microphones. . . . . . . . . . 386
C.16 Gains [dBref1] des FRF de correction des rponses des microphones. . . . . . 387
xxiii
C.17 Phase [rad] des FRF de correction des rponses des microphones. . . . . . . . 387
C.18 Photographie du systme de WFS approximatif. . . . . . . . . . . . . . . . . . 388
C.19 Dtails du rseau de sources du systme de WFS approximatif. . . . . . . . . . 389
C.20 Vue en plonge dune reprsentation schmatique de lantenne circulaire de
haut-parleurs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392
C.21 Vues gnrales et dtailles du montage exprimental dAWFS en salle semi-
anchoque. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393
C.22 Vue de larrire dun haut-parleur. . . . . . . . . . . . . . . . . . . . . . . . . 394
C.23 Vue rapproche des microphones de lerreur pour le systme dAWFS. . . . . . 394
C.24 Conguration exprimentale du systme dAWFS large bande . . . . . . . . 395
C.25 Conguration exprimentale du systme dAWFS pour des tons purs . . . . . . 395
C.26 Impdance lectrique du woofer des DX4 pos sur une table. . . . . . . . . . . 397
C.27 Impdance lectrique du woofer des DX4 pos sur une table et impdance lec-
trique du woofer, du tweeter et du circuit daiguillage de frquences dans un des
cabinets sans amplicateur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
C.28 Impdance lectrique du woofer des DX4 avec amortissement de lvent. . . . 398
C.29 Fonctions de rponse en frquences thoriques entre le dbit volumique de la
membrane (q
m
) et le dbit volumique de lvent (q
e
). . . . . . . . . . . . . . . 398
C.30 Niveaux de puissance acoustique de lvent et de la membrane pour une mem-
brane dbit volumique unitaire pour un cabinet DX4 sans amplicateur. . . . 399
C.31 Fonction de directivit en pression h() (entre 0 et 1) pour un piston de 4 po de
diamtre. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401
C.32 Mesure de la dcroissance spatiale en salle semi-anchoque . . . . . . . . . . 402
C.33 Mesure de la dcroissance spatiale en salle rverbrante . . . . . . . . . . . . . 402
C.34 Courbe de dcroissance spatiale moyenne mesure et thorique dans la chambre
semi-anchoque pour quatre trajectoires diffrentes. . . . . . . . . . . . . . . 404
C.35 Rponse limpulsion moyenne en nergie [dB ref 1] en chambre semi-anchoque
et en laboratoire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405
C.36 Fonctions de rponse en frquence typiques pour la salle semi-anchoque. . . . 405
C.37 Courbe de dcroissance spatiale moyenne mesure et thorique dans lespace
de laboratoire pour quatre trajectoires diffrentes. . . . . . . . . . . . . . . . . 407
C.38 Fonctions de rponse en frquences typiques pour le laboratoire. . . . . . . . . 407
C.39 Rponses limpulsion au niveau de lantenne de moniteurs dans le laboratoire. 408
C.40 Rponse limpulsion moyenne en nergie [dB ref 1] en laboratoire. . . . . . . 408
C.41 Vues gnrales et dtailles du montage exprimental dAWFS au laboratoire
du GAUS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 409
xxiv
C.42 Courbe de dcroissance spatiale moyenne mesure dans la chambre rverb-
rante pour quatre trajectoires diffrentes. . . . . . . . . . . . . . . . . . . . . . 410
C.43 Fonctions de rponse en frquences typiques pour la chambre rverbrante. . . 411
C.44 Vues gnrales et dtailles du montage exprimental dAWFS en salle rver-
brante. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
C.45 Filtres de compensation de phase pour lAWFS harmonique. . . . . . . . . . . 415
C.46 E
LS
normalis pour chaque moniteur et diffrents algorithmes dAWFS harmo-
nique (220 Hz) avec une source virtuelle en x
o
= [0, 4, 0] m. . . . . . . . . . . 416
C.47 E
LS
o
= [4, 0, 0] m. . . . . . . . . . 416
C.48 E
LS
o
= [1.19, 0.91, 0] m. . . . . . . 417
C.49 E
LS
o
= [0, 4, 0] m. . . . . . . . . . . 417
C.50 Champs acoustiques harmoniques reproduits par WFS en salle semi-anchoque. 418
C.51 Champs acoustiques harmoniques reproduits par AWFS en salle semi-anchoque.418
C.52 Champs acoustiques harmoniques reproduits par AWFS base sur le contrle
indpendant des modes de rayonnement en salle semi-anchoque. . . . . . . . 420
xxv
CHAPITRE 1
INTRODUCTION
Dun simple regard sur lhistoire humaine, il est possible de constater limportance de la
reprsentation chez lhomme. Que celle-ci prenne une forme visuelle, textuelle, symbolique ou
auditive, quelle relve de la communication technique ou artistique, assurment construite de
diffrents langages, tourne vers une foule de sujets distincts ; la reprsentation jalonne lhistoire
humaine.
Ainsi, de la mme faon que, par exemple, ldication progressive des rgles de la pers-
pective
1
correspond un effort de reprsentation de reproduction dune ralit visuelle
spatiale avec les instruments de lpoque [Damisch, 1987; Panofsky, 1975; de Vinci, 1987], il
est envisageable dentreprendre, et de poursuivre, aujourdhui laide des techniques et des
connaissances actuelles la reprsentation, la reproduction de champs acoustiques an de re-
produire par exemple une situation auditive (auralisation
2
de lieux ou de vhicules ; musique
ou trame sonore ; enregistre ou synthtise) dont les qualits spatiales sont reproduites sur une
zone tendue. La principale intention du projet de recherche introduit dans cette thse sinscrit
dans ces possibilits plus gnrales. On note, par contre, que laspect spatial de la reproduction
audio est videmment un ouvrage considrable dont les fruits et les applications commerciales
ne verront le jour que par laccumulation douvrages tel celui qui est introduit en ces pages.
Dans ce contexte, lensemble de cette thse est exclusivement ddi la dimension physique de
la reproduction de champs acoustiques.
Les motivations de tels efforts de reproduction sont tout aussi multiples que les obstacles qui
1
On parle ici de perspective graphique, perspective que lon pourrait dnir comme suit : la science qui ap-
prend reprsenter les objets tridimensionnels sur une surface bidimensionnelle, de faon que limage perspective
concide avec celle que fournit la vision directe[Panofsky, 1975].
2
Lauralisation dsigne tout processus technologique qui cherche rendre audible un champ acoustique imagi-
naire, virtuel ou simul. On utilise ce terme de la mme faon que lon parle de visualisation pour la vision [Kleiner
et al., 1993].
1
caractrisent la technicit de la tche. Considrons quelques exemples historiques qui sauront,
dun point de vue gnral, mettre en valeur les dites motivations.
Il semble en fait que la premire dmonstration publique dune tentative de saffranchir de
la reproduction monophonique
3
puisse tre attribue Ader [Audio Engineering Society, 1981;
Malham et Myatt, 1995; Torick, 1998; Sterne, 2003; Davis, 2003; Rumsey, 2002] qui, en 1881,
lors de lexposition dlectricit de Paris, disposa deux microphones de tlphone dans une salle
de concert et achemina les signaux vers des htels environnants lexposition jusqu une paire
de rcepteurs tlphoniques. Les gens taient alors invits placer un rcepteur sur chacune
de leurs oreilles. Vraisemblablement, lintrt principal dAder en cette dmonstration tait
bel et bien la transmission dune impression auditive spatiale [Rumsey, 2002]. Cette premire
dmonstration de Ader donne ensuite la vie une srie de diffusions tlphoniques connue sous
le nom du Thtrophon [Sterne, 2003].
Depuis ce premier balbutiement technique, des prototypes exprimentaux, des techniques,
des crits et des compositions musicales nont cess dinuer et dhabiter les proccupations
et les agissements des chercheurs concerns par cette dimension de la reproduction audio
4
.
3
La reproduction monophonique ninclut quun seul capteur, une seule ligne de transmission (ou une seule
piste denregistrement) et une seule source acoustique au bout de la chane lectroacoustique. La reproduction
monophonique ne rend pas, videmment, le caractre intrinsquement spatial de laudition naturelle [Bradley et
Souldore, 1995].
4
[Garas et Sommen, sans date; Evans et al., sans date; Steinke, 1996; Davis, 2003; Williams, 2003; Giomi
et al., 2003; Wilson, 2003; Glasgal, 2003; Zmolnig et al., 2003; de Vries et Boone, 2003; Melchor et al., 2003;
Theile et al., 2003; Plegsties et al., 2003; Strauss et al., 2003; Spors et al., 2003a; Zieli nski et al., 2003; Jin et al.,
2003; Kutschbach, 2003; Soulodre et al., 2003; Neher et al., 2003; Barbour, 2003; Cabrera et Tilley, 2003; Usher et
Woszczyk, 2003; Ford et al., 2003; Berg et Rumsey, 2003; Noisternig et al., 2003; Chun et al., 2003; Rdenas et al.,
2003; Yang et al., 2003; van der Heide, 2002; Hiyama et al., 2002; Rumsey, 2002; Nelson, 2002; Austin, 2001;
Brix et al., 2001; Boone, 2001; Malham, 2001; Trochimczyk, 2001; Rumsey, 2001; Cheng et Wakeeld, 2001;
Clozier, 2001; Sherburne, 2002; Lennox et al., 1999; Lokki et al., 1999; Kahana et al., 1999; Kirkeby et al., 1999;
Horbach et Boone, 1999; Nicol et Emerit, 1999; Norris, 1999; Dapelo et Macelloni, 1999; Varla et al., 1999; Farina
et Ugolotti, 1999; Garas, 1999; Honda et Hamada, 1999; Watanabe et al., 1999; de Vries et Boone, 1999; Kirkeby
et Nelson, 1999; Blauert, 1999; Hartmann et Wittenberg, 1999; Daniel et al., 1999; Gardner, 1998; Verheijen, 1998;
Kirkeby et al., 1998; Boone et Ouweltjes, 1997; Griesinger, 1997; Druyvesteyn et Garas, 1997; Nelson et al., 1997;
Uto et Hamada, 1995; Kendall, 1995a; Kirkeby et al., 1996; Roads, 1996; Nelson et al., 1996b,a; Kirkeby et al.,
1995; Berkhout et al., 1992, 1995; Griesinger, 1995; Ordua et al., 1995; Boone et al., 1995; Bradley et Souldore,
1995; Malham et Myatt, 1995; Nelson, 1994; Begault, 1994; Elliott et al., 1994; Schlegel, 1994; Berkhout et al.,
1993; Kleiner et al., 1993; Korenaga et Ando, 1993; Kirkeby et Nelson, 1993; Nielsen, 1993; Nelson et Elliot,
1992; Wightman, 1992; Wightman et Kistler, 1989a,b; Elliott et Nelson, 1989; Cooper et Bauck, 1989; Tohyama
et Suzuki, 1989; Berkhout, 1988; Romano, 1987; Ahnert, 1987; Veit et Sander, 1987; Meyer, 1984; Hartmann,
1983; Stern Jr. et Colburn, 1978; Nakanayashi, 1975; Gerzon, 1973; Camras, 1968; Crowhurst, 1957; Steinberg et
2
Quelques exemples de cration en musique contemporaine, exprimentale ou lectroacoustique
dmontrent lexistence indniable du mme intrt chez les crateurs. Pensons, par exemple,
aux concerts de haut-parleurs des compositeurs dits lectroacousticiens qui utilisent ds les an-
nes soixante de la spatialisation tel un lment esthtique de composition et de dynamisme
[Clozier, 2001; Austin, 2001; Malham et Myatt, 1995]. Cet intrt musical des annes soixante
et soixante-dix na, en aucun temps, perdu son soufe. Encore aujourdhui, des oeuvres rcentes
exploitent, comme principal sujet, le caractre spatial de laudition [Malham et Myatt, 1995].
Ainsi, Cardiff prsenta des installations audio au Muse des Arts Contemporains de Montral
en 2002
5
. Dans plusieurs des oeuvres de Cardiff, lexploitation du caractre spatial de la repro-
duction auditive est explicitement identie comme proccupation centrale dans ses rexions
et ses productions artistiques
6
. Dans le mme ordre dides, cest lors dun vnement multi-
disciplinaire, Le Mois Multi (dition 2003) dans le complexe Mduse Qubec, quun artiste
Hollandais prsente, A World Beyond The Loudspeaker [Mduse, Qubec, 2003; van der Heide,
2002], une installation sonore qui rcupre des notions introduites dans la littrature scienti-
que par Steinberg et Snow [Steinberg et Snow, 1934; Snow, 1953; Rumsey, 2002] en 1934 et
beaucoup plus tard, avec les technologies de la WFS (Wave Field Synthesis) plus rcentes
et fortement lies cette thse par Berkhout, la n des annes 1980 et au dbut des annes
1990 [Berkhout et al., 1992, 1993].
Les quelques exemples dactions autonomes cits plus haut, hors de tous standards tech-
niques de spatialisation et stalant sur pratiquement un sicle, constituent un exemple rcurrent,
et indpendant dimpratifs commerciaux, de la manifestation de lintrt de la reproduction du
caractre spatial de lexprience auditive.
Snow, 1934; Snow, 1953; Begault, 1999; Savioja et al., 1999; Berkhout et al., 1984; Bregman, 1990; Theile, 1993;
Blumlein, 1933; Hulsebos et de Vries, 2002; Hulsebos et al., 2003; Hulsebos, 2004; de Vries, 1996; Spors et al.,
2005a; Betlehem et Abhayapala, 2005; Takeuchi et Nelson, 2002; Nelson et Rose, 2005; Asano et Swanson, 1995;
Ise, 1999; Santilla n, 2001; Kim et al., 2002; Epain et al., 2004; Choi et Kim, 2004a; Gerzon, 1985; Poletti, 2000,
2005; Bai et Elliott, 2004; Tokuno et al., 1997; Corteel et al., 2002; Woszczyk et al., 2005; Poulin, 1957; Schobben
et Aarts, 2005; Fuster et al., 2005; Nelson, 2001; Daniel, 2001; Start et al., 1999; Lopez et Gonzalez, 2001; Rose
et al., 2002; Pulkki et Merimaa, 2006; Merimaa et Pulkki, 2005; AES, 2003; Bouchard et Quednau, 2000; Scheirer,
1999; Camurri et Ferrentino, 1999; Berkhout et al., 1997; de Vries et al., 2002; Kuhn et al., 2003; Passella et al.,
2001; Bleda et al., 2005; Lpez et al., 2005; Escolano et al., 2005; Pueo et al., 2005; Takane et al., 1999; Choi et
Kim, 2002; Bai et Lin, 2005; Bai et al., 2005; Puddie Rodgers, 1981; Riederer, 1998]
5
Dans le cadre de lexposition Janet Cardiff : un bilan de loeuvre incluant des collaborations avec George
Bures Miller, du 25 mai au 8 septembre 2002, Muse des Arts Contemporains de Montral.
6
Lartiste utilise mme des techniques de reproduction plus ou moins rcentes, comme le ltrage par des HRTFs
(Head Related Transfer Function) et lparpillement de sources acoustiques (et de capteurs, pour lenregistrement
initial).
3
En dehors dun contexte exclusivement dni par des intrts propres un univers audio
ou musical, quil soit bas sur la dlit de la reproduction ou sur linnovation crative, on re-
marque videmment limportance plus gnrale de limmersion multimdia auquelle peut faci-
lement souscrire cette recherche sur la reproduction physique de champs acoustiques. Par contre,
quoique la notion denvironnement virtuel soit trop souvent, voire malheureusement, attribue
une caractristique trs reprsentative, pratiquement exclusive ou compltement nouvelle, des
temps technologiques actuels, Grau [Grau, 2003]
7
, avec un ouvrage historique, fait le bilan du
rle dominant de limmersion dans diverses formes dart ou de reprsentation partir de lAn-
tiquit, dmontrant ainsi une continuit remarquable des recherches scientiques et artistiques
actuelles avec celles qui trouvent leurs fondements sur de plus anciennes pratiques de lillusion.
Une continuit historique (quil fut tent, plus tt, de faire valoir par lexemple de la perspective
graphique) trop peu visible et insufsamment reconnue dans leffervescence des activits de
recherche en ralit virtuelle.
Au-del des exemples prsents (soit des exemples plus ou moins marginaux ou essentiel-
lement historiques) dintrts, dactualits et de curiosits envers la reproduction du caractre
naturellement spatial de laudition, les applications potentielles et pratiques de masse, de ltude
ici introduite, rpondent des besoins et tendances de lactualit. Ainsi la technique de repro-
duction de champs acoustiques prsente dans cette thse sapproche des applications pratiques
suivantes [Malham et Myatt, 1995] :
1. systme dauralisation de lieux ou dintrieurs de vhicules, denvironnements sonores ou
de champs acoustiques stationnaires [Kleiner et al., 1993]
2. systme de reproduction pour salles de cinmas ou toutes autres salles pour lesquelles le
rendu audio comporte une importance[Rumsey, 2001; Kuttruff, 1999; Berkhout, 1988],
3. partie terminale dune chane de transmission audio haute-dlit en temps rel ou diffr
(tlreproduction multimdia de concerts ou dvnements) [Boone, 2001; Rumsey, 2001;
Ahnert, 1987],
4. systmes de communication et de navigation [Begault, 1994, 1999],
5. partie acoustique de systmes de ralit virtuelle [Boone, 2001; Wilson, 2003; Lokki et al.,
1999; Begault, 1994, 1999; Savioja et al., 1999], de tlprsence, de jeux vidos, densei-
gnement distance et de tlconfrence, [Zieli nski et al., 2003],
6. application potentielle pour des essais en psychoacoustique, psychoacoustique de la loca-
lisation spatiale [Blauert, 1999] ou en auralisation [Boone, 2001],
7
Louvrage de Grau [Grau, 2003] se consacre essentiellement limmersion visuelle. Son ouvrage peut, par
contre, tre aisment transpos vers lhistoire et les actualits de la reproduction du son.
4
7. application potentielle pour des mesures exprimentales acoustiques [Bravo et Elliott,
2004],
8. intgration aux systmes de vidoconfrence [Boone, 2001; Schaphorst, 1996; Evans
et al., sans date],
9. systme de reproduction pour les systmes de cinma maison [Rumsey, 2001; Boone,
2001].
Comme il est possible de sen convaincre par le biais de cette brve introduction, les re-
cherches sur la reproduction de champs acoustiques soit une dmarche spcique dans le
contexte de la reproduction du caractre spatial de laudition sont justies et trouvent chos
autant dans les besoins de dveloppement de lindustrie et du savoir en reproduction du son
que dans lintrt cratif musical. Ces quelques observations conrment nettement lintrt de
la prsente recherche en relation avec ltat actuel de la situation. Le caractre novateur de la
recherche se prsentera plus clairement dans les prochains chapitres dont la teneur sapparente
plus la technicit du projet.
On note aussi que, malgr la porte trs gnrale de cette introduction, le problme et lob-
jectif principal considrs dans cette thse sont avant tout physiques ; cest la reproduction ob-
jective, et non pas subjective ou perceptible, de champs acoustiques qui est tudie. Plus sp-
cialement, des bases dhybridation entre des technologies existantes et connues, la Wave Field
Synthesis, lAmbisonie et les applications drives du contrle actif du son, seront tablies dans
cette thse. On cherche donc investiguer cette possibilit technologique prcise. Les travaux
prsents dans cette thse contribuent en fait lavancement du savoir technologique thorique
et pratique sur des bases actuelles issues de la pratique et du savoir thorique. Cest ainsi que des
thories mathmatiques connues sont, par exemple, nouvellement appliques, dans cette thse,
au contrle actif de la reproduction spatiale du son.
1.1 Structure de la thse
Cette thse est divise en neuf chapitres. Au prochain chapitre, un certain nombre de notions
prliminaires sont introduites ; elles concernent la perception spatiale du son et les techniques
de reproduction spatiale de lexprience du son. Au sein de ce mme chapitre, ltat de lart, en
terme de reproduction du caractre spatial de laudition et, plus spcialement, de champs acous-
tiques, est prsent selon une progression chronologique gnrale puis pour les recherches plus
rcentes et rvlatrices la prsente recherche selon les types de solutions technologiques d-
5
crites. Le troisime chapitre est consacr la description des objectifs de la prsente recherche
ainsi qu la formulation de la mthodologie utilise. Cest du quatrime au neuvime chapitre
que les travaux de recherches sont explicitement prsents. La division de ces chapitres sera
expose lors de la formulation de la mthodologie utilise (chapitre 3). Finalement, la conclu-
sion comporte une discussion de lensemble des rsultats de recherche et la formulation des
recommandations pour des travaux futurs sur le sujet dans la suite des exercices de recherche ici
rapports. Les annexes prsentent des informations supplmentaires. Lannexe A rassemble des
dveloppements thoriques complmentaires aux dveloppements principaux prsents dans le
texte principal. Lannexe B regroupe les donnes utilises lors des simulations prsentes dans
le corps de la thse. En ce qui concerne les aspects exprimentaux de la recherche, cest dans
lannexe C que les donnes et les schmas complmentaires sont regroups.
6
CHAPITRE 2
NOTIONS PRLIMINAIRES ET TAT DE LA SITUATION
2.1 Introduction
Ce chapitre prsente un aperu de lhistorique de la reproduction audio en relation avec les
intrts et les dveloppements de la reproduction du caractre spatial de laudition. Dabord
gnrale et consacre laspect audio, cette revue de notions et de littrature donne, par la
suite, plus de poids aux techniques rcentes de reproduction physique de champs acoustiques.
Avant de retracer les travaux majeurs relis au rendu des qualits spatiales dun enregistrement
ou dune synthse de champs acoustiques, il est nanmoins impratif de prsenter rapidement
quelques concepts.
2.2 Notions prliminaires
Seuls certains aspects relatifs la problmatique de cette recherche sont ici introduits. Cest
ainsi que la description de la perception spatiale du sonore et la classication gnrique des
mthodes de reproduction du caractre spatial de laudition seront sommairement introduites.
2.2.1 La perception spatiale du sonore
Lensemble des mcanismes impliqus dans la perception auditive dvnements acous-
tiques
1
forme une chane de traitement particulirement complexe dont lexpression du dtail
1
La perception auditive dvnements acoustiques (dans le domaine physique) est aussi nomme vnements
auditifs (dans un domaine perceptif) [Blauert, 1999].
7
va au-del de la fonction du prsent document. Quelques concepts doivent tre nanmoins in-
troduits.
Pour se convaincre de la complexit de la sensation auditive, il suft de retracer les ph-
nomnes acoustiques (rayonnement, propagation, rexion, diffraction, etc.)
2
, physiologiques
(oreille humaine)
3
, et cognitifs
4
tous impliqus et inuents dans cette chane de la perception
spatiale du sonore. Pour le chercheur qui souhaiterait amliorer la qualit de la reproduction spa-
tiale, lampleur considrable de ces phnomnes regroups constitue une problmatique com-
plexe et, consquemment, favorise une approche spcialise, voire une concentration, sur lune
des mailles de la chane. Ainsi, considrant notre bagage technique, les travaux de recherche
sont ddis , et se concentrent sur, laspect acoustique et lectroacoustique de la reproduction
audio. Le tout sera support par une mise en oeuvre grce au traitement numrique de signal. Les
lieux de reproduction, la transduction et le traitement des signaux seront donc pris en compte
dans une dmarche rsolument tourne vers laspect physique de la reproduction de champs
acoustiques. Cette approche sinscrit, par exemple, aisment dans une dmarche plus gnrale
dauralisation de champs acoustiques obtenus par simulations numriques.
La connaissance a priori de la complexit de cette chane demeure tout de mme utile pour
expliquer certains phnomnes dont lun est dune importance notable et exemplaire. Ainsi, un
problme inhrent la reproduction de champs acoustiques pour des applications audio est celui
de linuence de la perception visuelle. Habituellement, le visuel prdomine sur lauditif et in-
ue considrablement lexercice auditif. Pour nous en convaincre, Griesinger
5
projette la vido
dun concert et son enregistrement audio sur un systme Surround 5.1
6
. En plus de lorchestre,
2
[Elmore et Heald, 1969; Kinsler et al., 2000; Dickason, 2000; Jouhaneau, 2000; Brel, 1951; Blauert, 1999;
Kuttruff, 1999; Morse, 1995; Bleinstein, 1984; Crocker, 1998; Bruneau, 1983; Borwick, 1988; Verschuur et al.,
1988; Berkhout et al., 1984; Meyer, 1984; Allison, 1976; Beranek, 1954]
3
[Puddie Rodgers, 1981; Blauert, 1999; Zwicker et Fastl, 1999; Nielsen, 1993; Denes et Pinson, 1963; Burkhard
et Sachs, 1975; Stern Jr. et Colburn, 1978; Hartmann, 1983; Raatgever et Bilsen, 1986; Tohyama et Suzuki, 1989;
Wightman et Kistler, 1989a; Moore, 1989; Wightman et Kistler, 1989b; Wightman, 1992; Schlegel, 1994; Bradley
et Souldore, 1995; Hartmann et Wittenberg, 1999; Blauert, 1999; Griesinger, 1997; Daniel et al., 1999; Rumsey,
2001, 2002; Chun et al., 2003]
4
[Denes et Pinson, 1963; Bregman, 1990; Zwicker et Fastl, 1999; Blauert, 1999]
5
Lors dun atelier dans le cadre de Multichannel Audio : The New Reality (AES 24
th
International Conference,
2003)
6
La nomenclature audio est telle que x.y signie x canaux avec y canaux supplmentaires pour les basses fr-
quences. Pour prciser la conguration, on parle parfois de systme strophonique xy. Dans ce cas, x correspond
au nombre de canaux directs alors que y rfre au nombre de canaux dambiance (des canaux Surround). Se-
lon cette nomenclature, le Surround 5.1 (le format actuel utilis dans les cinmas-maisons) peut tre identi
comme un systme 3-2.1 [Theile, 1993] : trois sources lavant de laudience se chargent de projeter le programme
8
des chanteurs sont en arrire-plan et lgrement surlevs. Alors que la camra zoome vers les
chanteurs, lauditeur ressent habituellement limpression de se rapprocher auditivement : le vo-
lume sonore des chanteurs semble augmenter en comparaison avec le niveau de lorchestre. Lors
du zoom, le systme de prise de son ne bouge pourtant pas ; cette sensation de focus nest donc
quune pure impression. Cet exemple simple formule une mise en garde envers lusage abusif
de lexpression : reproduction parfaite de limpression auditive qui pourrait dcouler dune
approche physique.
On parlera donc, pour cette recherche, de reproduction de champs acoustiques selon des
critres physiques agrments de commentaires et remarques au sujet des correspondances dans
le domaine de la perception. Dans le mme ordre dide, les tudes plus rcentes depuis
1982 en psychoacoustique spatiale conrment la forte prsence, et linuence, de mcanismes
cognitifs dans le processus de localisation [Blauert, 1999; Kendall, 1995a]. Le dtail de ces
notions dpasse le cadre du prsent document, cest la prcdente mise en garde que lon doit
garder en mmoire.
Parmi les mcanismes de localisation les plus importants, on trouve leffet de prcdence
qui est aisment reli au problme de reproduction de champs acoustiques dans des lieux rels.
En bref, leffet de prcdence est observable lors de la localisation dun vnement auditif
caus par plus dune source acoustique alors que ces sources acoustiques rayonnent des signaux
cohrents
7
. Un exemple simple serait donc un systme de son strophonique deux canaux
qui diffuserait le son dun instrument. Dans ce cas, leffet de prcdence intervient en fonction
des retards temporels, perus par le systme auditif, entre chacun des fronts donde cohrents.
Pour un dlai nul, ou trs faible (de 0 1 ms pour des sources spares par 80 degrs), leffet
de prcdence nintervient pas et cest plutt par localisation additive que lattribution dune
position perue la source est effectue : lvnement auditif peru sera localis entre les deux
sources. La position angulaire perue dpendra du retard temporel entre les arrives des deux
fronts donde. Au-del dun certain retard temporel (1 ms environ pour une sparation de 80 de-
grs), la localisation additive est supplante par leffet de prcdence. Ce dernier est caractris
par le fait que seule lincidence du premier front donde inue la localisation. Les autres fronts,
cohrents avec le premier, mais dcals dans le temps ninterviennent pas dans la localisation
gnral, deux sources arrire se chargent de latmosphre et un dernier transducteur produit les basses frquences
(habituellement sous 150Hz).
7
On suppose des conditions parfaites, alors quil ny a pas dinformations contradictoires entre les diverses
modalits sensorielles.
9
auditive, ils ne contribuent qu laugmentation du niveau sonore peru. Au-del du seuil de
lcho (de 30 ms 40 ms pour une sparation de 80 degrs), leffet de prcdence nest plus
effectif et des vnements auditifs distincts sont perus et localiss en des positions diffrentes.
Leffet de prcdence explique donc la capacit de localisation en salle : les rexions discrtes
ninterviennent pas dans le mcanisme de localisation dune seule source en salle.
Leffet de prcdence est trs important dans le cadre de la discussion de lensemble des r-
sultats de recherche qui suit puisque cet effet indique une certaine consigne pour la reproduction
de champs acoustiques potentiellement applique laudio. Ainsi, un systme de reproduction
de champs acoustiques donn doit fonctionner, objectivement, tout autant en espace inni quen
salle. Plus simplement : le systme doit reproduire le premier passage dun front donde exac-
tement comme en champ direct. Pour cette raison, le systme propos doit recevoir des consi-
drations en champ libre et en salle relle. La compensation pourra par contre tre applique
pour rduire leffet de la salle. Cette exigence pratique issue de laudio est explicitement prise
en compte dans la dnition de la technologie prsente dans cette thse.
2.2.2 Deux approches distinctes pour la reproduction spatiale du son
Parmi les recherches effectues sur le sujet, il est possible dintroduire une premire dicho-
tomie quant aux principales approches. La premire classe de mthodes est la simulation de la
perception et la seconde, selon une cole de pense oppose qui rpond lintrt de repro-
duire un champ acoustique sur une zone plus ou moins tendue, est la simulation de champs
acoustiques [Evans et al., sans date; Lennox et al., 1999]. Cette premire distinction de deux
approches gnrales est reprsente au tableau 2.1 et est illustre par quelques exemples pra-
tiques.
Ainsi, lensemble de ce qui est couramment identi comme des technologies binaurales
appartient la simulation de la perception. De telles technologies supposent, avec raison, que
la seule reproduction de la pression acoustique aux tympans de lauditeur peut tre efcace lors
de la reproduction dune impression spatiale auditive. La validit de cette hypothse repose sur
un fait maintenant bien connu et vri. On sait en effet quun ltrage opre selon la direction
darrive (par rapport loreille externe qui inclut le buste, la tte et le pavillon de loreille) des
fronts donde [Puddie Rodgers, 1981]. Ce ltrage procure des indications binaurales qui per-
mettent la localisation auditive des sources acoustiques puisque les signaux auditifs binauraux
sont lgrement colors selon la direction darrive des fronts donde et la distance des sources
10
OBJECTIF : REPRODUCTION ARTIFICIELLE DU CARACTRE SPATIAL DE LAUDITION
Approche : simulation de la perception Approche : simulation de champs acoustiques
STROPHONIE TRADITION-
NELLE : base sur une connais-
sance de la localisation audi-
tive, elle implique des mca-
nismes de perception diffrents
de ceux de lcoute naturelle.
La strophonie inclut : la re-
production sur deux canaux,
sur plusieurs canaux et mme
sur couteurs. La strophonie
est caractrise par la cration
de lillusion dune image fan-
tme. Lillusion dpend de la
fusion, par laudittion, dim-
pulsions dcales dans le temps
[Snow, 1953]. Avec un accrois-
sement du nombre de canaux,
on tend vers la simulation de
champs acoustiques.
TECHNIQUES BINAURALES :
bases sur linclusion du l-
trage acoustique des oreilles
externes dans la reproduction.
Ces techniques incluent : len-
registrement avec tte factice
ou manequin, lenregistrement
binaural sur une tte dhumain,
la synthse binaurale (ltrage
a posteriori par des HRTFs),
la reproduction binaurale sur
casque ou sur haut-parleurs
(avec rduction de la diapho-
nie). Les mcanismes de per-
ception solicits par ces tech-
niques correspondent ceux
rencontrs en coute naturelle
avec tte xe.
PROBLME INTRIEUR :
approche physique base sur
la reproduction de champs
lintrieur dune rgion
entoure de sources lec-
troacoustiques. Ce qui inclut
principalement : la WFS et
lAmbisonie. Le problme
intrieur est confront leffet
du lieu de reproduction. Si
la simulation de champs
acoustiques est effective, les
mcanismes de localisation
correspondent ceux de
lcoute naturelle [Snow,
1953]. Avec laugmentation de
la rgion dcoute jusqu un
espace semi-inni, le problme
intrieur peut rejoindre le
problme extrieur : cest
lextrapolation de champs.
PROBLME EXTRIEUR : ap-
proche physique base sur la
reproduction de champs acous-
tiques lextrieur dune sur-
face ou dun volume constitu
de sources lectroacoustiques.
Ce qui inclut essentiellement la
synthse de la directivit, la re-
production de directivits l-
mentaires comme un rayonne-
ment omnidirectionnel, etc. Si
la simulation de champs acous-
tiques est effective, les mca-
nismes de localisation corres-
pondent ceux de lcoute na-
turelle.
Tableau 2.1 Taxonomie des approches et des technologies de reproduction du caractre spatial
de laudition.
correspondantes. Cette lgre coloration suft nous permettre de localiser inconsciemment,
sur la base dun apprentissage aussi inconscient, les sources acoustiques. Lapproche technolo-
gique binaurale (qui peut inclure les enregistrements binauraux avec mannequins, la synthse
binaurale ou mme le ltrage binaural des prises de sons directes par les rponses impulsion-
nelles des oreilles externes) de la reproduction spatiale du son appartient donc la simulation
de la perception puisque cette solution technologique inclut une partie de la chane de la percep-
tion auditive, loreille externe dans ce cas. Les techniques de prises de sons et de strophonie
conventionnelles se basent quant elles sur lobservation et consquemment sur la connaissance
des phnomnes de la perception auditive pour tablir des rgles de mixage (images fantmes
par le biais de la strophonie dintensit ou de dlai, pseudo-stro par distribution frquen-
tielle, sensation diffuse en fonction de la cohrence, etc.). Encore une fois, une part de la chane
de la perception spatiale du son est prise en compte par le biais dexpriences et dobservations
des perceptions rsultant de certaines actions typiquement audio ralises la prise de son ou
en studio. Ce qui motive galement lappartenance des techniques de strophonies convention-
nelles (peu importe le nombre de canaux) la classe de la simulation de la perception.
Peu de systmes sont fonds sur une approche dite de simulation de champs acoustiques,
11
quoique les quelques dernires annes ont donn naissance plusieurs recherches qui abondent
en cette voie. Le nombre de sources de reproduction et le traitement de signal impliqus en simu-
lation de champs sonores sont, tous deux, plus importants que ceux voqus par une approche
de simulation de la perception. Tel que mentionn brivement plus tt, lhypothse propre la
simulation de champs acoustiques est la suivante : en reproduisant un champ acoustique dans
lespace (ou dans une partie plus ou moins grande de lespace) avec une dle distribution
spatiale de la pression, le systme auditif complet (ce qui inclut le ltrage naturel par loreille
externe) sera excit par un stimulus physique qui correspondra au stimulus virtuel, soit celui
que lon cherche reproduire. Clairement, la tche est plus de type physique et ne peut plus tre
atteinte par la seule comprhension thorique ou intuitive de la perception spatiale du son. La
Wave Field Synthesis (WFS) [Verheijen, 1998], comme son appellation le suggre, est une
mthode de simulation de champs acoustiques puisque le systme tente de reproduire un champ
acoustique donn dans une zone entoure par des haut-parleurs. La cration dun motif de di-
rectivit synthtique autour dune source qui peut inclure plusieurs transducteurs lectroacous-
tiques est aussi un exemple de technologie qui appartient la simulation de champs acoustiques.
Ces deux problmes prsentent une certaine dualit. Le premier type (reproduction dun champ
acoustique lintrieur dun rseau de sources comme pour la WFS) est un problme intrieur
et le deuxime type (reproduction dune directivit synthtique autour dune source complexe)
est un problme que lon pourrait qualier dextrieur (voir tableau 2.1). Cette nouvelle division
a dimportantes rpercussions sur les enjeux physiques et technologiques propres ces deux
objectifs complmentaires. On note par exemple que le problme extrieur est plus simple que
le problme intrieur puisque dans le cas du problme extrieur, lobjectif est formul dans des
conditions de champ inni. Pour le problme intrieur, lobjectif est formul pour une salle
relle et le couplage entre le systme de reproduction et la salle doit donc tre pris en compte,
ce qui introduit la principale difcult du problme intrieur auquel nous ferons face. La tech-
nologie ici introduite est principalement relie la WFS. Il sera par contre dmontr que cette
mme technologie peut aussi fournir une approximation lAmbisonie.
2.3 Aperu de lhistorique de la reproduction audio
Ds son origine, le problme de la reproduction audio migre, danne en anne et de pro-
grs en progrs, vers de nouvelles proccupations sans cesse renaissantes. Alors quaux ori-
gines, la seule ide de projeter acoustiquement un enregistrement reprsentait une utopie aux
aspects presque spcieux ou farfelus [Borwick, 1988; Ballou et al., 1991] ; il en est tout au-
12
trement actuellement. Le ferme dsir damliorer la qualit, ou lapproximation du ralisme,
de la reprsentation, auditive dans ce cas, presse chercheurs et dveloppeurs vers de nouveaux
achoppements surpasser pour transcender ltat prsent de la reproduction audio.
Au dpart, les problmes et ds technologiques concernent principalement la transduction
lectroacoustique. Des efforts sont alors dploys pour minimiser la prsence de distortions non-
linaires dans lopration de transduction de signaux lectriques vers des signaux acoustiques.
Cest plutt partir du moment o Ader ralisa sa dmonstration Paris en 1881, soit le premier
exemple connu de transmission multipiste [Malham et Myatt, 1995; Sterne, 2003], que lhistoire
de laudio nous concerne.
Suivant la tentative dAder, des travaux sont entams aux laboratoires du tlphone Bell en
1931 [Davis, 2003; Malham et Myatt, 1995]. Lobjectif est alors dtendre la zone dcoute
une audience forme de plusieurs auditeurs en recrant un front donde, ce qui ntait pas
le cas avec lexemple dAder (assurment plus proche de la simulation de la perception). Le
principe explor est simple, les chercheurs alimentent directement un rseau de haut-parleurs
partir des signaux provenant dun rseau de microphones semblable au rseau de haut-parleurs.
lpoque, les chercheurs concluent quil est possible dobtenir une reproduction satisfaisante
avec trois capteurs et trois haut-parleurs. Il est intressant de noter que cette conguration cor-
respond de prs la disposition actuelle des trois canaux frontaux des systmes Surround 5.1
qui, encore aujourdhui, soit plus de 70 ans plus tard, suscitent, entre les ingnieurs du son, de
nombreux dbats au sujet des mthodes de mixage et denregistrement qui devraient tre privi-
lgies avec de tels systmes [Rumsey, 2001; Williams, 2003]. Avant den arriver un certain
niveau de satisfaction subjective avec un nombre rduit dlments de transduction, les cher-
cheurs avaient commenc la reproduction de fronts donde avec plusieurs transducteurs : sur
la base du principe de construction de Huygens. Ces expriences illustrent la dgnration du
problme de reproduction de champs acoustiques par WFS vers le problme de reproduction
strophonique.
Dans la mme priode, Blumlein labore des lois de panoramisation (dcoulant dune dni-
tion de mthodes de prise de son avec deux microphones) et une quantit considrable dautres
techniques audio [Snow, 1953; Blumlein, 1933; Davis, 2003]. Par le biais de ces rgles de
panoramisation empiriques, il cherche produire une bonne illusion quant la prsence de
sources fantmes entre les haut-parleurs de systmes strophoniques deux canaux [Malham
et Myatt, 1995]. Ces importantes rgles de panoramisation et denregistrement (comme la po-
pulaire paire de microphones concidents qui mise sur une strophonie dintensit [Rumsey,
13
2001]) sont encore massivement utilises aujourdhui [Rumsey, 2001] malgr un lancement dif-
cile lpoque. Les travaux de Blumlein restent peu connus jusque dans les annes cinquante.
Cest au dbut des annes cinquante que les compositeurs des coles dites de musique
concrte et delektronische musik sintressent fortement au principe de la reproduction sur
support multipiste [Malham et Myatt, 1995; Blesser et Salter, 2007]. Une bonne part dentre eux
construisent leurs propres systmes avec, parfois, leurs propres lois de panoramisation et poten-
tiomtres de panoramisation. Cette dcennie semble dailleurs prolique en terme de musique
spatiale, comme lidentie Pierre Schaeffer [Malham et Myatt, 1995]. Cest en cette mme p-
riode, en 1958, que Varse produit Pome lectronique avec lexpertise de Philips Corporation.
Le systme comporte jusqu 400 haut-parleurs et prs de deux millions de visiteurs ont eu loc-
casion dassister la diffusion de la pice sur ce systme. Ce dernier, le plus important construit
lpoque, comporte deux lacunes : son utilisation est complexe, voire singulire, et ne repose
pas sur une comprhension de la localisation du son par lhumain [Malham et Myatt, 1995]. Fait
intressant ce sujet, les applications commerciales de la reproduction se limitent initialement
la reproduction monophonique (ce qui reprsente donc une rduction du caractre spatial de
la musique auparavant naturellement spatiale) alors que les compositeurs oeuvrant avec lenre-
gistrement sur support xe incluent ds le dpart des considrations au sujet du caractre spatial
de la reproduction, aussi simples soient elles [Bayles, 1992].
Pendant ce temps, la strophonie deux canaux pntre la sphre commerciale, parvient
ainsi aux salons des auditeurs [Davis, 2003] et atteint une acceptation massive ds les annes
soixante.
Tout au long de cette vaste priode davancements relativement lents et ponctuels, les efforts
sont limits par les technologies analogiques de lpoque. Avec lavnement des reprsentations
numriques des signaux et de leurs traitements [Zlzer, 1997], les possibilits stendent en une
foule de directions, laissant entre autres place une nouvelle effervescence dans la reproduc-
tion spatiale des enregistrements audio. De nouvelles solutions au problme de la reproduction
spatiale voient le jour.
Les exemples prcdents, dont limportance historique est considrable, ne sont que des
avances ponctuelles, en dehors defforts de standardisation. Cest lindustrie audio qui a le
mrite de proposer certains standards au sujet de la reproduction sur des systmes plusieurs
canaux. Nous ne ferons mention que des systmes Surround 5.1 (soient les systmes multi-
pistes les plus populaires lheure actuelle, ils incluent trois sources lavant pour la diffusion
14
du matriel principal, deux sources larrire pour lambiance et un transducteur pour les ex-
trmes graves). Le format 5.1 qui, grce la vague de popularit des systmes de cinma-
maison, sinstalle de plus en plus solidement dans le march des consommateurs domestiques
prsente trois dsavantages importants du point de vue de la perception spatiale : (1) une zone
dcoute optimale limite un seul auditeur, (2) limpossibilit de crer des sources fantmes
latrales situes entre les haut-parleurs avant et arrire (3) limprative ncessit de respecter
assez rigoureusement la conguration prescrite par les standards an dobtenir une image audi-
tive optimale
8
. Dautres systmes tel le 7.1 ou le 10.2 furent proposs plus ou moins rcemment
pour des applications en salles de cinma. Les principes qui supportent cette faon de faire sont
les mmes que dans le cas du 5.1. Dun autre ct, ces systmes complexient la tche des
ingnieurs du son en charge du mixage puisque le nombre de pistes formant la copie matresse
de lenregistrement devient passablement important. Mme si les systmes Surround com-
portent un nombre plus important de canaux, les approches se basent plus souvent quautrement
sur des strophonies dintensits et temporelles issues des expertises en strophonie deux
pistes. Avec laccroissement du nombre de canaux en strophonie, on se dirige vers la WFS o
les mthodes doivent changer compltement.
Dautres types de systmes, souvent proprits de compagnies, existent ; on pense aux dif-
frents systmes dencodage matriciel et quelques formats numriques particuliers
9
. Malgr
la simplicit relative de tels systmes soit un simple accroissement du nombre de canaux
un bon nombre de recherches et de publications traitent de ce sujet [Rumsey, 2001; Nakanaya-
shi, 1975]. Ces technologies restent dans le domaine de la strophonie : la cration de sources
fantmes entre les sources relles sur la base de la simulation de la perception. Dans ce cas,
lespace des sources virtuelles perues est limit la ligne ou la surface reliant la position
des sources relles. Cest leffet de dme sur lequel on projette des sources virtuelles. Dans un
contexte de reproduction de champs acoustiques, on peut potentiellement quitter cet effet de
dme pour produire des sources virtuelles devant et derrire cette surface imaginaire.
Cette brve section ddie lhistorique de la reproduction audio sachve ici. La prochaine
section aborde plus en dtail dautres mthodes qui furent et demeurent proposes titre de
solutions pouvant remplacer celles qui se parent du qualicatif multipiste dans sa forme la plus
simple. Ainsi, lensemble des systmes prsents dans le cadre historique de la prsente section
8
Un systme de reproduction 5.1 doit en effet respecter le standard ITU-R BS.775 [Rumsey, 2001] qui prescrit
la position angulaire des haut-parleurs.
9
Considrons Dolby Stereo, Dolby EX, Dolby Digital, DTS, Sony SDDS Prologic, Circle Sur-
round et Lexicon Logic 7 pour nen nommer que quelques-uns [Rumsey, 2001].
15
nutilise rien dautre que laccumulation de canaux sans technique particulire ou automatique
(sauf dans de rares cas). Seul lingnieur de son, prpos au mixage, et les producteurs sont
responsables de la dtermination manuelle de ce qui est envoy comme signal chacun des haut-
parleurs [Davis, 2003]. Ce nest pas le cas des mthodes introduites dans la section suivante.
2.4 Les techniques rcentes et novatrices
Sur une priode qui couvrirait, disons les quelques dernires dcennies, plusieurs applica-
tions aux caractres novateurs sont prsentes par les chercheurs. Tel quil fut indiqu plus haut,
le caractre novateur est principalement caractris par la rupture avec des mthodes pour les-
quelles les haut-parleurs sont simplement aliments par des signaux prpars ltape de la
production suivant une tradition strophonique. Les techniques de reproduction ci-aprs intro-
duites se distinguent grandement de cette faon de faire dont une part sapproche plus de notre
propre intention. Les systmes ne sont pas considrs selon un ordre chronologique gnral,
mais plutt selon la classication des mthodes telle quintroduite au tableau 2.1 la page 11.
Laccent est plac sur les techniques binaurales et, plus particulirement, sur la reproduction de
champs acoustiques pour le problme intrieur. La dernire section de ce chapitre est ddie aux
quelques publications qui touchent de trs prs la prsente recherche.
2.4.1 Techniques binaurales et rduction de la diaphonie
La souplesse, la lgret et la popularit de la strophonie deux canaux sont telles que
le dveloppement des techniques binaurales a prcd celui des autres mthodes plusieurs ca-
naux. La premire reproduction binaurale base sur un enregistrement avec mannequin et tte
factice remonte 1933 [Davis, 2003]. Les techniques binaurales regroupent lensemble des m-
thodes de reproduction sur casque dcoute ou avec haut-parleurs qui tentent de reproduire
dlement la pression acoustique aux tympans de lauditeur, on parle donc de simulation de la
perception (voir le tableau 2.1 la page 11) puisque loreille externe est prise en compte dans
le processus de reproduction. Les exemples dapplications les plus connus, et beaucoup plus
rcents, sont le ltrage par HRTF (Head-Related Transfer Function) reproduit sur casque
dcoute [Noisternig et al., 2003; Cheng et Wakeeld, 2001; Boulanger, 2000; Gardner, 1998;
Kendall, 1995a; Begault, 1994], la transauralisation (une des traductions de cross-talk cancel-
lation ; nous utiliserons systmatiquement par contre, au lieu de cette expression, lexpression
16
rduction de la diaphonie) [Cooper et Bauck, 1989] et lauralisation [Kleiner et al., 1993] sur
couteur (reproduction dun environnement acoustique virtuel avec simulation des rexions).
Le peu de ressources physiques ncessaires ldication de tels systmes a favoris le dvelop-
pement dune foule de plugiciels, et dapplications. Lusage de ces techniques est habituellement
efcace dans loptique de la perception mais limit, par contre, un seul auditeur et afche
certaines variations des sensations selon les auditeurs, soit une consquence du caractre indivi-
duel des HRTF [Kleiner et al., 1993]. Il est aussi admis que beaucoup de gens napprcient pas
spcialement les couteurs parce quils sont drangeants, inconfortables et parce quils favo-
risent une situation dcoute antisociale [Camras, 1968]. De plus, les systmes binauraux qui ne
disposent pas dadaptation en fonction du mouvement de la tte de lauditeur gnrent souvent
des impressions et des vnements auditifs intracrniens.
2.4.2 Reproduction de champs acoustiques par synthse de champs acoustiques (WFS) pour
le problme intrieur
Dans un autre ordre dides, qui correspond plus la prsente recherche, des travaux de
recherche furent entams par Berkhout en 1988 [Berkhout, 1988]. ce moment, Berkhout pro-
pose le contrle des champs acoustiques laide de lholographie (holographic ACS : Acoustic
Control System)
10
. Les applications prsentes par lauteur concernent alors principalement
la sonorisation (spectacles, concerts ou confrences). Cette premire publication de Berkhout
reprend plus rigoureusement, en incluant une analyse thorique, les premiers essais exprimen-
taux de Steinberg et Snowdes annes 30 qui furent raliss aux laboratoires Bell [Rumsey, 2002]
(voir section 2.3). Les travaux de Berkhout ce sujet peuvent tre aussi relis une prcdente
proposition de Camras en 1968 [Camras, 1968] principalement intuitive, mais nanmoins
base partiellement, elle aussi, sur le principe de Huygens. Il semble que la problmatique
lorigine du dveloppement initial de lACS soit simplement lamplication des champs acous-
tiques directs. Le systme ACS se base sur la formulation intgrale de Kirchhoff-Helmholtz.
Selon une des interprtations de cette formulation intgrale, un champ de pression acoustique
contenu dans un volume V volume dont la limite serait une surface S est uniquement d-
ni par la pression et le gradient de pression (normal S) valus sur S lorsquil ny a pas de
sources acoustiques dans V [Williams, 1999]. Considrant ce concept typique des phnomnes
ondulatoires, Berkhout remplace la version bidimensionnelle de S par une ligne L de sources
10
Mme si la terminologie avance par Berkhout utilise le terme contrle, il faut noter que le systme ne
comporte pas de contrle comme on lentend habituellement : le systme de Berkhout est un systme en boucle
ouverte.
17
dont chacune des alimentations est dnie par des oprateurs de synthse valus partir de la
formulation de Kirchhoff-Helmholtz pour la conguration de sources considre. Linclusion
de la reproduction des rexions et de la rverbration a suivi an de proposer une mthode,
moindres cots, de modication de lacoustique des salles [de Vries et Boone, 1999]. De tels
systmes ont t installs avec succs, au moins lUniversit de Delft (Delft, Hollande) et
lUniversit York (Toronto, Canada) [Berkhout, 1988] ds les annes quatre-vingt. Depuis les
quelques dernires annes, plusieurs installations de WFS ont t construites dans le monde.
Dautres parutions de Berkhout suivent plus tard [Berkhout et al., 1992, 1993].
Progressivement, cette bauche de Berkhout devient ce qui est maintenant identi comme
la WFS (Wave Field Synthesis)
11
[Verheijen, 1998]. Les premires dnitions de la WFS
sappliquent lacoustique des salles, soit comment modier certains paramtres tel le son
pseudo-direct, les premires rexions et la rverbration [Berkhout et al., 1993]. Le groupe
de recherche met laccent sur une solution de volume, an de couvrir une certaine audience,
et tente de reproduire, dans les domaines temporel et spatial, les fronts dondes dans la zone
dcoute. Les mthodes proposes, qui ont volu avec les annes, incluent quelquefois des
hypothses relatives la perception auditive, mais la base de solution repose toujours sur la
formulation intgrale de Kirchhoff-Helmholtz. Tel quintroduit plus tt, le systme typique de
WFS comporte une importante quantit de haut-parleurs et lusage doprateurs de synthse
en boucle ouverte qui permettent de dterminer les signaux fournir lensemble des haut-
parleurs selon la position, et le type, de sources virtuelles alimentes par des enregistrements
numriques monophoniques. Les oprateurs de synthse dcoulent de certaines simplications
de la formulation de Kirchhoff-Helmholtz. Ces simplications progressent comme suit : dun
volume V ni vers un volume V semi-inni, dune intgration de surface vers une intgration
de ligne laide de la mthode dapproximation de la phase stationnaire puis, nalement,
dune reprsentation continue vers une reprsentation discrte [Verheijen, 1998]. La section A.5
la page 327 introduit le dveloppement des oprateurs de synthse de la WFS. On note aussi
que le dveloppement de la WFS assume que les espaces virtuels et de reproduction sont des
espaces innis. Les systmes WFS, dans leur forme fondamentale, ne tiennent donc pas compte
du lieu de reproduction. Cest une limitation considrable.
Les sources virtuelles, planes ou sphriques, doivent tre agences dans un espace virtuel,
11
La traduction littrale de WFS (synthse de champs acoustiques) peut tre prise avec un sens gnrique, soit
toute reproduction synthtique de champs acoustiques. Dun autre ct, les travaux de Berkhout et de ses collabo-
rateurs sapproprient lappellation WFS pour dcrire une technique bien spcique de reproduction. Le lecteur est
donc pri de conserver ces subtilits lesprit tout au long de la lecture de cette thse.
18
celui que le systme tente de reproduire dans la zone de reproduction. Lutilisateur doit compo-
ser manuellement une scne (position des sources directes, cration des premires rexions et
imitation de la rverbration [de Vries et al., 1994a]). En comparaison avec les systme stro-
phoniques usuels, le gain en ralisme et exibilit est des plus remarquables. Certains recherches
rcentes sur la WFS concernent lutilisation dantennes de microphones pour la prise de son et
lextrapolation de champs acoustiques pour WFS [Hulsebos et de Vries, 2002; Hulsebos et al.,
2003; Hulsebos, 2004], ce qui accrot la correspondance entre champ virtuel et un champ rel
capt qui devient un champ virtuel reproduire. Avec une telle approche, il est possible def-
fectuer une prise de son de type WFS. Le passage de cette prise de son jusqu des sources
de reproduction pour WFS est direct et ltape de description dune scne virtuelle est alors
escamote.
Les chercheurs impliqus dans le dveloppement des systmes de type WFS se penchent sur
diffrents problmes au cours des annes. Des exemples dtudes et davancements, thoriques
ou exprimentaux, peuvent tre cits : effet de la discrtisation de la formulation intgrale [Ve-
rheijen, 1998; Boone et al., 1995; Berkhout et al., 1993; Start et al., 1995], effet de lespace de
sparation des sources de reproduction [de Vries et al., 1994b; Verheijen, 1998; Boone et al.,
1995; Berkhout et al., 1993; Corteel, 2006b; Spors et Rabenstein, 2006], effet du caractre ni
des sources [de Vries et al., 1994b; Verheijen, 1998; Boone et al., 1995; Berkhout et al., 1993],
effet et correction de la directivit des sources de reproduction [Berkhout et al., 1995], cration
distincte de champs directs, des premires rexions et de la rverbration dun lieu synthtique
ou dune salle relle couple un systme lectroacoustique [Boone, 2001; de Vries et Boone,
1999; Verheijen, 1998; Berkhout et al., 1993; de Vries et al., 1994a; Berkhout et al., 1995;
Pelligrini, 2002], diffrents types doprateurs de synthse en relation avec le type de source
(monople ou diple) utilis pour la reproduction [Berkhout et al., 1995], effet de la distance de
la source virtuelle par rapport aux sources de reproduction [Apel et al., 2004], effet et erreurs
damplitude [Sonke et al., 1998], prise en compte des motifs de directivit des sources de re-
production et des sources virtuelles [de Vries, 1996; Jacques et al., 2005], analyse de champs
par WFA (Wave Field Analysis) [de Vries et Boone, 1999], techniques denregistrement et
de composition de scne pour WFS [Boone, 2001], transmission multipiste [Horbach et Boone,
1999], utilisation de DSP [Boone, 2001], prise de son WFS avec antennes circulaires de capteurs
[Hulsebos, 2004], valuation de la performance de la WFS en salle relle [Boone et Verheijen,
1997; Klehs et Sporer, 2003; Sporer et Klehs, 2004], inclusion de la compensation des salles
de reproduction par inversion des transmissions lectroacoustiques en aval des oprateurs de
synthse [Spors et al., 2003a, 2004; Petrausch et Rabenstein, 2006; Spors et al., 2005a; Fuster
et al., 2005], utilisation de panneaux-actionneurs ou de haut-parleurs lectrostatiques pour rem-
19
placer les haut-parleurs lectrodynamiques [Verheijen, 1995; Boone, 2001; Kuster et al., 2005;
Spors et al., 2005b], effet de la perception et compatibilit vers des formats strophoniques 2-0
[Boone et al., 1995; Berkhout et al., 1995]. Certaines de ces rfrences sont publies en mme
temps que cette thse est produite.
lorigine, les travaux fondamentaux de Berkhout prennent place lUniversit Technique
de Delft (Hollande), la formation du groupe de recherche europen CARROUSO multiplie les
recherches et la convergence des travaux vers des applications commerciales [Fraunhofer, Insti-
tut Integrierte Schaltungen, 2003; Brix et al., 2001; Vnnen et al., 2002]. LUniversit McGill
Montral (Canada) a rcemment (en 2003-04) reu un systme de WFS (de Fraunhaufer)
pour un an. Les rsultats dexprimentation avec ce systme sont prsents au chapitre 4 de
cette thse. Le projet CARROUSO sest achev tout rcemment, de nouveaux dveloppements
pratiques et fondamentaux sont effectus au sein des anciens protagonistes du CARROUSO.
Considrant laccroissement de la popularit de ce sujet depuis 2000, un bon nombre dautres
chercheurs en dehors de CARROUSO se penchent sur le sujet.
Mme si cette section a couvert la WFS seule, dautres liens thoriques importants entre
WFS et Ambisonie sont cits la section 2.4.4. La section A.5, la page 327, prsente, quant
elle, tout le dveloppement thorique de la WFS ncessaire sa ralisation pratique.
2.4.3 Applications issues du contrle actif et du ltrage adaptatif
Considrons maintenant les travaux qui abordent la reproduction de champs avec une ap-
proche plus prs du contrle actif et du ltrage adaptatif, soit une faon de faire plus proche des
intentions lorigine de cette thse. Le concept, dans toute sa gnralit, est illustr la gure
2.1 (p. 21). Cette gure prsente un schma fonctionnel gnrique dun systme de reproduction
de champs de pression adaptatif. Sur cette illustration, on peut identier le contrleur adaptatif
(W), le systme lectroacoustique (C), les pressions acoustiques reproduire, la pression re-
produite, lerreur de reproduction (value aux points dgalisation
12
), les commandes envoyes
aux actionneurs du systme et les rfrences utilises en amont du contrleur. Selon la dnition
des signaux de rfrence, des pressions reproduire et de la structure du contrleur, diffrents
problmes peuvent tre reprsents, y compris lgalisation temporelle et frquentielle en plus
12
On note au passage quil est possible de travailler avec des points dgalisation dans un espace transform.
Ainsi, il est pensable dgaliser les amplitudes complexes des coefcients dune reprsentation transforme dun
champ acoustique rel [Spors et al., 2003a; Betlehem et Abhayapala, 2005].
20
Figure 2.1 Schma fonctionnel gnrique dun systme de reproduction audio adaptif
du contrle actif classique utilis dans lattnuation du bruit ou des vibrations. Selon la struc-
ture de la prescription des pressions reproduire, on pourra considrer un problme adaptatif de
reproduction spatiale de champs acoustiques.
En 1989, les premiers travaux dElliott et de Nelson [Elliott et Nelson, 1989] sur le su-
jet portent sur lgalisation en des points multiples laide du ltrage adaptatif dans une salle
dcoute. Lobjectif de ces travaux est dobtenir une galisation frquentielle dsire en plu-
sieurs points de la salle de reproduction laide de ltres adaptatifs (rcursifs [IIR Innite
Impulse Response] et non rcursifs [FIR Finite Impulse Response]) en amont des haut-
parleurs. On parle alors de dcoloration. Le problme considr par Nelson en est un de dlit
temporelle (soit reproduire, le plus adquatement possible, un seul signal audio en plusieurs
lieux dun espace ferm), ce type de problme est typique de lpoque alors que la dlit tem-
porelle et frquentielle prime sur la dlit spatiale. Dans le cas de lgalisation en plusieurs
points, les auteurs dmontrent que la meilleure galisation temporelle et frquentielle est obte-
nue en recrant ce qui ressemble une onde progressive plane dans la cavit. Les chercheurs
notent en fait que lgalisation frquentielle pour la reproduction dun seul et unique signal
en plusieurs points distincts est de meilleure qualit si des dlais sont introduits entre les si-
gnaux dsirs aux capteurs derreur, les dlais en question correspondent sommairement ceux
qui sont associs la progression dune onde acoustique plane. Dj, limportance et lutilit
de la dlit spatiale laissent prsager sa relation avec la dlit temporelle et frquentielle :
21
reproduire une certaine spatialit peut faciliter lgalisation frquentielle
13
.
Dautres articles sur lgalisation, linversion des parcours acoustiques et le ltrage adaptatif
furent publis par ces mmes auteurs et coauteurs [Nelson et Elliot, 1992; Elliott et al., 1994;
Kirkeby et al., 1995; Uto et Hamada, 1995; Nelson et al., 1996b].
Seules les conclusions importantes de ces ouvrages seront cites. En 1992, ces chercheurs
publient, avec Hamada, un nouvel article sur lgalisation multipiste mais les chercheurs in-
cluent aussi un objectif daffaiblissement de la diaphonie (crosstalk cancellation) [Nelson et
Elliot, 1992]. Les signaux dorigine sont, par exemple, des enregistrements raliss avec un
mannequin tte factice. Cette fois, ladaptation ralise par un contrle par anticipation
(feedforward) est utilise initialement pour dterminer les ltres inverses qui minimisent
la coloration du systme et de la salle en plus de rduire leffet des deux parcours controlat-
raux
14
. Cest donc une solution locale. Une fois ladaptation ralise, les capteurs peuvent tre
soustraits du systme qui, en mode de reproduction, nest plus adaptatif. Des essais exprimen-
taux sont raliss dans la suite de cette tude thorique. Une deuxime partie de larticle traite
thoriquement du cas multipiste gnrique alors quun systme de contrle adaptatif tente de
minimiser la somme des erreurs de reproduction (entre pression reproduite et pression repro-
duire toutes deux values aux capteurs) quadratiques en plusieurs points dans le but dtendre
la zone dgalisation ; la solution est donc, pour ce nouveau cas, une solution de volume.
En 1994, Elliott et al. [Elliott et al., 1994] publient leurs rsultats de recherche exprimentale
sur le mme sujet appliqu lgalisation piste unique dans une voiture. En 1995, Nelson et ses
collaborateurs prsentent la suite de leurs recherches thoriques sur lgalisation [Kirkeby et al.,
1995]. Les auteurs dmontrent dans quelles conditions, et de quelle faon, il est possible dinver-
ser exactement la fonction de transfert qui reprsente la transmission lectroacoustique dun sys-
tme de reproduction (soit des commandes aux transducteurs jusquaux pressions acoustiques
aux points dcoute) qui comporte habituellement des composantes dphasage non-minimal
15
13
Ce point est qualitativement cit par les auteurs mais ne fait pas, en cet article [Elliott et Nelson, 1989], lobjet
de simulations spciques.
14
Le qualicatif controlatral rfre, dans ce cas, aux parcours prsents du haut-parleur de gauche loreille
droite et vice versa. La prsence de parcours controlatraux engendre la diaphonie.
15
Ce genre de composantes appartient des systmes dits non-minimumphase qui, en reprsentation discrte,
comportent des zros lextrieur du cercle unitaire du plan complexe des z. Un tel systme est dit dphasage
non-minimal parce quil existe toujours un systme similaire qui offrira le mme gain de fonction de rponse
en frquence mais un dphasage moindre que le systme dphasage non-minimal. Cet autre systme est un
systme dphasage minimal pour lequel tous les ples et les zros sont lintrieur du cercle unitaire. Les
zros de ce systme sont les rciproques et conjugus complexes des zros du systme dphasage non-minimal
22
partiellement dues la prsence de dlai de propagation inhrent aux phnomnes acoustiques
[Neely et Allen, 1979]. Lintroduction dun dlai de modlisation permet linversion adaptative
dun systme dphasage non-minimal
16
. Encore une fois, le ltrage adaptatif est utilis.
En 1996, Nelson et ses collaborateurs publient leurs travaux, toujours sur lgalisation adap-
tative en plusieurs points, pour des applications pratiques et proposent, entre autre, un systme
de compensation pour la position non idale des haut-parleurs [Nelson et al., 1996b]. En cette
publication, les auteurs remarquent que la minimisation dun cart quadratique de reproduction
(dlit temporelle et frquentielle) ne garantit pas les meilleurs rsultats en terme de percep-
tion. Ces travaux abordent aussi la possibilit de crer un environnement virtuel avec cette ap-
proche. On note aussi quune thse de doctorat, par Ordua-Bustamante lISVR, concerne
le dveloppement dune mthode de traitement de signal pour des hautes frquences dchan-
tillonnage (tel 44.1kHz, le standard audio actuel le plus courant) [Nelson et al., 1996b], ce que
lauteur identie comme sparse update algorithms ou sparse adaptation [Elliott, 2001]. Ces
techniques offrent, comme principal avantage, la possibilit deffectuer lajustement des coef-
cients de ltres, un chantillon donn, avec un temps de calcul indpendant de la longueur
du ltre [Nelson et al., 1996b; Elliott, 2001]. Deux autres articles sont publis par Kirkeby et
Nelson en 1999 [Kirkeby et Nelson, 1999; Kirkeby et al., 1999]. On y remarque dabord luti-
lit dune rgularisation (dune pnalisation de la commande) ltre pour le problme audio du
ltrage optimal [Kirkeby et Nelson, 1999]. Les auteurs utilisent aussi des ltres WFIR (pour
Warped Finite Impulse Response. Dans le cadre de cette thse, des algorithmes de traitement
de signal adaptatif simples et appliqus des ltres non-rcursifs FIR sont modis et mis en
oeuvre pour la reproduction de champs acoustiques tout en proposant une hybridation entre
contrle et WFS. Cest laspect principal de la partie de la thse ddi au traitement adaptatif
des signaux.
Suivant ces recherches sur lgalisation, dautres travaux raliss lISVR (Institute of
correspondant. Un systme dphasage non-minimal peut toujours tre reprsent par une cascade du systme
dphasage minimal quivalent et un dphaseur pur (all-pass) [Oppenheim et Schafer, 1989].
16
Cette ralit est dmontre par Widrow dans le contexte gnral du contrle inverse adaptatif [Widrow et
Walach, 1995]. Lintroduction dun dlai de modlisation permet la ralisation adaptative dun ltre causal
et stable. Linversion directe dun systme dphasage non-minimal produisant deux solutions possibles (une
squence discrte causale mais instable et une squence discrte non-causale mais stable), il est dmontr que
la solution adaptive approche la squence non-causale, mais stable, dans la mesure o la prsence dun dlai
de modlisation pousse la partie non-causale dans la rgion ralisable dun ltre adaptatif. Dans le cadre de cette
thse, on utilise un dlai de modlisation variable. Selon Widrow, les meilleures inversions ralisables sont obtenues
lorsque le dlai de modlisation correspond au nombre de coefcients du ltre adaptatif divis par deux.
23
Sound and Vibration Research), sous le nom de projet Virtual Acoustics Project, sont rali-
ss par Nelson, Elliott et leurs collaborateurs. Ces recherches concernent le caractre spatial de
la reproduction audio, soit la reproduction de champs acoustiques ou denvironnements acous-
tiques virtuels. Ces mmes travaux entams par Kirkeby et Nelson relient plus fortement le
caractre spatial de la reproduction haute-dlit avec les techniques de contrle actif du son.
Le premier article des auteurs sur ce sujet semble tre publi en 1993 [Kirkeby et Nelson, 1993].
Dans cet article teneur exclusivement thorique, les chercheurs tudient la possibilit de re-
crer en champ libre une onde harmonique progressive plane avec des systmes de reproduction
deux ou quatre sources. Le problme est formul avec une approche typique en contrle actif,
soit la minimisation dune fonction cot. Il est intressant de noter que pour ces simulations,
les auteurs considrent la reproduction dun champ sur une zone limite un carr de 0.5 m de
ct, qui correspondrait la position dun seul auditeur. En conclusion, les auteurs proposent
un systme quatre voies centrales an de recrer plus efcacement des fronts dondes plans
jusqu des plus hautes frquences. Lapproche de Kikerby est dveloppe plus profondment
au chapitre 5. En 1994, Nelson [Nelson, 1994] publie des rsultats similaires avec de nouvelles
considrations, toujours laide de minimisations, au sujet de la reproduction directionnelle, de
la ralisation de ltres optimaux dans le domaine des frquences procurant le champ acous-
tique dsir, de la ralisation de ltres non rcursifs, ou rcursifs, optimaux dans le domaine
temporel, de lchantillonnage spatial et de lamlioration des systmes de reproduction stro-
phoniques actuels par le biais de la cration de sources virtuelles. La mthode propose pour
construire des sources virtuelles est soumise une valuation subjective en 1995 [Ordua et al.,
1995]. Selon cette valuation la localisation des sources virtuelles suit passablement la locali-
sation de sources relles (sauf pour quelques exceptions, notamment au sujet de la confusion
devant-derrire).
Un nouvel article est prsent par Kirkeby, Nelson, Ordua-Bustamante et Hamada en 1996
[Kirkeby et al., 1996]. La publication porte principalement sur la reproduction locale des fronts
dondes laide du traitement de signal numrique. Cette fois, lanalyse est entirement rali-
se dans le domaine temporel an dassurer le caractre ralisable de linversion et du ltrage.
Les auteurs proposent notamment une rgle approximative pour xer la pondration de la p-
nalisation de la commande dans le problme doptimisation. Limportance de ltude du condi-
tionnement du problme est aussi mentionne. Ce systme de synthse locale est aussi valu
subjectivement en 1996 par Nelson [Nelson et al., 1996a], les conditions dcoute varient dun
espace anchoque un intrieur de voiture. Les rsultats sont convaincants mais limits une
certaine plage de direction angulaire.
24
Progressivement, les publications de Nelson de la n des annes 90 traitent du diple st-
ro un systme de reproduction local des fronts donde. Le systme, constitu de deux haut-
parleurs rapprochs est principalement utilis pour crer un son une seule oreille de lauditeur.
Il semble que cette possibilit fut introduite une premire fois en 1996 par Nelson [Nelson et al.,
1997]. Un tel arrangement de sources est rput pour simuler discrtement la combinaison dun
monople et dun diple acoustiques [Nelson et al., 1997]. Cette combinaison offre la possibi-
lit de crer une pression non nulle, de la forme dune pulsation par exemple, un seul point
(une seule oreille) en injectant une seule pulsation aux deux sources. Des sources monopolaires
loignes devraient gnrer un champ de pression spatial plus complexe pour atteindre cet ob-
jectif. Connaissant les pressions acoustiques aux oreilles reprsentatives dun champ produit
par une source virtuelle (dont la position ne correspond pas aux deux sources du systme de
reproduction), il est possible de recrer adquatement les pressions aux environs des tympans
avec le diple stro. Un article sur le diple stro est publi par Kirkeby en 1998 dans le
journal de lAES [Kirkeby et al., 1998], cet article rapporte plus de simulations et soutient les
mmes avantages au sujet de la proximit de deux sources pour reproduire localement un champ
prescrit. Dautres articles sont par la suite publis [Watanabe et al., 1999; Kirkeby et Nelson,
1999; Nelson, 2002] en 1999 et 2002, ils considrent le diple stro (DS) avec diffrentes
intentions. Ils traitent principalement dapplications au systme de tlconfrence [Watanabe
et al., 1999], dvaluation objective des impressions auditives [Watanabe et al., 1999], de la
conception de ltres numriques pour le DS [Kirkeby et Nelson, 1999], de la signication et de
limportance du nombre de conditionnement du problme inverse de la reproduction en relation
avec lOSD (Optimal Source Distribution pour la reproduction audio : distribution spatiale
optimale des sources en fonction des frquences) [Nelson, 2002; Takeuchi et Nelson, 2002;
Nelson et Rose, 2005]. Des travaux plus rcents de lISVR portent sur la distribution optimale
des sources pour la synthse binaurale, soit sur lOSD
17
.
En 1995, Asano et al. prsentent des rsultats thoriques issus de la simulation de lga-
lisation frquentielle en salle [Asano et Swanson, 1995]. Les auteurs dmontrent lgalisation
possible de la rponse en diffrents points dun espace ferm sur la base dun rarrangement
modal, le modle de cavit est celui dune cavit rigide. Tel que prsent au chapitre 5, les si-
mulations prsentes en cette thse utilisent un modle de salle plus complet de telle sorte quil
soit possible dvaluer leffet de lamortissement sur la problmatique. De plus, le chapitre 5
prsente des rsultats supplmentaires au niveau des mcanismes de contrle et du condition-
nement du systme. Asano considrait le rang des matrices de transfert pour valuer la qualit
17
Dautres publications de Nelson, entre 2000 et 2001, au sujet des problmes inverses en acoustique, sont aussi
relies au projet de reproduction de champs acoustiques ici dcrit tout autant qu lOSD.
25
objective de la position des sources et des capteurs.
En 1999, Ise publie un texte teneur thorique au sujet de la reproduction de champs acous-
tiques par la reconstruction de la pression et du gradient de pression sur une surface couverte
de capteurs de pression et de gradient de pression [Ise, 1999]. Cette solution, issue, comme la
WFS, de la formulation intgrale de Kirchhoff-Helmholtz, nest videmment pas pratique tant
donn le nombre de capteurs ncessaire pour couvrir une surface tout en vitant le repliement
spatial. Les travaux de Ise sont aussi trs proches de la suggestion de Camras [Camras, 1968]
en 1968. Spors [Spors et al., 2003a] utilise une approche similaire mais remplace la surface de
contrle par une ligne de contrle, ce qui, tel que dmontr au chapitre 5, ne peut pas vraiment
apporter les rsultats escompts en salle.
En 2001, Santilln introduit une conguration particulire pour lgalisation de la rponse
en frquence dans une salle [Santilla n, 2001]. Ces travaux sont par contre trs spciques. En
crant une onde progressive plane dans une cavit rectangulaire, les auteurs dmontrent la possi-
bilit dobtenir une bonne galisation de la rponse, dans tout le volume, en plaant des capteurs
derreur de reproduction sur les surfaces de la pice. Loriginalit de ces travaux vient donc de
lgalisation de la rponse frquentielle en produisant une onde plane selon un des axes de la
pice, des haut-parleurs couvrent les deux extrmits de la pice desquelles mergent et abou-
tissent les ondes planes, respectivement. Ainsi, mme si Santilln touche la reproduction de
champs progressifs par contrle, il sollicite cette approche pour seule n dgalisation frquen-
tielle.
Dautres parutions, relies la reproduction du son ou de champs acoustiques, par contrle
actif sont cites dans la bibliographie. Sous forme de liste, on note lutilisation dgalisation
moyenne par centrodes de groupes de rponses impulsionnelles similaires [Brix et al., 2001],
usage de ltres propres pour lannulation de signaux [Bharitkar et Kyriakakis, sans date], inver-
sion directe pour la rduction de la diaphonie [Kim et al., 2002], tude de robustesse [Radlovi c
et al., 2000], effets subjectifs [Radlovi c et Kennedy, 2000], contraintes dans le domaine fr-
quentiel [Tam et Rafaely, 2002], reproduction de booms supersoniques [Epain et al., 2004],
galisation du champ direct de la WFS [Corteel, 2006a] et mthode active pour rehausser ou at-
tnuer les niveaux de champs produits selon les rgions dcoute [Choi et Kim, 2002, 2004a,b].
Quoique seulement prsents sous forme de liste, certains de ces ouvrages sont cits dans le
corps du document an de soutenir certains arguments en cours de route.
Clairement, selon la prcdente revue de recherches, lapplication des mthodes dites du
26
contrle actif du son peuvent tre appliques aux problmatiques de la reproduction du son
dans un contexte purement audio. Des hybridations entre les systmes sont prvoir an de
consolider lavancement des connaissances avec des compromis pratiques qui permettront lim-
plantation dun systme rel.
Si les prcdents paragraphes ont su prsenter les recherches les plus inuentes en repro-
duction adaptative du son, la dernire section de la revue de littrature (section 2.5) prsente le
dtail des quelques ouvrages plus actuels et mme parfois publis pendant la ralisation de cette
thse qui sont les plus proches de la recherche prsente en ces pages.
2.4.4 Ambisonie, quelques autres mthodes et hybridations possibles
Quelques autres techniques et mthodes connues (Ambisonie, Ambiophonics, etc.), ne
seront pas toutes prsentes ici puisquelles sont trop loignes de la prsente recherche
18
. Par
contre, parmi ces travaux, on remarque une hybridation entre lholophonie (un principe trs
proche de la WFS)
19
et lAmbisonie [Nicol et Emerit, 1999] prsente en 1999. Les auteurs
dressent des parallles entre ces techniques et leurs reprsentations thoriques respectives : Ni-
col, en prsentant une approche unie, dmontre que la reconstruction Ambisonique est un
cas particulier de lholophonie (lire aussi de la WFS). Holophonie et Ambisonie de base sont
toutes deux des systmes en boucle ouverte.
Parmi ces mthodes alternatives, lAmbisonie est relie lapproche privilgie dans cette
thse. Dans sa formulation la plus simple, le principe est abordable. Les quations Ambisoniques
sont en fait dveloppes an de fournir des lois de panoramisation
20
. Une fois les quations r-
solues, on trouve des lois de panoramisation qui sont utilises directement invariantes en
pratique. Le dveloppement des quations Ambisoniques de base sexplique comme suit (il est
prsent la section dannexe A.4 la page 313). Le champ reproduire est une onde plane
dans le plan horizontal. Dcrite en coordonnes cylindriques, elle est reprsente par une srie
18
[Gerzon, 1985; Glasgal, 2003; Zmolnig et al., 2003; Strauss et al., 2003; Noisternig et al., 2003; Rdenas
et al., 2003; Yon et al., 2003; Yang et al., 2003; Cooper et Bauck, 1989; Nicol et Emerit, 1999; Malham et Myatt,
1995; Korenaga et Ando, 1993; Kleiner et al., 1993; Romano, 1987; Ahnert, 1987; Meyer, 1984; Gerzon, 1973]
19
Lholophonie est le concept de reproduction de champs acoustiques le plus gnral qui nest rien dautre que
la ralisation de la reproduction de champs partir directement de lintgrale de Kirchhoff-Helmholtz ou partir
de sa formulation par simple source [Williams, 1999].
20
Cest--dire des fonctions de distribution damplitude de gain aux sources relles de reproduction pour
diffrentes positions angulaires dincidence reproduire.
27
de Fourier-Bessel pour laquelle les coefcients correspondent des directivits harmoniques
de microphones coincidents (harmoniques cylindriques) et lorigine du repre cylindrique.
Lespace de reproduction est suppos libre et inni dans lequel on trouve des sources dondes
planes distribues uniformment sur 2 radians pour la reproduction. Ces deux hypothses sont
svres. Chaque onde plane de reproduction est reprsente par une srie de Fourier-Bessel.
Lobjectif est donc de trouver les amplitudes de chaque onde plane de reproduction en galisant
les coefcients de la srie de Fourier-Bessel qui reprsentent la contribution interfrentielle de
toutes les sources de reproduction aux coefcients prescrits par londe plane reproduire. Pour
des sources de reproduction discrtes et des sries de Fourier-Bessel tronques, on trouve un sys-
tme algbrique dquations rsoudre par la pseudo-inversion puisque le systme dquation
peut tre sous-dtermin, sur-dtermin ou dtermin. En pratique, les systmes Ambisoniques
sont pratiquement toujours sous-dtermins. Les amplitudes des ondes planes de reproduction
en fonction de langle du champ plan reproduire forment les lois de panoramisation [Poletti,
2000].
Typiquement, les lois de panoramisation de lAmbisonie donnent des fonctions sinusodales
cardinales circulaires (une fonction sinc priodique sur 2) dont la largeur du lobe central est
dtermine par lordre de troncature des sries de Fourier-Bessel utilises pour la reprsentation
des champs [Poletti, 2000]. Fait important noter, plus lordre des sries est important, plus
la fonction sinc circulaire approche un train dimpulsion priodique (toujours sur 2) et plus
la solution Ambisonique sapproche dune solution holophonique (ou WFS) pour laquelle les
sources de reproduction exposent le centre du repre cylindrique leurs zones de rayonnement
de Fraunhofer. Cest le lien thorique qui unit holophonie, WFS et Ambisonie [Poletti, 2000].
Remarque tout aussi notable, la troncature dune srie de Fourier-Bessel correspond exacte-
ment la troncature du spectre discret (obtenu par srie de Fourier) qui reprsente le spectre
angulaire priodique des ondes planes produisant un champ acoustique quelconque. En dautres
mots, puisque tout champ de pression acoustique p(r, , )
21
en deux dimensions peut-tre re-
prsent (par transformes de Fourier spatiales) en une somme dondes planes, il est possible
de dcrire ce champ p(r, , ) en terme dune distribution angulaire dondes planes S(, ).
Cette distribution tant priodique en 2, il est possible de la reprsenter par une srie de Fou-
rier discrte qui donne le spectre angulaire discret de la distribution angulaire des ondes planes
S(, ).
En retournant sur les rsultats de lAmbisonie et puisque lutilisation du pseudo-inverse
correspond exactement la solution dun problme de contrle optimal gnrique par minimi-
21
r est le rayon, langle et la pulsation dintrt.
28
sation de la somme derreurs quadratiques, on note que lAmbisonie est une thorie issue du
contrle optimal qui minimise lerreur de reproduction value sur les coefcients dune srie
de Fourier-Bessel. La ralisation pratique de lAmbisonie est par contre fait en boucle ouverte
avec les solutions idales trouves a priori ; cest une approche dite mode-matching, [Poletti,
2005]. Ce parallle motive certains aspects de cette recherche sur la reproduction de champs
acoustiques par contrle actif. Le chapitre 7 prsente en fait une ralisation pratique de lAm-
bisonie en boucle ferme, plusieurs liens avec les prcdentes remarques seront explicitement
observables. Cette dimension, et toute la comprhension du problme correspondant, forme une
des originalits de lapproche avance dans cette thse.
2.5 Les travaux rcents les plus rvlateurs par rapport aux objectifs de recherche
Parmis les travaux les plus relis la prsente thse, seuls quelques auteurs sont considrs
en dtail dans cette revue de littrature. On note que certaines publications, ici revues, furent
publies pendant la ralisation de cette recherche.
Lun des travaux les plus intressants dans le cadre de cette revue est celui de Garas [Garas
et Sommen, sans date; Garas, 1999; Druyvesteyn et Garas, 1997] dont la part la plus importante
fut compile dans un livre en 1999 [Garas, 1999]. Le chercheur tudie la problmatique du point
de vue du traitement de signal. Les propositions concernent lusage dune stratgie dadaptation
de type LMS adjoint, limplantation de ladaptation dans le domaine frquentiel et les am-
liorations possibles, en terme de performance de ladaptation dans le contexte audio. Un des
points importants de ltude concerne la robustesse, aux mouvements des auditeurs, des sys-
tmes de reproduction adaptatifs. Les autres aspects considrs sont : lutilisation de diffrents
types de warped lter (avec rsolution frquentielle non uniforme)
22
, la gnralisation du pro-
blme de contrle (formulation unique pour laffaiblissement de la diaphonie, la ralisation de
sources virtuelles, la simulation denvironnements rverbrants, la correction de la coloration
des haut-parleurs et le contrle actif du bruit), lamlioration de la robustesse aux mouvements
par llargissement des zones dgalisation (robustesse aux petits mouvements), lamlioration
de la robustesse aux mouvements par mesure et rtroaction de la position de lauditeur (robus-
tesse aux grands dplacements), lutilisation et la comparaison de diffrents ltres invariants
rsolution frquentielle non uniforme
23
. Les travaux sont principalement thoriques, sous forme
22
Cette dimension du problme fut dj aborde par Kirkeby en 1999 [Kirkeby et Nelson, 1999].
23
Il semble que lusage de tels ltres dont la rsolution spectrale varie en fonction de la frquence procure de
meilleurs rsultats pour les applications audios puisque loreille humaine suit cette mme tendance [Garas, 1999;
29
de simulations, et proposent des solutions locales : la reproduction de la pression acoustique aux
tympans des auditeurs qui devraient, consquemment, porter des microphones en leurs conduits
auditifs pour mesurer lerreur de reproduction [Garas, 1999]. Cette contrainte nest peut-tre pas
la plus pratique. Un bon nombre de considrations lectroacoustiques peuvent tre ajoutes ces
ides de systmes adaptatifs avances par Garas. Cest, entre autres, ce qui est caractristique
de la prsente thse qui nest pas exclusivement ddie au traitement du signal.
Au sujet de la compensation active en salle pour la WFS, Spors [Spors et al., 2003a, 2004;
Petrausch et Rabenstein, 2006; Spors et al., 2005a] valorise lintrt du contrle dans un do-
maine transform qui est, supposment, plus reprsentatif des champs acoustiques sur une r-
gion spatiale plus tendue que la rgion couverte par les capteurs utiliss. Spors se base en fait
sur la dcomposition de champs acoustiques en ondes planes pour effectuer des extrapolations
de champs [Williams, 1999] et pour, aussi, travailler dans un espace transform qui dcouple le
systme sous contrle. Le dcouplage est donc partiellement bas sur un modle thorique de
propagation. Le problme avec la mthode prsente tient du fait que Spors suppose que la me-
sure de la pression et de la vitesse particulaire normale sur une antenne de capteurs circulaire est
sufsante pour dcrire le champ acoustique, en salle, dans la surface ferme par lantenne circu-
laire de capteurs
24
, il effectue ensuite une transforme en ondes planes sur la surface encercle
par lantenne de capteurs. Ce problme au niveau de la concordance des hypothses avec la ra-
lit pratique se manifeste par une rduction de lerreur de reproduction bien moindre que prvue
en dehors de lantenne de capteurs [Spors et al., 2003a] ; ce qui est clairement reli aux aspects
mentionns plus haut [Spors et al., 2005a] et qui, indirectement, rend le problme pratiquement
identique un problme dgalisation en plusieurs points. Les premiers rsultats de Spors sont
publis en 2003 [Spors et al., 2003a]. Les considrations au sujet de la tridimensionalit du pro-
blme sont publies en 2005 [Spors et al., 2005a]. Les exprimentations de Spors ne sont pas
effectues en temps rel tant donne la charge de calcul implique. Une des distinctions de la
synthse de champs sonores adaptatives (lAWFS, Adaptive Wave Field Synthesis) prsente
dans cette thse avec lapproche dcouple prsente par Spors vient du fait que lAWFS ne se
base pas sur lextrapolation de champs mais sur lusage dune antenne de capteurs compacte et
sur un dcouplage numrique du systme identi.
En 2005, Betlehem [Betlehem et Abhayapala, 2005] publie quant lui une thorie de re-
production de champs acoustiques en salle. Pour illustrer la mthode, lauteur se base sur une
Blauert, 1999].
24
Ce passage se base sur lintrgrale de Kichoff-Helmholtz avec des fonctions de Green cylindriques pour des
problmes en deux dimensions.
30
salle deux dimensions (plafonds et plancher parfaitement absorbants). Le choix du problme
deux dimensions est simplement motiv par le fait que le mme problme en trois dimensions,
avec une thorie parfaitement similaire, implique un nombre trop important de capteurs et de
sources de reproduction qui doivent alors couvrir des surfaces. Comme point de dpart, Betle-
hem dcrit les champs reproduire et les champs reproduits par des sries de Fourier-Bessel
(harmoniques cylindriques), aucune hypothse a priori nest effectue sur les coefcients de
ces sries lexception de ceux qui reprsentent le champ acoustique reproduire. En se ba-
sant sur des valuations (thoriques dans cet article, elles seraient identies en pratique) des
fonctions de rponse en frquence entre les sources de reproduction et une antenne circulaire
de capteurs, lauteur dcompose par la suite ces fonctions de rponse en frquence sur la base
dune srie de Fourier-Bessel lantenne de capteurs utilise. Le problme de reproduction est
ensuite formul comme un problme de minimisation de la somme des erreurs quadratiques
entre les coefcients de la srie (tronque en pratique) reproduire et les coefcients de la srie
reproduite. Puisque Betlehem se base sur des sries de Fourier-Bessel, son approche (ralise
en boucle ouverte, aprs identication des rponses en frquence maintenant bases sur des
sries de Fourier-Bessel) correspond donc une approche Ambisonique en boucle ouverte ; la
seule diffrence tient du fait que Betlehem remplace le modle de rayonnement Ambisonique
(qui correspond typiquement un modle de champ libre) par un modle identi. Lutilisation,
en pratique de fonctions orthogonales de champs (ondes planes [Spors et al., 2003a], harmo-
niques cylindriques, harmoniques sphriques) connues a priori implique un certain problme.
Par exemple, dans le cas de Betlehem, une application pratique de reproduction par dcomposi-
tion de champs en harmoniques cylindriques avec une antenne de capteurs circulaire ncessite
une absorption totale et parfaite du plafond et du plancher, faute de quoi lantenne circulaire de
capteurs ne peut plus tre utilise pour la dcomposition en harmoniques cylindriques puisque
tout le champ acoustique reproduit ne peut plus tre dcompos en harmoniques cylindriques.
Cette particularit rejoint les travaux de Spors [Spors et al., 2003a]. Dans le cas de lAWFS, on
vite se problme en utilisant des fonctions orthogonales qui dcoulent du systme identiti,
soit par dcomposition en valeurs singulires. Aussi, la thorie avance par Betlehem suppose
que les sources de reproduction sont des sources dondes cylindriques. Une autre lacune de lap-
proche de Betlehm est trs relie la pratique : si plafonds et planchers doivent tre parfaitement
amortissants, pourquoi se priver de le faire pour les autres surfaces et fonctionner entirement
en champ libre.
Entre 2000 et 2005, Poleti publie sur lenregistrement et la reproduction de champs acous-
tiques en deux, puis en trois, dimensions [Poletti, 2000, 2005]. Dans tous les cas, lauteur se
concentre sur la reproduction en champ libre sur la base de lexpansion de champs acoustiques
31
partir des fonctions orthogonales de lquation donde acoustique homogne. Son plus rcent
article [Poletti, 2005]
25
approche certaines aspects de cette thse et doit tre rsum. Poleti [Po-
letti, 2005] effectue une revue des techniques de reproduction de champs acoustiques en trois
dimensions. Une des bases du dveloppement thorique de lauteur rside sur le fait que tout
champ acoustique peut tre dcrit par une double srie, tronque on non, dharmoniques sph-
riques et de fonctions de Bessel sphriques [Williams, 1999; Poletti, 2005]. Dans cette optique,
on note, selon lauteur, trois approches typiques denregistrement (cest--dire didentication
des coefcients de la double srie) de champs acoustiques en trois dimensions : (1) avec une
sphre de capteurs en champ libre (le volume de la sphre est libre), (2) avec une sphre de
capteurs sur une sphre rigide (le volume de la sphre est plein et rigide) et (3) avec une grille
quelconque de capteurs [Poletti, 2005]. Pour ce qui est de la reproduction de champs acous-
tiques en champ libre, lauteur propose deux principales mthodes qui concernent, toutes deux,
la prsente thse.
Approche par concidence de modes (mode-matching) : Pour ce type dapproche, on tente
dapproximer (par inversion directe ou par minimisation des moindres-cars) les coef-
cients des harmoniques sphriques (ou cylindriques pour les cas en deux dimensions)
reproduire par ceux reproduits. LAmbisonie telle que dcrite en annexe est, par exemple,
une telle approche en deux dimensions.
Approche par formulation par simple source. Dans ce cas assez proche de la WFS puis-
quelle se base sur la formulation intgrale de Kirchhoff-Helmholtz (KH) , lintgrale
KH est rsolue pour le problme intrieur ou le problme extrieur (et non les deux la
fois) avec un terme de rayonnement qui correspond seulement une rayonnement mono-
polaire. Cest la formulation par simple source de lintgrale KH [Williams, 1999]. On
note que cette approche est en fait une forme de WFS, en trois dimensions, dveloppe
sur la base des harmoniques sphriques et qui exclut donc lapproximation de la phase
stationnaire propre la WFS en deux dimensions sollicite dans cette thse (voir annexe
A).
En ce qui concerne lAWFS, on note dabord des liens avec lapproche par concidence
de modes puisque lAWFS, en pratique, ralise une telle approximation, non pas sur la base
dharmoniques cylindriques (puisque lAWFS implique la WFS en deux dimensions), mais
sur la base de fonctions orthogonales provenant de la dcomposition de matrices en valeurs
singulires (SVD, Singular Value Decomposition)
26
. Cette parent avec les thories de Po-
leti est renforce par le lien quentretient la SVD avec lexpansion, de fonctions continues,
en valeurs singulires (SVE, Singular Value Expansion) puisque la SVD est une version
25
Article publi en 2005, soit lors de la troisime anne de la ralisation de cette thse.
26
Pour lAWFS, on parle de modes de rayonnement lorsquil est temps de nommer ces fonctions orthogonales.
32
discrte de la SVE [Hansen, 1998]. Sachant que pour une intgration trs gnrale de type
_
V
G(x[y)Q(y)dV = p(x)
27
, la SVE (et donc la SVD) offre des fonctions singulires qui cor-
respondent aux solutions propres orthogonales du noyau de lintrgrale
28
. On ne doit pas se
surprendre si la SVD applique lAWFS donne des fonctions orthogonales qui correspondent
de prs des harmoniques cylindriques aux sources de reproduction et aux capteurs de lerreur
de reproduction. Lavantage de lobtention de fonctions orthogonales par SVD plutt que par
connaissance a priori des solutions orthogonales de lquation donde homogne, tient du fait
que les fonctions en question seront toujours orthogonales, mme dans des lieux rels. Cette
approche par SVD permet dont la ralisation de transformations et de ltres sur la base dun
algorithme numrique de SVD sans connaissance a priori de fonctions orthogonales thoriques.
Mme si la thorie de Poleti est intressante en champ libre, elle est peu pratique pour
des applications exprimentales : les simulations prsentes par lauteur implique 100 ou 256
sources de reproduction [Poletti, 2005]. Dans le cadre de cette thse, cest la WFS qui est
la base de la AWFS et on ne touche pas aux aspects tridimensionels de la reproduction de
champs acoustiques parce que, justement, le nombre de sources est trop lev et peu commode
en pratique. Pour ce qui est de la reproduction tridimensionelle de champs acoustiques en salle,
Poleti considre lapproche par concidence de modes qui donne de bon rsultats [Poletti, 2005]
et qui correspond la version tridimensionnelle de la thorie prsente par Betlehem [Betlehem
et Abhayapala, 2005] en 2005
29
. Dans tous les cas, Poleti se limite des considrations purement
thoriques et ne fournit aucune considration pratique, que ce soit au niveau du traitement du
signal ou au niveau de rsultats exprimentaux [Poletti, 2000, 2005].
Bai et Elliott [Bai et Elliott, 2004] sintressent en 2004 au prconditionnement du FXLMS
pour la rduction de la diaphonie. Avec la dcomposition en valeurs singulires (SVD), les au-
teurs dcouplent et blanchissent au pralable le systme sous contrle. Un algorithme adaptatif
de type LMS est par la suite branch aux bornes de ce nouveau systme dcoupl et blanchi. Des
simulations en champs libres sont introduites et dmontrent le bon fonctionnement du dcou-
plage par SVD. Dans le cadre de cette thse, le mme type dalgorithme est sollicit mais modi-
, notamment pour inclure la solution WFS dans lalgorithme dadaptation. Dautres aspects,
passs sous silence par Bai, comme les problmes dordre des vecteurs singuliers en fonction de
la frquence sont aussi considrs dans cette thse (au chapitre 8, sur le traitement du signal). De
plus, la SVD est utilise pour lucider des proprits et des mcanismes physiques fondamen-
27
Dans cette quation, G(x|y) est par exemple une fonction de Green et Q(y), une distribution de source.
28
En acoustique, ce noyau correspond par exemple aux fonctions de Green de lintgrale KH.
29
Tout juste aprs notre publication du chapitre 5 dans le Journal of the Acoustical Society of America, Bet-
lehem publie larticle en question [Betlehem et Abhayapala, 2005].
33
taux de lAWFS (chapitre 7). Qui plus est, cette thse inclut une dmonstration exprimentale
du dcouplage large bande dun systme de synthse de champs sonore adaptatif. Une telle
dmonstration exprimentale constitue aussi une originalit.
2.6 Conclusion
Ce chapitre a pos la base et le contexte des travaux prsents dans cette thse. Suivant une
classication des mthodes de reproduction articielle du caractre naturel de laudition, on
note le contexte physique contexte qui concide parfaitement avec les travaux de cette thse
du problme de reproduction de champs acoustiques qui se dtache des aspects perceptifs.
Plusieurs rfrences bibliographiques ne furent pas explicitement commentes dans les sections
prcdentes mais ont su jouer un rle dans llaboration de cette revue de litrature
30
.
En bref, des points saillants de cette revue de connaissances sont maintenant prsents. De l
merge les dtails de la dnition du projet de cette thse. De faon bien gnrale, le problme
intrieur de la reproduction de champs acoustiques pose encore des problmes non-rsolus et des
dveloppements potentiels. Cest ainsi quon trouve diffrentes mthodes bases sur lintrgrale
de Kichhoff-Helmholtz comme la WFS et dautres bases sur le contrle actif ou le ltrage
adaptatif. On note, par contre, bien peu de travaux, lexception de ceux de Spors et dautres
trs rcents, qui touchent ou intgrent les deux mthodes. Cette thse peut sinscrire dans cette
30
[Berkhout et al., 1980; Morgan, 1980; Kabal, 1983; Dobbins, 1984; Massa, 1985; Eargle, 1986; Miyoshi et
Kaneda, 1988; Kuriyama et Furukawa, 1989; Veronesi et Maynard, 1989; Kawakami et Shimizu, 1990; Kim et
Lee, 1990; Miyoshi et Kaneda, 1991; Tichener, 1992; Genereux, 1992; Gao et Snelgrove, 1992; Elliott et al., 1992;
Kirkeby et al., 1993; Stoughton, 1993; Elliott, 1993; Snyder et Tanaka, 1993; Mahieux et al., 1995; Rocchesso,
1995; Fahnline, 1995; Poltmann, 1995; Kendall, 1995b; Chen et al., 1996; Laakso et al., 1996; Ahn et Voltz, 1996;
Start et al., 1997; Davis et Davis, 1997; Mahieux et al., 1997; Garcia-Bonito et al., 1997; Chen et al., 1998; Feng et
Gan, 1998; Roure et Albarrazin, 1999; Jot, 1999; Fontana et al., 1999; Kahana et al., 1999; Berkhout et al., 1999;
Renault et al., 2000; Ihle et al., 2000; Yoon et Nelson, 2000; Fielder, 2001; Brandstein et Ward, 2001; Brix et al.,
2001; Delalande, 2001; Wang et H. Ge, 2001; Becker et Sapp, 2001; Leboucher et al., 2002; de Diego et al., 2002;
Wu et Zhao, 2002; Bouchard, 2002; Merimaa, 2002; Daniel, 2003; Bouchard, 2003; Komiyama et al., 2003; Jaffe,
2003; Miyazaki et al., 2003; Freiheit, 2003; Lu et Wu, 2003; New Adventures in Sound Art, 2003; Takane et al.,
2003; Caulkins et al., 2003; Gover et al., 2003; Spors et al., 2003b; Fahy, 2003; Yon et al., 2003; Fielder, 2003;
Bastyr et Capone, 2003; Zieli nski et al., 2003; Kim et Wang, 2003; Reiter et al., 2003; Murphy et Beeson, 2003;
Buchner et al., 2004; Takane et Sone, 2004; Yokota et al., 2004; Theile et Wittek, 2004; Fahline, 2004; Kuster
et al., 2004; Gover et al., 2004; Rafaely, 2004; Bharitkar et Kyriakakis, 2004; Bai et Lin, 2005; Zhao et Wu, 2005;
Ahmad et Kundu, 2005; Mitsuki et al., 2005; Park et Rafaely, 2005; Guillaume et Grenier, 2006; Toole, 2006;
Sausalito Audio Works, sans date; Zvonar, sans date]
34
zone combinant la fois WFS et ltrage adaptatif. Plus spcialement, il reste encore matire
dcouvrir et dvelopper au niveau des liens possibles entre WFS et contrle actif, et ce
notamment par le dveloppement dune nouvelle formulation du problme. Cest le sujet de
cette thse, dtaill au chapitre suivant par le biais des objectifs de recherche et de la mthode
retenue.
35
CHAPITRE 3
OBJECTIFS ET MTHODES
3.1 Introduction
Ce chapitre prsente les points saillants qui ont t poursuivis lors de la ralisation de cette
rercherche sur la reproduction de champs acoustiques laide du contrle actif du son. En r-
sum, les objectifs peuvent tre diviss en deux points gnraux : (1) tablir une comprhension
de la reproduction de champs acoustiques par WFS et contrle actif en champ libre et en salle ;
(2) dvelopper un prototype illustrant la solution technologique retenue. Le dtail de la mtho-
dologie privilgie est ensuite fourni.
3.2 Contexte de ralisation de la recherche
La prsente recherche fut effectue au sein du GAUS (Groupe dAcoustique de lUniver-
sit de Sherbrooke) qui, dans le cadre dun projet de plus grande ampleur sur la transmission
multimdia, entretient des liens avec le CIRMMT (Centre for Interdisciplinary Research in Mu-
sic, Media, and Technology, Facult de Musique, Universit McGill)
1
. Lobjectif principal du
CIRMMT est la ralisation de recherches interdisciplinaires directement relies la cration,
la transmission et la perception du son et de la musique.
Finalement, le CIRMMT fut, en 2003-04, quip dun systme de WFS provenant de linsti-
tut de recherche Fraunhofer en Allemagne. Ce systme fut utilis dans le cadre du prsent projet
de recherche.
1
Le GAUS est un membre du CIRMMT.
36
3.3 Objectifs de la recherche
Considrant ltat de lart en matire de reproduction audio ou de champs acoustiques, tat
prcdemment revu, il est possible de formuler les objectifs de la prsente recherche. De faon
trs gnrale, lexercice de recherche comportera la fusion de deux domaines distincts, soit le
contrle actif du son et la reproduction de champs acoustiques. Cette approche transdisciplinaire
a dj fait lobjet de quelques tudes rcentes. Il nen demeurre pas moins quune bonne part de
la recherche sur le sujet reste faire.
Voici la liste explicite des objectifs gnraux associs la recherche concernant la reproduc-
tion de champs acoustiques laide des techniques du contrle actif.
1. tablir une comprhension physique de la WFS (avantages et inconvnients) fonde sur
des simulations et des exprimentations.
2. Investiguer la nature de la physique de la reproduction de champs acoustiques en salle et
en champ libre par contrle actif.
3. Formuler une nouvelle approche de type WFS adaptative (AWFS, pour Adaptive Wave
Field Synthesis) dans le domaine physique et pour son quivalent rel en traitement de
signal adaptatif.
4. laborer cette nouvelle mthode de synthse de champs acoustiques sur une base essen-
tiellement physique. Cet objectif principal comporte les subdivisions suivantes
2
:
(a) production dune zone de reproduction de champs acoustiques optimale plus large
pouvant par exemple contenir une audience plus ou moins importante
3
. Du point de
vue du contrle actif du son, on sait que les zones dgalisation (dattnuation de
lerreur) peuvent stendre aux environs dun dixime de la longueur donde autour
dun capteur derreur. Avec diffrentes congurations dantennes de capteurs, on
peut sattendre mieux. Dun autre ct, la WFS couvre un espace dcoute consi-
drable qui nest vraisemblablement que fonction du nombre de sources, et de la
2
Il est intressant de noter que ces sous-objectifs, spcialement ce point, est typique de toute tentative actuelle
ou rcente damlioration de la reproduction audio.
3
En terme de comprhension et dexplication des phnomnes, ltude nest pas force de se limiter de larges
zones. Toute autre comparaison pourra tre dun apport bnque. On note que le sweet spot, la zone dcoute
optimale, pour la strophonie deux canaux, forme un espace dont le diamtre correspond 60 centimtres
environ. En dehors de cet espace, le caractre spatial de limage auditive se dgrade [Nelson, 1994] tout autant que
la qualit du champ reproduction.
37
taille de lantenne de sources, autour de laudience. Pour le prsent projet, on de-
vrait, en terme dtendue de la zone dcoute, proposer quelque chose de similaire
la WFS;
(b) reproduction optimale, dans un espace de reproduction donn, dun champ acous-
tique prescrit
4
;
5. Raliser des exprimentations (dans le domaine acoustique et dans le domaine du trai-
tement du signal) qui dmontrent lintrt et la valeur de lapproche technologique de
reproduction de champs acoustiques par WFS adaptative.
3.4 Mthodologie propose
Avant dtablir la structure hiarchique des activits qui fut suivie, quelques prcisions
doivent tre introduites au sujet des techniques privilgies.
Dans le monde de la reproduction sonore, lobjectif ultime est de recrer une impression
auditive tridimensionnelle dle. Comme il fut mentionn plus haut, cette intention nimplique
pas de simples problmes. En effet, certaines techniques de reproduction spatiale du son, telle
la strophonie voque au tableau 2.1, misent mme sur lillusion psycho-acoustique. Dans le
cadre de la prsente recherche, cest la reproduction physique de champs acoustiques qui forme
lobjet de ltude.
Dun autre ct, en contrle actif des vibrations et du son, il est plus quhabituel dinjecter
une ou plusieurs perturbations secondaires an de construire un champ secondaire qui, par in-
terfrence destructive, radique un champ primaire. Considrant ces dimensions de laudio et
du contrle actif du son, lusage du contrle actif pour crer un champ secondaire, limage
dun champ primaire, dans le cadre de la reproduction, semble tout fait lgitime [Kirkeby
et al., 1996]
5
. Par contre, en comparaison avec la WFS, un systme dadaptation actif implique
lusage dune antenne de capteurs. Cette complication en terme dapplication introduit avan-
tageusement la possibilit de tenir compte automatiquement du caractre acoustique de lespace
de reproduction. Chose qui nest pas possible avec la WFS qui assume, dans sa dnition fon-
4
Dans le cadre de ces travaux on tente de reproduire des ondes simples an de comprendre la physique du
problme. Recrer, ds le dpart, une impression auditive pourrait tre plus difcile puisquelle implique des tran-
sactions sensorielles multimodales complexes.
5
Voir le chapitre prcdent, plus prcisment la section 2.5.
38
damentale, un espace de reproduction anchoque. Dautres dtails ce sujet sont prsents plus
loin.
Lensemble du projet peut tre divis en deux grandes parties. Les prochaines sections in-
troduisent et explicitent, principalement sous forme de liste, ces deux parties.
Partie I - Revue de littrature, tudes et exprimentations prliminaires, formulations
thoriques du problme et simulations (chapitres 2 8)
Le principal objectif de cette premire partie est simple : dnir, prciser et comprendre
le fonctionnement de lapproche choisie tout en valorisant une forte connaissance des travaux
rcents et plus anciens dans le domaine. Les activits incluses dans cette premire partie sont
classes comme suit :
1. lecture et recherche bibliographique sur les sujets suivants (chapitre 2) :
psychoacoustique et perception spatiale du son,
acoustique des salles,
traitement du signal adaptatif,
techniques de reproduction spatiale du son ;
2. analyses et exprimentations prliminaires de la WFS (chapitre 4) :
antennes de sources acoustiques en champ libre,
dveloppement thorique de la WFS,
simulations de la WFS en champ libre (et donc, production dun programme qui gnre
les oprateurs de synthse de la WFS classique, utilisable ltape du traitement des
signaux et des exprimentations),
mesures de champs reproduits par WFS et comparaison avec les simulations de la WFS
en champ libre pour valuer leffet du lieu ;
3. analyses thoriques et simulations de la problmatique fondamentale (chapitre 5) :
construction dun modle thorique du systme de reproduction par contrle actif (as-
pect physique de la reproduction en salle),
ralisation de simulations partir du modle,
laboration de la comprhension des phnomnes acoustiques en jeu partir de simu-
lations et danalyses thoriques,
39
tude paramtrique, en particulier au sujet de leffet de lespace dcoute (avec ou sans
rexions) sur la qualit et les mcanismes de la reproduction,
formulation dune conclusion quant la possibilit physique de reproduction de champs
acoustiques en salle ;
4. simulations thoriques et dveloppement du systme ralis en pratique (chapitres 6 8) :
ralisation de simulations limage de la WFS adaptative (AWFS) pour tablir les bases
dun systme qui sera dvelopp ultrieurement,
comprhension des mcanismes fondamentaux de lAWFS,
dnition de larchitecture de traitement du signal correspondant lAWFS :
modication du FXLMS (Filtered-Reference Least-Mean-Square),
dnition de lAWFS avec contrle indpendant des modes de rayonnement ;
simulations du traitement de signal adaptatif sollicit pour lAWFS pour le contrle
indpendant des modes de rayonnement.
Partie II - Essais exprimentaux et implantation pratique (chapitre 9)
Cette seconde partie constitue un aspect important de la recherche puisquelle inclut la d-
monstration pratique du fonctionnement de la mthode propose.
Cette partie de la recherche fut divise comme suit :
1. dveloppement dune plateforme du traitement de signal pour lAWFS exprimentale,
2. conception, construction et installation dun prototype dAWFS,
3. reproduction de champs acoustiques par AWFS :
effet de diffrentes conditions de reproduction ;
reproduction large-bande en temps diffr ;
reproduction harmonique en temps rel.
3.5 Conclusion
En conclusion, la recherche porte donc sur la reproduction de champs acoustiques laide
des mthodes de contrle actif et de WFS. Lobjectif est simple : recrer un champ acoustique le
40
plus dlement possible an de procurer ventuellement une bonne reproduction auditive pour
une audience plus ou moins tendue. Le caractre novateur de la prsente recherche concerne
lusage des techniques du contrle actif du son pour la reproduction audio, ce qui est baptis
lAWFS dans cette thse. Cette application, quoique dj entame par dautres chercheurs, de-
meure relativement peu exploite : de nouveaux dveloppements, amliorations, analyses et hy-
bridations, peuvent tre encore effectus. On note, comme exemple de nouveaut, la dnition
de lAWFS sur une base de contrle indpendant des modes de rayonnement.
41
CHAPITRE 4
EXPRIMENTATIONS PRLIMINAIRES AVEC UN SYS-
TME DE WFS CONVENTIONNEL
4.1 Introduction
Ce chapitre introduit une analyse objective de la performance de la WFS dans une salle de
reproduction relle. Elle permet dvaluer o se situent les amliorations potentielles qui pour-
raient tre introduites par la prsente recherche doctorale sur lamlioration de la reproduction
de champs acoustiques laide du contrle actif.
An dvaluer distinctement les implications de lusage dun rseau de sources de repro-
duction discrtes et de la dynamique de la salle de reproduction, des simulations en champ libre
sont pralablement introduites pour illustrer leffet dantenne et la construction interfrentielle
en basse frquence (sections 4.2 4.4), ncessaire pour la WFS. Ce type de simulations est
ensuite utilis comme base de comparaison quantitative avec les mesures exprimentales (d-
tailles la section 4.5). Les simulations en champ libre illustrent aussi le comportement des
oprateurs de la WFS et fournissent ainsi une meilleure comprhension des rouages de la WFS
en lien avec les notions issues de la thorie des ouvertures et des rseaux de sources [Ziomek,
1995].
ce sujet, il importe de notier certains correspondances entre la WFS et la thorie des
ouvertures et des rseaux [Ziomek, 1995] : pour la WFS, on sintresse au champ proche
1
des
sources de reproduction puisque cest dans cette zone que les interfrences permettent la re-
production dun champ acoustique. Pour les applications plus usuelles des rseaux acoustiques,
on sintresse aux possibilits que procurent les rseaux dans le champ lointain : soit, princi-
1
En accord avec la dnition de champs proches telle que rencontre dans la thorie des ouvertures et des
rseaux de sources [Ziomek, 1995].
42
palement, la formation de motifs de directivit. Les deux problmes se rejoignent parce que,
par exemple, la reproduction dune onde plane par WFS produit, en champ lointain, un lobe
principal de rayonnement dans la direction correspondante.
En complment aux notions et rsultats prsents dans ce chapitre, lannexe A prsente le
dveloppement thorique de la WFS et lannexe C contient tous les dtails sur les exprimenta-
tions ici dcrites.
4.2 Rseau de sources acoustiques en phase
Dans un premier temps, quelques remarques sont introduites au sujet dune antenne linaire
de sources acoustiques en phase en champ libre puisque, pour une premire approximation,
cette application correspond la production approximative dune onde plane
2
(dont la direction
de propagation est perpendiculaire lantenne linaire) comme il le serait fait avec la WFS
[Gauthier et al., 2005a].
En considrant une seule source monopolaire thorique en champ libre, la rponse en fr-
quence value en un point de lespace est directement fonction de lamplitude de la source en
question. Ds que deux sources ou plus sont prsentes simultanment, la rponse en frquence
dun point quelconque laisse voir lapparition dun ltre en peigne. Ce ltrage en peigne est
attribuable la prsence dinterfrences destructives et constructives au point dvaluation de
la rponse. Pour la WFS, ce sont ces motifs dinterfrences spatiales qui permettent la synthse
de fronts donde, mais ils peuvent aussi tre nuisibles pour la WFS. Les deux sous-sections sui-
vantes prsentent des distributions de rponses en frquences et de rponses limpulsion dans
lespace pour quelques antennes de sources en champ libre.
2
Pour la WFS, la reproduction dune onde plane peut paratre comme un abus de langage puisquelle cor-
respond, en fait, une section plane horizontale dune onde cylindrique (puisque lantenne de reproduction est
linaire). Dans ce plan horizontal, la distribution de phase dune onde cylindrique correspond la distribution de
phase dune onde plane, do lusage de lexpression onde plane pour dcrire une telle onde dans le contexte de
la WFS.
43
4.2.1 Distribution de la rponse en frquence dans un espace inni
La seule prsence de deux sources en champ libre introduit un effet de ltre en peigne qui
varie selon la position du point dvaluation de la rponse. La gure 4.1 (p. 45) prsente la
conguration introduite pour illustrer simplement cette ide. Pour les capteurs et les sources, la
distance de sparation est 0.175 m. Sur cette gure, et les suivantes du mme type, les points
noirs reprsentent des points de mesure ou dvaluation de la pression alors que les carrs cochs
reprsentent des sources acoustiques, des monoples dans ce cas. La gure 4.3 (p. 45) prsente
les FRF (Fonctions de Rponse en Frquence) lorsque les deux monoples sont aliments en
phase, cest--dire damplitudes monopolaires complexes gales. Lentre du systme corres-
pond lalimentation des sources (qui est unique pour toutes les sources) et la sortie correspond
la pression mesure, ou value, aux diffrents points de mesure. Pour ces simulations, les
sources sont modlises comme des monoples acoustiques pour lesquels lamplitude monopo-
laire tait unitaire en fonction de la frquence de telle sorte que le champ acoustique rayonn
par une telle source soit
p(x) = S
e
jkr
r
. (4.1)
Pour cette quation, qui suppose une oscillation harmonique dans le temps, k = /c [rad/m]
est le nombre dondes, [rad/s] est la pulsation dintrt, c [m/s] la vitesse de phase du son
dans lair, r [m] la distance entre la source et le point dvaluation x de la pression acoustique
p [Pa] et S [kg/s
2
] lamplitude monopolaire de la source [Morse, 1953; Pierce, 1991]. Le champ
acoustique produit par une srie de sources damplitudes monopolaires gales S est donc
p(x) = S
L
l=1
e
jkr
l
r
l
. Les FRF sont alors issues des ratios p(x)/S [Pa s
2
/kg 1/m].
Avec ce simple exemple, la gure 4.3 (p. 45) dmontre lapparition dun ltre en peigne
dont lallure change selon la position du capteur dintrt. Dans ce cas, avec deux sources seule-
ment, le capteur central offre une rponse en frquences constante tant donne la symtrie de la
position des sources par rapport la position de ce capteur. Lillustration 4.3 (p. 45) montre lim-
portante inuence mutuelle que peuvent avoir deux sources, et ce mme en champ libre. Cette
inuence fait apparatre des uctuations dans les fonctions de rponse en frquence. Des uc-
tuations qui changent selon la position dintrt et qui sont, du point de vue de la reproduction
(mme dans le cas de base de la strophonie deux canaux), indsirables, quoique attnues ou
dformes par leffet dune salle dcoute relle qui nest jamais un lieu anchoque [Rumsey,
2001].
Lorsque le nombre de sources devient plus important, et donc plus proche dune relle ap-
44
2 1 0 1 2
0.5
0
0.5
1
1.5
2
2.5
x
1
[m]
x
2

[
m
]
Figure 4.1 Conguration en champ libre
utilise pour la simulation du ltre en peigne
avec une distance de sparation de 0.175 m.
2 1 0 1 2
0.5
0
0.5
1
1.5
2
2.5
x
1
[m]
x
2

[
m
]
Figure 4.2 Deuxime conguration en champ
libre utilise pour la simulation du ltre en
peigne avec une distance de sparation de
0.175 m.
Figure 4.3 Gains des rponses en frquence pour la conguration prsente la gure 4.1 (p.
45)
plication lmentaire de la WFS [Gauthier et al., 2005a], comme pour le cas prsent la gure
4.2 (p. 45)
3
, les FRF deviennent nettement plus complexes selon laxe des frquences comme le
montre la gure 4.4 (p. 46).
An de mieux identier les phnomnes impliqus par les rsultats de simulation de la gure
4.4 (p. 46), la gure 4.5 (p. 47) prsente de diffrentes faons la FRF du capteur central uni-
quement. Demble, on note deux phnomnes importants. Dabord, linterfrence constructive
en basses frquences est telle que les sources acoustiques agissent comme une source cylin-
3
La distance de sparation des sources et des capteurs est toujours de 0.175m.
45
Figure 4.4 Gain des rponses en frquence pour la conguration prsente la gure 4.2 (p.
45)
drique unique (ou continue) dont lamplitude est plus importante tant donne la contribution
cumulative des sources qui, en comparaison avec la longueur donde en basses frquences, sont
essentiellement au mme point lorsque la frquence diminue. Comme il sera possible de le
voir plus loin, cette tendance converge vers un ltre de -3 dB/octave au fur et mesure que le
nombre de sources de reproduction est augment. Sur les gures 4.5 (p. 47) et 4.6 (p. 47) qui
expriment le gain [p/S[ en dcibels, cette courbe de -3 dB/octave est introduite par le biais dun
trait mince de type discontinu et pointill pour illustrer cette convergence
4
. On peut aisment
observer cette convergence la gure 4.6 (p. 47) qui prsente la FRF pour le capteur central
(voir la gure 4.2 (p. 45) pour la position des points de mesure) lorsque celui-ci fait face cent
sources formant un rseau linaire. Cette tendance est habituellement compense par la WFS
grce lintroduction dun ltre de type +3 dB/octave (caus par le terme
_
jk/2 dans les
oprateurs de synthse WFS prsents au tableau A.1 la page 338)
5
.
Toujours selon la gure 4.6 (p. 47), il est clair que la distance sparant les sources (0.175 m
dans ce cas) dtermine la frquence partir de laquelle le ltre en peigne devient effectif. Cest
partir de cette frquence que, dun mode dinterfrence principalement constructif, on passe
un mode dinterfrence destructif et constructif. Cette frquence de transition est dnie comme
la frquence de repliement spatial pour la WFS.
4
On note par contre que la position verticale de la courbe est ajuste manuellement pour n de comparaison
visuelle.
5
Sachant que la WFS dcoule de la formulation intgrale de Kirchhoff-Helmholtz, on note au passage que
le fait que des monoples de reproduction soient aliments par le gradient de pression (attribuable une source
virtuelle) introduit naturellement et partiellement (le reste est attribuable lapproximation par la mthode de la
phase stationnaire) le terme
_
jk/2 dans les oprateurs de synthse de la WFS.
46
10
1
10
2
10
3
10
4
0
2
4
6
8
Freq. [Hz]
|
p
/
S
|

[
1
/
m
]
10
1
10
2
10
3
10
4
40
30
20
10
0
10
20
Freq. [Hz]
G
a
i
n

|
p
/
S
|

[
d
B

r
e
f

1
]
945Hz 1890Hz
Figure 4.5 Gain de la rponse en frquence du
capteur central pour la conguration de la
gure 4.2 (p. 45).
10
1
10
2
10
3
10
4
0
5
10
15
20
25
Freq. [Hz]
|
p
/
S
|

[
1
/
m
]
10
1
10
2
10
3
10
4
30
20
10
0
10
20
30
Freq. [Hz]
G
a
i
n

|
p
/
S
|

[
d
B

r
e
f

1
]
945Hz 1890Hz
Figure 4.6 Gain de la rponse en frquence du
capteur central pour une conguration
semblable celle de la gure 4.2 (p. 45) avec
100 sources spares par 0.175 m le long de x
1
.
La longueur donde correspondant la sparation des sources donne environ 1890 Hz dans
le cas de la gure 4.6 (p. 47). Pour la WFS, la limite suprieure en frquence est traduite par
le besoin davoir au moins deux sources par longueur donde, ce qui donne environ 945 Hz
[Verheijen, 1998]. Ce dernier critre au sujet de lchantillonnage spatial est le plus svre de
ceux qui existent [Corteel, 2006b; Spors et Rabenstein, 2006] : il est en effet bien connu que
la frquence de repliement spatial est aussi dpendante de la forme de lantenne de sources
(circulaire ou linaire), de la direction de propagation du champ acoustique reproduire et de
luniformit de la distance de sparation des sources de reproduction [Corteel, 2006b]. Si, de ces
aspects, il nest conserv que celui en lien avec la direction de propagation du champ acoustique
reproduire, on utilise le critre suivant pour les antennes linaires de sources acoustiques
[Spors et Rabenstein, 2006]
f
repliement
=
c
l
(1 +[ cos [)
(4.2)
o la frquence de repliement est en Hz, c est la vitesse du son [m/s],
l
[m] est la distance de
sparation des sources et [rad] langle dincidence dune onde plane reproduire par rapport
lantenne linaire de sources
6
. Au-del de cette frquence de repliement spatial, on note lappa-
rition dondes planes supplmentaires qui ne correspondent pas la direction de propagation de
londe plane reproduire [Spors et Rabenstein, 2006]. Les directions de propagation et la quan-
tit de ces ondes planes indsirables varient avec la frquence et, selon le point dobservation,
6
Avec = 0 ou = , on obtient une onde rasante alors quavec = /2 on obtient une onde dont la direction
de propagation est perpendiculaire lantenne linaire.
47
viennent modier les FRFs, comme on peut le voir la gure 4.6 (p. 47). Pour 0 , on
trouve, selon lquation (4.2), que la frquence de repliement est environ comprise entre 945 Hz
et 1890 Hz alors que le dnominateur varie de
l
2
l
. La rgle svre mentionne plus tt
donne 945 Hz pour des ondes rasantes. Dans le cas considr, toutes les sources sont en phase
pour produire une onde plane de propagation perpendiculaire lantenne ( = /2), on trouve
la frquence de repliement de 1890 Hz, cest cette frquence qui correspond bien la zone de
transition identie la gure 4.6 (p. 47). De faon gnrale, et pour la suite de cette thse,
la dnition de la frquence de repliement sera la plus svre et donc exigera deux sources de
reproduction par longueur donde. Cette rgle est privilgie de telle sorte quelle vite, pour
tous les cas de position et de type de sources virtuelles en relation avec les sources de repro-
duction, les imperfections de repliement spatial imputables un sous-chantillonnage spatial au
niveau de lantenne de sources. Cette dnition plus stricte de la frquence de repliement spatial
correspond la dnition classique du thorme dchantillonnage spatial dans la thorie des
rseaux de sources et de capteurs [Ziomek, 1995].
Cette brve remarque au sujet des plages de frquences effectives en relation avec la spara-
tion des sources permet de faire valoir que pour la plage dintrt pour la WFS, les pointes et les
crevasses les plus nfastes sont au-del de la plage de frquence effective pour la WFS ; plage
de frquences dlimite par la frquence de repliement spatial. Certaines uctuations demeurent
nanmoins prsentes dans cette plage effective ; tel quil est possible de le voir la gure 4.5 (p.
47) pour un nombre de sources plus raliste. Ce genre de uctuations est fonction (1) du nombre
de sources de reproduction impliques lors de la reproduction dune source virtuelle donne et
(2) des effets de bords attribuables lusage dune antenne de sources nie dans lespace. Plus
de dtails au sujet des effets de bords sont prsents plus loin. Si lon ne tient pas compte de la
construction des basses frquences, on peut voir des uctuations denviron 2 ou 3 dcibels la
gure 4.5 (p. 47). Dans le cas de la reproduction en salle, ces uctuations seront ajoutes aux
uctuations attribuables la rponse de la salle de reproduction. Une premire cause de uc-
tuations indsirables de la rponse en frquence est donc identie et lie aux effets dantenne
discrte tronque. Finalement, en terme de perception spatiale du son, la distribution prcise
de la pression (amplitude et phase) dans lespace nest pas si importante au-del de 1890 Hz
puisque pour les frquences plus leves ce sont les diffrences temporelles interaurales des
enveloppes qui priment, et non pas les retards temporels entre les nes structures des signaux
binauraux [Blauert, 1999]. Cest plutt lallure de la FRF attribuable aux ltres en peigne
crs par lantenne de sources qui pourra causer des problmes, des colorations indsirables
dans ce cas. Ces uctuations drastiques peuvent tre supplantes par la prsence de la salle de
reproduction [Rumsey, 2001].
48
4.2.2 Multi-tracs des rponses limpulsion dans lespace
Dans le domaine temporel, leffet de ltre en peigne et, en consquence, des jeux dinter-
frence apparaissent sous la forme dune srie dimpulsions discrtes intervalles irrguliers.
Cest ce qui est prsent par la gure 4.7 (p. 50) pour le capteur central de la conguration
de la gure 4.2 (p. 45). La partie du bas de la gure prsente un agrandissement sur les 150
chantillons sur lesquels stend la partie signicative de la rponse limpulsion de lantenne
de sources. Sur cette gure, des chos distincts sont clairement visibles
7
. Cette gure permet
lobservation dun fait important au sujet de lchantillonnage spatial au niveau des sources : un
chantillonnage spatial rgulier implique un chantillonnage temporel irrgulier et variable se-
lon la position du point de mesure [Corteel, 2006b]. Cest en particulier les dernires impulsions
du groupe qui, tant les plus distances dans le temps, abaissent la frquence de repliement spa-
tial formule dun point de vue temporel (cest la principale distinction entre les approches de
Spors [Spors et Rabenstein, 2006] et de Corteel [Corteel, 2006b] ; en ce qui a trait la dnition
de lapparition du repliement spatial, ces approches ne sont pas incompatibles).
Face une telle antenne de sources toutes soumises la mme impulsion comme entre,
un auditeur ne percevrait pas dchos discrets puisque la rponse et les chos stendent sur
environ 50 chantillons avec une frquence dchantillonnage de 40 kHz, ce qui donne environ
1.3 ms. Selon les tudes psycho-acoustiques de la perception spatiale du son, le seuil daudition
de lcho est environ 30 ms ou 40 ms [Blauert, 1999], ce qui explique que leffet de ces chos ne
sera essentiellement peru que par la coloration, dite en peigne, de la rponse en frquence. Dans
une telle situation, le mcanisme de localisation serait plutt bas sur la localisation additive ou
leffet de prcdence [Blauert, 1999].
La gure 4.8 (p. 50) introduit le mme type de rsultat de simulation pour les 9 capteurs dans
la conguration de la gure 4.2 (p. 45). Dun point de vue objectif, il est clair, selon la gure 4.8
(p. 50) (a) quun front donde plan nest pas exactement produit par une telle antenne. Pourtant,
cest ce type dalimentation et de conguration qui serait utilis pour la WFS pour produire
un front donde plan dans le plan horizontal. La partie (b) de la gure 4.8 (p. 50) introduit les
rponses impulsionnelles qui reprsentent la plage de 0 945 Hz alors que la partie (c) prsente
la plage de 945 20000 Hz. Ainsi, pour la plage de frquences dlimite par leffet de repliement
spatial (au moins deux sources par longueur donde, selon le critre le plus svre, ce qui donne
7
tant donn que les chos discrets (dune largeur de bande limite par la discrtisation du signal) ne tombent
pas directement sur la grille dchantillonnage (pour des valeurs dchantillon entires), certaines impulsions se
retrouvent distribues sur les chantillons voisins selon le principe des dlais fractionnaires.
49
0 100 200 300 400 500
0.4
0.2
0
0.2
0.4
0.6
0.8
chantillons
R
p
.

i
m
p
.

[
1
/
m
]
200 250 300 350
0.4
0.2
0
0.2
0.4
0.6
0.8
chantillons
R
p
.

i
m
p
.

[
1
/
m
]
zoom
Figure 4.7 Rponse impulsionnelle value
pour le capteur central (frquence
dchantillonnage : 40 kHz, la conguration est
prsente la gure 4.2 (p. 45)).
0.7
0.525
0.35
0.175
0
0.175
0.35
0.525
0.7
5
6
7
8
9
x 10
3
0
0.5
1
x
1
[m]
Temps [s]
R
p
.

i
m
p
.

[
1
/
m
]
0.7
0.525
0.35
0.175
0
0.175
0.35
0.525
0.7
5
6
7
8
9
x 10
3
0
0.5
1
x
1
[m]
Temps [s]
R
p
.

i
m
p
.

[
1
/
m
]
0.7
0.525
0.35
0.175
0
0.175
0.35
0.525
0.7
5
6
7
8
9
x 10
3
0
0.5
1
x
1
[m]
Temps [s]
R
p
.

i
m
p
.

[
1
/
m
]
(a)
(b)
(c)
Figure 4.8 Rponses impulsionnelles values
pour les sources de la conguration prsente
la gure 4.2 (p. 45) (frquence
dchantillonnage : 40 kHz, le trait pointill
prsente le temps de propagation sur 2 m
331 m/s).
50
environ 945 Hz), un front donde plan peut tre reconstruit. Pour lensemble des travaux de
recherche qui suivent, cette limite en frquence, dnie par la frquence de repliement spatial,
dtermine la plage de frquences dintrt. Cet exemple illustre le principe de la WFS tel que
dveloppe lannexe A.
4.3 Simulations et tudes de la WFS en champ libre
An de mieux cerner les effets dantenne discrte et nie dcrits plus haut dans le cas de la
reproduction de champs acoustiques par la WFS, quelques simulations de la WFS sont intro-
duites. La conguration utilise pour la simulation de la WFS en champ libre est prsente la
gure 4.9 (p. 52). Cest la mme disposition relative que celle introduite la gure 4.1 (p. 45)
sauf que les positions des sources virtuelles sont identies la gure 4.9 (p. 52) par les lettres
(a), (b) et (c).
4.3.1 Distribution de la rponse en frquence dans lespace et effet de la position de la source
virtuelle pour un rseau linaire de sources de reproduction
Les gures 4.10 (p. 52) 4.12 (p. 54) prsentent les pressions acoustiques reproduites par
WFS aux diffrents capteurs en fonction de la frquence pour les trois positions de source vir-
tuelle. Ces pressions reproduites sont plutt exprimes sous la forme des gains des FRF [1/m].
En comparaison avec les simulations de la section prcdente, celles ici introduites au su-
jet de la WFS prsentent des caractristiques gnrales similaires. Ces caractristiques sont
pratiquement toutes issues des interfrences attribuables lexistence dun rseau de sources
discrtes. En gros, il est possible de distinguer deux phnomnes sur les gures 4.10 (p. 52)
4.12 (p. 54).
Dabord, mme sous la frquence de repliement spatial de la WFS (environ 945 Hz), cer-
taines uctuations sont observables et, notamment, plus importantes dans le cas o la source
virtuelle est loigne de lantenne de sources de reproduction (position virtuelle (a)). Dans ce
cas, les alimentations respectives des sources de reproduction sont presque toutes les mmes et
consquemment proches des cas tudis la section prcdente au sujet des antennes de sources
en phase. Plus la position de la source virtuelle approche la position de lantenne de sources de
51
4 2 0 2 4
0
1
2
3
4
5
6
7
x
1
[m]
x
2

[
m
]
(a)
(b)
(c)
Figure 4.9 Conguration utilise pour la
simulation de la WFS en champ libre avec trois
positions de sources virtuelles (en aval,
cest--dire derrire les sources de
reproduction) indiques par des triangles (la
distance de sparation des sources et des
capteurs est toujours de 0.175 m).
Figure 4.10 Gain de la rponse en frquence
aux capteurs pour la conguration de la gure
4.9 (p. 52) avec une source virtuelle en (a).
reproduction, moins leffet de ltre en peigne est important. Ce qui tait prvisible puisque
plus la source virtuelle est proche de lantenne de sources de reproduction moins de sources de
reproduction sont impliques pour la cration du champ attribuable la source virtuelle. Ces
remarques sont supportes plus aisment par lobservation des quatre graphiques de la gure
4.13 (p. 54). En plus des trois positions de sources virtuelles (a), (b) et (c), le quatrime gra-
phique illustre la FRF obtenue lorsque la source virtuelle est seulement 2.5 cm larrire de
lantenne des sources. La gure 4.13 (p. 54) illustre clairement aussi un autre phnomne propre
la WFS en fonction de la position de la source virtuelle en comparaison avec la FRF simule
pour la source virtuelle. Ainsi, quoique la proximit de la source virtuelle introduise la souhai-
table rduction de leffet de ltre en peigne, la FRF (sous la frquence de repliement spatial, soit
945 Hz) converge vers un gain de +3 dB/octave directement issu de la dnition des oprateurs
de synthse de la WFS (voir le tableau A.1). Ce qui ntait pas le cas avec la source virtuelle la
plus loigne puisque, quoique prsentant un ltre en peigne plus important, les oscillations de
la FRF se trouvaient autour dune droite horizontale. Cette forte coloration de +3 dB/octave,
assurment indsirable dans un contexte de reproduction audio, est une consquence de lhypo-
thse de grande distance relative entre la source virtuelle et les sources de reproduction
8
. Dans
8
La section A.5 la page 327 donne tous les dtails sur la construction classique des oprateurs de synthse de
la WFS.
52
Figure 4.11 Gain de la rponse en frquence aux capteurs pour la conguration de la gure
4.9 (p. 52) avec une source virtuelle en (b).
le dveloppement des oprateurs de synthse, on assume en effet que la distance entre ces deux
types de sources est grande en comparaison avec la longueur donde dintrt. Ce qui nest vi-
demment pas le cas avec une source virtuelle dont la proximit avec les sources de reproduction
est considrable, comme pour la dernire illustration de la gure 4.13 (p. 54). Ainsi, malgr le
fait que la WFS ne soit pas physiquement valide lorsque les sources virtuelles et les sources de
reproduction sont proches, la technologie actuelle de la WFS est tout de mme utilise pour ra-
liser de telles sources virtuelles puisque cest lutilisateur nal qui place les sources virtuelles.
Les remarques prcdentes ont donc illustr deux dformations nuisibles des FRF attri-
buables la position de sources virtuelles reproduites par WFS. Ces deux modications pourront
donc expliquer une part des imperfections observables dans les mesures exprimentales de la
reproduction de champs acoustiques par WFS. On note aussi que ces dformations de la r-
ponse en frquence peuvent donc tre dautres objectifs damlioration de la WFS par contrle.
Dautres dtails sont donns la section 4.4.
En salle, de tels effets de ltre en peigne peuvent tre attnus. Par contre, un gain de
+3 dB/octave (alors que la source virtuelle est proche de lantenne de sources de reproduc-
tion) sera assurment perceptible au travers de sa combinaison avec la rponse en frquence de
la salle de reproduction.
53
Figure 4.12 Gain de la rponse en frquence aux capteurs pour la conguration de la gure
4.9 (p. 52) avec une source virtuelle en (c).
0 1000 2000 3000 4000
30
20
10
0
10
G
a
i
n

|
p
/
S
|

[
d
B

r
e
f

1
]
0 1000 2000 3000 4000
30
20
10
0
10
G
a
i
n

|
p
/
S
|

[
d
B

r
e
f

1
]
0 1000 2000 3000 4000
30
20
10
0
10
G
a
i
n

|
p
/
S
|

[
d
B

r
e
f

1
]
0 1000 2000 3000 4000
30
20
10
0
10
Frq. [Hz]
G
a
i
n

|
p
/
S
|

[
d
B

r
e
f

1
]
FRF pour les WFS
FRF pour les sources virtuelles
0 1000 2000 3000 4000
0
200
400
600
P
h
a
s
e

[
r
a
d
]
0 1000 2000 3000 4000
0
200
400
600
0 1000 2000 3000 4000
0
200
400
600
0 1000 2000 3000 4000
0
200
400
600
Phases des FRF
945Hz 1890Hz
Position virtuelle (a) ((0,7,0) [m])
Position virtuelle (b) ((0,4,0) [m])
Position virtuelle (c) ((0,2.5,0) [m])
Position virtuelle (0,2.025,0) [m]

P
h
a
s
e

[
r
a
d
]

P
h
a
s
e

[
r
a
d
]
P
h
a
s
e

[
r
a
d
]

Figure 4.13 Gain de la rponse en frquence
au capteur central pour la conguration de la
gure 4.9 (p. 52) avec des sources virtuelles en
(a), (b), (c) et (0,2.025,0) [m].
0.7
0.525
0.35
0.175
0
0.175
0.35
0.525
0.7
0.019
0.02
0.021
0.022
0.023
0.024
0.025
0.2
0
0.2
x
1
[m]
Temps [s]
R
p
.

i
m
p
.

v
i
r
t
u
e
l
l
e

[
1
/
m
]
Figure 4.14 Rponses impulsionnelles
virtuelles (de la source monopolaire virtuelle,
position virtuelle (a) la gure 4.9 (p. 52),
frquence dchantillonnage : 40 kHz).
54
4.3.2 Multi-tracs des rponses impulsionnelles dans lespace inni
Cette section introduit les rponses temporelles des rponses en frquences illustres la
section prcdente.
Le premier cas considr est prsent la gure 4.14 (p. 54). Laquelle illustre la rponse
impulsionnelle de lantenne de capteurs simule pour la source monopolaire virtuelle. Sur cette
gure, deux lignes supplmentaires (les traits plus ns) sont introduites pour illustrer le temps
darrive dun front donde virtuel et lamplitude du front donde virtuel
9
. Ce genre de lignes
est aussi introduit sur les prochaines gures.
Suivant la simulation de la reproduction dune source virtuelle place en (a) (selon la con-
guration de la gure 4.9 (p. 52)) qui produit un champ acoustique impulsionnel illustr la
gure 4.14 (p. 54), la gure 4.15 (p. 56) prsente les rponses impulsionnelles produites par un
systme de WFS en champ libre. Sur cette gure, la rponse limpulsion est divise en deux
bandes de frquences ((b) 0 environ 976 Hz et (c) 976 Hz 20 kHz, on retient 976 Hz qui est
proche de la frquence de repliement selon le critre le plus strict). Comme on peut le voir sur
lensemble des trois graphiques de la gure 4.15 (p. 56), les basses frquences du front donde
sont convenablement reproduites, notamment au niveau de la courbure et du temps darrive du
front donde. Au-del de la frquence de repliement spatial, le front donde nest pas conve-
nablement reproduit : des chos discrets apparaissent tant donn que la densit du rseau de
sources de reproduction nest pas sufsante pour que les plus hautes frquences forment, par
interfrence constructive, le front donde virtuel. Sur toute la plage de frquences, on sait aussi
que leffet de louverture spatiale nie de lantenne produit des ondes de diffraction (provenant
des extrmits de lantenne) qui suivent le passage du front donde reconstruit. On note au pas-
sage que, pour ces simulations en champ libre, lantenne de capteurs utilise ne prsente pas
dambigut dincidence tant donn : (1) la connaissance a priori du systme en jeu, (2) la pr-
sence de sources dun seul ct de lantenne et (3) le fait que les sources et les capteurs habitent
le mme plan horizontal. Ce qui permet les conclusions suivantes. Lors des exprimentations,
des phnomnes dambigut dincidence surgissent puisque lantenne de capteurs ne voit pas
de diffrence entre un front donde arrivant de lavant ou de larrire ni mme un front donde
9
Il est intressant de noter au passage que mme lors de lvaluation des rponses impulsionnelles pour la
source virtuelle, les amplitudes des rponses ne correspondent pas exactement aux deux lignes introduites pour
illustrer le temps darrive et lamplitude du front donde produit par la source virtuelle. Cette diffrence sex-
plique simplement puisque les retards temporels ne sont pas ncessairement des multiples entiers de la priode
dchantillonnage. La section A.7.1 prsente plus de dtails ce sujet
55
0.7
0.525
0.35
0.175
0
0.175
0.35
0.525
0.7
0.019
0.02
0.021
0.022
0.023
0.024
0.025
0.2
0
0.2
x
1
[m]
Temps [s]
R
p
.

i
m
p
.

[
1
/
m
]
0.7
0.525
0.35
0.175
0
0.175
0.35
0.525
0.7
0.019
0.02
0.021
0.022
0.023
0.024
0.025
0.01
0
0.01
x
1
[m]
Temps [s]
R
p
.

i
m
p
.

[
1
/
m
]
0.7
0.525
0.35
0.175
0
0.175
0.35
0.525
0.7
0.019
0.02
0.021
0.022
0.023
0.024
0.025
0.2
0
0.2
x
1
[m]
Temps [s]
R
p
.

i
m
p
.

[
1
/
m
]
(a)
(b)
(c)
Figure 4.15 Rponses impulsionnelles pour la
WFS lors de la reproduction du front donde de
la gure 4.14 (p. 54). (a) Plage de 0 20 kHz,
(b) 0 976 Hz (environ) et (c) 976 Hz (environ)
20 kHz.
0.019 0.02 0.021 0.022 0.023 0.024 0.025
2
0
2
4
6
x 10
3
R
p
.

i
m
p
.

[
1
/
m
]
0.019 0.02 0.021 0.022 0.023 0.024 0.025
2
0
2
4
6
x 10
3
R
p
.

i
m
p
.

[
1
/
m
]
0.019 0.02 0.021 0.022 0.023 0.024 0.025
2
0
2
4
6
x 10
3
R
p
.

i
m
p
.

[
1
/
m
]
0.019 0.02 0.021 0.022 0.023 0.024 0.025
2
0
2
4
6
x 10
3
R
p
.

i
m
p
.

[
1
/
m
]
0.019 0.02 0.021 0.022 0.023 0.024 0.025
2
0
2
4
6
x 10
3
Temps [s]
R
p
.

i
m
p
.

[
1
/
m
]
Capteur #1 (0.7, 0, 0) [m]
Capteur #2 (0.525, 0, 0) [m]
Capteur #3 (0.35, 0, 0) [m]
Capteur #4 (0.175, 0, 0) [m]
Capteur #5 (0, 0, 0) [m]
Figure 4.16 Comparaison des rponses
impulsionnelles (dans la plage de frquences
de 0 976 Hz) reproduites et virtuelles. Les
traits pais reprsentent les rponses
impulsionnelles reproduites et les traits ns, les
rponses impulsionnelles reproduire.
arrivant lantenne avec une certaine lvation par rapport au plan horizontal des sources et des
capteurs. Ce sont des ambiguts triviales [Manikas et Proukakis, 1998], propres une antenne
de capteurs omnidirectionels linaire, qui empchent la possibilit de conclure sur la direction
darrive dune rexion. Il est par contre, pour le cas trait, possible de conclure sur cette di-
rection darrive puisque que la direction dincidence du premier front donde (le son direct)
arrive videmment de lavant.
56
An de mieux apprcier la correspondance de la reproduction dun front limit 976 Hz
(une frquence choisie pour sa proximit la frquence de repliement spatial) la gure 4.16 (p.
56) prsente des versions agrandies des rponses impulsionnelles des cinq premiers capteurs.
Comme le montre cette gure en cinq illustrations, le front donde est convenablement reproduit
mais une lgre coloration est introduite suivant le passage de limpulsion principale.
De la mme faon, la gure 4.18 (p. 58) introduit des simulations de la WFS en champ libre
dans le domaine temporel pour une source virtuelle situe en (c). Cette fois, les chos produits
par une cumulation de sources discrtes sont moins importants (lamplitude des chos suivant
la premire impulsion est plus faible et rduit limportance du ltre en peigne) comme il est
possible de le voir par lallure de la trane des rponses prsentes la gure 4.17 (p. 58) (a) en
comparaison avec la gure 4.17 (p. 58) (b). Ainsi, tel que le prsentent les gures 4.17 (p. 58)
(b) et 4.18 (p. 58), le front donde, et sa courbure maintenant plus importante pour la position
virtuelle (c), est bel et bien reproduit dans la plage de frquences effective en WFS (cette fois,
cest 940 Hz qui est utilise comme approximation de la frquence de repliement). Ce qui nest
pas le cas en plus hautes frquences alors que les chos discrets introduisent une coloration dj
commente la section prcdente. Par contre, comme on peut le voir la gure 4.18 (p. 58),
une certaine erreur damplitude de reproduction est visible. Cette erreur est essentiellement at-
tribuable au ltre +3 dB/octave (qui attnue une part des basses frquences) dont leffet devient
nuisible lorsque la source virtuelle est trop proche des sources de reproduction et ne respecte
plus ainsi une des hypothses sollicites lors de ldication des oprateurs de synthse de la
WFS
10
.
En gros, au sujet de leffet de lutilisation dun rseau de sources discrtes pour la recons-
truction des champs acoustiques par WFS classique, il est possible de conclure sur les points
qui suivent.
Lusage de sources discrtes introduit une coloration frquentielle de type ltre en peigne
qui varie selon la positions de la source virtuelle et selon la densit spatiale de sources de
reproduction.
Lusage de sources discrtes introduit une coloration frquentielle (+3 dB/octave) lorsque
la source virtuelle est proche des sources de reproduction.
Lusage de sources discrtes reproduit convenablement un front donde en basses fr-
quences, pour les plus hautes frquences des chos discrets rsultent du repliement spatial
10
Cest la section A.5 quil est possible de voir comment cette hypothse sinscrit dans le dveloppement des
oprateurs de synthse de la WFS.
57
0.7
0.525
0.35
0.175
0
0.175
0.35
0.525
0.7
6
7
8
9
10
11
12
13
x 10
3
1
0
1
x
1
[m]
Temps [s]
R
p
.

i
m
p
.

[
1
/
m
]
0.7
0.525
0.35
0.175
0
0.175
0.35
0.525
0.7
6
7
8
9
10
11
12
13
x 10
3
0.01
0
0.01
x
1
[m]
Temps [s]
R
p
.

i
m
p
.

[
1
/
m
]
0.7
0.525
0.35
0.175
0
0.175
0.35
0.525
0.7
6
7
8
9
10
11
12
13
x 10
3
1
0
1
x
1
[m]
Temps [s]
R
p
.

i
m
p
.

[
1
/
m
]
(a)
(b)
(c)
Figure 4.17 Rponses impulsionnelles pour la
WFS lors de la reproduction du front donde de
la gure 4.14 (p. 54). (a) Plage de 0 20 kHz,
(b) 0 940 Hz et (c) 940 Hz 20 kHz.
6 7 8 9 10 11 12 13
x 10
3
5
0
5
10
x 10
3
R
p
.

i
m
p
.

[
1
/
m
]
6 7 8 9 10 11 12 13
x 10
3
5
0
5
10
x 10
3
R
p
.

i
m
p
.

[
1
/
m
]
6 7 8 9 10 11 12 13
x 10
3
5
0
5
10
x 10
3
R
p
.

i
m
p
.

[
1
/
m
]
6 7 8 9 10 11 12 13
x 10
3
5
0
5
10
x 10
3
R
p
.

i
m
p
.

[
1
/
m
]
6 7 8 9 10 11 12 13
x 10
3
5
0
5
10
x 10
3
Temps [s]
R
p
.

i
m
p
.

[
1
/
m
]
Capteur #1 (0.7, 0, 0) [m]
Capteur #2 (0.525, 0, 0) [m]
Capteur #3 (0.35, 0, 0) [m]
Capteur #4 (0.175, 0, 0) [m]
Capteur #5 (0, 0, 0) [m]
Figure 4.18 Comparaison des rponses
impulsionnelles (dans la plage de frquences
de 0 940 Hz) reproduites et virtuelles.
58
caus par un sous-chantillonnage spatial au niveau des sources de reproduction.
Ces points peuvent, parmi dautres facteurs, expliquer les erreurs de reproduction en salle
qui seront notables la section suivante. Cette courte analyse par le biais de simulations tho-
riques permettra donc de mieux interprter les mesures exprimentales. Finalement, ces lacunes
sont aussi des points dignes dattention dans le cadre de cette thse puisquelles pourraient tre
sujettes certaines amliorations par le biais du contrle actif et donc du ltrage adaptatif. La
section suivante prsente deux modications simples de la WFS pour amliorer la qualit du
champ reproduit (toujours dans le cas de ltude en champ libre).
4.4 Attnuation des effets de bord en WFS et choix de la ligne de rfrence
Une des causes de limperfection des fonctions de rponse en frquence obtenue pour la
WFS est issue de leffet de bord. Cest--dire une consquence directe de lusage dune ligne
de sources de reproduction nie [Ziomek, 1995] et non pas innie comme lassume le dve-
loppement des oprateurs de la WFS. Dans ce cas, les sources de reproduction lextrmit de
lantenne nie produiront des ondes de diffraction
11
indsirables.
Pour amenuiser ces effets de bord, une fentre spatiale est habituellement applique pour
rduire progressivement lamplitude des sources de reproduction aux extrmits du rseau de
sources sollicites pour la reproduction dune source virtuelle donne laide de la WFS. La
fentre mise de lavant par Verheijen [Verheijen, 1998] est une fentre rectangulaire dont les
extrmits (stalant sur un mtre environ) sont deux moitis dune fentre de Hanning.
Pour illustrer cet effet de bord et lutilisation dune telle fentre, la gure 4.19 (p. 60) pr-
sente les FRF rsultant de la WFS (comme dans le cas de la gure 4.10 (p. 52) pour la con-
guration de la gure 4.9 (p. 52) avec la position de source virtuelle (a)) avec et sans fentre
11
On fait rfrence ici la production dondes de diffraction par analogie avec la rexion et la diffraction dun
corps rigide ni expos une onde acoustique. Ainsi, en exposant une plaque nie et rigide une onde acoustique
issue dune source ponctuelle devant la plaque, on obtient une image (selon la technique des images) de la source
produisant londe incidente dans la mesure o la frquence est sufsamment leve pour produire un gradient de
pression incidente sufsamment important pour solliciter lapparition de rexion et de diffraction an de respecter
une condition frontire rigide. Par contre, limage, tant donnes les dimensions nies de la plaque, ne rayonne pas
pour toutes les directions de telle sorte que suivant un front donde produit par limage devant la plaque, dautres
fronts surgissent de la priphrie de la plaque. Il y a donc diffraction. Et cest par analogie que lon tend le principe
de diffraction des bords la reproduction de champs acoustiques.
59
Figure 4.19 Comparaison des rponses en frquence sans (en haut) et avec fentre (en bas)
dattnuation des effets de bord
dattnuation des effets de bord. Selon cette gure, il est clair quune part des effets de ltre en
peigne identis la section 4.3.1 sont donc attribuables aux effets de bord
12
Dun autre ct, ce type de pondration spatiale prsente ses limites. Ainsi, lorsque le rseau
de sources de reproduction prsente des discontinuits gomtriques, il y a dabrupts change-
ments dans les amplitudes des sources de reproduction et les coins gomtriques produisent
aussi des ondes de diffraction puisque les amplitudes aux coins ne sont pas pondres. Ces
changements damplitudes attribuables aux coins gomtriques proviennent du fait que le gra-
dient normal de pression virtuelle, qui fait partie de la dnition des oprateurs de la WFS
partir de la formulation intrgale de Kirchhoff-Helmholtz, change tant donne, justement, la
12
On souligne ici que labrupte discontinuit spatiale des amplitudes monopolaires sollicites pour la recons-
truction dun champ est la cause des effets de bord. Aux environs de ces discontinuits, dautres sources devraient
(dans le cas de la ligne innie) tre actives et qui, par interfrence avec celles causant les effets de bord, viteraient
lapparition de fronts donde retardataires qui causent une part des effets de ltre en peigne sous la frquence de
repliement spatial.
60
3
2
1
0
1
2
3
1
0
1
2
3
0
0.5
1
x
2
[m]
x
1
[m]
Figure 4.20 Amplitudes des sources de reproduction (reprsentes par des et multiplies
par 6 pour ns dillustration) et amplitude de la pondration spatiale (reprsente par les plus
gros cercles).
discontinuit de la dnition de la normale. La gure 4.20 (p. 61) prsente un exemple avec
une antenne de sources brise. Sur cette gure, les carrs reprsentent les sources, les pr-
sentent les amplitudes (multiplies par 6 pour n dillustration) des sources selon la WFS et les
plus gros cercles illustrent la pondration spatiale dcrite au prcdent paragraphe. Les courtes
lignes termines par de petits cercles dans le plan horizontal ne font quillustrer laxe principal
des sources de reproduction de type monople
13
. On note aussi que la gure 4.20 (p. 61) pr-
sente des rsultats pour une frquence donne arbitrairement, sous la frquence de repliement
spatial. Pour dautres frquences, la courbe conserve la mme distribution relative des ampli-
tudes, seule lamplitude gnrale des sources change. Pour cette raison, cette gure reprsente
donc un cas gnrique lamplitude prs. La source virtuelle nest pas montre sur lillustration.
Elle se trouve (0, 7, 0) mtres. Les discontinuits dans la distribution spatiale des amplitudes
des sources de reproduction pourront aussi produire des ondes de diffraction indsirables. La
contribution de ce genre de composantes pourrait aussi tre rduite par le biais du contrle actif
de la reproduction par WFS.
Ainsi, quoique des lacunes de reproduction par la WFS furent identies la section 4.3.1,
une part de celles-ci peut tre aisment attnue par lintroduit dune fentre de correction des
amplitudes des sources de reproduction. Il demeure quune certaine coloration puisse apparatre,
notamment en fonction de la position de la source virtuelle, tel quil le fut introduit la section
13
Mme si on suppose que les sources produisent un rayonnement omnidirectionnel, laxe principal est important
dans le calcul des oprateurs de la WFS puisquil dtermine la normale (dans le plan horizontal) la ligne de sources
de reproduction.
61
4
2
0
2
4
0
2
4
0
1
x
2
[m]
x
1
[m]
Ligne de rf.
Source virtuelle
Figure 4.21 Conguration dun systme de
WFS avec une ligne de rfrence linaire.
2
1
0
1
2
3
4
0
1
2
3
4
0
0.5
1
1.5
x
2
[m]
x
1
[m]
L
i
g
n
e

d
e

r
f
.

Source virtuelle
Figure 4.22 Conguration dun systme de
WFS avec une ligne de rfrence circulaire.
4.3.1. Les ondes de diffraction produites par les coins dune antenne de sources pourraient aussi
tre corriges par le contrle actif de la WFS. Toutes les prochaines simulations avances pour
n de comparaison avec les mesures de champs reproduits incluent la fentre de correction
introduite en cette section, soit deux demi-fentres de Hanning aux extrmits du groupe de
sources de reproduction actives (ces demi-fentres stalent sur une mtre environ).
En plus de lutilisation dune pondration spatiale des amplitudes de reproduction pour at-
tnuer les effets de bord, on introduit maintenant quelques notes au sujet du choix de la ligne
de rfrence. Tel que lexpose la section A.5 partir de la page 327, le choix de la ligne de
rfrence intervient dans la dnition des oprateurs de synthse de la WFS. Deux types de
ligne de rfrence sont habituellement utiliss. Dans le premier cas, la ligne de rfrence est une
droite passant par le centre de lantenne de sources et perpendiculaire avec une droite reliant la
source virtuelle au centre de lantenne de sources [Verheijen, 1998]. Le dtail dun tel exemple
est illustr la gure 4.21 (p. 62). Sur la gure 4.21 (p. 62), les prsentent lamplitude des
sources de reproduction (toujours multiplie par 6) pour n dillustration. Le fait dutiliser une
ligne de rfrence linaire peut introduire quelques uctuations dans les amplitudes des sources
de reproduction.
Dans le deuxime cas, la ligne de rfrence est un cercle passant par le centre de lantenne
de sources et centr la position de la source virtuelle [Verheijen, 1998]. Le dtail dun tel
exemple est illustr la gure 4.22 (p. 62). En terme de champs reproduits, la diffrence entre
les approches est faible mais la ligne de rfrence de type circulaire rduit quelques problmes
gomtriques et simplie le calcul des oprateurs de la WFS. Pour la plupart des simulations et
des exprimentations prsentes dans cette thse, on utilise une ligne de rfrence circulaire sauf
62
au chapitre 5 alors quune ligne droite de rfrence fut utilise dans une version simplie de la
WFS. Pour les ralisations pratiques de la WFS (chapitre 9), une ligne de rfrence circulaire
est utilise.
4.5 valuation objective de la WFS en situation exprimentale
Cette section regroupe lensemble des rsultats les plus importants qui ont suivi une pro-
cdure dvaluation objective de la reproduction laide de la WFS dans une situation relle.
Par le biais de telles mesures, on souhaite identier les caractristiques relles qui mritent une
attention pour n damlioration.
4.5.1 La procdure exprimentale en rsum
Le systme tudi est un systme de WFS dvelopp par linstitut de recherche Fraunhofer
bas Ilemenau (Allemagne) [Fraunhofer, Institut Integrierte Schaltungen, 2003]. Le systme,
qui regroupait 88 haut-parleurs et deux transducteurs dextrmes basses, est illustr la gure
4.23 (p. 64) et prsent avec plus de dtails (notamment au sujet du lieu de reproduction) lan-
nexe C. La conguration des haut-parleurs et des microphones est prsente la gure 4.24 (p.
64). Le rseau de haut-parleurs couvre approximativement un cercle denviron 2.2 m de rayon.
Le local de reproduction est situ au sous-sol du Redpath Hall lUniversit McGill (Mont-
ral, Qubec, Canada), ce local de recherche est le MARLAB (Multichannel Audio Research
LABoratory). Le reste de linformation sur le systme de WFS (le lieu de reproduction et la
dmarche de traitement des donnes) est plac en annexe (annexe C, page 374).
En bref, on sintresse aux rponses limpulsion et aux rponses en frquences entre la
source virtuelle et un rseau de microphones. Les rponses limpulsion sont directement obte-
nues partir dun processus didentication adaptative. Tous les signaux et les rponses prsen-
ts dans les sections qui suivent sont ltrs passe-bas 1 kHz pour viter le repliement spatial
dans la mesure o ce sont les performances de la WFS effective qui sont dimportance.
63
Figure 4.23 Photographie principale du systme de WFS install lUniversit McGill
montrant la partie frontale du rseau de haut-parleurs, la station PC et lantenne de
microphones utilise.
2 0 2
2
0
2
x [m]
y

[
m
]
Loudspeakers
Origin
Microphones
9 17
25
1
33
41
49
57
65
73
81
1 8
Figure 4.24 Conguration dans le plan horizontal des haut-parleurs et des microphones
utiliss pour la mesure objective de la reproduction de champs acoustiques par WFS.
64
8 6 4 2 0 2 4 6 8
2
0
2
4
6
8
10
12
x
1
[m]
x
2

[
m
]
3
0

d
e
g
r
s

Hautparleurs
Sources virtuelles
M
i
c
r
o
p
h
o
n
e
s

(
a
)

(
b
)
(c)
Figure 4.25 Conguration des sources
virtuelles tudies dans le plan horizontal.
200 400 600 800 1000
0.2
0.4
0.6
0.8
1
Frq. [Hz]
C
o
h
r
e
n
c
e
550 600 650 700 750 800 850
0.8
0.9
1
Frq. [Hz]
C
o
h
r
e
n
c
e
200 400 600 800 1000
0
0.5
1
Frq. [Hz]
C
o
h
r
e
n
c
e
50
0
50
100
G
a
i
n

d
e

l
a

F
R
F

[
d
B

r
e
f

1
]
#2
#3
#4
#5
512
64
128
256
512
64
128
256
(a)
(b)
(c)

FRF
Figure 4.26 Estimations des fonctions de
cohrence pour diffrents nombres de
moyennes.
4.5.2 Congurations tudies
Pour lvaluation objective de la qualit de la reproduction par la WFS, diffrentes positions
de sources virtuelles et diffrentes congurations des rideaux acoustiques qui recouvrent les
murs sont tudies. Les positions des six sources virtuelles sont prsentes la gure 4.25 (p.
65) en relation avec la position des haut-parleurs et du centre de lantenne de haut-parleurs (le
point dorigine pour la description des scnes virtuelles). En tout, dix essais diffrents furent
raliss. Dans cette thse, seulement quatre essais sont exposs an de faire valoir lessentiel
des conclusions au sujet de lvaluation objective des performances de la WFS en salle.
Une premire srie dessais est ralise pour les six positions de sources virtuelles indiques
la gure 4.25 (p. 65). On note quau moment des exprimentations, le logiciel de synthse
wfssynth, responsable de la production des oprateurs de WFS et du ltrage, produisait des
messages derreur lors de la reproduction dondes planes. La production dondes planes fut donc
simplement remplace par la production dondes sphriques loignes (avec compensation de la
perte damplitude). On note, par contre, quavec un rayon de courbure de 12 m au centre de lan-
tenne de capteurs (qui fait prs de 1.225 m de long), le front virtuelle serait pratiquement plan.
Trois autres essais sont raliss pour deux positions de sources virtuelles, mais cette fois cer-
taines parties (le quart environ) des rideaux acoustiques sont enleves. Les positions de sources
65
virtuelles dont les mesures sont relates dans cette thse sont identies par (a), (b) et (c) la
gure 4.25 (p. 65).
4.5.3 Au sujet de la cohrence et de la validit des mesures
Quelques mots sont introduits au sujet de la cohrence et de la convergence des rponses
limpulsion (values par le biais de la mthode introduite la section C la page 374) an de
dmontrer sommairement la validit des rsultats exprimentaux.
Cohrence
Les fonctions de cohrence entre le signal de rfrence et les pressions acoustiques mesures
pour quelques microphones dans le cas de la production dune source virtuelle en (a) sont pr-
sentes la gure 4.26 (p. 65) titre dexemples typiques. Pour cette valuation, un maximum
de 512 moyennes sont ralises avec un chevauchement de 66%.
La partie (a) de la gure 4.26 (p. 65) dmontre quen augmentant le nombre de moyennes
lors de lestimation de la cohrence, cette mme estimation converge vers la courbe 512
moyennes. La partie (b) de la mme gure offre plus de dtails ce sujet alors quil est possible
dy voir la variation de cohrence avec laugmentation du nombre de moyennes. Pour les sec-
teurs o la cohrence est prs de un, il est impossible de distinguer des changements alors que
dans les secteurs o la cohrence est plus faible, laugmentation du nombre de moyennes laisse
voir une convergence plus tale en fonction du nombre de moyennes. Ces deux remarques,
conjugues avec latteinte dune cohrence pratiquement unitaire sur une large plage de fr-
quence ( lexception des plages de rsonances et de crevasses de la rponse qui sont visibles
sur la FRF superpose au fonction de cohrence
14
), valident donc la qualit des mesures. La
partie (c) de la gure 4.26 (p. 65) prsente des estimations de cohrences pour quatre autres
microphones pour le mme scnario de reproduction.
14
Il est typique dobtenir de telles rductions de la cohrence aux frquences de rsonance et aux crevasses de
la rponse tant donn que le dnominateur et le numrateur de la FRF deviennent trs faibles pour des zones de
rsonance et de crevasse, respectivement.
66
Rponse limpulsion
Pour lidentication des fonctions de transfert, un ltrage adaptatif de type gradient sto-
chastique LMS (Least-Mean-Square) normalis est utilis dans le domaine temporel. Pour
souligner la validit de lapproche on note que la variation absolue moyenne des coefcients du
ltre la n de ce processus didentication est de lordre de 10
9
alors que le coefcient maxi-
mal du ltre correspondant est environ 6 10
2
soit bien au-del du niveau de variation moyen
des coefcients. Les identications utilises pour illustrer la qualit de la reproduction par WFS
se basent sur prs de 1 200 000 chantillons (environ 240 secondes 6 kHz), tous utiliss pour
lidentication adaptative des rponses impulsionnelles.
4.5.4 Rponses en frquence
De la mme faon que les FRF de la WFS furent prsentes pour les simulations thoriques,
les FRF exprimentales sont ici introduites pour quelques cas reprsentatifs. On sintresse,
cette fois, plus spcialement la coloration potentielle de la salle sur les FRF.
Position virtuelle (a)
Les FRF mesures pour la position virtuelle (a) sont prsentes la gure 4.27 (p. 69) pour
les huit microphones. Les gains sont exprims en [dBref1] partir du ratio entre les pressions
mesures et le voltage de rfrence. Sur cette mme gure, les FRF simules pour la WFS
en champ libre (comme la section 4.3
15
) sont aussi introduites. On note, par contre, que les
dnitions des gains des simulations ne correspondent pas avec les gains des mesures et sont
donc arbitrairement superposs sur cette gure. Ils sont positionns manuellement an dobtenir
une correspondance moyenne pour n de comparaison. Dans le cas des FRF simules pour la
WFS, le gain est dni par le ratio entre pression acoustique simule et lamplitude monopolaire
S de la source virtuelle. Ce dcalage damplitude nest pas important puisque cest lallure, la
distribution, de la courbe en fonction de la frquence qui nous importe.
partir de cette premire gure, il est facile de constater limportant cart entre la WFS
15
An de clarier quelque peu, on note que ces simulations de la WFS en champ libre incluent lensemble des
lments mentionns la section 4.3 : pondration spatiale de lamplitude des sources de reproductionpour attnuer
les effets de bord, utilisation dune srie discrte de sources de reproduction dont les positions correspondent
celles du systme rel utilis pour les mesures et recours une ligne de rfrence circulaire.
67
simule en champ libre et la WFS mesure dans une salle relle. Les imperfections de la WFS
en salle sont donc essentiellement attribuables la dynamique de la salle bien plus quaux autres
phnomnes identis en champ libre dans les sections prcdentes.
Toujours selon la gure 4.27 (p. 69), on constate que les FRF, pour chacun des micro-
phones, sont passablement similaires en basses frquences. Cest ainsi que les FRF partagent
par exemple une pointe de rponse, aux environs de 160 Hz, possiblement attribuable un des
modes de la salle de reproduction. En plus hautes frquences, les FRF montrent plus de distinc-
tions entre elles, ce qui est normal tant donne la taille de la longueur donde en comparaison
avec celle de lantenne de microphones. En plus, lautocorrlation spatiale est dune tendue
rduite en plus hautes frquences pour un champ acoustique dans un espace clos [Pierce, 1991].
En basses frquences (sous 250 Hz environ), les FRF, en plus dtre semblables, prsentent
une rponse typiquement modale comme aux environs de 150 Hz. Il est par contre difcille
de dire avec certitude si cette pointe de rponse est cause par un mode propre seul ou par
un formant de salle [Jouhaneau, 1997]. Il est plus probable que ce soit un formant de salle
(une agglomration de modes) puisque 150 Hz est probablement au-dessus de la frquence de
Schroeder
16
de la salle. En plus hautes frquences, on note labscence de pointes dans les FRF.
Par contre, plusieurs crevasses, causes par linterfrence destructive des rexions aux capteurs
sont remarquables. Ce genre de rponse est typique pour des espaces acoustiques ferms [Elliott,
2001]. Sur cette gure et les suivantes du mme type, des rsultats de simulations en salle sont
superposs pour les plus basses frquences. Ces simulations sont bases sur le modle dcrit
au chapitre suivant. On note que, mme si les FRF simules en salle sont diffrentes de celles
obtenues par exprimentation (ce qui est normal si on considre la seule complexit gomtrique
du lieu rel versus celle du modle), elles prsentent une tendance similaire celles mesures,
comme, par exemple, lapparition de formants de salle en basses frquences et la similarit des
huit FRF pour les plus basses frquences.
Position virtuelle (b)
Les FRF mesures pour la position virtuelle (b) sont prsentes la gure 4.28 (p. 69)
pour les huit microphones. On peut essentiellement avancer les mmes conclusions que pour
la position virtuelle (a). Cest au niveau de la forme du premier front donde reproduit que des
diffrences entre les positions des sources virtuelles seront plus videntes et faciles interprter
16
Au-del de la frquence de Schroeder, plus de trois modes sont alors excits chaque frquence.
68
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
Gains des FRF mesures (p/v)
et simules (p/S) pour la
WFS [dB ref 1]
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
40
20
0
Frq. [Hz]
Mesures
Sim. champ libre
Sim. en salle
#
1
#
2
#
3
#
4
#
5
#
6
#
7
#
8
Figure 4.27 FRF mesures et simules pour la
position virtuelle (a).
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
Frq. [Hz]
Mesures
Sim. champ libre
Sim. en salle
Gains des FRF mesures (p/V)
WFS [dB ref 1]
#
1
#
2
#
3
#
4
#
5
#
6
#
7
#
8
position virtuelle (b).
la section 4.5.5.
Position virtuelle (c)
Les FRF mesures pour la position virtuelle (c) sont prsentes la gure 4.29 (p. 71) pour
les huit microphones. On peut essentiellement avancer les mmes conclusions que pour les
positions virtuelles (a) et (b).
69
Position virtuelle (a) avec une part des rideaux acoustiques qui est soustraite
Les FRF mesures pour la position virtuelle (a) sont prsentes la gure 4.29 (p. 71)
pour les huit microphones alors quenviron le quart de la surface des rideaux acoustiques est
soustraite. Encore une fois, les FRF mesures ne correspondent pas avec la WFS thorique
idale dune situation de type champ libre.
An dentrevoir quel pourrait tre leffet de la rduction de la surface couverte par les ri-
deaux acoustiques, la gure 4.30 (p. 71) superpose les rsultats obtenus avec plus ou moins de
rideaux acoustiques. Comme on peut le voir sur cette dernire gure, des diffrences sont vi-
sibles mais aucune tendance particulire ne semble les caractriser. Il savre en fait impossible
de conclure quant leffet de la diffrence des situations puisque cette distinction nest pas assez
marque.
En ce qui concerne lensemble des FRF mesures pour toutes les positions virtuelles, la
conclusion la plus importante semble tre le fait que la salle introduit une importante coloration
de la rponse frquentielle (en comparaison avec la WFS thorique simule en champ libre)
qui ne semble pas varier en fonction de la position de la source virtuelle. Ainsi, quoique quen
champ libre cette coloration pouvait changer pour diffrentes positions de sources virtuelles,
il semble que ce soit la rponse de salle qui domine la dviation de la rponse frquentielle
reproduite en comparaison avec celle simule en champ libre.
4.5.5 Rponses limpulsion
Les RI exprimentales sont ici introduites pour des cas reprsentatifs de la reproduction de
champs par WFS. On sintresse plus spcialement la reproduction de la courbure des fronts
donde en salle et lidentication des effets de la salle sur la qualit du front donde reproduit,
et ce, notamment, aprs le passage du premier front donde correspondant au champ direct.
Position virtuelle (a)
Les RI pour la position virtuelle (a) sont prsentes la gure 4.31 (p. 73). Encore une fois,
les rsultats de simulations en champ libre ont t positionns manuellement sur les rsultats ex-
primentaux pour n de comparaison, mme si les systmes simuls ne correspondent pas un
70
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
Gain des FRF mesures (p/V)
WFS [dB ref 1]
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
Frq. [Hz]
Mesures
Sim. champ libre
Sim. en salle
#
1
#
2
#
3
#
4
#
5
#
6
#
7
#
8
position virtuelle (c).
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
Gains des FRF mesures (p/V)
pour la WFS [dB ref 1]
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
100 200 300 400 500 600 700 800 900 1000
60
40
20
0
Frq. [Hz]
Avec rideaux
Avec 3/4 rideaux
#
1
#
2
#
3
#
4
#
5
#
6
#
7
#
8
position virtuelle (a) avec une part des rideaux
acoustiques en moins.
ratio entre pression sonore et voltage de rfrence mais bien entre pression sonore et amplitude
monopolaire. Puisque les rsultats simuls en champ libre sont ainsi superposs aux rsultats
exprimentaux pour valuer la forme du front donde reproduit : globalement, lamplitude et le
retard temporel ne sont pas vraiment rvlateurs. Ce qui permet donc cet ajustement manuel des
rsultats. En plus des simulations de la WFS en champ libre, les temps et amplitudes de passage
du front donde virtuel sont indiqus par des cercles et relis par un trait sur cette mme gure.
Ces valeurs virtuels ont aussi t ajustes manuellement pour n de comparaison.
Comme on peut le voir sur la gure, le premier front donde mesur est convenablement
71
reproduit en ce qui concerne les amplitudes relatives et des dlais relatifs entre les capteurs :
la correspondance avec la WFS simule en champ libre et le passage du front donde virtuel
est bonne. On note aussi une bonne symtrie des RI autour du centre de lantenne ; ce qui
correspond bien avec le fait que la source virtuelle est centre devant lantenne de microphones.
Par contre, aprs le passage du premier front (symtrique par rapport au centre de lantenne de
microphones), la rponse de la salle de reproduction dmontre clairement son inuence et la
dgradation de la correspondance entre les simulations en champ libre et les mesures en salle.
Quoiquil soit prilleux didentier prcisment les lments de la rponse impulsionnelle, on
note la probable prsence de quelques chos. An de mieux interprter cette gure, on remarque
que 5 ms (selon la grille de la gure) correspond environ une distance de propagation de 1.65 m
(avec une vitesse de propagation de 331 m/s).
Position virtuelle (b)
Les RI pour la position virtuelle (b) sont prsentes la gure 4.32 (p. 73). Selon le mme
type dobservations que pour les RI de la position virtuelle (a), on note que le premier front
est convenablement reproduit. Et ce, notamment, au niveau de la courbure du front (diffrente
de celle de la position virtuelle (a)) et des amplitudes relatives. Par contre, puisque la ligne
de rfrence ne croise le groupe de microphones quau centre de la pice
17
, des erreurs de
reproduction damplitudes [Verheijen, 1998] relatives entre les microphones sont probablement
introduites dans les rsultats.
Position virtuelle (c)
Les RI pour la position virtuelle (c) sont prsentes la gure 4.33 (p. 74). Toujours selon
les arguments prsents aux deux sous-sections prcdentes, seul le premier front donde qui
correspond une situation en champ libre, cest--dire avant toute rexion est bien reproduit.
Suivant le passage de ce premier front, la dynamique indsirable de la salle laisse voir son effet.
17
La ligne de rfrence correspond la ligne o, selon le dveloppement thorique de la WFS, il ny a pas
derreur damplitude lors de la reproduction thorique en champ libre. En dehors de la ligne de rfrence, on peut
sattendre de lgres erreurs damplitude.
72
0.165 0.17 0.175 0.18 0.185 0.19
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
Temps [s]
Capteur #1
Capteur #2
Capteur #3
Capteur #4
Capteur #5
Capteur #6
Capteur #7
Capteur #8
Figure 4.31 RI mesures et simules pour la
position virtuelle (a). Les temps et amplitudes
darrive du front donde virtuel sont illustrs
par les cercles et connects par le trait pointill.
0.165 0.17 0.175 0.18 0.185 0.19
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
Temps [s]
Capteur #1
Capteur #2
Capteur #3
Capteur #4
Capteur #5
Capteur #6
Capteur #7
Capteur #8
position virtuelle (b). Les temps et amplitudes
Position virtuelle (a) avec une part des rideaux acoustiques qui est soustraite
Les RI pour la position virtuelle (a) avec moins de rideaux absorbants sont prsentes la
gure 4.34 (p. 74). Encore une fois, seul le passage du premier front donde est convenablement
reproduit. En ce qui concerne la comparaison avec le cas qui inclut lensemble des rideaux et
celui dont une part des rideaux est soustraite, il est possible de noter que, par le biais de la gure
4.34 (p. 74) qui prsente les deux RI, comme du point de vue frquentiel, les diffrences sont
trop faibles pour tablir une quelconque conclusion ce sujet.
Lensemble des rsultats dvaluation des RI peut se rsumer autrement par le biais des
73
0.165 0.17 0.175 0.18 0.185 0.19
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
Temps [s]
Capteur #1
Capteur #2
Capteur #3
Capteur #4
Capteur #5
Capteur #6
Capteur #7
Capteur #8
position virtuelle (c). Les temps et amplitudes
0.165 0.17 0.175 0.18 0.185 0.19
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
0.05
0
Temps [s]
Capteur #1
Capteur #2
Capteur #3
Capteur #4
Capteur #5
Capteur #6
Capteur #7
Capteur #8
Figure 4.34 RI mesures pour la position
virtuelle (a) avec une part rideaux des
acoustiques en moins. En pointill : avec le 3/4
des rideaux. En continu : avec tous les rideaux.
Les temps et amplitudes darrive du front
donde virtuel sont illustrs par les cercles et
connects par le trait pointill.
74
gures 4.35 (p. 76) et 4.36 (p. 77). Avec ces deux groupes de gures, on note quelques points
supplmentaires. Tel quil le fut dj remarqu, et comme on peut le voir sur la gure 4.35 (p.
76), les fronts dondes sont convenablement reproduits. Par contre, la gure 4.35 (p. 76) permet
aussi de constater lallure et la prsence de rexions distinctes suivant le passage du premier
front. Cest ainsi quentre 0.17 s et 0.18 s on note le passage de deux ou trois rexions qui
prennent pratiquement la mme courbure que le front reproduire, ce qui laisse supposer que
ces rexions proviennent de surfaces proches des sources de reproduction : le mur derrire
les haut-parleurs, le plafond et le plancher. Suivant 0.18 s, on peut voir dautres fronts, moins
uniformes sur lantenne. Fait intressant, de plus petits fronts, avec un certain angle dincidence,
sont visibles dans le cas des positions virtuelles (b) et (c). En complment, la gure 4.36 (p. 77)
prsente une seule partie des rponses impulsionnelles dans lespace de telle sorte quil soit
possible de mieux visualiser lallure des fronts directs. Comme on peut le voir, les positions
virtuelles (b) et (c) (qui proposent la mme direction dincidence lantenne mais des distances
diffrentes) produisent des courbures de front diffrentes, comme le sont les fronts reproduire
(on approche une onde plane dans le cas de la source virtuelle en (c) qui est douze mtres du
centre de lantenne de capteurs).
Pour lensemble de ces rsultats danalyse des RI mesures en comparaison avec les RI
simules en champ libre pour la WFS, on retient donc que le premier front donde (plus pr-
cisment sa courbure et ses dlais relatifs aux positions des microphones) est reproduit mais
que la pice laisse des traces indsirables aprs son passage. Encore une fois, cest la salle qui
prsente le plus dinuences indsirables dans le domaine temporel comme dans le domaine des
frquences.
4.6 Conclusion
Ce chapitre rassemble les premiers essais au sujet de lvaluation objective (sur la base de
critres physiques) de la qualit de la reproduction de champs acoustiques par WFS classique
dans une salle relle. En deux parties, dont une prsentait des simulations thoriques en champ
libre et dont lautre illustrait les rsultats de mesures exprimentales, il fut montr que la WFS
introduit diffrents types derreurs causes par diffrents facteurs. Pour rsumer ces aspects, la
liste suivante est introduite.
1. Par le biais de simulations de rseaux et de la WFS en champ libre, il fut montr que
75
Figure 4.35 Rponses impulsionnelles mesures pour la WFS en fonction du temps et de
lespace. Le trait reprsente la courbure du front virtuel titre indicatif.
(a) la WFS peut reproduire un front sous la frquence de repliement spatial de la WFS
(au moins deux sources de reproduction par longueur donde, selon le critre le plus
restrictif) ;
(b) la WFS souffre dune limite en frquence dnie par la sparation des sources (re-
pliement spatial) ;
(c) selon la position de la source virtuelle par rapport lantenne de sources de repro-
duction, une coloration frquentielle indsirable peut apparatre mme en champ
libre ;
(d) des colorations sont aussi attribuables aux effets de bord ; une part de ces colora-
tions peut tre rduite grce lutilisation dune fentre de pondration spatiale des
amplitudes des sources ;
2. Grce aux mesures exprimentales, il fut dmontr que (sous 1 kHz)
(a) les rponses en frquences subissent une importante coloration essentiellement at-
tribuable la dynamique de la salle ;
76
Figure 4.36 Zoom temporel sur les rponses impulsionnelles mesures pour la WFS en
fonction du temps et de lespace. Le trait reprsente la courbure du front virtuel titre indicatif.
(b) ces colorations prennent plus dimportance que les dfauts introduits dans la situa-
tion thorique en champ libre ;
(c) ces colorations ne prsentent pas de tendances en fonction de la position de la source
virtuelle ;
(d) en basses frquences, on remarque lapparition probable de formants de salle ;
(e) en basses frquences, les FRF aux capteurs sont trs similaires (la rponse est rela-
tivement homogne sur lantenne de capteurs) ;
(f) en hautes frquences, les colorations sont causes par des rexions et des interf-
rences destructives aux capteurs ;
(g) en hautes frquences, les FRF aux capteurs varient beaucoup en fonction de les-
pace ;
(h) les premiers fronts dondes sont par contre convenablement reproduits (en terme de
courbure et dincidence du front, sous la frquence de repliement spatial) ;
(i) suivant le passage du premier front (en champ direct) la salle introduit des artfacts
indsirables qui causent un cart entre la WFS thorique et la WFS pratique, en
situation relle.
77
Lensemble de ces remarques montre donc clairement que la WFS, en situation relle, est
sujette diffrentes imperfections dabord causes par la prsence dun espace de reproduction
ferm. Cest sur ce point que la reproduction de champs acoustiques par contrle actif et ltrage
adaptatif pourrait donc introduire une amlioration.
78
CHAPITRE 5
MODLISATIONACOUSTIQUEDE LA REPRODUCTION
DECHAMPS ACOUSTIQUESENSALLE: ANALYSES THO-
RIQUES ET SIMULATIONS
5.1 Rsum franais
Cet article
1
prsente les premires simulations de contrle actif de la reproduction de champs
acoustiques en salle et en champ libre. Lobjectif tait alors deffectuer une tude de faisabilit
qui se tournait vers laspect physique du problme. Le rsum de larticle suit.
Cet article dcrit les simulations et les rsultats obtenus en appliquant la thorie du contrle
optimal la reproduction de champs acoustiques progressifs (principalement pour des appli-
cations audio) sur une plage tendue de lespace laide de haut-parleurs monopolaires. Le
modle simule un systme de reproduction qui opre en champ libre ou en un espace ferm
qui approche une salle dcoute typique et se base sur le contrle optimal dans le domaine fr-
quentiel. Cette approche simple est retenue comme premire investigation de la physique de
la problmatique. Dautres sujets abords concernent la comparaison avec la WFS et lidenti-
cation des mcanismes de contrle physiques. Les rsultats suggrent que la reproduction de
champs acoustiques en salle par contrle actif peut tre atteinte avec une erreur de reproduc-
tion rsiduelle moins importante que celle de la WFS dans la mme situation. Les techniques
actives de reproduction ont lavantage de compenser automatiquement la dynamique de la salle
de reproduction. Pour les cas considrs, les simulations montrent que les rsultats de contrle
optimal ne sont pas sensibles (en terme derreur de reproduction) labsorption des murs de
la salle de reproduction. Une conguration spciale circonfrentielle de capteurs est introduite
1
P.-A. Gauthier, A. Berry, W. Woszczyk, Sound eld reproduction in-room using optimal control techniques :
Simulations in the frequency domain, Journal of the Acoustical Society of America, vol. 117, no 2, p. 662-678,
2005.
79
pour un espace dcoute dgag de capteurs pour des applications en champ libre.
5.2 Sound eld reproduction in-room using optimal control techniques : Simulations in
the frequency domain
This paper describes the simulations and results obtained when applying optimal control to
progressive sound eld reproduction (mainly for audio applications) over an area using mul-
tiple monopole loudspeakers. The model simulates a reproduction system that operates either
in free-eld or in a closed space approaching a typical listening room, and is based on optimal
control in the frequency domain. This rather simple approach is chosen for the purpose of phy-
sical investigation especially in terms of sensing microphones and reproduction loudspeakers
congurations. Other issues of interest concern the comparison with Wave Field Synthesis and
the control mechanisms. The results suggest that in-room reproduction of sound eld using ac-
tive control can be achieved with a residual normalized squared error signicantly lower than
open-loop Wave Field Synthesis in the same situation. Active reproduction techniques have
the advantage of automatically compensating the rooms natural dynamics. For the considered
cases, the simulations show that optimal control results are not sensitive (in terms of reproduc-
tion error) to wall absorption in the reproduction room. A special surrounding conguration of
sensors is introduced for a sensor-free listening area in free eld.
5.3 Introduction
This paper investigates the theoretical possibilities for sound eld reproduction using opti-
mal control methods for potential audio applications. The major goals of this work are feasibi-
lity and parametric studies with questions : 1) The effect of a reective acoustic environment
on objective reproduction quality in comparison with free-eld conditions, 2) the comparison of
optimal control method with Wave Field Synthesis (WFS) and 3) the introduction of a practical
conguration which can be, as mentioned later, related to WFS.
The simulations presented in this paper have been carried with a conventional least-square
error formulation for the acoustical part of the problem [Elliott, 2001; Nelson et Elliot, 1992]
while Wave Field Synthesis has been simulated using non-focusing WFS operators for a ge-
neral source array with a straight reference line [Verheijen, 1998]. Simple and harmonic wave
80
reproductions are considered in free-eld or in-room conditions.
Historically, spatial sound reproduction has been a vivid and creative research domain in-
volving artists, engineers and scientists [Davis, 2003; Henriksen, 2002; Rumsey, 2001; Wilson,
2003]. Numerous examples of historical systems, formats, patents and advances concerning
spatial audio have also been reported recently [Davis, 2003; Rumsey, 2001]. With the relati-
vely recent arrival of digital representation and multiple channels of audio, new possibilities of
sound eld control and sound reproduction have been investigated. Commonly cited examples
are : binaural techniques [Begault, 1994; Blauert, 1999], ambisonic formats [Rumsey, 2001],
Wave Field Synthesis (WFS) [Berkhout et al., 1993; Verheijen, 1998], and Stereo-Dipole (SD)
[Nelson et al., 1997; Nelson, 2002; Watanabe et al., 1999]. In a broad sense, most of these tech-
niques try to improve two aspects of the consumer level reproduction technology, with variable
weighting and methods. 1) Achieve a large listening area for a given audience. 2) Create an
appropriate 3-D (or 2-D) auditory scene.
A few words will be introduced on some of those techniques since they are mainly distingui-
shed from traditional loudspeakers systems where the mixing engineer is entirely responsible
for the channels content, like for the 5.1 or 10.2 surround systems [Rumsey, 2001]. (The x.y
numbering convention for surround sound system is used to describe a system with x broad-
band channels and y low frequency channels for subwoofers.) The work presented here is more
connected to sound eld simulation rather than to perceptual simulation, this short review will
be mainly devoted to sound eld simulation which may provide a broader listening area without
any perceptual assumptions.
Although the ultimate goal of sound eld reproduction is an audio application, one must be
aware that perfect reproduction of sound eld does not necessarily lead to perfect auditory events
reproduction since multimodal sensory inuences and cognitive mechanisms both strongly in-
uence sound localization and construction of a 3-D auditory scene [Blauert, 1999; Bregman,
1990]. In spite of this, it is assumed that, if not perfect, at least optimal sound eld reproduc-
tion will achieve optimal auditory impression if the audio system is not conicting with visual
indications or other sensory experiences. This assumption justies the wave eld simulation
approach.
81
5.3.1 Recent advances in spatial sound reproduction
The whole issue of reproduction of the spatial character of hearing may be divided in various
complementary and hierarchic categories. The rst fundamental division arises while introdu-
cing a distinction between perceptual simulation and sound eld simulation. To ensure a more
general understanding, one can interpret the simulation of sound elds like the simulation of the
physical stimulus, the sound eld in this case. Any technology that implies a measure or know-
ledge of the spatial hearing mechanisms will belong to the perception simulation class. Example
of this type are binaural technologies which may include a measure of the perceptive chain, the
external ear in this case [Begault, 1994; Blauert, 1999; Boulanger, 2000] and stereophonic pro-
ductions (usually based on phantom imaging related to interaural time delay or interaural level
difference auditory cues, [Rumsey, 2001]). With sound eld simulation, although possibly ad-
dressing the hearing system, one is not concerned with the perceptive mechanisms of spatial
hearing in the technological development. Both perceptual simulation and sound eld simula-
tion are subject of the research activities [Berkhout et al., 1993; Gardner, 1998; Kirkeby et al.,
1998; Nelson et al., 1997; Nelson, 2002; Takeuchi et Nelson, 2002; Tokuno et al., 1997; Ve-
rheijen, 1998; Ward et Elko, 1999; Watanabe et al., 1999]. The simulation of sound elds can
also be divided into two further approach types. The rst is the outer problem (the creation of
a synthetic directivity pattern around a set of acoustical sources, the reproduced sound eld is
surrounding the reproduction sources). The second is the inner problem. In this case the liste-
ning zone is surrounded by loudspeaker array which is introduced to create a sound eld within
the interior of the surrounding array. The here reported investigations belong to this last type :
inner problem of sound eld simulation. At the interface between outer and inner sound eld
simulations, there is the sound eld extrapolation where the reproduction sources are located
on a plane separating the listening area (either virtual or real) from a space where a sound eld
must be extrapolated to the listening area.
Wave Field Synthesis (WFS)
The work on the WFS originates from the theoretical analysis by Berkhout in the late 80s
and in the early 90s [Berkhout et al., 1993; Verheijen, 1998]. The underlying idea is rather
simple. From the Kirchhoff-Helmholtz integral theorem, WFS operators are dened to link a
given simple virtual source, fed by monophonic input, to an array of loudspeakers which should
reproduce the virtual source acoustic eld. The problem is usually concerned with reproduc-
tion in the horizontal plane by means of a nite number of discrete sources using appropriate
82
simplications of the integral formulation [Verheijen, 1998]. Berkhouts theory seems to be a
rigorous and up-to-date synthesis of some older ideas expressed by [Camras, 1968] and in the
30s, at the Bell Telephone Laboratory, by Steinberg and Snow [Davis, 2003; Rumsey, 2001]
2
.
With this WFS system, it is claimed that plane and spherical waves can be reproduced in a broad
planar listening area surrounded by the loudspeaker array, it is thus a volume solution. Consi-
derable amount of work on WFS has followed in Delft University of Technology and, later, in
the CARROUSO European research project, where practical issues have been investigated and
have been brought to a nal prototype installed in a movie theater in Ilmenau (Germany). WFS
researches have investigated : spatial aliasing, source type, source directivity [Verheijen, 1998],
multi-actuator panel loudspeaker [de Vries et Boone, 2003], room compensation [Spors et al.,
2003a], scene composition with WFS, subjective evaluation [Verheijen, 1998] and more.
On one hand, the benet of current WFS prototype is its efciency to transmit a spatial
impression over a broad area surrounded by the loudspeakers. Actual prototypes also provide a
convenient software tool for scene construction and kinetic spatial compositions. On the other
hand, WFS drawbacks are more subtle and mainly related to the synthesis operators denition
which makes assumptions on two points : 1) Synthesis operators are dened for a virtual free
eld space. 2) Reproduction rooms response is not considered in the process, except in specic
applications including room compensation lters after the WFS lters [Spors et al., 2003a]. The
typical WFS system is consequently based on an open-loop architecture.
In the following simulations, a relation will be shown between WFS and some particular
conguration of sensors using active control techniques.
2
The historical origin of what is called Wave Field Synthesis in its current symbolismand formulation is attribu-
table to Berkhout although some descriptions and ideas such as the ones introduced by Steinberg [Rumsey, 2001]
and later by [Camras, 1968] have been previously introduced. Interestingly, a similar theoretical concept has
been introduced by Jessel as early as in 1973 [Jessel, 1973]. Jessels holophony is based on the same Kirchhoff-
Helmholtz integral interpretation as WFS. Similar terminology is introduced about primary and secondary sources,
which is borrowed fromHuygens principle. In his book, Jessels idea was only theoretically developed in a generic
way. In fact, WFS is a specic application (implying a nite set of discrete reproduction sources) of the holophony
concept. A more recent publication has established a clear theoretical connection between ambisonic and holo-
phony or WFS [Nicol et Emerit, 1999], where it is demonstrated that ambisonic is a special case of holophony or
WFS.
83
Active sound control and adaptive ltering in audio reproduction
Classical active sound control techniques may be conceptually connected to sound repro-
duction from different view points. Firstly, in its application, active control of sound is aimed
to create a controlling (secondary) pressure eld which, locally or globally, cancels a disturbing
(primary) pressure eld. This task is nearly similar, except for a sign change, to the reproduc-
tion of a given sound eld for audio applications. Secondly, from a temporal or spectral view
point, active control and corresponding adaptive ltering techniques may be used for single-
point or multiple-point frequency response equalization. With this in mind, active sound eld
control may be applied to the spatial audio problem. This has already been done in the past using
various approaches and solutions.
Adaptive multi-point equalization in various environments, such as room and car, have been,
to our knowledge, studied and published by Elliot and Nelson rstly in 1985 and later in 1989
[Elliott et Nelson, 1989]. At that time, the main objective was the realization of a better fre-
quency response uniformity in a room enclosure. The equalization of room and loudspeakers
is thus approached from a frequency view point more than from a standpoint of an exten-
ded spatially-dependent sound eld reproduction. It is now more than interesting to note some
conclusions from the previously cited authors. It clearly seems that appropriate multiple-point
frequency equalization has been obtained by applying a proper modelling delay between the
desired signals (at the error sensor locations) which where all deduced from a single monopho-
nic signal. The introduction of these delays reproduces a wave somewhat similar to a travelling
plane wave. This suggests that room and loudspeakers frequency equalization may thus benet
from proper spatial reproduction of a given virtual eld.
Simulations have been introduced by [Kirkeby et Nelson, 1993] for plane wave reproduction
over a restricted area in free-eld condition. Major differences between Kirkebys paper and the
present paper are related to the congurations considered, the presence of a reective environ-
ment and comparisons with WFS. Following Kirkebys conclusion, a narrow-arc arrangement of
loudspeakers in front of an equalization zone (a square of 0.5 meters) may create a progressive
plane wave in free-eld reproduction conditions.
Another important research about adaptive 3-D sound systems is authored by [Garas, 1999].
Most of Garas work is related to various adaptive multichannel signal processing, including
generic electroacoustical transfer functions, for a general design which can be applied to active
noise control, cross-talk cancellation, and virtual imaging. In the case of adaptive virtual acous-
84
tics, the author suggests the use of error microphones inside listeners ears, a solution which
may not be practical.
These previous examples form a part of the published works on active control in relation
with sound reproduction. Other important papers concerning audio applications of active control
and adaptive ltering which have been published more or less recently are listed in references
[Elliott et Nelson, 1989; Elliott et al., 1994; Kirkeby et al., 1996; Nelson et al., 1992; Nelson,
1994; Kirkeby et al., 1995; Nelson et al., 1996b, 1997; Nelson, 2002; Uto et Hamada, 1995].
5.4 Theoretical model
This section introduces the theoretical model on which the simulations are based. As it
was previously mentioned, the simulations are mainly concerned with sound eld reproduction.
The reproduction system can be characterized by L monopole sources and M sound pressure
sensors. The radiation model for the sources is introduced rst while the optimal control formu-
lation, the sound eld reproduction (or sound eld control), is presented next.
The proposed model is more appropriate for low frequencies, where the monopole may
more adequately represent a closed-box loudspeaker. In all cases, the simulations are carried
up to 1.5 kHz. This frequency limit roughly corresponds to the auditory transition from an ITD
(Interaural Time Delay) auditory cue based on signals ne structure of time differences to the
one based on signals envelope time differences [Blauert, 1999]. Note that this upper frequency
limit seems to be shared by the WFS systems which integrate frequencies up to 1500 Hz or so
[Verheijen, 1998]. In our room simulations, this upper frequency limit is lowered to 400 Hz for
computational efciency. However, the covered frequency range is still representative for the
room considered in our simulations since it includes the Schroeder frequency [Nelson et Elliot,
1992] which dictates the progressive transition from a dominant-mode response to a diffuse
response.
5.4.1 Radiation modelling
The model is based on the Helmholtz equation for harmonic acoustic elds
2
p(x) +k
2
p(x) = 0. (5.1)
85
Figure 5.1 Signs and symbols convention for
the rectangular room. x describes an arbitrary
point in volume V (or on the surface S), y
describes an arbitrary point on S, n is a unitary
vector normal to S and pointing outward, x
i
is
a set of Cartesian coordinates and e
i
, a triad of
unit base vectors.
Figure 5.2 First investigated conguration in
free eld. denes the propagation direction
for a progressive plane wave target eld. The
sensor array covers a 1 m1 m area with a
separation distance of 0.125 m along x
1
and x
2
.
The source array covers approximately a
7.5 m6.4 m rectangle with a separation of
approximately 0.46 m.
and on boundary conditions (homogeneous and mixed) for locally reacting surfaces
p(y) n = jk(y)p(y). (5.2)
Where p is the space-dependent complex acoustic pressure [Pa], k the wavenumber [rad/m]
(k = /c), x the position in rectangular coordinates [m], y the position on walls [m], the
specic acoustic admittance dimensionless ratio for a given surface (normalized by c, with
= 1.18 kg/m
3
and c = 341 m/s), n a unit vector normal to the room surface (pointing
outwards the room), the radial frequency [rad/s] and c the sound phase speed [m/s] at ambient
temperature. A e
jt
time dependence is assumed for pressure and other harmonically varying
variables. The systemunder study, with signs convention and parameter denition, is graphically
introduced in Fig. 5.1 (p. 86).
Two different reproduction situations are investigated and compared : in a free eld, and
in a room. In all cases, the reproduced sound eld is simply the sum of the individual sources
86
radiated sound eld
p
(rep)
(x) =
L
l=1
G(x[x
l
)(jq
l
), (5.3)
where q
l
is the complex strength of source l (located at x
l
) and G(x[x
l
) is the Greens function
[Nelson et Elliot, 1992; Pierce, 1991]. In free eld, the Greens function is
G(x[x
l
) =
e
jk|xx
l
|
4[x x
l
[
, (5.4)
While in a room, the following denition (which implicitely assumes modal expansion and the
fact that eigenfunctions
n
form an orthogonal set) is used [Morse et Ingard, 1968]
G(x[x
l
) =
N
n=0
n
(x)
n
(x
l
)
V [k
2
n
k
2
]
. (5.5)
Where, in Eq. (5.5),
n
is the nth eigenfunction of Eq. (5.1) with boundary conditions Eq. (5.2),
k
n
the associated nth eigenvalue and V , the room volume. The eigenfunctions are amplitude
normalized in such a manner that
_
V

n
m
dV =
nm
. For the non-rigid case associated with Eq.
(5.2), complex eigenfunctions and eigenvalues are expected. The eigenfunctions and eigenvalues
are function of the driving frequency, which is explicit in the boundary conditions (see Eq. 5.2).
The modal scheme approximation for a rectangular room with non-rigid surfaces is taken from
Morse and Ingard [Morse et Ingard, 1968] and is given by the following expressions :
n
(x) =
n
x1
(x
1
)
n
x2
(x
2
)
n
x3
(x
3
)/A
n
, (5.6)
A
n
=
_
V
n
x1
n
x2
n
x3
dV, (5.7)
n
xi
(x
i
) cos
_
q
n
xi
x
i
L
xi
+j
kL
xi
q
n
xi
_
, (5.8)
q
0
xi

1
j
_
2jkL
xi
, (5.9)
q
n
xi
n
2jkL
x1
2
n
, (5.10)
k
2
n

_
q
n
x1
L
x1
_
2
+
_
q
n
x2
L
x2
_
2
+
_
q
n
x3
L
x3
_
2
. (5.11)
This approximation is valid for a uniform admittance (which is the case since is uniformly
distributed over S in the simulations) and for lowkL
xi
, it is thus limited to low admittance and
more representative to low excitation frequency. Using matrix notation, Eq. (5.3) can be more
compactly written
p
(rep)
= [p
(rep)
(x
1
) . . . p
(rep)
(x
m
) . . . p
(rep)
(x
M
)]
T
= Z
(m)
q (5.12)
87
for a nite number of point, M, corresponding to receivers positions. In Eq. (5.12), Z
(m)
is a
transfer impedance matrix (from source strength to the reproduced sound pressure evaluated at
x
1
. . . x
m
. . . x
M
in the reproduction space) and q, a complex source strength column vector
dened as follows
q = [q
1
. . . q
l
. . . q
L
]
T
. (5.13)
5.4.2 Control modelling
Now that the reproduced pressure eld is dened in V subject to L simple monopole exci-
tations, the optimal determination of q needs to be derived. The target wave eld, or the image
eld, which has to be reproduced by the sources in V , is a plane wave of amplitude A
p
(im)
(x) = Ae
j
kx
(5.14)
where

k is the wavenumber vector. The plane wave is assumed to propagate in the horizontal
(x
1
, x
2
) plane, with a direction dened by angle in Fig. 5.2 (p. 86). Alternatively, the image
eld can be a spherical wave
p
(im)
(x) = A
e
jk|xxo|
[x x
o
[
. (5.15)
In the last equation, the virtual source position is dened by x
o
.
Using Eq. (5.3), (5.14) or (5.15), a reproduction error function evaluated as a function of x
is dened as follows
e(x) = p
(im)
(x) p
(rep)
(x). (5.16)
Perfect and ideal sound eld reconstruction would thus be obtained everywhere in the reproduc-
tion area while reaching e(x) = 0 with properly adjusted source strengths q. On a more practical
ground, now assume that the reproduction system is not only made of L sources fed by an open-
loop architecture but also of M error sensors for which the errors between the target pressure de-
ned and the reproduced pressure are evaluated at a set of M discrete points, x
1
. . . x
m
. . . x
M
.
The corresponding set of reproduction error amplitudes have to be minimized with respect to
the control source strengths q. With this in mind, an error vector e = [e
1
. . . e
m
. . . e
M
]
T
is
introduced. For the mth term of e
e
m
(x
m
) = p
(im)
(x
m
) p
(rep)
(x
m
). (5.17)
88
This allows the following denition of a cost function (in terms of quadratic error e
H
e), which
corresponds to the quadratic Hermitian including Tikhonov regularization (that is an effort pe-
nalty here expressed as q
H
q) [Nelson, 2001]
J
M
= e
H
e + q
H
q. (5.18)
In equation (5.18), H superscript denotes the Hermitian transpose and , the regularization
parameter. The reproduction performance optimization is expressed as function of the quadratic
reproduction errors because one wish to bring the errors to zero as nearest as possible, that is
the least-square solution. Moreover, this is a common practice in active control of sound or
vibration which found his correspondence with practical applications through adaptive ltering
which is often based on such type of quadratic cost function. On one hand, the regulariza-
tion parameter can represent the possible trade-off between optimal reproduction and source
strength minimization. On the other hand, introduces convenient regularization in the inverse
problem [Nelson, 2001] as it will be seen in the next equation. This Tikhonov regularization,
which is nothing more than the introduction of a -weighted source-strength penalty term in the
cost function, is thus used to circumvent any ill-conditioning of the problem. The purposes and
considerations of conditioning in regards to the sound eld reproduction are both addressed in
section 5.5.5. Within the context of active control practice, such a regularization is conceptually
connected with the leaky adaptation of a feedforward system [Elliott, 2001]. For a more detai-
led review of inverse problems and regularization, the reader is referred to the work of [Nelson,
2001].
Provided that [Z
(m)H
Z
(m)
+I] is positive denite, which is the case when L < M [Nelson
et Elliot, 1992], the cost function J
M
has a unique minimum associated with
q
opt
=
_
Z
(m)H
Z
(m)
+I
1
Z
(m)H
p
(im)
, (5.19)
where I is the identity matrix and p
(im)
= [p
(im)
(x
1
) . . . p
(im)
(x
m
) . . . p
(im)
(x
M
)]
T
. By inspec-
tion of Eq. (5.19), it is apparent that the conditioning and hence invertibility of the matrix
_
Z
(m)H
Z
(m)
+I
will strongly inuence the quality of the minimization results, therefore the
usefulness of the regularization parameter which adds a value to the diagonal terms of the
matrix to be inverted in Eq. (5.19). Explained briey and textually, such an addition increases
all the matrix singular value from a given amount and consequently reduces the ratio of the lar-
gest to the smallest singular value. This ratio denes the condition number. While inverting any
matrix, a very small singular value of the matrix while results in very large values of the solution
and this may reduce the solution quality or even the numerical invertibility of the matrix [Nelson
89
et Yoon, 2000]. For this reason, the added diagonal value will stabilize the inversion of the
matrix. By such means, the Tikhonov regularization thus circumscribes the solution values q
opt
to a more acceptable range but, at the same time, it reduce, appreciably or not, depending on ,
the reproduction quality.
Substitution of Eq. (5.19) in J
M
allows the denition of the residual normalized cost function
(excluding the Tikhonov regularization term q
H
q) when q is set to q
opt
E
LS
=
J
( q= qopt)
M
q
H
opt
q
opt
J
( q=
0)
M
. (5.20)
This parameter has been chosen for comparison and validation with past works from [Kirkeby
et Nelson, 1993]. The real scalar-valued E
LS
here expresses the tness between the image eld
and the reproduced eld. A small E
LS
value will thus demonstrate a good t between the two
elds and therefore expressing the effectiveness of the reproduction. Although, one can monitor
the spatial sound eld reproduction quality by means of the real scalar cost function J
M
of Eq.
(5.18), it would be difcult to use such a scalar for comparison purposes because it include the
effort penalty contribution (weighted by ) and it vary with a varying number of error sensors
since J
M
includes the sum of the M quadratic errors. This motivates the E
LS
denition for
comparison purposes.
Using a small value of the regularization parameter can be sufcient, in term of regulariza-
tion, without reducing the reproduction quality. This idea is presented in Fig. 5.3 (p. 91) for the
free-eld conguration of Fig. 5.2 (p. 86) while reproducing a progressive plane wave at 220 Hz
with = 30 degree. For a given regularization parameter, in this case roughly between 10 and
10
4
, the total source strength amplitude [q
opt
[ is bounded to acceptable value without important
residual reproduction error increase (E
LS
stays far below the suggested limit of E
LS
= 0.5
[Kirkeby et Nelson, 1993]). Accordingly, a xed value of = 50 is used for all the simulations
considered in this paper although more rigorous determination rules have been introduced for
the regularization of the inverse problem [Nelson, 2001]. Moreover, Fig. 5.4 (p. 91) shows an
alternative representation of Fig. 5.3 (p. 91) which is referred to as a L-curve, where the chosen
is near the corner region associated with the optimal regularization parameter [Nelson, 2001].
Even if we use a frequency and case independent , it is, for our purpose, still sufciently near
the optimal corner of the case-dependant L-curves. Some numerical experiments have shown
better conditioning with values as small as = 0.1 in comparison with absence of any regula-
rization ( = 0). However, such small values usually lead to important error outside the sensor
array ; thus potentially introducing high sound pressure outside the reproduction area. This hi-
gher sound pressure is suggested in Fig. 5.3 (p. 91) by the [q
opt
[ drastic increase with small .
90
10
2
10
0
10
2
10
4
10
6
0
0.1
0.2
0.3
0.4
0.5
E
l
s
10
2
10
0
10
2
10
4
10
6
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
|
q
o
p
t
|
= 50
Figure 5.3 E
LS
(on left) and [q
opt
[ (on right)
variation as a function of for the free-eld
case of Fig. 5.2 (p. 86) while reproducing a
plane wave at 220 Hz with = 30 degree.
10
4
10
3
10
2
10
1
10
0
10
3
10
2
10
1
10
0
E
LS
|
q
o
p
t
|
= 0.001
= 0.15999
= 2.0236
= 25.5955
= 323.7458
= 655128.5569
= 50
Figure 5.4 Relation between [q
opt
[ and E
LS
,
with as a parameter (that is the L-curve
representation of Fig. 5.3 (p. 91) for the
free-eld case shown in Fig. 5.2 (p. 86))
Although this increase introduces an E
LS
reduction, its at the costly expense of potentially dis-
turbing high source strengths. A regularization parameter of = 50 thus seems to be a good
compromise between objective reproduction quality and source strength amplitude. When the
regularization parameter is roughly kept in the at regions of E
LS
and [q
opt
[ shown in Fig. 5.3
(p. 91), the results can be considered to be valid and revealing for our purposes. This region
corresponds to the L-curves corner where a higher concentration of points can be seen on Fig.
5.4 (p. 91) for a logarithmic variation of . As shown in both Figs. 5.3 (p. 91) and 5.4 (p. 91),
this region is quite large and can support a variation, a tolerance which allow the use of a
case-independent for our purposes.
Tikhonov regularization and regularization parameter choice have been extensively studied
in the context of inverse source problem [Nelson, 2001] and for sound reproduction lter design
[Tokuno et al., 1997]. In our current theoretical problem, the idea is not to precisely dene the
sources strength from a set of measurements (like for the inverse source problem) but more to
physically reproduce a given wave eld and evaluate the possibilities. For this simple reason,
and for computational efciency, the regularization parameter is not rigorously optimized in this
work.
This entirely acoustical approach to the control problem is easily connected to feed-forward
control systems which usually try to reduce an estimated error by the adaptation of lters ups-
tream of the actuators [Elliott, 2001]. Using the optimal control approach in the frequency do-
91
main, simulations give some cues about the best possible situation and the involved control
mechanisms. It is thus a preliminary evaluation and comparison tool which guides the unders-
tanding and the subsequent construction and conguration of such a system.
Since source power outputs may give some relevant indications about control mechanisms,
each source acoustical power output is computed using
l
= (1/2)'
_
p
H
(x
l
)q
l
_
[Elliott, 2001],
where superscript H denotes complex conjugation (that is the Hermitian transpose of a scalar)
and '(z), the real part of z.
As it will be presented in the next section, some comparisons with WFS are made. In this
case, the source strengths are derived from straight application of WFS operators given by [Ve-
rheijen, 1998] for general source arrays, non-focusing virtual image dened by a spherical wave
and a straight reference line through the source array center. For a given virtual spherical source,
the reference line is perpendicular to a line from the virtual source position to the source array
center. Some adjustments have been done to convert monopole amplitude to source strength re-
presentation [Pierce, 1991] using consistent time dependence notation. In this case, the optimal
source strength vector is replaced by the corresponding WFS sources strength.
5.5 Results of numerical simulations
5.5.1 Feasibility study
The rst question that should be addressed concerns the feasibility of a method such as
active control in the context of sound eld reproduction. As a rst investigation, Figs. 5.2 (p.
86) to 5.11 (p. 97) illustrate some results for the free-eld case with given source and sensor
congurations. The system conguration, which is depicted in Fig. 5.2 (p. 86), includes a one
meter square sensor array. The target wave eld is rst dened as a progressive plane wave with
a propagation direction of = 30 degrees. Figure 5.5 (p. 93), which presents the minimization
results, shows considerably low residual normalized cost function (E
LS
) over the frequency
range. Such a low residual error corresponds to a satisfactory quantitative reproduction of sound
eld, at least over the sensor array. (This is shown in further gures.) Also note in Fig. 5.5 (p.
93) that the reduction of [q
opt
[ with increasing frequency is related to low monopole radiation
efciency at low frequencies (for a frequency independent source strength, which is volume
velocity in this case).
92
500 1000 1500
0
0.2
0.4
0.6
0.8
1
E
L
S
Freq. [Hz]
500 1000 1500
0
0.01
0.02
0.03
0.04
0.05
0.06
|
q
o
p
t
|
Figure 5.5 Variation of E
LS
(on left) and
[q
opt
[ =
_
q
H
opt
q
opt
(on right) for progressive
plane wave ( = 30 degree) reproduction in the
(x
1
, x
2
) plane, see conguration in Fig. 5.2 (p.
86).
Figure 5.6 On left, real part of the target wave
eld (plane wave) and, on right, the reproduced
wave eld at 220 Hz in free eld.
Figure 5.6 (p. 93) shows the real part of the target wave eld and the reproduced wave
eld for the same conguration at 220 Hz. Clearly, a low E
LS
(below 0.1 as in Fig. 5.5 (p.
93) for 220 Hz) corresponds to a good wave eld reproduction over the sensor array and in its
immediate vicinity. [Kirkeby et Nelson, 1993] suggested 0.5 as a maximumacceptable value for
E
LS
for a similarly formulated reproduction problem. Although this simulation corresponds to
an ideal situation, Figs. 5.5 (p. 93) and 5.6 (p. 93) allow to conclude that it is possible to locally
(in a 1 m
2
area) reproduce a plane wave using such a conguration in conjunction with active
control techniques. This demonstrates that active control can thus be effective as a wave eld
reconstruction system, like WFS. This was to be expected from previously published works for
simple source congurations [Kirkeby et Nelson, 1993].
By analyzing Fig. 5.7 (p. 94), two simple phenomena can be observed for free-eld condi-
tion. First, slightly better objective reproduction, in terms of E
LS
, is obtained for, roughly, 45
and 135 degree target plane wave propagation directions. These directions correspond to the
largest possible distance between reproduction source and sensor array for this conguration
(consequently presenting a spherical wavefront of larger radius at the sensor array) and, accor-
ding to Fig. 5.7(b), are associated with a [q
opt
[ increase. Second, depending on the target plane
wave propagation direction, a peculiar E
LS
uctuation can be observed around 1400 Hz. This
uctuation can be related to spatial aliasing which is function of sensor separation for this con-
guration. In this respect, Fig. 5.8(a) shows E
LS
variations for a dense sensor array (which is the
93
500
1000
1500
0
45
90
135
180
0
0.02
0.04
0.06
0.08
0.1
A
n
g
l
e

[
d
e
g
]
Freq. [Hz]
E
L
S
500
1000
1500
0
45
90
135
180
10
3
10
2
10
1
A
n
g
l
e

[
d
e
g
]
Freq. [Hz]
|
q
o
p
t
|
(b)
(a)
LS
(a) and [q
opt
[ (b)
with frequency and angle , for plane wave
reproduction in free eld (see conguration in
Fig. 5.2 (p. 86)).
1000
2000
3000
0
45
90
135
180
0
0.2
0.4
0.6
0.8
1
Freq. [Hz]
A
n
g
l
e

[
d
e
g
]
E
L
S
1000
2000
3000
0
45
90
135
180
0
0.2
0.4
0.6
0.8
1
Freq. [Hz]
A
n
g
l
e

[
d
e
g
]
E
L
S
(b)
(a)
LS
with frequency
and angle , for plane wave reproduction in
free eld with : (a) a dense sensor array (see
conguration in Fig. 5.2 (p. 86)) and (b) a
sparse sensor array (double spaced in
comparison with Fig. 5.2 (p. 86)).
same as in Fig. 5.2 (p. 86)) and Fig. 5.8(b) shows similar uctuation for a sparse array (the same
number of sensors with a spacing twice that of Fig. 5.2 (p. 86)), both for a broader frequency
span. Above 1400 Hz, E
LS
rapidly increases for the dense array which is characterized by a
0.125 m sensor spacing (corresponding approximately to half wavelength at 1400 Hz). When
halving the sensor array density, this limiting frequency is also halved. This can be attributed to
spatial aliasing by the sensor array. At least two sensors per wavelength have to be included for
proper spatial sampling.
94
5.5.2 Comparison with WFS in free eld
Since WFS systems have shown to provide impressive subjective reproduction, a compari-
son between optimal control of sound eld reproduction and simple WFS is rst presented in
free-eld in Figs. 5.9 (p. 96) to 5.11 (p. 97). All these simulations have been carried out with a
virtual spherical source located at x
o
= [2, 2, 1.2]
T
expressed in meters. The synthesis opera-
tors for an arbitrary source array and non-focusing virtual source are borrowed from [Verheijen,
1998] with a reference line across the sensor array center. This line is perpendicular to a line
from the virtual source to the source array center. The virtual sources height, 1.2 m, is equal to
source and sensor height. The inspection of E
LS
in Fig. 5.9 (p. 96) shows that the reproduction
error is lower for optimal control than for WFS over the considered frequency range at the sen-
sor array. WFS provides an acceptable E
LS
at low frequency. Above 369 Hz (see broken vertical
line in Fig. 5.9 (p. 96)), the error for the WFS system increases drastically and monotonically.
This result was to be expected since the sources separation gives a spatial aliasing frequency
of approximately 369 Hz for WFS in a rst approximation [Verheijen, 1998; Nicol et Emerit,
1999]. In fact, with such a source separation, WFS is penalized for higher frequencies. A den-
ser source array would advantageously push this upper frequency limit for WFS. WFS upper
frequency limit is actually dened by sources separation [Verheijen, 1998], while the optimal
control frequency limit is dened by sensors separation, at least for this conguration. From
a practical view point, increasing microphone density is more easily achieved than increasing
loudspeaker density since microphones are usually smaller than loudspeaker cabinets. On the
other side, from an auditory perception view point, it may not be relevant to attempt physical
sound eld reconstruction at frequencies larger than 1.5 kHz since our auditory mechanism of
sound localization is dominated in time-domain, above this frequency, by ITD cues of signal en-
velope and not by ITD cues of signals ne temporal structure [Blauert, 1999]. Interaural Level
Differences (ILD), however, are still effective for a higher frequency range [Blauert, 1999].
Even if the residual error is considerably lower for the optimal control solution, the wave
eld is correctly reproduced by WFS over a broader listening area at 220 Hz as demonstrated
in Fig. 5.10 (p. 97). However, increasing the size of the listening area for optimal control using
a broader sensor array may be desirable. The listening area aspect is further investigated in the
next section of this paper.
Figure 5.11 (p. 97) shows the source power output for optimal control and for WFS. Clearly,
similar power injection may be observed for both cases in free-eld. Somewhat lower power
injection for optimal control is related to the smaller listening area, which corresponds to the
95
500 1000 1500
10
-2
10
-1
10
0
E
L
S
20 500 1000 1500
0
2
4
6

-
4
|
q
o
p
t
|

i
n

1
0
Freq. [Hz]

E
L
S

=

0
.
5

3
6
9
H
z

LS
and [q
opt
[ for spherical wave reproduction (x
o
= [2, 2, 1.2]
T
meters) in free eld, see conguration on Fig. 5.2 (p. 86). Solid lines : Optimal control. Dashed
lines : WFS.
sensor array in this case.
According to these simulations of the two methods, active control is able to achieve wave
eld reproduction comparable to WFS in free-eld condition.
5.5.3 In-room reproduction, comparison with WFS and control mechanisms
The effect of a reective environment on optimal reproduction at the sensor array position,
in comparison with WFS, can now be evaluated. As shown previously, wave eld reproduction
can be physically achieved in free eld using active control technique. In the following, the
comparison is conducted for a simple rectangular room.
The investigated conguration is depicted in Fig. 5.12 (p. 98). The room dimensions have
been dened in accordance with the Audio Engineering Society [AES Technical Comittee
on Multichannel and Binaural Audio Technology, 2001] and German Surround Sound Forum
[Rumsey, 2001] recommendations for the optimal size of multichannel monitor rooms. For the
given volume, V = 139 m
3
(precisely 7.5 6.42.896 m; source and sensor height : 1.2 m), a
nominal reverberation time of approximately T
60
= 0.28 s is suggested [Rumsey, 2001]. Using
the Eyring-Norris reverberation model for diffuse eld without medium absorption [Kinsler
96
Figure 5.10 (a) Real part of the target wave
eld at 220 Hz in free eld. (b) Real part of the
reproduced wave eld at 220 Hz in free eld
using optimal control (on left) and using WFS
(on right, the dashed line is the reference line).
0
2
4
6
0
2
4
6
0
2
4
x
1
[m] x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0

-
4
W
0
2
4
6
0
2
4
6
0
2
4

x
1
[m] x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0

-
4
W
(a)
(b)
Figure 5.11 Acoustical power output for : (a)
optimal control and (b) WFS while
reproducing a spherical wave at 220 Hz in free
eld, see Fig. 5.9 (p. 96) and 5.10 (p. 97).
et al., 2000]
T
60
=
0.161V
S ln(1 a)
, (5.21)
an associated random-incidence energy absorption coefcient, a, is calculated and converted
into an equivalent specic conductance ratio (normalized by the air characteristic impedance
c) using an implicit relation [Kinsler et al., 2000]
a = 8
_
1 +

+ 1
2 ln
_
+ 1
__
. (5.22)
The surface-specic conductance ratio (see boundary conditions in Eq. (5.2) and modal
scheme in Eqs. (5.6) to (5.11)) is set to 0.0651, which is real, frequency independent and uni-
form on S. For the simulations, the number of modes in Eq. (5.5), N, is set to 6137. This proved
sufcient to ensure convergence of the total time-averaged acoustical potential energy up to
400 Hz.
97
x
1
x
2
x
3
Sources
Error sensors
l
x1
: 7.5 [m]
l
x2
: 6.4 [m]
l
x3
: 2.8956 [m]
Sources: 50
Sensors: 81
Figure 5.12 Second investigated
conguration : a room of 139 m
3
with a
reverberation time of 0.28 s (as suggested by
the [AES Technical Comittee on Multichannel
and Binaural Audio Technology, 2001])
100 200 300 400
10
3
10
2
10
1
10
0
10
1
E
L
S
20 100 200 300 400
0
2
4
6
x 10
4
|
q
o
p
t
|
Freq. [Hz]

E
L
S

=

0
.
5

Dashed lines : WFS
LS
(on left) and
[q
opt
[ (on right) for spherical wave reproduction
in room. Solid lines : Optimal control. Dashed
lines : WFS. Thick lines : Reverberation time
of 0.28 s. Thin lines : Reverberation time of
2.8 s. [q
opt
[ is independent of the reverberation
time for WFS.
Figure 5.13 (p. 98) shows the comparison, for such a conguration, between optimal control
and WFS. The target wave eld is a spherical wave originating from x
o
= [2, 2, 1.2]
T
ex-
pressed in meters. E
LS
for optimal control is below 0.02. Optimal control provides a small
reproduction error over the whole frequency range. By comparison, WFS produces an E
LS
lar-
ger than 1 for the same frequency range in the simulated room. According to Eqs. (5.16) to
(5.20) an E
LS
value of 1 corresponds to a reproduction error as important as perfect silence
(p
(rep)
(x) = 0 and e(x) = p
(im)
(x)) in the reproduction space, hence large differences may be
expected between the target wave eld and the wave eld reproduced by WFS with this room
model. This is indeed supported by Fig. 5.14(a) to (c) where, this time, real and imaginary parts
of pressure have been plotted to clearly differentiate propagating and standing waves. As shown
on Fig. 5.14(b), the optimal control approach properly recreates the wave eld at the position
of the sensor-array in the room. On the other hand, Fig. 5.14(c) reveals that WFS does not re-
create the wave eld in room situation. Moreover, Fig. 5.14(d) shows that optimal control can
reproduce a progressive wave eld over a larger area in the room (2 m 2 m sensor array).
Similar simulations have been carried out for another conguration (where the surface-
specic admittance ratio have been replaced by 0.0059) corresponding to a reverberation
time of approximately 2.8 s (that is, ten times longer than the AES recommendation for the gi-
98
Figure 5.14 Real (on left) and imaginary (on right) part of : (a) the target wave eld at 220 Hz
in room (T
60
0.28 s), (b) the corresponding reproduced wave eld using optimal control, (c)
the reproduced wave eld in room using WFS, and (d) the reproduced wave eld using optimal
control in room for a larger sensor array.
ven volume). The reproduction room is consequently regarded as a poor environment for audio
applications since strong and distinct standing waves may appear both in space and frequency
responses. The results are again shown on Fig. 5.13 (p. 98) for active control and WFS. From
this gure, it is possible to conclude that active control, automatically accounts for room dyna-
mics, even for a highly reective environment. This illustrates the usefulness of active control
in sound eld reproduction.
99
0
2
4
6
0
2
4
6
0
0.5
1
x
1
[m]
x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0

-
6
W
0
2
4
6
0
2
4
6
0
5
10

x
1
[m]
x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0
-
7
W
(a)
(b)
Positive
Negative
reproducing a spherical wave at 220 Hz, in
room (T
60
0.28 s).
0
2
4
6
0
2
4
6
0
2
4
x
1
[m]
x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0

-
7
W
0
2
4
6
0
2
4
6
0
0.5
1
1.5

x
1
[m]
x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0
-
6
W
0
2
4
6
0
2
4
6
-1
0
1
2

x
1
[m]
x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0
-
7
W
Negative
Positive
Negative
Positive
(a)
(b)
(c)
reproducing a spherical wave at 70.5 Hz, in
room (T
60
0.28 s). (c) Acoustical power
output for optimal control while reproducing a
spherical wave at 220 Hz, in room with a lower
admittance (T
60
2.8 s).
The source acoustical power output for the 220 Hz spherical wave eld reproduction is
shown in Fig. 5.15(a) for optimal control, and in Fig. 5.15(b) for WFS. The source output
distributions are clearly different in each case. Power absorption (negative power output) by
acoustic sources is hardly visible on Fig. 5.15(a) for the active control of sound reproduction.
This ensures reconstruction of a propagating wave eld on a modal basis.
100
For such a frequency of 220 Hz (above the rooms Schroeder frequency which is approxi-
mately 94 Hz [Pierce, 1991]), where modal density and modal overlap are progressively more
important, control mechanisms may be interpreted, in the limit of the present physical model,
as a modal re-arrangement where appropriate eld reconstruction arises from the superposition
and arrangement of modal responses at the driving frequency. Recalling that each rooms oblique
mode can be seen as a superposition of eight propagating plane waves, some superposition pos-
sibilities have to be expected when modal overlap increases. At lower frequencies, where the
modal density is, by far, lower, acoustical power absorption by the reproduction sources be-
comes more important. This is illustrated in Fig. 5.16(a) and (b) for an image eld at 70.5 Hz.
For such low frequencies (below the rooms Schroeder frequency) the spatial sound pressure va-
riations over the sensor array are small and the modal density is smaller. In this frequency range,
the optimal control, again for this conguration, acts to create an acoustical energy ow over
the sensor array and mainly prevents a pure standing wave pattern. Acoustical power outputs are
nally shown in Fig. 5.16(c) at 220 Hz for the same room with a longer reverberation time of
approximately 2.8 s. In this case, power absorption by the reproduction sources is more effective
in the optimal reproduction process above the Schroeder frequency. From these results and com-
parisons with WFS, it is clear that all the sources are active in contributing to progressive wave
eld reconstruction in room. For this reason, wave eld reconstruction and room compensation
may not be performed with only a fraction of the total number of reproduction sources. These
sources that are inactive in WFS have to perform power absorption or modal re-arrangement for
better sound eld reproduction in room.
5.5.4 Investigation of practical sensing conguration
In this section, a more practical microphone array is briey introduced for sound eld re-
construction. The main objective is to investigate a potential sensor array which can reduce the
total number of sensors and leave a listening zone (where the wave eld must be reproduced)
free of any sensor.
WFS is based on the Kirchoff-Helmoltz integral formulation [Verheijen, 1998; Morse et
Ingard, 1968]
p(x) =
_
S
(G(x[y)p(y) p(y)G(x[y)) ndS
(5.23)
which represents a mathematical formulation of the Huygens principle where the normal pres-
sure gradient on S
becomes a continuous monopole source and the pressure on S
becomes
101
a continuous dipole source. Note that this applies only in the volume V

bounded by surface
S
(see Fig. 5.1 (p. 86) for the chosen convention). Also note that S
may not correspond to

a physical surface such as a room wall or source array. The WFS fundamental and theoretical
interpretation of this formulation is that the wave eld can be reconstructed using a surroun-
ding and continuous distribution of appropriately driven monopoles and/or dipoles sources on
S
where p(y) is the target wave eld on S
. Another interpretation of Eq. (5.23) is that any

sound pressure eld inside V

, which is assumed to be free of acoustic sources, is entirely and
uniquely dened by its pressure and pressure gradient on the bounding surface S
. With this
in mind, perfect wave eld reconstruction should be obtained if the pressure and the pressure
gradient is continuously reconstructed on S
with reproduction sources outside V

and S
. Such
interpretation has been previously pointed out by [Ise, 1999]. Now considering the fact that
WFS, using a nite number of sources along a nite line replacing S
, appropriately repro-
duces an approximation of the target wave eld below the WFS aliasing frequency in free-eld
[Berkhout et al., 1993; Verheijen, 1998], another sensor array for optimal control is introduced
in Fig. 5.17(a). For this conguration, the sensors are distributed over the sides of a 3 m3 m
square, and consist of either single microphones or microphone pairs. For the microphone pair,
the microphones are separated by 0.1071 m. There is a total of 84 sensors. With this linear sensor
array, any reproduction error reduction will reconstruct an approximation of the sound pressure
(single microphone) and sound pressure gradient (microphone pairs) around the listening area.
Depending on the situation, it is consequently expected that such a reconstruction will also im-
ply wave eld reproduction inside the sensor array. The surrounding property of the linear array
is chosen to ensure reproduction for all possible propagation directions in the horizontal plane.
In free-eld, a simple layer, which only approximates sound pressure, could have alternatively
been considered as sufcient for reproduction.
A similar type of reconstruction has been used by [Corteel et al., 2002] for Wave Field
Synthesis with panel loudspeakers. In their paper, the authors report the experimental usage of
a simple linear sensor array in front of the panel sources to achieve lter design using adaptive
lters. Adaptive lter design procedure is chosen since explicit WFS operators would be too
difcult to theoretically dene for such multi-exciter panel loudspeakers.
Using the discrete approximation of reproduced pressure and pressure gradient around a
listening area, in order to obtain an appropriate eld inside the horizontal array, some revealing
results about practical possibilities for such a surrounding array are provided. Optimal control
application for a conguration in free-eld situation is summarized in Figs. 5.17 (p. 103) and
5.18.
102
Figure 5.17 (a) A linear sensor array in free
eld superposed to the real part of the target
wave eld (a spherical wave originating from
x
o
= [1, 2.8, 1.2]
T
meters) at 220 Hz. (b)
Real part of the corresponding reproduced
wave elds in free eld with optimal control
(on left) and WFS (on right, the dashed line is
the reference line)
0
2
4
6
0
2
4
6
0
1
2
x
1
[m] x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0

-
3
W
0
2
4
6
0
2
4
6
0
1
2

x
1
[m] x
2
[m]
P
o
w
e
r

o
u
t
p
u
t

i
n

1
0
-
3
W
(a)
(b)
Figure 5.18 Acoustical power output while
reproducing a spherical wave at 220 Hz, in free
eld with (a) optimal control and (b) WFS (see
Fig. 5.17 (p. 103)). Diamond markers denote
zero power output for WFS.
Wave eld reproduction is conveniently achieved in the listening zone, surrounded by this
sensor array, using optimal control of error reproduction at these sensor locations. As illustrated
in Fig. 5.17(b), optimal control results are comparable to WFS reproduction. Clearly, this simple
preliminary result using a linear sensor array shows that active control leads to a sound eld
reconstruction which is very similar to WFS reconstruction in a free-eld reproduction space.
This type of pressure and pressure gradient reconstruction constitutes a conceptual connection
between WFS and active control of reproduction errors. Source power outputs are shown in
Fig. 5.18 (p. 103). Again, sound eld control and WFS show similar power output distributions.
The narrower power distribution for optimal control is related to the smaller dimensions of
103
the reproduction area, as compared to the dimension of the WFS reference line in front of the
sources. As expected for the free-eld acoustics, there is no control mechanism that operates in
this example other than wave interference. In comparison with the free-eld results shown in
Fig. 5.10 (p. 97), a larger listening zone is achieved. This difference is due to the larger extent
of the sensor array that is more demanding in terms of securing a suitable reproduction area.
Being able to successfully use such an array in a room would be practically very attractive.
Unfortunately, preliminary simulations using such a sensor array in a room situation show an
inappropriate reproduction of sound eld inside the surrounding array except for low frequen-
cies. For low frequency, the sensor array is not any more a linear array since the dimensions of
the sensor array are comparable to the acoustic wavelength. Such a difference between free-eld
and in-room situations was physically foreseeable. From the Kirchhoff-Helmholtz formulation,
any distribution of sound pressure and sound pressure gradient over S
will entirely dene sound

pressure p(x) inside V

. Since our simulations are concerned with a planar listening area (that
is source distribution and sensors distribution in an horizontal plane), the free-eld situation al-
lows one to replace the surface integration by a line integration surrounding the listening area.
The linear array of Fig. 5.17 (p. 103) is thus a free-eld specic interpretation of the Kirchhoff-
Helmholtz integral simplied to a surrounding line. By marked contrast with the free-eld si-
tuation, the room situation implies source reections from the walls, ceiling and oor, the sound
pressure eld is thus dened by sound waves propagating with all possible directions through
the closed surrounding surface S
which consequently cannot be replaced by a line array without

loss of information. About this point, one can see a connection with the practical implementation
of surrounding linear sensor array by [Spors et al., 2003a] used for plane wave decomposition
and room compensation. For the aforementionned reasons, a linear array as the one introduced
in Fig. 5.17 (p. 103) should be replaced by a surrounding sensor surface for the in-room context
to achieve a more ideal correspondence with the Kirchhoff-Helmholtz integral formulation. In
any case, further investigation should be carried out to evaluate both the effect and nature of
such type of line approximation for in-room situation.
This linear sensor array gives only a frequency dependent approximation of the continuous
sound pressure and sound pressure gradient around the listening space, the reproduction inside
the array is consequently more sensitive to residual error and its quality is no more objectively
evaluated by the unique consideration of E
LS
. In spite of the need for further investigation of
such a sensor array, the previous simulations suggest some potential and interesting applica-
tions. Moreover, this establishes a relation between Wave Field Synthesis and active control of
sound reproduction. From a practical view point, such a linear sensor array would be attrac-
104
tive for sound eld control since the quantity of sensors is seriously reduced (in comparison
with a uniform rectangular array) and the listening area, which is considerably larger, is free of
sensors. On the other hand, as mentioned earlier, some serious efforts should be devoted to the
applicability and adaptation of such a type of sensor array in-room situation.
5.5.5 Conditioning of the reproduction system
This section deals with two other aspects of sound eld reproduction. The rst is related
to the effect and meanings of the introduced earlier Tikhonov regularization within the optimal
control approach while the second is a search for an ideal source and sensor conguration.
Here, however, we do not seek an absolute solution to the quest for an ideal conguration, but
general rules for practical elaboration of a sound eld reproduction system. For both aspects,
conditioning of matrices is regarded as a source of relevant information.
Figure 5.19 introduces some aspects of sound eld reproduction in a room in comparison
with a free-eld situation from the matrix inversion view point. Such considerations are rst
monitored by the condition number of [Z
(m)H
Z
(m)
+I], that is the matrix to be inverted in Eq.
(5.19) while achieving optimal control. The condition number of a matrix is formally dened as
the ratio of the largest to the smallest non-zero singular values of the matrix. (See [Golub et van
Loan, 1996] and [Nelson et Yoon, 2000] for a more detailed review of the potential meanings
and applications of the condition number in relation with singular value decomposition, a topic
which is beyond the scope of this paper.) A simple numerical interpretation of the condition
number is that an higher condition number reveals an ill-conditioned matrix which, by means of
numerical inversion, may lead to errors and uctuations in the solution q
opt
. In the worst case of
ill-conditioning, the solution may not be valid at all (showing an extremely sensitive reaction to
numerical errors) and the matrix is nearly singular or singular and thus prevents any signica-
tive matrix inversion. For our application and by inspection of Fig. 5.19 (p. 106), the condition
number of the matrix which has to be inverted in the optimal control process is drastically re-
duced when the regularization parameter is introduced, as expected from Section 5.4.2. Since
a large condition number characterizes an ill-conditioned problem, the Tikhonov regularization
improves the conditioning and hence demonstrates its useful presence. Consequently, since this
regularization corresponds to an effort penalty in the active control perspective, the benecial
effect of parameter suggests for future works on sound eld reproduction with optimal control,
that a specic adaptation scheme such as the leaky adaptation
3
[Elliott, 2001] is to be considered
3
Leaky adaptation is the practical time-domain adaptive ltering method corresponding to the cost function
105
20 100 1000 1500
10
5
10
0
10
5
10
10
10
15
10
20
Freq. [Hz]
[
Z
(
m
)
H
Z
(
m
)
+
I
]
c
o
n
d
i
t
i
o
n

n
u
m
b
e
r
Free field, =50
Free field, =0
In room (T
60
0.28s), =0
In room (T
60
0.28s), =50
Figure 5.19 Condition number of
[Z
(m)H
Z
(m)
+I] (see congurations in Figs.
5.2 (p. 86), 5.14(d) and 5.12 (p. 98)).
Figure 5.20 Condition number of Z
(m)
for
various congurations (physical situation, the
source conguration and the sensor
conguration). Normal refers to source
position of Fig. 5.2 (p. 86). Random refers to
source position of Fig. 5.2 (p. 86) with an
additional 0.1 m randomization along the
three axes. Small refers to sensor positions of
Fig. 5.2 (p. 86) while large refers to a larger
(3 m3 m) array with 81 sensors.
for practical implementation to compensate for ill-conditioning of the problem and by doing so
avoid unacceptable large source strengths. Again from Fig. 5.19 (p. 106), the condition num-
ber shows strong variations with frequency in a room enclosure. In case of modal-dominated
response (at lower frequency), the condition number increases at room resonances and thus sug-
gests the effect of room dynamics on the optimal control problem conditioning. This will be
more developed in the following comments.
We now consider effect of various parameters, such as : in-room versus free-eld situation,
admittance variation, sensor and source positions, on the condition number of the matrix Z
(m)
to reach some guidelines for design purposes. This matrix is the plant matrix and it describes the
reproduction system through the relation between q and p
(rep)
expressed by Eq. (5.12). Theore-
introduced earlier by Eq. (5.18) [Elliott, 2001]. The leaky qualier arises from the introduction of an effort-
penalty term in the cost function which make the solution leak toward zero when its possible.
106
tically, the condition number of Z
(m)
bounds the variations of q caused by p
(rep)
variations [Nel-
son, 2001] in the set of equations q = Z
(m)
1
p
(rep)
. In such a manner that a well-conditioned
matrix (with a small condition number) shows a small source strength variations caused by small
pressure variations while an ill-conditioned matrix (with a large condition number) implies im-
portant source strength variations for small pressure variations. Since for optimal control p
(rep)
is always trying to imitate in a least-square sense p
(im)
, a high condition number for Z
(m)
may
thus lead to strong variations of q
opt
associated with slight variations of p
(im)
. Such a behavior
is undesirable in practice because progressive or smooth time variations of the target wave eld
should necessarily be associated with a rather smooth variation of the source strength, since such
abrupt change may be noticeable to an audience. For all these reasons, the condition number of
Z
(m)
provides some cues for the most appropriate reproduction conguration. Moreover, the
condition number of Z
(m)
alone allows to compare the conditioning in various congurations
without the inuence of . It worth noting that Optimal Source Distribution (OSD) systems for
cross-talk cancellation have been developed on a similar theoretical basis about conditioning
for a system including only two sources and two reproduction points [Takeuchi et Nelson, 2002;
Ward et Elko, 1999].
The computed Z
(m)
condition numbers are introduced in Fig. 5.20 (p. 106) for various con-
gurations in free eld and in room. The small sensor array refers to the one of Fig. 5.2 (p. 86).
The large sensor array refers to a larger (3 m3 m) square centered sensor array again including
81 sensors. Source positions are kept identical to Fig. 5.12 (p. 98), except for one case with
random variations of the source positions limited to 0.1 m along the three axes. As introdu-
ced earlier, an admittance ratio of = 0.0651 is used in normal reverberation (T
60
0.28 s)
conditions (following the AES requirements) and an admittance ratio of = 0.0059 (T
60

2.8 s) is used to evaluate the effect of less room absorption. All the corresponding J
M
minimi-
zation results are shown in Figs. 5.21 (p. 109) and 5.22 (p. 109) for an image eld dened by a
spherical wave originating from x
o
= [2, 2, 1.2]
T
expressed in meters.
In all cases of Fig. 5.20 (p. 106), the condition number decreases with increasing frequency.
This is caused by source and sensor separation distance in relation with decreasing wavelength.
At low frequency, where the spatial variation of the sound pressure is small over the source and
sensor arrays, the elements of Z
(m)
tend to be identical and the transfer impedance matrix Z
(m)
tends to be singular (hence presenting a more important condition number). This also explains
the better conditioning associated with the large sensor array, that can more effectively observe
longer wavelengths without the apparition of similar elements or linearly dependant lines or
rows in the matrix Z
(m)
.
107
For both free-eld and in-room situations, the slightly randomized source positions implies
a better conditioning than the straightforward rectangular symmetrical array. Such alteration
effectively breaks the potential symmetry and increases the differences between Z
(m)
elements
and, consequently, reduces the Z
(m)
condition number and avoids a singular characteristic.
Let now investigate the effect of the reproduction space on the condition number as function
of frequency. From Fig. 5.20 (p. 106), the room situation with a shorter reverberation time shows
a better conditioning than both the free-eld situation and the longer reverberation room situa-
tion. (This is for the same source and receiver positions.) Consequently, although E
LS
variation
for various reverberation times were nearly unnoticeable on Fig. 5.13 (p. 98) using optimal
control approach, the Z
(m)
condition number increases when reverberation time is increased to
T
60
= 2.8 s. This suggests that, although active control of sound may, in one unique operation,
synthesize a wave eld and overcome the rooms natural dynamics, a less reective environ-
ment, such as the one based on AES recommendations, is favorable in terms of conditioning
and robustness of the inverse problem q = Z
(m)
1
p
(rep)
. Hence, a more damped room, that
is with a shorter reverberation time, will ensure less important q
opt
variation for a given p
(im)
variation.
The previous observation that suggests that the in-room case (with T
60
= 0.28 s) is better
conditioned than the free-eld case may seem surprising at rst glance. In fact, the major condi-
tioning difference between free-eld and in-room situations arises from free-eld and in-room
model differences. For the free-eld model, a given frequency corresponds to a single acoustic
wavelength while the room model implies a modal expansion of the Greens function. Recalling
that each mode has its own eigenvalue and corresponding wavelengths along axes, each mode
present in the response will differently contribute to Z
(m)
at a given frequency. The contribu-
tion of higher order modes in the room response therefore implies more differences in the Z
(m)
coefcients, and ultimately a better conditioning of the problem. Even when Z
(m)
is compu-
ted at low frequencies or for modal-dominated responses, such higher modes introduce a little
regularization of the matrix which drastically improves the matrix conditioning.
Again from Fig. 5.20 (p. 106), the best conditioning situation is obtained for the large sensor
array with rectangular source array in room. However, such a sparse sensor array may reduce
the upper frequency effective limit which is, as seen previously, dictated by effective spatial
sampling by the sensor array. Moreover, Figs. 5.21 (p. 109) and 5.22 (p. 109) show that both
free-eld and in-room situations including a large sensor array are associated with the largest
source strengths and reproduction errors for spherical wave reproduction. However, in all cases
108
Figure 5.21 E
LS
values for the various cases
presented in Fig. 5.20 (p. 106) while
reproducing a spherical wave originating from
x
o
= [2, 2, 1.2]
T
expressed in meters.
Figure 5.22 [q
opt
[ values for the various cases
presented in Fig. 5.20 (p. 106).
introduced in Figs. 5.21 (p. 109) and 5.22 (p. 109), E
LS
is still below 0.5. For these reasons, the
most well-conditioned system may not suggest an ideal conguration. However, it is clear, from
previous allegations about conditioning, that a broken symmetry and a reduced reverberation
time will provide a better conditioned systemwhich should be favored for practical applications.
Since these conditioning considerations have been formulated for the transfer impedance
matrix Z
(m)
, the remarks apply to a broader range of problems such as optimal control of noise
and inverse problems in acoustics since the usage of such transfer impedance matrix like Z
(m)
is common to those problems. Moreover, even within a sound reproduction context which is not
based on optimal control, the conditioning observations give interesting insight into the relation
between source strengths and reproduced pressure variations.
5.6 Discussion
From a practical perspective, loudspeakers can be relatively inexpensive, allowing their li-
beral use in multiple-loudspeaker arrays. On the other hand, a microphone array, such as the
one introduced in Fig. 5.2 (p. 86) or 5.17, gives no practical advantages to an audience and its
109
physical presence may even be questionable in comparison with multiple channel open-loop
systems such as WFS. Indeed, one should consider that any attempt to introduce more complex
reproduction systems (including more sources and, in this case, a supplementary set of sen-
sors) in real situation will have to overcome some resistance attributable to the non-practical
nature of a supplementary device located in the reproduction space intended for entertainment
or virtual reality purposes. However, substantial benets of the sensor array and active control
are closely related to closed-loop and adaptive architectures for wave eld reproduction and
room dynamics compensation as shown in section 5.5.3. Moreover, the adaptive nature of a ty-
pical active control system implies that source (loudspeaker) frequency responses may not be
perfectly matched since adaptive lter design will compensate for such discrepancies. This ar-
gument again points to the usefulness of sensors aray in contrast with other open-loop systems.
In this paragraph we had briey introduced the subtle and touchy compromise between high-
delity objective reproduction and more practical and less critical applications. A compromise
is needed which is a key factor for any further practical developments and which may suggest
few different practical approaches to this problem.
A rst type of method would thus be a straight-forward direct application of optimal control
as simulated in this paper, that is providing the optimal control of sound eld reproduction
on-line. Alternatively, one can think of optimal control including a sensor array as a setup pro-
cedure, that is working off-line. In the latter case, a database of both possible virtual source
positions and types may have to be stored. This database should also includes the complete set
of corresponding lters which would have been identied by means of adaptive signal proces-
sing, consistently with the optimal control theoretical analysis. Such a setup procedure could
thus rapidly become a tedious one and may consequently be not so interesting in comparison
with on-line applications. Moreover, the off-line application may introduce serious errors which
come from the weakly time-variant acoustical nature of a room[Hatziantoniou et Mourjopoulos,
2004]. In either the on-line or off-line case, the here introduced observations and conclusions
still valid, again except for the remark about the nature of room acoustics which may slightly
change with time [Hatziantoniou et Mourjopoulos, 2004].
Considerations and decision regarding the merits of on-line versus off-line solutions could
be both further investigated and claried in any corresponding practical studies.
From an adaptive active control view point, the system includes a large number of inputs and
outputs and may consequently become a computational burden, even for a 1.5 kHz frequency
range. On the other hand, depending on the controller architecture and adaptation scheme [El-
110
liott, 2001], some reduction in computation time can be achieved. If some practical aspects of
current audio systems and sound control technology are taken into account, a reduced number
of sensors should be considered in subsequent simulations and research.
In spite of this, the introduced congurations and the associated physical model have been
used for investigation purposes, because they give indications about the physical possibility of
creating a wave eld (spherical or planar) in a given horizontal region with various closed-
loop reproduction systems. These simple simulations have in fact revealed that it is possible to
reproduce a progressive wave front in a closed reective environment, thus from a set of room
modes, in a least-square sense.
Most of the presented simulations have been interpreted from an active control view point,
assuming an adaptive controller such as feedforward system with effort penalty. The simulations
and results can also be considered from the inverse problem perspective. From this view point,
the questions are : is it physically possible to recreate a given wave eld with a given set of
sources and what mechanisms are involved ? As a response, the wave elds can be constructed,
in the least-square sense, by a set of simple sources with source strengths totally different than
WFS source strengths in a room situation. Some sources that are inactive in WFS are now active
in the optimal control approach and may possibly perform power absorption. This suggests the
need for WFS modications in reective environments. (See [Spors et al., 2003a] as an example
of practical implementation).
5.7 Conclusion
Active control techniques can be applied to sound eld reproduction with satisfactory quan-
titative reproduction results achieved in a room and in a free eld. These methods provide more
accurate sound eld reproduction than a standard open-loop WFS system operating in a room.
Such benets are related to source power absorption and compensation of room dynamics in a
reective environment. Moreover, the simulations show that all reproduction sources are active
in the optimal control approach, thus suggesting a need for modications of the standard WFS
operators. It is also demonstrated that active sound control can simultaneously perform wave
eld reproduction and room compensation in a unique error minimization task.
Other relevant conclusions are related to spatial aliasing and special sensor conguration. It
111
has been shown that spatial aliasing in optimal control is dictated by sensor spacing in the case of
a dense enough sensor array away from the sources, while it is source density which dominates
spatial aliasing for WFS [Verheijen, 1998; Nicol et Emerit, 1999]. For this reason, optimal
control may be more interesting since a dense microphone array is practically more convenient
than a dense source array. However, one has to reduce the quantity of sensors for practical
applications. Again from a practical view point, an interesting conguration of sensors, namely
a sensor layer around a listening area, provides satisfactory sound eld reproduction inside the
array while keeping the listening region free of any sensors. Such a conguration, which implies
pressure and pressure gradient reconstruction on a surrounding line constitutes a conceptual link
between active control and WFS. In this paper, the surrounding sensor conguration has not
been optimized for all possible situations. Further research should address this point, since the
sensor array introduced here is not performing sound eld reproduction in a room.
Other conclusions have been drawn on the conditioning of the reproduction system inclu-
ding sources, reproduction situation and sensors. The results suggest that a large sensor area, a
slightly randomized source positioning and reproduction in closed space are favorable in terms
of the problem conditioning. On the other hand, some well-conditioned congurations, like the
large sensor area, imply larger reproduction errors. The introduction of a regularization parame-
ter at this stage of the study suggests the needs for proper effort penalty consideration in any
following practical work.
Future work should be devoted to control architecture, practical prototyping and further
objective evaluation of the suggested technique.
Acknowledgments
This work has been supported by NSERC (Natural Sciences and Engineering Research
Council of Canada), FQRNT (Fond Qubecois de la Recherche sur la Nature et les Techno-
logies), VRQ (Valorisation Recherche Qubec) and Universit de Sherbrooke.
112
CHAPITRE 6
TUDE COMPARATIVE DE LA WFS, DE LA MINIMISA-
TION RGULARISE DE LERREUR ET DE LAWFS
6.1 Introduction
Les deux chapitres prcdents ont su dmontrer lutilit thorique de la reproduction de
champs acoustiques par contrle plutt que par WFS lorsque la reproduction doit par exemple
avoir lieu en salle. Le chapitre 5 ayant plutt mis sur la comprhension physique de la repro-
duction dondes progressives en salle, le prsent chapitre se base sur une formulation similaire
et introduit la dnition de lAWFS (Adaptive Wave Field Synthesis, loriginalit technolo-
gique dcrite dans cette thse) mais se consacre surtout aux analyses des intrts et limitations
des applications et congurations pratiques potentielles ; lobjectif principal tant de comparer
certaines congurations gomtriques et nalement de dnir celle qui sera privilgie expri-
mentalement.
Un reproche couramment formul lgard de lgalisation en plusieurs points (ce qui cor-
respond quelques dtails prs la formulation de contrle optimal pur [minimisation de ler-
reur de reproduction et pnalisation de la commande] expose au chapitre 5) vient du fait que
mme si lerreur de reproduction est rduite aux points de contrle, il est possible que lerreur
de reproduction soit trop importante pour des points qui ne correspondent pas des points de
contrle
1
. Dautres mthodes dgalisation spatiale ont t proposes pour tenter dviter ce
problme [Spors et al., 2003a]. Lune des principales se base sur des notions dextrapolations
de champs acoustiques [Poletti, 2000; Spors et al., 2003a] an dtendre les zones de contrle.
Par contre, ces extrapolations de champs sont bases sur des hypothses dont la validit peut ai-
sment tre mise en doute puisquau bout du compte, les extrapolations (bases sur lutilisation
1
On trouve le problme quivalent dans le cas du contrle actif du bruit alors que de faibles erreurs aux capteurs
de contrle nindiquent pas toujours une rduction globale dun niveau de bruit indsirable.
113
dune antenne de capteurs circulaire et des dcompositions en harmoniques cylindriques puis en
ondes planes) rsident en partie sur des hypothses de champs libres [Spors et al., 2003a]. Ce
qui ne correspond pas au cas de la reproduction en salle. Mme dans ce cas dextrapolation de
champs, la performance idale du systme serait caractrise par une erreur nulle aux capteurs
de lerreur, ce qui donc ne distingue pas vraiment lapproche par extrapolation de champs telle
que mise de lavant par Spors [Spors et al., 2003a] de lapproche par galisation en plusieurs
points. De plus, Spors reconnat textuellement quune faible erreur rsultante observe dans
lexpression du champ transform na pas donn les rsultats escompts en dehors des positions
des capteurs de lerreur, soit comme dans le cas de lgalisation en plusieurs points [Spors et al.,
2003a].
En plus des inconvnients mentionns plus tt, on note le problme pratique de lencombre-
ment dun espace de reproduction par une vaste antenne de capteurs de lerreur de reproduction.
Dans cette optique, ce chapitre met laccent sur des antennes de capteurs compactes an dviter
ce problme dencombrement.
Dans ce chapitre, des comparaisons entre les trois mthodes (WFS, minimisation rgularise
de lerreur de reproduction comme au chapitre 5 et AWFS) sont avances avec la dnition
thorique de lAWFS an dvaluer les caractristiques propres aux approches mentionnes.
Ces comparaisons sont effectues avec diffrentes congurations de sources et de capteurs.
Lobjectif nest pas de prtendre latteinte dune erreur nulle, ou trs faible, sur un espace
trs tendu mais plutt dtablir laquelle des mthodes semble la plus prometteuse par rapport
au critre de rduction de limportance des erreurs en dehors des points de contrle.
Ce chapitre est donc introduit titre de complment au prcdent et prsente un rsum de
tous les rsultats de simulations issus de cette tude comparative des mthodes et congurations
possibles. Il met aussi en place la formulation de la partie physique de lAWFS la section 6.2.
La section 6.3 prsente les rsultats en champ libre, la section 6.4 analyse leffet de la distance
de sparation des capteurs, la section 6.5 prsente une conguration de sources en U alors que
les sections suivantes (6.6 et 6.7) abordent respectivement leffet de la prsence dune surface
rigide innie et la description de la conguration privilgie pour les exprimentations et pour la
suite de cette thse. On note aussi que cette analyse rpond au besoin dtablir et de comprendre
les mcanismes dune mthode, lAWFS, qui requiert possiblement un nombre moindre de cap-
teurs pour des applications pratiques viables (considrer ce sujet la discussion au chapitre 5
aux pages 109 et suivantes). LAWFS est dveloppe et tudie selon dautres perspectives aux
chapitres 7 9. Le prsent chapitre constitue, quant lui, une dnition prliminaire de lAWFS.
114
6.2 Formulation thorique dune approche dAWFS
Dans cette section, la dnition de la WFS adaptative (lAWFS) est introduite pour laspect
physique du problme. Dautres dtails au sujet de ce dveloppement sont prsents en annexe
la section A.3 partir de la page 302. Les proprits de lAWFS sont aussi dveloppes dans
tous les chapitres suivants puisque lAWFS est la solution technologique retenue dans le cadre
de cette thse.
Indpendamment de la relation entre le nombre de sources et le nombre de capteurs, une
nouvelle fonction cot reprsentative de lintention de lamlioration reproduction par contrle
actif est pose comme suit
J
AWFS
= e
H
e +(q q
WFS
)
H
(q q
WFS
) (6.1)
o e
H
e reprsente lindice scalaire de performance et (q q
WFS
)
H
(q q
WFS
) la pnalisation
de lcart de la solution optimale en rapport une solution pose a priori, soit q
WFS
dans le cas
de lAWFS. Lensemble de la dnition des termes suit donc la nomenclature du chapitre pr-
cdent. La solution pose a priori est celle obtenue par la dnition des oprateurs de synthse
de la WFS pour le cas considr (les oprateurs de synthse sont dnis la section A.5). Ce
type de formulation des moindres-carrs est connu dans le contexte plus gnral des problmes
inverses linaires [Hansen, 1998]. Cette nouvelle fonction cot reprsente donc le fait quune
solution qui minimise les erreurs de reproduction est recherche tout en favorisant, selon lam-
pleur de , la solution optimale la plus proche de celle avance par la WFS. Dans le cas o la
fonction cot de lquation (6.1) est utilise avec q
WFS
,=
0, on parlera dAWFS; si q
WFS
=
0,
on parlera de minimisation rgularise des erreurs de reproduction.
Il est possible dutiliser lquation (6.1) mme dans le cas sous-dtermin (avec un nombre
de sources plus important que le nombre de capteurs) tant donn que la prsence de la pnalisa-
tion de la commande (q
H
q) dans le dveloppement du terme (q q
WFS
)
H
(q q
WFS
) garantit
que la matrice Hessienne de la fonction quadratique Hermitienne de lquation (6.1) soit dnie
positive
2
. Ce qui assure quune seule solution optimale puisse minimiser cette nouvelle fonction
cot. Cette solution optimale est la suivante
q
(opt)
=
_
Z
(m)
H
Z
(m)
+I
_
1
_
Z
(m)
H
p
(im)
+q
WFS
_
(6.2)
rgularise donc la solution q
(opt)
aux environs de la solution pose a priori q
WFS
.
2
La section A.3 la page 302 prsente la dmonstration de ces deux afrmations.
115
6.3 Comparaisons en champ libre entre WFS, AWFS et minimisation rgularise des
erreurs de reproduction
Ce chapitre prsente principalement des rsultats de simulations de lAWFS qui servent de
premires illustrations des possibilits de lAWFS. Des comparaisons sont effectues en champ
libre pour, par exemple, considrer la nature du champ direct qui serait reproduit en salle par les
diffrentes approches. On cherche comparer les diffrences de base et celles qui sont visibles.
De plus, un systme de AWFS devrait performer aussi bien en salle quen champ libre, ce qui
motive cette approche comme entre en la matire en AWFS.
6.3.1 Conguration circulaire des sources et congurations centres pour les capteurs de
lerreur
Deux congurations de sources sont tudies, en cercle ou en U ( la section 6.5). Dans les
deux cas, on considre un total de 24 sources acoustiques. Pour les congurations de capteurs,
on considre des distributions compactes centres pour rduire le nombre de capteurs et lespace
dencombrement quils occupent.
Cas (a) : antenne de sources circulaire et capteur central unique.
La conguration est prsente la gure 6.1 (p. 117). Elle inclut un seul capteur derreur
pour le contrle et 32 moniteurs de lerreur de reproduction an dvaluer lerreur de reproduc-
tion en dehors du point de contrle. La distance de sparation des sources est de 26.11 cm et
donne une frquence de repliement spatial denviron 634 Hz (en accord avec le critre dni
au chapitre 4). Le diamtre de lantenne de sources est de 2 m et la sparation angulaire des
sources est de 14.4 deg. Les gures 6.2 (p. 117) 6.5 (p. 118) prsentent les rsultats de la WFS
selon la mme approche que celle du chapitre prcdent. Comme ces gures le suggrent, la
reproduction par WFS suit bien ce qui fut expos au chapitre 4 et est maintenant utilise comme
base de comparaison.
Pour la mme conguration, les rsultats par minimisation rgularise de lerreur (avec un
paramtre de rgularisation () de 50 et q
WFS
=
0) sont prsents aux gures 6.6 (p. 118) 6.9

(p. 120). tant donn quun seul capteur de lerreur est utilis, le systme qui se baserait ainsi
uniquement sur la rduction de lerreur sans solution a priori ne pourrait pas avoir accs des
116
x
2
2 m
x
1
Sources
Capteur
Moniteurs
Sources: 24
Capteur: 1
Figure 6.1 Conguration pour le cas (a). :
position de la source virtuelle, : direction
principale des sources.
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Frq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
3
|
q
o
p
t
|
Figure 6.2 E
LS
et [q
opt
[ pour la WFS pour le
cas (a). : [q
opt
[. : E
LS
valu aux
moniteurs. : E
LS
valu aux capteurs
derreur.
Figure 6.3 Pression acoustique relle
reproduite pour le cas (a) par WFS 220 Hz.
: courbes isopression (p
(im)
(x) = 0) de la
pression acoustique relle reproduire. :
source virtuelle.
Figure 6.4 Pression acoustique imaginaire
reproduite pour le cas (a) par WFS 220 Hz.
(im)
(x) = 0) de la
pression acoustique imaginaire reproduire.
: source virtuelle.
117
1
2
3
1
2
3
0
0.005
0.01
0.015
x
1
[m]
x
2
[m]
P
u
i
s
s
a
n
c
e

d
e
s
o
r
t
i
e

[
W
]
Figure 6.5 Puissance acoustique de sortie
pour le cas (a) par WFS pure 220 Hz. B :
Puissance de sortie positive. # : Puissance de
sortie nulle.
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Frq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
3
|
q
o
p
t
|
Figure 6.6 E
LS
et [q
opt
[ pour la minimisation
rgularise de lerreur pour le cas (a). :
[q
opt
[. : E
LS
valu aux moniteurs. :
E
LS
valu aux capteurs derreur. Les courbes
en gris correspondent la WFS.
informations au sujet de la distribution spatiale des champs reproduire et reproduits. Dans ce
cas, toutes les sources contribuent galement (voir la gure 6.9 (p. 120) ce sujet) produire le
bon niveau de pression acoustique au seul capteur derreur.
Mme si ce cas de minimisation rgularise de lerreur de reproduction de champs avec un
seul capteur semble peu intressant lorsque le contrle de lerreur est appliqu sans solution a
priori (sans q
WFS
), il en est tout autrement lorsque le principe de lAWFS expos plus tt est
appliqu la mme situation. Les rsultats de lAWFS (avec = 50 et q
WFS
dni par les
oprateurs de la WFS dans le domaine des frquences) sont rsums aux gures 6.10 (p. 120)
6.13 (p. 121). Ainsi, la pnalisation par rapport une solution q
WFS
pose a priori introduit
une tout autre distribution des puissances acoustiques des sources de reproduction, mme avec
un seul capteur de lerreur de reproduction, comme on peut le voir en comparant les gures 6.9
(p. 120) et 6.13 (p. 121) alors que les puissances acoustiques de sources dans le cas de lAWFS
sont trs proches de celles introduites par la WFS (voir les gures 6.13 (p. 121) et 6.5 (p. 118)).
Lavantage du contrle de type AWFS par rapport la minimisation rgularise de lerreur (avec
pnalisation de la commande et non pas pnalisation de lcart par rapport la WFS) tient donc
du fait que limprcision spatiale de cette antenne de capteurs (et notamment lambigut maxi-
118
reproduite pour le cas (a) par minimisation
rgularise de lerreur 220 Hz. : courbes
isopression (p
(im)
(x) = 0) de la pression
acoustique relle reproduire. : source
virtuelle.
reproduite pour le cas (a) par minimisation
isopression (p
(im)
acoustique imaginaire reproduire. : source
virtuelle.
male attribuable un seul capteur omnidirectionnel) est compense par linformation fournie a
priori par la dnition de q
WFS
. Lavantage de lAWFS par rapport la WFS se situe quant lui
au niveau de la coloration rduite au capteur de contrle. Ce qui peut se voir en considrant la
valeur de E
LS
en fonction de la frquence pour lAWFS (gure 6.10 (p. 120)) et la WFS (gure
6.2 (p. 117)). Qui plus est, la seule introduction du terme de pnalisation par rapport la solu-
tion pose a priori (AWFS) procure au bout du compte une distribution de pression acoustique
immensment plus dle au champ reproduire (et donc celui produit par WFS en champ libre)
que dans le cas de minimisation rgularise de lerreur (sans solution pose a priori) comme on
peut le voir en comparant les gures 6.11 (p. 120) et 6.12 (p. 120) avec les gures 6.3 (p. 117)
et 6.4 (p. 117).
Cas (b) : antenne de sources circulaire et antenne de capteurs centrale approchant deux
capteurs de premier ordre perpendiculaires.
La conguration en question est illustre la gure 6.15 (p. 122). Comme il est possible de
le voir, les positions des capteurs forment une approximation dun quadruple tessral dans le
plan horizontal. Il est ainsi possible de contrler au moins la pression acoustique et les gradients
de pression au centre de lantenne de sources. Les capteurs sont spars par 0.175 m selon x
1
119
1
2
3
1
2
3
0
2
4
x 10
4
x
1
[m]
x
2
[m]
P
u
i
s
s
a
n
c
e

d
e
s
o
r
t
i
e

[
W
]
pour le cas (a) par minimisation rgularise de
lerreur 220 Hz. B : Puissance acoustique de
sortie positive. # : Puissance acoustique de
sortie nulle.
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Frq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
3
|
q
o
p
t
|
Figure 6.10 E
LS
et [q
opt
[ pour lAWFS pour le
cas (a). : [q
opt
[. : E
LS
valu aux
moniteurs. : E
LS
valu aux capteurs
derreur. Les courbes en gris reprsentent les
rsultats de la WFS.
reproduite pour le cas (a) par AWFS 220 Hz.
(im)
(x) = 0) de la
source virtuelle.
reproduite pour le cas (a) par AWFS 220 Hz.
(im)
(x) = 0) de la
: source virtuelle.
120
1
2
3
1
2
3
0
0.005
0.01
0.015
x
1
[m]
x
2
[m]
P
u
i
s
s
a
n
c
e

d
e
s
o
r
t
i
e

[
W
]

pour le cas (a) par AWFS 220 Hz. B :
Puissance de sortie positive. # : Puissance
acoustique de sortie nulle.
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Frq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
3
|
q
o
p
t
|
Figure 6.14 E
LS
et [q
opt
rgularise de lerreur pour le cas (b). :
[q
opt
[. : E
LS
E
LS
valu aux capteurs derreur.
et x
2
. Les rsultats de minimisation rgularise de lerreur (toujours avec = 50 et q
WFS
=
0)
sont rsums par les gures 6.14 (p. 121) 6.16 (p. 122). En comparaison avec la minimisation
rgularise de lerreur du cas (a), il fut observ que le cas (b) avec la mme mthode tend la
zone de contrle (voir les gures 6.7 (p. 119) et 6.8 (p. 119) versus les gures 6.15 (p. 122)
et 6.16 (p. 122)). Ainsi, mme pour la minimisation rgularise de lerreur sans AWFS, le cas
avec quatre capteurs laisse voir un avantage important par rapport une conguration avec un
seul capteur : le champ reproduit est plus tendu dans lespace. On note videmment quil fut
observ que la taille de cette tendue est fonction de la longueur donde : de faibles longueurs
donde produisant de plus petites zones o lerreur est moindre.
Les rsultats pour cette conguration avec une approche AWFS sont prsents aux gures
6.17 (p. 122) 6.19 (p. 123). Lavantage le plus important de lAWFS en comparaison avec la
minimisation rgularise de lerreur vient encore du fait que lerreur aux moniteurs est moins
importante par AWFS que par minimisation rgularise de lerreur (voir les gures 6.14 (p.
121) et 6.17 (p. 122)), tant donne linformation spatiale introduite a priori par lexpression
de q
WFS
qui compense pour le manque dinformations disponibles par la seule entremise des
capteurs de lerreur. Ce qui suggre encore une fois lintrt dune approche par AWFS avec
capteurs centrs.
121
reproduite pour le cas (b) par minimisation
isopression (p
(im)
virtuelle.
isopression (p
(im)
virtuelle.
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Frq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
3
|
q
o
p
t
|
Figure 6.17 E
LS
et [q
opt
[ pour lAWFS pour le cas (b). : [q
opt
[. : E
LS
valu aux
moniteurs. : E
LS
122
reproduite pour le cas (b) par AWFS 220 Hz.
(im)
(x) = 0) de la
source virtuelle.
isopression (p
(im)
virtuelle.
Cas (c) : antenne de sources circulaire et antenne de capteurs centrale approchant deux
capteurs de second ordre en position perpendiculaire.
La conguration en question est illustre la gure 6.20 (p. 124). Comme il est possible
de le dduire par cette gure, le groupe de capteurs peut former diffrents motifs de directivit
(monpole, diples, quadruple tessral et quadruples axiaux) qui fournissent, du coup, une
approximation des drives partielles de second ordre selon x
1
et x
2
. Des rsultats en minimi-
sation rgularise de lerreur sont prsents aux gures 6.20 (p. 124) 6.23 (p. 125). En basses
frquences, le champ reproduit correspond bien au champ reproduire (gure 6.20 (p. 124)), par
contre en plus hautes frquences, notamment aux environs de 600 Hz, on remarque une certaine
particularit (gures 6.22 (p. 125) et 6.23 (p. 125)). Cette particularit est difcilement expli-
cable lheure actuelle mais se comprend aisment la lueur des considrations thoriques, au
sujet des modes de rayonnement, de lAWFS prsentes au chapitre suivant.
La gure 6.24 (p. 125) rsume les rsultats dAWFS pour le mme cas. Encore une fois,
lerreur de reproduction value aux moniteurs de lerreur est plus faible que dans le cas de la
minimisation rgularise de lerreur pour la mme conguration. Par contre, comme le prsente
la gure 6.24 (p. 125), cette conguration de capteurs introduit une particularit indsirable
123
reproduite pour le cas (c) par minimisation
isopression (p
(im)
virtuelle.
isopression (p
(im)
virtuelle.
aux environs de 600 Hz (particularit aussi note aux gures 6.22 (p. 125) et 6.23 (p. 125)) :
lerreur de reproduction value aux moniteurs prsente une importante dviation, mme plus
importante que pour le cas (b) qui comportait un nombre moins important de capteurs. Cette
conguration serait donc proscrire. Tel que not plus tt, cette particularit sexplique plus
facilement avec la description thorique de lAWFS prsente au chapitre suivant.
Cas (d) : antenne de sources circulaire et antenne de capteurs centrale approchant
quatre capteurs de second ordre spars par 45 degrs.
La conguration en question est illustre la gure 6.27 (p. 127). Comme il est possible de
limaginer par le biais de la conguration de capteurs illustre sur cette gure, le groupe de cap-
teurs pourrait former diffrents motifs de directivit (monpole, diples, quadruples tessraux
et quadruples axiaux). Les rsultats en minimisation rgularise de lerreur sont rsums aux
gures 6.25 (p. 126), 6.27 (p. 127) et 6.28 (p. 127). Avec un plus grand nombre destimations
possibles des drives spatiales, il fut observ que la zone de correspondance entre champ
reproduire et champ reproduit est plus grande. Il est en fait mme possible de le voir en plus
hautes frquences en considrant les gure 6.27 (p. 127) et 6.28 (p. 127). Pour des congura-
tions de capteurs telle celle du cas (b), la zone effective de reproduction en champ libre et en
124
isopression (p
(im)
virtuelle.
isopression (p
(im)
virtuelle.
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Freq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
3
|
q
o
p
t
|
Figure 6.24 E
LS
et [q
opt
[ pour lAWFS pour le cas (c). : [q
opt
[. : E
LS
valu aux
moniteurs. : E
LS
125
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Frq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
3
|
q
o
p
t
|
Figure 6.25 E
LS
et [q
opt
rgularise de lerreur pour le cas (d). :
[q
opt
[. : E
LS
E
LS
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Frq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
3
|
q
o
p
t
|
Figure 6.26 E
LS
et [q
opt
[ pour lAWFS pour le
cas (d). : [q
opt
[. : E
LS
valu aux
moniteurs. : E
LS
valu aux capteurs
derreur.
plus hautes frquences ( 600 Hz) tait plus petite que celle prsente par cette gure.
Les rsultats de lAWFS pour le cas (d) sont quant eux rsums aux gures 6.26 (p. 126),
6.29 (p. 127) et 6.30 (p. 127). Il est essentiellement possible de formuler les mmes remarques
que dans le cas (c) avec lAWFS. Par contre, la particularit observe pour le cas (c) aux en-
virons de la frquence de repliement spatial de lantenne de source (634 Hz) est disparue. La
conguration (d) serait donc avantageuse par rapport la conguration (c).
Avec les quatre cas de conguration de capteur considrs, il est clair quune approche
AWFS introduit un intrt par rapport la WFS seule ou la minimisation rgularise de ler-
reur seule. Mme si les rsultats prsents jusquici nexplicitent pas la nature fondamentale
de lAWFS, ils dmontrent clairement lintrt de lapproche. Le chapitre suivant prsente une
interprtation fondamentale de lAWFS; une telle interprtation permet dexpliquer les spci-
cits observes sur les courbes issues des simulations prliminaires prsentes dans le chapitre.
Aussi, dun point de vue pratique, lutilisation dune antenne compacte est plus commode
que le recours une antenne circulaire en situation relle (en salle) parce quil demeure plus
facile dajouter quelques capteurs selon un axe vertical pour mieux distinguer les incidences
des rexions attribuables la salle. Ce qui, dans le cas dune approche priphrique (avec une
antenne de capteurs circulaire largie, ou linaire et carre [voir par exemple la conguration
de Spors [Spors et al., 2003a]]), ncessiterait une surface compltement discrtise de capteurs
126
reproduite pour le cas (d) par minimisation
isopression (p
(im)
virtuelle.
reproduite pour le cas (d) par minimisation
isopression (p
(im)
virtuelle.
reproduite pour le cas (d) par AWFS 220 Hz.
(im)
(x) = 0) de la
source virtuelle.
reproduite pour le cas (d) par AWFS 220 Hz.
(im)
(x) = 0) de la
: source virtuelle.
127
(voir la discussion du chapitre 5) et donc, un nombre de capteurs beaucoup plus important. Pour
comparer les performances des quatre congurations de capteurs, deux gures synthses sont
introduites. Cest ainsi que les gures 6.31 (p. 129) et 6.32 (p. 129) introduisent lensemble
des E
LS
valus pour tous les cas. Sur ces gures, deux frquences importantes sont indiques.
La premire, 634 Hz, correspond une premire approximation de la frquence de repliement
spatial attribuable la distance de sparation des sources
3
. La deuxime, 945 Hz, correspond
la frquence de repliement spatial attribuable la distance de sparation des moniteurs. On porte
une attention particulire aux valeurs de E
LS
values aux moniteurs de lerreur de reproduction
puisquelles indiquent la validit du contrle en dehors de la zone de contrle et, du coup, le
compromis entre nombre de capteurs et gain en terme de qualit de reproduction. On remarque
aussi, que pour fournir une base de comparaison valable, la valeur du paramtre de rgularisation
varie selon les cas (pour lensemble des gures prcdentes, elle tait xe 50)
4
. Ainsi,
puisque est x 50 pour le cas (a) avec un capteur, on impose respectivement = 200,
= 250 et = 450 pour les cas avec 4 (cas (b)), 5 (cas (c)) et 9 (cas (d)) capteurs.
En considrant dabord la gure 6.32 (p. 129), on remarque que les congurations (b), (c)
et (d) en AWFS procurent les meilleures rductions E
LS
aux moniteurs sous la frquence de
repliement spatial du rseau de sources. Outre la variation particulire de E
LS
aux moniteurs
avec la conguration (c) en AWFS aux environs de 634 Hz, les trois congurations procurent
une rduction comparable de E
LS
. Il serait donc possible de solliciter une conguration avec un
nombre rduit de capteurs comme la conguration (b) pour obtenir des rsultats proches dune
conguration plus exigeante telle la (d). Dans tous les cas, une rduction de E
LS
aux moniteurs
est seulement observable sous la frquence de repliement spatial de lantenne de sources. On
note aussi que lerreur par WFS augmente considrablement partir de 634 Hz alors quil y a
repliement. Ainsi, le gain de qualit attribuable lAWFS nest valable que sur la plage de fr-
quences effective de la WFS : en approchant la frquence de repliement spatial de lantenne de
sources, lAWFS et la WFS convergent vers une mme valeur de E
LS
aux moniteurs. La gure
6.31 (p. 129) montre quavec un accroissement du nombre de capteurs, lerreur de reproduction
rsiduelle normalise (E
LS
) devient de plus en plus importante, quoiquelle demeure tout de
mme trs loin sous la limite suprieure de E
LS
= 0.5.
3
On note que cette premire approximation est ainsi baptise puisquelle dpend en fait de la direction dinci-
dence du front donde virtuel arrivant lantenne de sources pour la WFS. En gros, cette premire approximation
dcoule de la distance de sparation des sources : pour viter le repliement, il doit y avoir au moins deux sources
par longueur donde.
4
Il est important de changer la valeur de selon le nombre de capteurs, tant donn quavec un nombre de
capteurs de plus en plus important et avec un nombre de sources constant, lapport de la rgularisation est rduit en
comparaison avec e
H
e qui est en fait la somme des erreurs quadratiques.
128
10
2
10
3
10
6
10
5
10
4
10
3
10
2
10
1
10
0
E
L
S
Frq. [Hz]
WFS (a)
AWFS (a)
WFS (b)
AWFS (b)
WFS (c)
AWFS (c)
WFS (d)
AWFS (d)
634Hz
945 Hz
Figure 6.31 E
LS
aux capteurs de lerreur pour
les quatre cas.
10
2
10
3
10
2
10
1
10
0
E
L
S
Frq. [Hz]
WFS (a), (b), (c) & (d)
AWFS (a)
AWFS (b)
AWFS (c)
AWFS (d)
634Hz
945 Hz
Figure 6.32 E
LS
aux moniteurs de lerreur
pour les quatre cas.
6.4 Effet de la distance de sparation des capteurs
Pour les cas considrs la section prcdente, les distances de sparation des capteurs
taient xes arbitrairement partir de 0.175 m qui offre une frquence de repliement spatial
denviron 945 Hz. Sachant que la conguration (b) avec quatre capteurs (voir la gure 6.18
(p. 123)) semble procurer de bons rsultats, de nouvelles simulations sont effectues en faisant
varier la distance nominale de 0.35 m 0.0875 m avec un paramtre de rgularisation de 200.
Les simulations sont rsumes aux gures 6.33 (p. 130) et 6.34 (p. 130).
Comme on peut le voir dans le cas de E
LS
(voir la gure 6.33 (p. 130)) aux capteurs en
fonction de la frquence, plus la distance de sparation des capteurs est petite, plus la prsence
dune pointe de E
LS
est repousse en hautes frquences. Ce qui indique donc quune antenne
plus compacte pourrait tre avantageuse puisquelle peut repousser cet accroissement subit en
dehors de la plage de frquence dintrt. Par contre, cet accroissement reste un niveau der-
reur relativement faible en comparaison avec lerreur par simple WFS, ce qui permettrait tout de
mme lutilisation dune antenne pas trop compacte, comme dans le cas (b) initialement intro-
duit la section prcdente. De plus, la gure 6.34 (p. 130) dmontre que la variation de lerreur
aux moniteurs est faible pour lAWFS lorsque la distance de sparation des capteurs est varie.
Lerreur aux moniteurs est mme plus faible lorsque lantenne des capteurs de lerreur afche
une distance de sparation plus importante.
129
10
2
10
3
10
7
10
6
10
5
10
4
10
3
10
2
10
1
10
0
E
L
S
Frq. [Hz]
WFS (b), 0.35m
Contrle (b), 0.35m
AWFS (b), 0.35m
WFS (b), 0.175m
Contrle (b), 0.175m
AWFS (b), 0.175m
WFS (b), 0.0875m
Contrle (b), 0.0875m
AWFS (b), 0.0875m

6
3
4
H
z

9
4
5

H
z
WFS
AWFS
Contrle
Figure 6.33 E
LS
aux capteurs de lerreur pour
le cas (b) avec un variation de la distance entre
les capteurs selon les deux axes.
10
2
10
3
10
2
10
1
10
0
E
L
S
Frq. [Hz]
WFS (b), toutes sp.
Contrle (b), 0.35m
AWFS (b), 0.35m
Contrle (b), 0.175m
AWFS (b), 0.175m
Contrle (b), 0.0875m
AWFS (b), 0.0875m

6
3
4
H
z

9
4
5

H
z
WFS
C
o
n
t
r
l
e

W
F
S

&
A
W
F
S

Figure 6.34 E
LS
aux moniteurs de lerreur
pour le cas (b) avec un variation de la distance
entre les capteurs selon les deux axes.
Les gures 6.33 (p. 130) et 6.34 (p. 130) illustrent aussi clairement une diffrence particu-
lire entre lAWFS et la simple minimisation rgularise de lerreur (identie contrle sur
ces gures). Lerreur de reproduction aux capteurs de lerreur est plus importante par contrle
que par AWFS. Cette diffrence, peut-tre surprenante aux premiers abords, sexplique sim-
plement. Dans la mesure o une part de la solution par minimisation rgularise de lerreur
comporte des lments proches de la WFS, lensemble de cette solution est plus pnalise par la
rgularisation que dans le cas de lAWFS o la partie proche de la solution par WFS nimplique
quune faible contribution dans la pnalisation particulire de la fonction cot de lAWFS.
En bref, on recommande donc lutilisation dune antenne de capteurs dont la frquence de
repliement spatial est proche de celle de lantenne de sources utilise pour lAWFS. De plus,
la distance minimale entre les capteurs est inuence par la marge derreur sur les rponses en
phase des microphones qui prendront, en pratique, la place des capteurs de lerreur. Ainsi, la
tolrance sur lerreur de phase entre des microphones sera plus faible dans le cas dune antenne
trs compacte puisque les retards temporels de propagation entre les capteurs deviennent de plus
en plus brefs et donc, potentiellement de lordre des erreurs de phase entre les microphones.
130
CONFIGURATION DES SOURCES POINTS DISTINCTIFS
Conguration circulaire (g. 6.15 (p. 122)) Distribution plus lisse des E
LS
(voir gures 6.37 (p. 132)
et 6.38 (p. 132)).
E
LS
plus faibles pour la WFS et lAWFS (voir gures 6.37
(p. 132) et 6.38 (p. 132)).
Structure portante plus difcile raliser en pratique.
Couverture angulaire complte.
Conguration en U (g. 6.35 (p. 132)) E
LS
plus importants pour la WFS et lAWFS (voir gures
6.37 (p. 132) et 6.38 (p. 132)).
Effet de diffraction des coins plus important.
Possibilit dvaluer la compensation des effets de coins
par AWFS.
Structure portante rectangulaire plus facile raliser en
pratique.
Couverture angulaire incomplte.
Tableau 6.1 Points distinctifs pour les antennes de sources circulaires et celles en U.
6.5 Antenne de sources en U
Pour des raisons pratiques, il peut tre plus facile de raliser un systme dAWFS bas sur
des antennes de sources linaires, un peu comme lantenne introduite pour les tudes thoriques
fondamentales en salle prsentes au chapitre 5. Puisque la conguration (b) de capteurs semble
prometteuse en pratique, une mme conguration de capteurs est considre alors quelle est
entoure dune antenne de sources en U. La conguration est en fait prsente la gure 6.35
(p. 132). Lensemble des rsultats est rsum par les gures 6.35 (p. 132) et 6.36 (p. 132) pour
lAWFS seulement (avec = 50) qui illustre la proximit des rsultats de lAWFS avec une telle
conguration en U et ceux de lAWFS avec la conguration circulaire de sources prsente
plus tt. On remarque que la conguration en U ici introduite est inspire de la conguration
prsente par Spors [Spors et al., 2003a].
En complment, les gures 6.37 (p. 132) et 6.38 (p. 132) introduisent la comparaison entre
une antenne de sources circulaire et une autre en U pour la mme situation par le biais des
erreurs aux capteurs (dans la conguration de capteurs (b)) et aux moniteurs. Les observations
sont rsumes au tableau 6.1. En pratique, et pour les chapitres qui suivent, on retient la con-
guration circulaire principalement parce que sa couverture angulaire est complte (elle recouvre
360 deg).
131
reproduite pour le cas (b) par AWFS avec une
conguration de sources en U 220 Hz.
(im)
(x) = 0) de la
source virtuelle.
reproduite pour le cas (b) par AWFS avec une
conguration de sources en U 220 Hz.
(im)
(x) = 0) de la
: source virtuelle.
10
2
10
3
10
6
10
5
10
4
10
3
10
2
10
1
10
0
E
L
S
Frq. [Hz]
AWFS, en U
AWFS, en O
Contrle pur, en O
Contrle pur, en U
WFS, en U
WFS, en O
A
W
F
S

C
o
n
t
r
l
e

WFS

6
3
4
H
z

9
4
5

H
z
Figure 6.37 E
LS
aux capteurs de lerreur par
WFS, AWFS et minimisation rgularise de
lerreur pour le cas (b) avec des congurations
de sources circulaires () et en U ().
10
2
10
3
10
1
10
0
E
L
S
Frq. [Hz]
AWFS, en U
AWFS, en O
WFS, en O
WFS, en U
Contrle pur, en O
Contrle pur, en U

6
3
4
H
z

9
4
5

H
z
W
F
S

C
o
n
t
r
l
e

AWFS
Figure 6.38 E
LS
aux capteurs de lerreur par
WFS, AWFS et minimisation rgularise de
lerreur pour le cas (b) avec des congurations
de sources circulaires () et en U ().
132
6.6 Effet dune seule rexion cause par une surface rigide innie
Quelques cas sont ici prsents en bref pour des congurations similaires celles sollicites
aux sections prcdentes mais en prsence dune surface innie rigide. Lobjectif principal est
dobtenir une ide des implications attribuables la prsence dune surface rchissante.
Les premiers rsultats correspondent exactement au cas (b), avec une antenne de sources
circulaire, prsente prcdemment, ils sont rsums aux gures 6.39 (p. 135) 6.41 (p. 135).
La diffrence avec les cas nots plus tt vient du fait quune surface rigide innie est place dans
le plan x
1
x
3
(voir la gure 6.15 (p. 122)). Sur ces gures, les rsultats en champ libre sont
superposs titre de rfrences comparatives. Leffet de la surface rigide et innie est modlis
par la mthode des images. Comme on peut le voir en considrant les variations de E
LS
aux
moniteurs, la prsence de la rexion augmente gnralement la valeur de E
LS
aux moniteurs
mais peut tout de mme tre compense par lAWFS, en comparaison avec la WFS, par exemple.
Pour toutes ces simulations, la pnalisation () est arbitrairement xe 50.
De faon gnrale les valeurs de E
LS
pour les capteurs et les moniteurs sont plus importantes
en prsence dune surface rigide qui de les hypothses la base de la dnition de la WFS. On
note par contre que dans le cas de reproduction par minimisation rgularise de lerreur ou par
AWFS, lerreur aux capteurs de lerreur et aux moniteurs de lerreur est de beaucoup moindre
que par WFS. Ce qui illustre encore lintrt de la compensation active.
Pour ces mmes simulations, des champs de pression acoustique reproduits par WFS et par
AWFS sont prsents aux gures 6.42 (p. 136) et 6.43 (p. 136) (page 136). Selon ces gures,
il est clair que la rexion cause par la surface rigide ne domine pas lallure des champs har-
moniques reproduits tant donn la distance relativement importante des images des sources de
reproduction par rapport la distance des sources relles jusquau centre de lantenne, soit la
zone dintrt. Par contre, la prsence dune erreur de reproduction est indniable (et plus impor-
tante quen champ libre) au niveau des valeurs de E
LS
values pour les moniteurs de lerreur
(gure 6.41 (p. 135)). Elle reste par contre moindre en AWFS et en minimisation rgularise de
lerreur quen WFS.
Les informations les plus rvlatrices au sujet de leffet dune rexion sur le contrle de
la reproduction viennent de la gure 6.44 (p. 137) sur laquelle on peut voir la superposition
des rponses impulsionnelles des sources pour la reproduction par minimisation rgularise de
133
lerreur de reproduction et par AWFS, pour les rsultats correspondant aux gures 6.40 (p. 135)
et 6.41 (p. 135). Comme ces rsultats en boucle ferme le suggrent, la prsence dune rexion
acoustique est compense par une seconde impulsion ngative et damplitude rduite dans les
rponses impulsionnelles des sources. Par extension, on peut imaginer quen prsence de plu-
sieurs surfaces rchissantes parallles, la nature des rponses impulsionnelles des sources
serait plutt rcursive puisque chaque front produit pour compenser les rexions doit tre
son tour compens lorsquil est lui-mme rchi. Soit un aspect qui peut prsenter certaines
limitations en pratique. Par contre, la pnalisation variable de lcart par rapport aux oprateurs
de la WFS permet toujours de limiter manuellement la dviation de la solution optimale par
rapport aux oprateurs de la WFS qui ne comportent videmment pas de composante rcursive.
Cest une caractristique importante et intressante de lAWFS.
On note aussi la diffrence damplitude globale des rponses limpulsion (gure 6.44 (p.
137)) pour la minimisation rgularise de lerreur versus lAWFS. Dans le cas de la minimisa-
tion rgularise, le problme vient justement de la rgularisation qui pnalise autant la partie de
la solution produisant le champ direct (semblable la dnition de la WFS) que la partie qui
annule la rexion. Un accroissement de lamplitude de limpulsion produisant le champ direct
augmente aussi la valeur de la fonction cot alors que dans le cas de lAWFS cest, approxi-
mativement, seulement la partie compensatoire des rponses limpulsion (la diffrence entre
la WFS et la solution de lAWFS) qui est pnalise, ce qui permet une amplitude globale plus
importante sans pnalisation.
Les derniers rsultats de simulations en prsence dune surface rchissante sont prsents
aux gures 6.45 (p. 138) et 6.46 (p. 138), pour la WFS et lAWFS seulement. Cette fois, la
surface rchissante est un plan horizontal (selon x
1
x
2
avec x
3
= 2 m) au-dessus des sources
de reproduction. Lintrt de ces simulations vient du fait que les sources de reproduction ne
peuvent pas ncessairement compenser une rexion dont lincidence sur lantenne de capteurs
ne correspond pas une incidence directe des sources de reproduction. Comme on peut le voir
lAWFS nest pas plus efcace que la WFS aux moniteurs de lerreur. Une des causes de cette
erreur peut tre lie la dnition gnrale de lAWFS telle quexpose lquation (6.1). Les
chapitres suivants montrent quil est possible damliorer ce constat.
134
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Frq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
3
|
q
o
p
t
|
Figure 6.39 E
LS
par WFS pour le cas (b) avec
une conguration de sources circulaire avec
1
x
3
.
: E
LS
aux moniteurs de lerreur. : E
LS
aux capteurs de lerreur. : E
LS
aux
moniteurs de lerreur en champ libre. : E
LS
aux capteurs de lerreur en champ libre. :
[q
opt
[.
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Frq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
3
|
q
o
p
t
|
Figure 6.40 E
LS
par minimisation rgularise
de lerreur pour le cas (b) avec une
conguration de sources circulaire avec une
surface rigide forme par le plan x
1
x
3
(voir
la nomenclature la gure 6.39 (p. 135)).
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Freq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
3
|
q
o
p
t
|
Figure 6.41 E
LS
par AWFS pour le cas (b) avec une conguration de sources circulaire et avec
1
x
3
(voir la nomenclature la gure 6.39 (p. 135)).
135
Figure 6.42 Pression acoustique reproduite
220 Hz (en haut : partie relle ; en bas : partie
imaginaire) par WFS pour le cas (b) avec une
conguration de sources circulaire et avec une
1
x
3
.
Figure 6.43 Pression acoustique reproduite
220 Hz (en haut : partie relle ; en bas : partie
imaginaire) par AWFS pour le cas (b) avec une
conguration de sources circulaire et avec une
1
x
3
.
6.7 Discussion et conguration choisie
La conguration des capteurs de lerreur privilgie pour le reste du dveloppement prsent
dans cette thse correspond la conguration (b) faite de quatre capteurs centrs. En pratique,
il sera possible de varier, au besoin, la distance de sparation des capteurs.
Pour ce qui est de la conguration des sources de reproduction, on favorise une antenne cir-
culaire plutt quune antenne en U. Mme si lantenne en U serait plus facile construire,
136
0 50 100 150
5
0
5
10
15
20
25
x 10
5
q
o
p
t
0 50 100 150
5
0
5
10
15
20
25
x 10
5
chantillons
q
o
p
t
Figure 6.44 RI des sources pour la reproduction avec une surface rigide forme par le plan
x
1
x
3
. En haut, reproduction par minimisation rgularise de lerreur de reproduction. En
bas, reproduction par AWFS.
on favorise une structure portante modulaire (faite de produits commerciaux) de telle sorte que
le positionnement des sources de reproduction en cercle reste simple. Encore une fois, la dis-
tance de sparation des sources pourra tre change au besoin. On note aussi, plus spcialement
la lueur des considrations prsentes dans le chapitre suivant, que la conguration de sources
de reproduction en cercle introduit limmense avantage dtablir un lien plus clair avec la WFS,
lAWFS et lAmbisonie. Le rseau de source circulaire, contrairement lantenne en U, offre
aussi une couverture angulaire complte dans le plan horizontal. Lantenne circulaire est retenue
pour lensemble de ces raisons.
137
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Freq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
3
|
q
o
p
t
|
Figure 6.45 E
LS
par WFS pour le cas (b) avec
une conguration de sources circulaire avec
une surface rigide forme par un plan
horizontal deux mtres au-dessus de x
1
x
2
(voir la nomenclature la g. 6.39 (p. 135)).
0 500 1000 1500
0
0.5
1
1.5
2
E
L
S
Frq. [Hz]
0 500 1000 1500
0
1
2
3
4
x 10
3
|
q
o
p
t
|
Figure 6.46 E
LS
par AWFS pour le cas (b)
avec une conguration de sources circulaire
avec une surface rigide forme par un plan
horizontal deux mtres au-dessus de x
1
x
2
(voir la nomenclature la g. 6.39 (p. 135)).
6.8 Conclusion
En bref, ce chapitre a pos la dnition prliminaire dune fonction cot limage de la
WFS adaptative (Adaptive Wave Field Synthesis ou AWFS) qui reprsente la minimisation
dune erreur de reproduction accompagne de la pnalisation de lcart de la solution optimale
par rapport la solution WFS.
Il fut dmontr, par le biais dexemples, lefcacit de lAWFS rduire lerreur de repro-
duction en comparaison avec la WFS tout en obtenant une solution pas trop loigne selon la
pnalisation de la solution de type WFS.
Par contre, puisque ce chapitre na que pos des observations en relation avec des simula-
tions numriques, il est plus difcile de gnraliser la porte des conclusions et il est impossible
dclairer les mcanismes fondamentaux de lAWFS. Dans la mesure o lAWFS semble par
contre intressante, des recherches sur le comportement fondamental de lAWFS furent entre-
prises. Elles sont prsentes au chapitre suivant dans lequel on trouve aussi des propositions
de ralisations particulirement avantageuses du traitement de signal adaptatif en relation avec
la nature fondamentale de lAWFS aussi prsente au chapitre suivant. Cette comprhension
appronfondie de lAWFS rend cette mme solution technologique dautant plus intressante.
Dautres considrations au sujet de lAWFS sont prsentes dans lannexe A.
138
CHAPITRE 7
WFS ADAPTATIVEAVECCONTRLEINDPENDENTDES
MODES DE RAYONNEMENT
7.1 Rsum franais
Cet article
1
paru en 2006 prsente la dnition de la synthse de champ adaptative (Adap-
tive Wave Field Syntesis, ou AWFS), soit une approche de contrle optimal de lerreur de
reproduction qui combine une pnalisation de lcart de la solution optimale par rapport la
solution boucle ouverte de type WFS. Par le biais de la dcomposition en valeurs singulires
du systme lectroacoustiques sous contrle, les proprits thoriques de lAWFS sont analy-
ses et illustres par des exemples simples en champ libre. Avec une telle dcomposition, et
selon un argument analytique, il fut possible dillustrer la nature de la rdondance dans les de-
gres de libert dun systme gnrique de contrle plusieurs canaux. En travaillant lAWFS
dans un espace transform, il est ainsi possible dannuler ces redondances et de contrler ind-
pedement chacun des modes de rayonnement du systme lectroacoustique. Parmi les aspects
intressants de lAWFS, on note que la solution WFS projete sur la base vectorielle formant le
noyau de la matrice de transfert reprsentant le systme lectroacoustique forme la partie boucle
ouverte, constante et impose, dun systme dAWFS. La partie en boucle ferme de lAWFS
implique aussi une projection des oprateurs de synthse mais sur la base vectorielle forme
par les premiers vecteurs singuliers de la dcomposition en valeurs singulires. Cette partie en
boucle ferme inclut en plus, videmment, une partie adaptative. Avec la dcomposition en va-
leurs singulires, il fut aussi possible de dmontrer le lien quentretient lAWFS avec une autre
technologie de reproduction de champs acoustiques : lAmbisonie. LAWFS proposerait ainsi
non seulement une ralisation hybride de la WFS et du contrle actif, mais une ralisation en
1
P.-A. Gauthier, A. Berry, Adaptive wave eld synthesis with independent radiation mode control for active
sound eld reproduction : Theory, Journal of the Acoustical Society of America, vol. 119, no 5, p. 2721-2737,
2006.
139
boucle ferme de lAmbisonie quelque peu modie. Ainsi, ce lien augmente loriginalit et
la pertinence de lAWFS en relation directe avec la WFS, mais aussi avec lAmbisonie; deux
technologies importantes de reproduction de champs acoustique dans le contexte du problme
intrieur de la reproduction de champs acoustiques.
Cet article traite de laspect physique de lAWFS; ces considrations physiques permettent
le dveloppement de la mthode du traitement de signal adaptatif dvelope dans les deux cha-
pitres subsquents.
7.2 Adaptive wave eld synthesis with independent radiation mode control for active
sound eld reproduction : Theory
Sound eld reproduction nds applications in music or audio reproduction and experimental
acoustics. For audio applications, sound eld reproduction can be used to articially reproduce
the spatial character of natural hearing. The general objective is then to reproduce a sound eld
in a real reproduction environment. Wave eld synthesis (WFS) is a known open-loop techno-
logy which assumes that the reproduction environment is anechoic. For classical WFS, the room
response thus reduces the quality of the physical sound eld reproduction. In this paper, adaptive
wave eld synthesis (AWFS) is analytically investigated as an adaptive sound eld reproduction
system combining WFS and active control with a limited number of reproduction error sensors
to compensate the response of the listening environment. The primary point of this paper is the
denition of AWFS. Therefore, the fundamental behavior of AWFS is illustrated by analytical
considerations and simple free-eld simulation results. As demonstrated, AWFS is fundamen-
tally related to WFS and Ambisonics. The paper introduces independent adaptive control of
sound eld reproduction on the basis of radiation modes, via the singular value decomposition
of the transfer impedance matrix. Possible practical independent control of radiation modes for
AWFS is discussed.
7.3 Introduction
Sound eld reproduction nds applications in music or audio reproduction (multisensory
immersion for teaching, concerts, etc. [Woszczyk et al., 2005]) and experimental acoustics and
psychoacoustics. For audio applications, sound eld reproduction can be used to articially re-
140
produce the spatial character of natural hearing. Such a challenge has always fascinated both
inventors and sound artists [Poulin, 1957; Malham et Myatt, 1995; Davis, 2003; Staff technical
writer, 2005]. The general objective is to reproduce a sound eld in a real reproduction envi-
ronment. [See reference [Staff technical writer, 2005] for a review of spatial and multichannel
audio.]
Wave eld synthesis (WFS) is an open-loop sound eld reproduction technology which as-
sumes that the reproduction environment is anechoic [Berkhout, 1988; Berkhout et al., 1993;
Verheijen, 1998]. For objective sound eld reproduction, classical WFS thus does not perform
well in a real reproduction space [Gauthier et al., 2005c]. Typical physical inaccuracies are cau-
sed by the room resonant response at low frequencies along with reections and reverberation
at higher frequencies. Adaptive wave eld synthesis (AWFS) is investigated as a potential so-
lution for room compensation with a limited number of acoustic sensors. The primary point of
this paper is the theoretical analysis of AWFS. Therefore, the fundamental behavior of AWFS
is illustrated by analytical considerations and simple free-eld simulations. Other research has
been devoted to in-room sound eld reproduction or local sound reproduction using various ap-
proaches often derived from adaptive control [Kirkeby et Nelson, 1993; Nelson, 1994; Asano et
Swanson, 1995; Uto et Hamada, 1995; Kirkeby et al., 1996; Garas, 1999; Ise, 1999; Santilla n,
2001; Corteel et al., 2002; Nelson, 2002; Spors et al., 2003a; Epain et al., 2004; Gauthier et al.,
2005b; Schobben et Aarts, 2005; Spors et al., 2005a; Fuster et al., 2005].
This paper theoretically introduces AWFS which is a combination of optimal control and
open-loop Wave eld synthesis (WFS) designed for active sound eld reproduction. The adap-
tive nature of AWFS comes from the use of reproduction error sensors that observe the system
performance and adapt the input of the reproduction sources. What differentiates AWFS from
classical active control is that the regularization is not included as a quadratic effort-penalty
term in the cost function, but as a quadratic departure penalty from the WFS solution.
Although AWFS can be applied to any source and sensor conguration, numerical results
are presented here for a small, central and compact sensor array that provides WFS compen-
sation without occupying the reproduction space with a large and impractical sensor array. As
discussed in previous reports [Gauthier et al., 2005b], such a reduced sensor array is used as a
practical compromise. However, the use of a limited number of reproduction sensors results in
interesting properties of AWFS.
A compact sensor array is investigated here as a practical alternative to larger or circular
141
sensors arrays that have been previously proposed. They were suggested for applications such
as sound eld recording [Hulsebos et al., 2003; Poletti, 2005], WFS room compensation [Spors
et al., 2003a, 2005a] and active sound eld reproduction [Betlehem et Abhayapala, 2005].
As introduced by references [Spors et al., 2003a, 2005a], one approach to active compensa-
tion in WFS is to work in a transformed domain which can potentially uncouple the problem.
In the present paper, it is shown that AWFS can be achieved in a transformed domain based on
the source modes and pressure modes derived from the Singular Value Decomposition (SVD) of
the source-sensor transfer impedance matrix. SVD has found various applications in acoustics
[Nelson, 2001; Nelson et Kahana, 2001; Nelson, 2002; Williams et al., 2003; Bai et Lin, 2005].
Recently, reference [Bai et Elliott, 2004] used a plant transfer matrix SVD to dene an
uncoupled adaptive system. This was motivated by the need to accelerate the convergence of
standard LMS adaptive multichannel algorithms and the results are illustrated in the context of
binaural sound eld reproduction with cross-talk cancelation. The authors used two comple-
mentary methods : 1) prewhitening of the reference and 2) plant uncoupling via SVD of the
transfer impedance matrix in the frequency domain and time-domain realization of the resulting
uncoupled multichannel system. This proved to accelerate the LMS convergence rate at the cost
of a processing delay.
Section 7.4 of the paper presents the radiation, WFS and AWFS models. Section 7.5 intro-
duces a rst interpretation of the AWFS mechanism. Numerical simulations are introduced in
Sec. 7.6. Section 7.7 expands the theoretical behavior of AWFS on the basis of the SVD of the
transfer impedance matrix including room effects. Section 7.8 specically shows the link bet-
ween AWFS and closed-loop Ambisonics. Practical considerations for independent radiation
mode control are discussed in Sec. 7.9.
7.4 Radiation, WFS and control models for AWFS
Let an active sound eld reproduction system be represented by L monopole reproduction
sources located at x
(l)
1
x
(l)
L
and M sound pressure sensors located at x
(m)
1
x
(m)
M

where x are position vectors expressed in rectangular coordinates (see Fig. 7.1 (p. 144) for an
explanatory sketch). In the frequency domain, the sound pressure eld radiated by the reproduc-
142
tion sources is dened as follows at radial frequency [rad/s]
p
(rep)
() = Z()q(), (7.1)
where p
(rep)
() is a M coefcients column vector comprising the reproduced complex sound
pressures [Pa] at sensor locations, Z() is a M L transfer impedance matrix and q() [m
3
/s]
is the L coefcients reproduction source strength column vector. The frequency dependance
may be omitted. All components in Eq. (7.1) are complex. For practical reasons, it is assumed
that M < L since a convenient system should not introduce a large number of sensors in
the reproduction space. For free-eld radiation, the transfer impedance matrix coefcients are
dened by the free-eld Greens function G(x[x
(l)
l
) [Pierce, 1991; Nelson et Elliot, 1992]
Z
ml
= jG(x
(m)
m
[x
(l)
l
) (7.2)
with
G(x[x
(l)
l
) =
e
jk|xx
(l)
l
|
4[x x
(l)
l
[
, (7.3)
where x [m] is the eld point, x
(l)
l
[m] the l source position, k = /c [rad/m] the wave number
(with sound speed c = 331 m/s) and [kg/m
3
] the air density ( = 1.18 kg/m
3
). The time
convention is e
jt
(p(x, t) = p(x, )e
jt
). Without loss of generality, the following analytical
developments can also be applied to Greens functions dened for semi-innite or nite spaces.
Free-eld Greens functions are used here to illustrate general results of the fundamental AWFS
behavior, through simple simulations. With these simulations, our primary objective is to clarify
and illustrate the theoretical properties of AWFS.
The reproduction goal is dened as a target pressure eld produced by a virtual source
located at x
o
[m]
p
(im)
(x, ) = A()
e
jk|xxo|
[x x
o
[
, (7.4)
where k is the wave number and A() is the virtual source monopole amplitude, which is set
to unity. Such a specic target wave eld is used for simulation purposes. It could be replaced
by any other target eld denition (plane or directive elds for example) and the remaining
analytical developments would still be valid. Indeed, a part of the main points presented in this
paper relies on analytical developments where no assumptions about the nature of p
(im)
(x, )
or G(x[x
(l)
l
) are included. The virtual source position is arbitrary. A virtual source in front
of the source array (i.e. on the same side as the listening space) is often cited as an interesting
practical possibility of sound eld reproduction. In this paper, virtual sources are always located
behind the array (with respect to the listening space).
143
Figure 7.1 Symbol convention for the WFS operators denition. The virtual source is located
in x
o
. The reproduction source l is located in x
(l)
l
. x
(ref)
describes points which belong to the
reference line. x describes any eld point and x
(m)
m
is the m sensor position. L is the
reproduction source line, the virtual source is on the left of the source line and the reproduction
space is on the right of the source line. All sources and sensors are located in the x
1
x
2
plane.
7.4.1 WFS operators
WFS is an open-loop technology for sound eld reproduction which assumes a free-eld re-
production space [Berkhout et al., 1993; Verheijen, 1998]. The WFS operators are dened from
the Kirchhoff-Helmholtz integral theorem. These operators are then used to drive a reproduc-
tion source array according to the virtual source denition and to the reproduction source array
geometry. In free-eld conditions, using these WFS operators along with the source array would
then approximately reproduce the target eld produced by the virtual source. The WFS problem
is usually limited to reproduction in the horizontal plane by means of a nite number of discrete
sources using appropriate simplications of the integral formulation [Verheijen, 1998; Nicol et
Emerit, 1999; Spors et al., 2005a]. A monopole array for WFS would be fed by the normal
virtual sound pressure gradient evaluated along the reproduction source line. This is obtained
using the monopole radiation part of the Kirchhoff-Helmholtz integral with the stationary phase
approximation [Junger et Feit, 1993; Verheijen, 1998]. Both the stationary phase approximation
and the source line discretization introduce reproduction errors. Moreover, usage of a truncated
reproduction array or piecewise linear array in practical WFS implementation causes nite aper-
ture and corner effects which produce reproduction errors [Verheijen, 1998]. The above WFS
reproduction errors are readily observable in free eld but they are masked in rooms by the
144
comparatively large room effects. [This was observed by time- and frequency-domain numeri-
cal simulations in comparison with objective WFS sound eld reproduction measurements in a
real studio [Gauthier et al., 2005c].]
On the one hand, the inherent free-eld assumption of WFS reduces the objective accuracy
of the sound eld reproduction in real situations, thus suggesting the need for a closed-loop
compensation [Spors et al., 2003a; Gauthier et al., 2005b,c]. On the other hand, WFS provides
satisfactory results for sound localization by the human auditory system since the WFS direct
eld approaches the target eld [Gauthier et al., 2005c]. (It is possible to decompose the WFS
reproduced eld as the superposition of a direct eld and a eld which is reverberated by the
room walls and furniture surfaces.) Direct-eld reproduction is critical for accurate subjective
localization [Blauert, 1999]. Therefore, the active compensation introduced by AWFS includes
a departure penalty from the WFS operators, thus motivating the Adaptive WFS terminology.
The WFS operators are dened as follows [Verheijen, 1998] :
Q
WFS
(x
(l)
l
, ) = A()j
_
jk
2
cos
e
jkro
r
o
_
r
(ref)
/(r
(ref)
+r
o
)
l
(7.5)
and
q
WFS
(x
(l)
l
, ) =
4Q
WFS
(x
(l)
l
, )
j
, (7.6)
where A() is the virtual source monopole amplitude, [rad] is the angle between the virtual
source and the normal to the reproduction line at the reproduction source position x
(l)
l
, r
o
=
[[x
o
x
(l)
l
[[
2
is the distance [m] between the virtual source (in x
o
) and the reproduction source
(in x
(l)
l
) and r
(ref)
= [[x
(ref)
x
(l)
l
[[
2
is the distance [m] between the reproduction source and the
reference line along the line r
o
. These geometric parameters are illustrated in Fig. 7.1 (p. 144).
In Eq. (7.5),
l
[m] is the reproduction source separation (
l
= [[x
(l)
l
x
(l)
l+1
[[
2
). Equation (7.5)
expresses the WFS monopole source amplitude Q
WFS
(x
(l)
l
, ) to produce p
(im)
(x, ) while
Eq. (7.6) transforms WFS monopole amplitudes in source strength amplitudes q
WFS
(x
(l)
l
, )
[Pierce, 1991].
The stationary phase approximation in WFS also leads to the denition of a reference line
[Verheijen, 1998] on which the amplitude of the reproduction error should theoretically be zero
in comparison with points outside the reference line, again for free eld. Indeed, the stationary
phase approximation in WFS implies that the reproduced sound eld would be effectively re-
produced only on a line in front of the reproduction source array. For WFS, this line is arbitrarily
chosen and this corresponds to the WFS reference line. This line is shown in Fig. 7.1 (p. 144).
In this paper, the reproduction source line L is dened as a circle, and the reference line is also
145
dened as a circle, centered on the virtual source position x
o
and passing through the source
array center. The choice of a given reference line denition is not relevant to the AWFS fun-
damental idea, but it remains an important choice for the WFS denition (for numerical results
reproducibility) since the reference line inuences the WFS operators of Eq. (7.5).
For WFS, a reproduction source is active if [[ < /2 radian (see Fig. 7.1 (p. 144) for
denition). An active source implies that Q
WFS
(x
(l)
l
, ) ,= 0. Other sources, with [[ /2, are
not active [articially forced to Q
WFS
(x
(l)
l
, ) = 0]. This highlights the fact that WFS solution
implies that only a part of the reproduction source array is active for a given virtual source. A
spatial weighting window is also used to progressively reduce the WFS strength amplitudes.
This is applied to the reproduction sources closer to the end of the active part of the source WFS
array. Such spatial windowing limits the nite aperture effects of the reproduction array. Here,
the spatial weighting window is a rectangular window with half Hanning windows at its ends.
The half Hanning window extends over 0.5 m [Verheijen, 1998].
7.4.2 Denition of AWFS
Using the radiation model of Eqs. (7.1) to (7.3) with the target pressure eld of Eq. (7.4),
AWFS (adaptive wave eld synthesis) is introduced as an optimal control approach with this
cost function
J
AWFS
= e
H
e +(q q
WFS
)
H
(q q
WFS
) (7.7)
which must be minimized with being a real positive scalar. Superscript
H
denotes Hermitian
transposition. Equation (7.7) introduces the reproduction error vector e = p
(im)
p
(rep)
=
p
(im)
Zq, where p
(im)
is the complex column vector of the target sound pressure at the M sensor
locations, dened by Eq. (7.4) with x
(m)
m
replacing x. The rst term in Eq. (7.7) represents the
summation of the quadratic reproduction errors with respect to the target reproduced sound eld,
observed at the sensor locations. The second term in Eq. (7.7) is weighted by the regularization
parameter and it represents a quadratic departure penalty of the solution q with respect to the
xed WFS solution q
WFS
.
J
AWFS
is a quadratic function of q,
J
AWFS
= q
H
_
Z
H
Z +I
q q
H
_
Z
H
p
(im)
+q
WFS
_
p
(im)
H
Z +q
H
WFS
_
q +
_
p
(im)
H
p
(im)
+q
H
WFS
q
WFS
_
, (7.8)
146
where I is the L L identity matrix.
Although the reproduction system of Eq. (7.1) is under-determined (M < L) [Nelson et
Elliot, 1992], the WFS departure penalty term, weighted by , ensures that there will be a
unique minimum of Eq. (7.7). That is, the Hessian matrix ([Z
H
Z + I]) of the quadratic Eq.
(7.8) is positive denite provided that > 0. This optimum source strength vector minimizes
the cost function [Nelson et Elliot, 1992]
q
(opt)
=
_
Z
H
Z +I
1
_
Z
H
p
(im)
+q
WFS
. (7.9)
When the solution reduces to the WFS operators q
WFS
, when 0 the solution is the
optimal control solution that minimizes the reproduction error in a least-mean-square (LMS)
sense. These two situations are the limiting cases of AWFS.
7.5 Interpretation of AWFS
Equations (7.7) and (7.9) lead to insightful observations about the behavior of AWFS. It
rst should be noted that the second term of the cost function (7.7) includes a standard effort
penalty obtained by q
H
q and a projection term 2q
H
WFS
q. The rst term acts like a standard
regularization while the second introduces a contribution of q
WFS
in the solution.
Rewriting Eq. (7.9) and extracting the q
WFS
contribution, one nds
q
(opt)
=
_
Z
H
Z +I
1
_
Z
H
e
WFS
+q
WFS
, (7.10)
where e
WFS
= p
(im)
Zq
WFS
is the reproduction error of WFS at the sensors. This potentially
includes the inherent WFS approximation errors reviewed in Sec. 7.4.1, along with the room
effects.
Equation (7.10) illustrates that the optimal solution q
(opt)
is the superposition of the optimal
correction [Z
H
Z + I]
1
[Z
H
e
WFS
] on the xed WFS solution q
WFS
. The optimal correction
matches a standard optimal solution for active control (including effort penalization), the dif-
ference is that the target is the WFS reproduction error e
WFS
replacing the target wave eld
p
(im)
. Although the WFS contribution q
WFS
activates only a limited set of sources, the optimal
contribution ([Z
H
Z +I]
1
[Z
H
e
WFS
]) will activate all the reproduction sources.
147
Figure 7.2 System conguration in free eld and real part of the target wave eld at 220 Hz.
Dashed lines represent zero-pressure contours of the target pressure eld p
(im)
(x, ). , the
normals to the source line. ,, virtual source in x
o
= [2, 6, 0] meters.
7.6 Simulation results
Simulation results are reported for a relatively small and compact hypothetical error sensor
array prototype. (Such a prototype is currently under development for practical AWFS.) Simu-
lations are performed in free eld to illustrate the fundamental AWFS mechanisms.
The system conguration and the target pressure eld p
(im)
(at 220 Hz) are shown in Fig.
7.2 (p. 148). As illustrated, the system includes 24 sources, 4 error sensors and 32 monitoring
sensors used to quantify the reproduction quality outside the control region dened by the error
sensor locations. The error sensors are separated by 0.175 m along x
1
and x
2
. The source array
has a diameter of 2 m and the source separation is 0.2611 m. The monitoring sensor array has
a diameter of 1 m and the monitoring sensor separation is 0.098 m. All the arrays are centered
around x
1
= x
2
= 2 m. The virtual source is located at x
o
= [2, 6, 0] meters.
Simulation results are globally quantied by E
LS
E
LS
=
e
H
e
p
(im)
H
p
(im)
(7.11)
148
E
LS
is the global residual quadratic reproduction error normalized by the summation of the qua-
dratic target pressures at the error sensor locations. E
LS
= 0 characterizes perfect reproduction
and E
LS
= 1 corresponds to an error as large as the target eld.
E
LS
can also be computed for the M
m
monitoring sensors using the reproduction errors at
the monitoring sensor locations x
(mon)
1
x
(mon)
Mm
. The monitoring sensors are introduced to
monitor the reproduction error outside the error sensor locations.
Results in terms of E
LS
are shown in Figs. 7.3 (p. 150) and 7.4 (p. 150) for the conguration
of Fig. 7.2 (p. 148) and others. Conguration (b) corresponds to Fig. 7.2 (p. 148). Conguration
(a) corresponds to a unique sensor located at the center of the source array (at x
1
= x
2
= 2 m).
Conguration (c) is similar to (b) plus an additional sensor at the center of the source array.
Conguration (d) includes 9 sensors forming two tesseral quadrupoles (/2 radian apart, the
separation distance is the same as in case (b)) plus a centered sensor. In Fig. 7.3 (p. 150), WFS
produces slightly different E
LS
because the error sensor locations change : The WFS reproduced
eld is the same for the four congurations. In each case, the regularization parameter for
AWFS was set to different values to take into account that an increased number of sensors
reduces the importance of the penalization term in J
AWFS
with a xed . Case (a) was simulated
with = 50 while the other values were : (b) = 200, (c) = 250 and (d) = 450. Here, the
values are not optimally chosen (with respect to inverse problem criteria such as the L-curve
[Hansen, 1998; Nelson, 2001]), they were set to an arbitrary value multiplied by the number of
sensors.
As shown in Fig. 7.3 (p. 150), E
LS
at the error sensors is larger with WFS than AWFS.
Also, the reproduction quality at the monitoring sensors with AWFS converges to the WFS
results above approximately 634 Hz (Fig. 7.4 (p. 150)). This frequency corresponds to the WFS
spatial aliasing frequency which is dened in a rst approximation by the source separation
distance [Verheijen, 1998]. WFS requires at least two reproduction sources per wavelength to
avoid spatial aliasing.
Reproduced sound elds at 220 Hz for WFS, AWFS and reproduction error regularized mi-
nimization [ = 50 and q
WFS
= 0 in Eq. (7.9), that is optimal sound eld reproduction without
the WFS a priori solution] are shown in Figs. 7.5 (p. 151), 7.6 (p. 151), and 7.7 (p. 153) for
the conguration (b) shown in Fig. 7.2 (p. 148). = 50 for all these reproduced elds. The
reproduced sound elds approach the target wave eld. On these three gures, the spatial extent
of effective reproduction is also shown. The size of this region varies with frequency. The spatial
149
10
2
10
3
10
6
10
5
10
4
10
3
10
2
10
1
10
0
E
L
S
Freq. [Hz]
WFS (a)
AWFS (a)
WFS (b)
AWFS (b)
WFS (c)
AWFS (c)
WFS (d)
AWFS (d)
634Hz
W
F
S

A
W
F
S

(a) (b) (c) (d)
Figure 7.3 E
LS
at the error sensors for various
approaches (WFS and AWFS) and error sensor
congurations (shown as dot plots).
Conguration (b) corresponds to Fig. 7.2 (p.
148) ; (a) corresponds to a unique sensor
located at the center of the source array ; (c)
corresponds to conguration (b) plus an
additional sensor at the center of the source
array ; (d) includes nine sensors approaching
two tesseral quadrupolelike dispositions (45
degrees apart) plus a centered sensor.
10
2
10
3
10
2
10
1
10
0
E
L
S
Freq. [Hz]
WFS (a), (b), (c) & (d)
AWFS (a)
AWFS (b)
AWFS (c)
AWFS (d)
634Hz
W
F
S

A
W
F
S

(a) (b) (c) (d)
Figure 7.4 E
LS
at the monitoring sensors for
the cases of Fig. 7.3 (p. 150) (the error sensor
congurations are shown as dot plots).
extent of effective reproduction is displayed via contour plots of the local quadratic normalized
error ([p
(im)
(x, ) p
(rep)
(x, )[
2
/[p
(im)
(x, )[
2
). Contours are plotted only for the 0.25, 0.5,
0.75, 1 and 1.5 levels. The 0.5 level is suggested as the acceptable reproduction region limit
for comparison purposes [Kirkeby et Nelson, 1993; Gauthier et al., 2005b]. AWFS introduces
lower reproduction error than WFS in the source array center and the effective reproduction re-
gion is somewhat larger than the WFS effective region. AWFS in Fig. 7.6 (p. 151) also produces
a more extended reproduction area (based on the 0.5 error level) than when simply minimizing
the reproduction error at the error sensors with a control effort penalty (Fig. 7.7 (p. 153)).
One of the benets of AWFS is that it is possible adjust the solution between a pure WFS
realization (using a large penalization parameter) to a simple reproduction error minimization
(with 0). This is shown in Fig. 7.8 (p. 153) on the basis of E
LS
variations as a function of
the penalization term . WFS, AWFS and reproduction error minimization regions are dened
150
Figure 7.5 Reproduced sound eld at 220 Hz
in free eld by WFS (real part on top,
imaginary part on bottom). Dashed lines show
zero-pressure contours of the target pressure
eld. Local normalized quadratic residual error
is represented as continuous line contour plots.
Reproduction sources are replaced by a thick
source line for clarity. ,, virtual source.
Figure 7.6 Reproduced sound eld at 220 Hz
in free eld by AWFS with = 50 (real part
on top, imaginary part on bottom). Dashed
lines show zero-pressure contours of the target
pressure eld. Local normalized quadratic
residual error is represented as continuous line
contour plots. Reproduction sources have been
replaced by a thick source line for clarity. ,,
virtual source.
151
in Fig. 7.8 (p. 153). The E
LS
values for regularization parameter =
2
i
(where
i
are the
transfer impedance matrix singular values) are plotted as circles. WFS corresponds to a large
value of and E
LS
does not signicantly change with in this region. Reproduction error
minimization corresponds to small values of and E
LS
does not signicantly change with in
this region. The AWFS region is dened by the transition region between WFS and reproduction
error minimization. The points for =
2
i
belong to this transition region.
For near-coincident error sensor arrays (relative to the wavelength) such as shown in Fig.
7.2 (p. 148), an under-regularized AWFS ( 0) system can be regarded as a closed-loop
Ambisonics reproduction system (Ambisonics systems are usually implemented as a open-
loop systems, that is without any feedback or compensation), because such sensor arrays can be
used to evaluate the pressure and two perpendicular pressure gradients in the horizontal plane.
This relation between Ambisonics reproduction and AWFS is examined in Sec. 7.8.1.
These simple simulations were used as an exemplary illustration of a simple AWFS behavior
in free eld. The more general underlying AWFS behavior, independent of the reproduction
space, is exposed in the following section.
7.7 AWFS and singular value decomposition of Z
The singular value decomposition of the transfer impedance matrix is [Golub et van Loan,
1996]
Z = U
MM
ML
V
H
LL
, (7.12)
where subscripts indicate matrix dimensions. Uis the matrix whose columns are the left singular
vectors u
i
of Z, V is the matrix whose columns are the right singular vectors v
i
of Z and is
the rectangular matrix of Z real positive singular values
i
=
_
1
0 0
0
2
0 0
.
.
.
0 0
M
0
_
_
ML
, (7.13)
where
i
>
i+1
. The rank r of Z (r M < L) is equal to the number of nonzero singular
values. In Eq. (7.13) it was assumed that r = M for convenience.
152
Figure 7.7 Reproduced sound eld in free
eld at 220 Hz by reproduction error
minimization with = 50 and q
WFS
=
0 (real
part on top, imaginary part on bottom). Dashed
lines show zero-pressure contours of the target
pressure eld. Local normalized quadratic
residual error is represented as continuous line
contour plots. Reproduction sources have been
replaced by a thick source line for clarity. ,,
virtual source.
10
2
10
0
10
2
10
4
10
6
10
8
10
10
0
0.1
0.2
0.3
0.4
0.5
E
L
S
9.2
9.3
9.4
9.5
9.6
x 10
4
|
q
(
o
p
t
)
|
WFS AWFS Error
=
5
0

Error and WFS
departure
minimization
minimization
1 2

3 2
=
2 2
4 2

Figure 7.8 E
LS
at the error sensors (thick line)
and at the monitoring sensors (thin line) and
[q
(opt)
[ =
_
q
(opt)
H
q
(opt)
(dashed line) at 220 Hz
as a function of the regularization parameter .
E
LS
values for =
2
i
are shown as circles.
153
The matrices U and V are unitary matrices (U
H
U = UU
H
= V
H
V = VV
H
= I) since
the left and right singular vectors are orthonormal vectors. SVD has well known properties
[Golub et van Loan, 1996; Hansen, 1998]. Examples of SVD in acoustics are described by refe-
rences [Nelson, 2001; Nelson et Kahana, 2001; Williams et al., 2003; Bai et Elliott, 2004; Bai et
Lin, 2005]. The span of the left singular vectors u
i
constitutes the range of the matrix Z and the
span of the last Lr right singular vectors v
i
is the nullspace of Z(Zv
i
= 0 for i > r and i L)
[Lancaster et Tismenetsky, 1985; Golub et van Loan, 1996]. In order to explicitly relate left and
right singular vectors to physical parameters, right singular vectors v
i
and left singular vectors u
i
will hereafter be respectively identied as source modes and pressure modes. Each source
and pressure modes pair with the corresponding singular value is here dened as a radiation
mode. This AWFS-specic terminology is different from the terminology introduced by re-
ference [Photiadis, 1990] and from the more common denition of a radiation mode being a
source distribution which radiates sound power independently from the other radiation modes.
Equations (7.1) and (7.12) result in this transformed radiation equation
p
(rep)
=
q (7.14)
with the transformed source strengths

q and acoustic pressures

p
p
(im)
= U
H
p
(im)
,

p
(rep)
= U
H
p
(rep)
,

q = V
H
q. (7.15)
Since is a pseudodiagonal rectangular matrix (the elements are nonzero only on the main dia-
gonal), the radiation problem of Eq. (7.14) is a set of independent acoustical radiation between
source modes v
i
and pressure modes u
i
.
7.7.1 Nature of the under-determined set of equations Zq = p
(im)
In Section 7.4.2 we treated the equation Zq = p
(im)
as a quadratic minimization. We nowdis-
cuss the under-determined set of equations Zq = p
(im)
. Since there are more unknown variables
than equations (L > M), the set of equations Zq = p
(im)
can not be solved in this form : there
exists an innite set of source strength values that will produce p
(im)
. Such under-determination
is expressed as the contribution of left singular vectors in the solution
q =
r
i=1
p
(im)
i
i
v
i
+
L
i=r+1
i
v
i
, (7.16)
154
where
i
represents arbitrary coefcients which, with the vector basis of the null space of Z,
dene the under-determined nature of Zq = p
(im)
. Inserting (7.16) in Zq will effectively produce
p
(im)
regardless of
i
. A solution to such an under-determined problem is to cast it in a new
quadratic minimization form which seeks to reduce the departure between the solution q and a
given solution q
o
. If this a priori solution [Hansen, 1998] is simply 0 then the pseudo-inversion
can be applied to solve Zq = p
(im)
[Golub et van Loan, 1996]. If the a priori solution q
o
is not
zero, a more general rule is obtained : the
i
in Eq. (7.16) correspond to the projection of q
o
on
v
i
i
= v
H
i
q
o
i > r and i L (7.17)
and the rst r contributions of v
i
are determined by the rst term in Eq. (7.16). This minimizes
the cost function
J(
i
) =
r
i=1
_
p
(im)
i
/
i
v
H
i
q
o
_
2
+
L
i=r+1
_
i
v
H
i
q
o
_
2
(7.18)
In the next section, we proceed to show how the AWFS solution [expressed by Eq. (7.9)]
corresponds to a modied version of Eqs. (7.16) and (7.17) where q
WFS
replace q
o
.
7.7.2 Independent radiation mode control for AWFS
Taking the AWFS solution of Eq. (7.9) and using the SVD of Z, the AWFS solution can be
expanded over the source modes v
i
, q
(opt)
=
L
i=1
q
i
v
i
, as follows
q
i
=
_
i
(
2
i
+
i
)
p
(im)
i
+

i
(
2
i
+
i
)
v
H
i
q
WFS
i r M,
v
H
i
q
WFS

i
> 0 , i > r and i L,
0
i
= 0, i > r and i L,
(7.19)
where the independent contributions of v
i
in q
(opt)
were individually regularized with
i
. AWFS
thus proceeds to control each radiation mode independently. The AWFS solution of Eq. (7.9)
implicitly assumed an identical regularization parameter for all sources modes,
i
= i. Note
that Eq. (7.19) was slightly modied in comparison to Eq. (7.9) for the particular case
i
= 0 :
Eq. (7.19) is forced to the pseudoinverse denition by the addition of the third case in Eq. (7.19)
[Hansen, 1998]. The reproduction error is expanded
e =
M
i=1
e
i
u
i
(7.20)
155
with
e
i
=

i
( p
(im)
i

i
v
H
i
q
WFS
)
(
2
i
+
i
)
i r. (7.21)
Equation (7.19) shows that even if the multichannel system must generate the L source
inputs in q
(opt)
, the total number of degrees of freedom is in fact r. In the rst case [i r M
in Eq. (7.19)], the q
i
are a combination of reproduction error minimization with q
WFS
projection
on the corresponding source mode v
i
. This combination is weighted by
i
. When
i
= 0, Eq.
(7.19) provides the same solution as Eqs. (7.16) and (7.17) for i r M. In the second case
[i > r and i L in Eq. (7.19)], the corresponding q
i
are solely dened by the projection of
q
WFS
on v
i
if
i
> 0. This shows that even if such source modes produce no sound pressure
at sensor locations, they contribute to the solution in order to better match the WFS sound eld
reproduction outside the control region. These results explain how a part of the WFS operators
is modied by AWFS and how the other xed part is dened by the projection of q
WFS
on the
null space vector basis. Since these observations stem from an analytical development and since
the SVD exist for any complex matrix Z, it is possible to extent this interpretation to a any real
situation.
Equation (7.19) shows the discontinuity in the solution q
(opt)
as 0, specically in the
components q
i
corresponding to the null space of Z. This discontinuity in the solution would not
be observable in the reproduced eld at the error sensors, because the span of these source modes
is the nullspace of the transfer impedance matrix. However, anywhere else such discontinuity
would be observable in the reproduced sound eld.
Equations (7.19) and (7.21) give insights into how each radiation modes are affected by
i
= . Rewriting these equations for i r in terms of transformed WFS reproduction error
( e
i
WFS
= u
H
i
p
(im)
i
v
H
i
q
WFS
= u
H
i
( p
(im)
Zq
WFS
)), one nds
q
i
=

i
(
2
i
+
i
)
e
i
WFS
+v
H
i
q
WFS
i r (7.22)
and
e
i
=

i
(
2
i
+
i
)
e
i
WFS
i r (7.23)
When
i
<<
2
i
, the solution q
i
, for the control of the radiation mode i, is dominated by WFS
reproduction error e
i
WFS
minimization ( q
i
v
H
i
q
WFS
is large and e
i
is small). When
i
>>
2
i
,
the solution q
i
is dominated by WFS departure penalty ( q
i
v
H
i
q
WFS
is small and e
i
is large).
This illustrates that for a regularization parameter as in Eqs. (7.7) and (7.9), the amount of
penalization is different for each radiation mode ; some radiation modes can be over-penalized
156
0 5 10 15 20 25
0.5
0
0.5
A
m
p
.
Source modes
1 2 3 4
1
0
1
1
= 1232.0589

Pressure modes
0 5 10 15 20 25
0.5
0
0.5
A
m
p
.
1 2 3 4
1
0
1
2
= 235.4339
0 5 10 15 20 25
0.5
0
0.5
A
m
p
.
1 2 3 4
1
0
1
3
= 235.4339
0 5 10 15 20 25
0.5
0
0.5
Source number (l)
A
m
p
.
1 2 3 4
1
0
1
Sensor number (m)
4
= 32.6085
Real part
Imaginary part
1
= 1232.0589

2
= 235.4339
3
= 235.4339
4
= 32.6085
Figure 7.9 Source modes v
i
at 220 Hz on the
left-hand side and corresponding pressure
modes u
i
(for
i
,= 0, that is i r = M) on
the right-hand side. Source and sensor numbers
are shown in Fig. 7.2 (p. 148).
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Numro de sources
A
m
p
.
0 5 10 15 20 25
1
0
1
Source number (l)
A
m
p
.
0 5 10 15 20 25
1
0
1
Source number (l)
A
m
p
.
Real
Imaginary
Figure 7.10 The null space source modes v
i
at
220 Hz. Increasing i proceeds from left to right
and from top to bottom.
(
2
i
) and some others under-penalized (
2
i
). This suggests that the behavior of AWFS
with a global penalization (
i
= ) is a complex contribution of the radiation modes. This
denes the AWFS transition band in Fig. 7.8 (p. 153).
7.8 Analysis of simulation results with SVD
The behavior of independent AWFS is illustrated through numerical results shown in Figs.
7.9 (p. 157)-7.14 (p. 161) for free-eld situations. Our goal is to simply exemplify the analytical
results presented in the preceeding section.
Figure 7.9 (p. 157) shows the rst four source and pressure modes for the conguration
of Fig. 7.2 (p. 148) at 220 Hz. There is 24 sources modes and four pressure modes in this
conguration. The last 20 source modes produce no sound pressure at the sensor array. Figure
7.9 (p. 157) shows that the source modes have a single circumferential harmonic component, and
the corresponding pressure modes provide a multipole expansion of the sound eld at the sensor
array. Moreover, one notes that the third source mode has a /4 radian spatial phase difference
157
with the second source mode (a similar trend is observed for the corresponding pressure modes).
The source modes producing the Z null space are shown in Fig. 7.10 (p. 157). The null space
source modes are spatially high-pass ltered impulses. This ltering removes the low-order
source mode components from the spatial impulses.
Figure 7.11 (p. 159) shows the produced sound eld for the rst six source modes v
i
at
220 Hz. The rst source mode produces uniform sound pressure at the sensor array [subgure
(a)]. The next two source modes [subgures (b) and (c)] produce perpendicular pressure gra-
dients. The next source mode [subgure (d)] produces a tesseral quadrupole eld component.
The last two source modes produce no sound pressure at the sensors [subgures (e) and (f)]
since the corresponding source modes belong to the nullspace. These two source modes are
shown on the rst line in Fig. 7.10 (p. 157).
Figure 7.12 (p. 160) shows multipole representations of the pressure modes u
i
at 220 Hz. The
corresponding free-eld directivities are also shown as polar plots. These directivity patterns
were computed with plane wave responses at the sensors weighted by the complex pressure
modes u
H
i
as sensor gains. This gure illustrates that the i = 1 pressure mode corresponds
to sound pressure, the i = 2 pressure mode approximates pressure gradient along x
1
(dipole
sensitivity in the low frequency limit), the i = 3 pressure mode gives a pressure gradient along
x
2
(dipole sensitivity in the low frequency limit) and the i = 4 pressure mode corresponds to
a tesseral quadrupole nite approximation. Since Eq. (7.19) suggests independent control of
the reproduced pressure modes, one can conclude, from the pressure mode shapes of Fig. 7.12
(p. 160), that AWFS [Eqs. (7.7) and (7.9)] effectively operates on the independent control of
pressure, pressure gradients and tesseral quadrupole pressure modes at the sensor array.
Figure 7.13 (p. 161) shows the source strength vectors for WFS and AWFS used to produce
the sound elds in Figs. 7.5 (p. 151) and 7.6 (p. 151) along with the projections of q
WFS
and
q
(opt)
on the source modes v
i
. By comparing the left graphs of Fig. 7.13 (p. 161), it is clear
that WFS activates only a part of the reproduction sources while AWFS signicantly activates
nearly all sources. This illustrates the additive combination of WFS and reproduction error mi-
nimization. As shown in the right graphs of Fig. 7.13 (p. 161), AWFS only changes the rst
r = M source mode contributions q
i
in comparison with WFS, this was shown in Eq. (7.19).
This illustrates that the general AWFS minimization [Eqs. (7.7) and (7.9] effectively gives the
SVD solution of Eq. (7.19). Even if deriving (7.19) from (7.9) is straightforward using SVD,
this numerical example is used to illustrate this equivalence.
158
Figure 7.11 Sound eld radiated by the rst six source modes. Source modes (a)-(d) generate
the range of the transfer impedance matrix. Source modes (e) and (f) belong to the null space of
the transfer impedance matrix. Dashed lines show zero-pressure contours of the pressure elds.
159
Pressure mode 1 Pressure mode 2
Figure 7.12 Multipole representations of the rst M = 4 pressure modes and corresponding
free eld directivity. , sensor position; , positive real part ; , negative real part ; +, positive
imaginary part ; , negative imaginary part. Symbol diameter illustrates the magnitude of the
corresponding value. Dashed lines, free eld directivity.
7.8.1 AWFS and Ambisonics
The next simulations are introduced to draw the link between AWFS, using a compact cen-
tered sensor array as shown in Fig. 7.2 (p. 148), and Ambisonics.
For the rst simulation, the regularization parameter was set to the small value of 110
4
and the WFS solution q
WFS
was set to 0 in Eq. (7.9). A small penalization parameter is one
of the limiting cases of AWFS. This corresponds to the minimization of the reproduction errors
with a small penalty of the control effort. The optimal source strengths q
(opt)
at 220 Hz and
the corresponding projections on the source modes v
i
are shown in Fig. 7.14(a). Figure 7.14(a)
shows that only the rst r = M source modes are active, this is consistent with Eq. (7.19)
when q
WFS
= 0. As explained below, such a type of source distribution is somewhat related to
Ambisonics panning functions.
A short description of Ambisonics is introduced here. A more complete theoretical de-
velopment is included in the appendix. Ambisonics is an open-loop reproduction technology
from the 70s introduced by Gerzon [Rumsey, 2001]. In the most simple case, the target wave
160
0 5 10 15 20 25
2
1
0
1
2
3
4
x 10
4
Source number (l)
q
W
F
S
0 5 10 15 20 25
4
2
0
2
4
x 10
4
Source mode index (i)
q
i
0 5 10 15 20 25
2
0
2
4
x 10
4
Source number (l)
q
(
o
p
t
)
0 5 10 15 20 25
4
2
0
2
4
x 10
4
q
i
Real
Imaginary
WFS WFS
AWFS AWFS (b)
(a)
~

~

Figure 7.13 Left, complex source strengths
for (a) WFS (q
WFS
corresponding to Fig. 7.5
(p. 151)) and (b) AWFS (q
(opt)
corresponding
to Fig. 7.6 (p. 151)). Right, complex source
mode contributions q
i
of (a) WFS and (b)
AWFS solutions obtained from the orthogonal
projection ( q
i
= v
H
i
q
(opt)
or q
i
= v
H
i
q
WFS
) of
the source strengths on the source modes.
0 5 10 15 20 25
2
0
2
4
x 10
4
Source number (l)
q
(
o
p
t
)
0 5 10 15 20 25
4
2
0
2
4
x 10
4
q
i
0 5 10 15 20 25
2
0
2
4
x 10
4
Source number (l)
q
(
o
p
t
)
0 5 10 15 20 25
4
2
0
2
4
x 10
4
q
i
Real
Imaginary
Real
Imaginary
=110
4
q
WFS
=0
=110
4
q
WFS
=0
=110
4
q
WFS
0
=110
4
q
WFS
0
(a)
(b)
~

~

~

~

Figure 7.14 Left, complex source strengths
for optimal control (a) q
(opt)
with = 1 10
4
and q
WFS
=
0, (b) q
(opt)
with = 1 10
4
and q
WFS
,=
0). Right, corresponding source

mode contributions q
i
obtained from the
orthogonal projections ( q
i
= v
H
i
q
(opt)
) of the
source strengths on the source modes.
eld p
(im)
(x, ) is dened as a plane wave in free eld
p
(im)
(R, , ) = A()e
jkRcos()
, (7.24)
where space coordinates are now described in terms of cylindrical coordinates (R, , z), and
is the direction of propagation of the plane wave.
The reproduction system is assumed to be in free eld and the reproduction sources (uni-
formly distributed over 2 radians) produce a set of plane waves at the origin of the coordinate
system
p
(rep)
(R, ) =
L
l=1
A
l
e
jkRcos(
l
)
, (7.25)
where A
l
is the unknown contribution of the plane reproduction wave l whose direction of
propagation is
l
.
161
Using Fouriel-Bessel series for both the target sound pressure eld [Eqs. (7.24) and (7.28)]
and the reproduced eld [Eqs. (7.25) and (7.34)], it is possible to minimize (in an LMS sense)
the reproduction error over each of the coefcient of the Fourier-Bessel series. This gives a
panning function (amplitude A
l
of plane waves reproduction sources as function of and
l
)
A
l
=
A
L
_
1 + 2
N
n=1
cos(n(
l
))
_
(7.26)
This is a circular sinc function of
l
for which the series truncature order N denes the number
and amplitudes of the side lobes.
From this, one gets a panning function as to how (in an a posteriori operation) distribute a
given signal to a circular source array to create, under the free eld and plane wave assump-
tions, the target wave eld. Since the Fourier-Bessel coefcients [see Eq. (7.31)] correspond
to low-order directivity patterns of microphones (rst order Ambisonics, N = 1, gives three
coefcients in the two series : monopole and two perpendicular dipole patterns), it is possible
to consider the limiting case of AWFS with 0 as a closed-loop Ambisonics realization.
The closed-loop appears since AWFS would be implemented with real microphones for re-
production error minimization while Ambisonics is a LMS solution that is implemented as
an open-loop system. This is rst supported by the pressure modes of Fig. 7.12 (p. 160) which
shows that AWFS in this case corresponds to independent reproduction control of pressure, two
perpendicular sound pressure gradients and a tesseral quadrupole approximation of the sound
eld at the error sensors in the low frequency limit. However, this connection between Ambi-
sonics and AWFS using compact sensor array is essentially conceptual. This arises from that
AWFS and Ambisonics use 1) different radiation models (spherical waves and plane waves
for the reproduction system, respectively) and 2) different sensing devices (discrete sensor array
for AWFS and perfectly coincident directive patterns for Ambisonics).
The previous remarks show that AWFS (while letting 0 and forcing the WFS solution
to zero) can be interpreted as a closed-loop Ambisonics realization. In the next example, we
proceed in explaining how the AWFS realization (with q
WFS
,= 0 and for the specic sensor
conguration shown in Fig. (7.2 (p. 148))) is an hybrid solution between WFS and a closed-
loop Ambisonics realization. This corresponds to closed-loop modied Ambisonics. The
modied Ambisonics arises from the superposition of the ltered WFS solution and the low-
order closed-loop Ambisonics solution.
Figure 7.14(b) corresponds to the limiting case of AWFS with a vanishing regularization
parameter = 1 10
4
and q
WFS
corresponding to the WFS solution [Eq. (7.5) and (7.6)].
162
For the rst four source modes contributions ( q
i
with i = 1, 2, 3, 4), the solution with q
WFS
,= 0
is almost identical to the solution with q
WFS
= 0. This was to be expected from Eq. (7.19)
since when 0, q
i
p
(im)
i
/
i
for i r. The higher-order source mode (r < i L)
contributions q
i
are the WFS projections (v
H
i
q
WFS
) on v
i
and are independent of . This appears
when comparing the two graphs on the right-hand side of Fig. 7.14 (p. 161).
The previous results suggested a conceptual connection between AWFS in the conguration
of Fig. 7.2 (p. 148) and Ambisonics. In the next example, the nearly exact correspondence of
AWFS, using Eq. (7.19), and the Ambisonics panning function of Eq. (7.26) will be shown.
For this simulation, the AWFS radiation model is replaced with a reproduction source radiation
model consistent with the Ambisonics formalism (plane waves as reproduction sources). The
sensor array is however kept identical to the one shown in Fig. 7.2 (p. 148). Eq. (7.19) is also
applied in the following conditions : First, the a priori solution q
WFS
is set to 0. Second, the
effort penalization parameter is set to 0. Third, the q
i
components are only computed for
i = 1, 2, 3 (these rst three pressure modes correspond to uniform pressure and two pressure
gradients sensing at the sensor array). This would correspond to rst order Ambisonics using
N = 1 in Eq. (7.26). Fourth, the target wave eld is a plane wave [see Eq. (7.24)] for which the
direction of propagation corresponds to reproduction source number 12, see Fig. 7.2 (p. 148)
for the angular plane source distributions which correspond to the reproduction source angular
positions). The corresponding AWFS and Ambisonics solutions are shown in Fig. 7.15 (p.
164). The AWFS and Ambisonics source distributions are almost identical and correspond to
a raised cosine [see Eq. (7.26) with N = 1]. Despite apparences, the solutions are not exactly
the same. The difference is due to the AWFS sensor array which can only provide a nite
approximation to monopole and dipole sensitive patterns. The AWFS solution of Eq. (7.19)
matches the Ambisonics solution of Eq. (7.42) when the radiation models are consistent.
In summary, when the regularization parameter is large, AWFS simply converges towards
WFS. When is small, the rst (i r) source modes contributions q
i
approach a closed-loop
Ambisonics realization with a small WFS departure penalty, while all the other source modes
(which create the nullspace) contributions are determined by the projection of WFS solution
q
WFS
on the corresponding source modes v
i
. This precisely denes what was described earlier as
closed-loop modied Ambisonics. Briey stated, the limiting cases of AWFS implementation
produce (1) the WFS solution or (2) a closed-loop Ambisonics solution superposed to the
spatially ltered WFS solution.
163
0 5 10 15 20 25
0.1
0.05
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
Source number (l)
P
l
a
n
e

w
a
v
e

a
m
p
.

(
A
l
)
First order Ambisonics
Imaginary part, AWFS
Real part, AWFS
Reproduction source 12
corresponds to the target
plane wave direction.

l
=
1
2
Figure 7.15 Reproduction source amplitudes
for plane wave reproduction with rst order
Ambisonics and truncated modied AWFS.
0 5 10 15 20 25
0.5
0
0.5
A
m
p
.
(a) With a rigid plane
0 5 10 15 20 25
0.5
0
0.5
1
= 1151.2298
(b) In room
0 5 10 15 20 25
0.5
0
0.5
A
m
p
.
0 5 10 15 20 25
0.5
0
0.5
2
= 246.1264
0 5 10 15 20 25
0.5
0
0.5
A
m
p
.
0 5 10 15 20 25
0.5
0
0.5
3
= 234.9035
0 5 10 15 20 25
0.5
0
0.5
A
m
p
.
Source number (l)
0 5 10 15 20 25
0.5
0
0.5
4
= 29.5188
Real
Imaginary
1
= 1566.746
2
= 326.5514
3
= 275.8447
4
= 37.8151
Source number (l)
Figure 7.16 First four source modes and
singular values. (a) with a rigid plane in
x
2
x
3
. (b) in a room of 6.05 5.2 2m with
a reverberation time of approximately 0.28 s.
7.8.2 Including reections and room effects
The preceeding paragraphs showed the fundamental theoretical mechanisms of AWFS on
the basis of analytical developments and illustrative simulation results in free eld. However,
AWFS has the potential to compensate for the effects of the listening space. Although this paper
does not primarily address AWFS in room situation, some details are introduced to extend the
signicance of the preceeding sections. In room, the compensation is more signicant since the
free-eld assumptions of WFS are no longer respected and the accuracy of the reproduction by
WFS is reduced [Gauthier et al., 2005b,c].
The main goal of this section is to illustrate that even if both source modes and singular
values are altered by the presence of boundaries, the pressure modes still provide pressure and
pressure gradients estimates at the error sensors. Interestingly, this, with Eq. (7.19) (which is
valid for any Z), extends the relation between AWFS and Ambisonics to sound eld repro-
duction in rooms : independent control of pressure, pressure gradients and tesseral quadrupole
pressure modes is achieved by AWFS in the conguration shown in Fig. 7.2 (p. 148) even in
theoretical non-free-eld conditions.
164
Figure 7.16(a) shows the rst four source modes at 220 Hz when a rigid wall replaces the
x
2
x
3
plane. The transfer impedance matrix was computed using the method of images. The
corresponding pressure modes are shown as multipole representations in Fig. 7.17 (p. 166). Even
if the pressure modes of Fig. 7.17 (p. 166) are slightly different to the free-eld source modes
of Fig. 7.12 (p. 160), the pressure modes still give nite difference approximations of pressure,
pressure gradients and tesseral quadrupole as shown in Fig. 7.17 (p. 166). Figure 7.16(b) shows
the rst source modes when the system is located in a room for which the transfer impedance
is based on a modal model including 6137 modes [the model is fully described by reference
[Gauthier et al., 2005b], see also reference [Morse et Ingard, 1968]]. The room is rectangular
and its dimensions are 6.05 5.2 2 m, the room corner is located at x
1
= x
2
= x
3
= 0. The
source and sensor plane is at x
3
= 1.2192 m. The reverberation time is approximately 0.28 s.
The corresponding pressure modes are shown as a multipole representation in Fig. 7.18 (p. 166).
Even though the source modes are distorted in comparison with the free eld or rigid wall si-
tuation, the pressure modes still give nite difference approximations of pressure, perpendicular
pressure gradients and tesseral quadrupole at the sensor array as shown in Fig. 7.18 (p. 166).
By comparing Figs. 7.9 (p. 157) and 7.16(b), one notes that the room singular values are signi-
cantly higher than the free-eld and the semi-innite space singular values. This demonstrates
that for a given source strength vector q, the sound pressures p
(rep)
produced in a closed volume
are larger than in free eld.
According to these examples, independent control of radiation mode as pressure and higher-
order sound pressure eld derivatives is still a valid fundamental interpretation of Eq. (7.19)
in the presence of a wall or a room. This suggests that AWFS based on independent radiation
mode control as shown by Eq. (7.19) is a promising avenue for practical adaptive sound eld
reproduction which should somehow keep a link with Ambisonics and WFS.
7.9 Implementation of AWFS by independent feedforward control of radiation modes
This section describes a possible implementation of AWFS based on adaptive signal pro-
cessing. As noted in Eq. (7.19), each source mode contribution q
i
in q
(opt)
is solely dened by
the corresponding p
(im)
i
,
i
,
i
and v
H
i
q
WFS
. It is possible to exploit this independence of the
radiation modes for practical implementations of AWFS.
In a classical adaptive minimization of Eq. (7.7), a centralized multichannel adaptive algo-
165
Figure 7.17 Multipole representations of the
rst M = 4 pressure modes and corresponding
free eld directivity for the source modes in
Fig. 7.16 (a). , sensor position ; , positive
real part ; , negative real part ; +, positive
imaginary part ; , negative imaginary part.
Symbol diameter illustrates the magnitude of
the corresponding value. Dashed lines, free
eld directivity.
Figure 7.18 Multipole representations of the
rst M = 4 pressure modes and corresponding
free eld directivity for the source modes in
Fig. 7.16 (b). , sensor position ; , positive
real part ; , negative real part ; +, positive
imaginary part ; , negative imaginary part.
Symbol diameter illustrates the magnitude of
the corresponding value. Dashed lines, free
eld directivity.
rithm would be implemented [Elliott, 2001] using a feedforward architecture. This is illustrated
in Fig. 7.19 (p. 167). A set of z-transformed adaptive lters w(z) are adapted to reduce the
quadratic summation of the M reproduction errors e
M
(n). The discrete lters w(z) are fed by a
reference signal x(n) and produce the L command signals y
L
(n) for the L reproduction sources.
Here, Z(z) is the only physical system : All other operations are achieved in a signal processing
domain. This includes

Z(z) which is an identied approximation of Z(z). The target eld de-
nition at the error sensors is obtained by passing the reference signal x(n) through the target
pressure modeler a(z). The WFS solution departure penalty [see Eq. (7.7)] is automatically ta-
ken into account by the LMS adaptation which is based on a discrete time representation of the
AWFS cost function of Eq. (7.7). Using M sensors, this will be a multiple-input-multiple-output
(MIMO) L M system. The computational burden involved in the block diagram of Fig. 7.19
(p. 167) becomes prohibitive as L, M and the adaptive lters order increase [Elliott, 2001; Bai
et Elliott, 2004]. Moreover, this may slow down the gradient LMS algorithm convergence as L
and M increase [Bai et Elliott, 2004].
166
Figure 7.19 Block diagram of a possible
AWFS least-mean-square adaptive digital
processing implementation using FXLMS
multichannel algorithm. Subscripts denote
signal dimensions.
Figure 7.20 Block diagram of a possible
AWFS least-mean-square adaptive digital
processing implementation based on
independent radiation mode control. Subscripts
denote signal dimensions.
Another approach is illustrated as a block diagram in Fig. 7.20 (p. 167). Z(z) is again the
only physical system. With this diagram, we seek to produce a set of M (with M L) in-
dependent SISO (single-input-single-output) adaptive systems

w
i
(z). Here, each independent
adaptive system generates the signal sent to each source mode v
i
for i < r M. This type of
independent control using SVD was investigated by reference [Bai et Elliott, 2004] for cross-
talk cancelation but without any a priori solution like q
WFS
. This independent radiation mode
control of AWFS is also a modication of the principal-component LMS (PC-LMS) for active
noise control of tonal disturbance [Cabell et Fuller, 1999; Elliott, 2000; Cabell et al., 2001].
The PC-LMS is based on SVD, but for AWFS the SVD decoupling must operate over the entire
frequency range of interest [Bai et Elliott, 2004].
This implementation requires additional MIMO (multiple-input-multiple-output) synthesis
and MIMO analysis lters,
(s)
G
(z) and
(a)
G(z) respectively, which must be generated in a
priori identication stage. In this case, an identication of frequency response functions (FRF)
Z
ml
() between each source l and each sensor m must be achieved. The SVD of the correspon-
ding transfer matrix for each frequency provides source modes v
i
() and corresponding pressure
modes u
i
(). The inverse Fourier transform of v
i
()/
i
() i r M and u
i
() generates
the z-transformed discrete-time impulse responses (IR) matrices
(s)
G
(z) and
(a)
G(z), respec-
tively. The
(s)
G
(z) matrix generates the inputs of the individual reproduction sources from the
source mode inputs with a delay of
SV D
samples [Bai et Elliott, 2004]. Note that division by
i
() implies plant whitening along uncoupling. Conversely, the
(a)
G(z) matrix is used to ge-
167
nerate the pressure mode errors from the individual sensor errors, again with a delay of
SV D
samples [Bai et Elliott, 2004]. The second synthesis lter matrix
(s)
G
(z) is created from the

nullspace source modes to produce the xed part of the AWFS solution. The delay block (Fig.
7.20 (p. 167)) of 2
SV D
samples then represents the uncoupled plant model. This type of rea-
lization was more extensively described by reference [Bai et Elliott, 2004] for cross-talk cance-
lation. Also, because of the WFS departure penalty in the AWFS denition, an additional set of
xed lters produce the outputs for the i > r (and i )L WFS xed source mode contributions
q
i
. This a priori solution creates a difference with the work of reference [Bai et Elliott, 2004].
All the preceding remarks should be subject of further investigations and experimental veri-
cations. This is topic of current research on practical AWFS in a real reproduction space, that
is including a reective environment.
7.10 Conclusion and perspectives
This paper introduced AWFS in the physical domain for active sound eld reproduction.
AWFS is based on the minimization of the quadratic reproduction errors with a quadratic de-
parture penalty from the WFS solution. Although the AWFS practical interest would be for
room compensation, this theoretical paper was mainly concerned with the fundamental AWFS
behavior via general analytical considerations and simple free-eld simulations.
AWFS can be interpreted as an additive combination of (1) a xed WFS solution and (2) an
optimal regularized solution which seeks to minimize the WFS reproduction error. Contrary to
WFS, the AWFS active contribution is spread over the entire source array.
SVD of the transfer impedance matrix shown that, for AWFS, independent control operates
on each radiation mode. In the case of a four sensor array, this leads to independent control
of a multipole expansion of the sound eld at the error sensor locations. For a transfer impe-
dance matrix including either a rigid wall reection or room effects, the pressure modes still
provide nite difference approximations of pressure, pressure gradients and tesseral quadrupole
as pressure modes. In real situation, we thus expect that AWFS control will effectively and in-
dependently work on similar pressure modes at the sensor array since the analytical results of
Sec. 7.7.2 apply for any transfer impedance matrix Z.
168
Apractical usefulness of AWFS arises fromthe possibility to move fromWFS to closed-loop
modied Ambisonics. AWFS converges toward (1) WFS when the regularization parameter
is large and (2) closed-loop modied Ambisonics when is low. In the latter case, it was
shown that low order source mode contributions approach an Ambisonics problem and that
higher order source mode (creating the null space) contributions are imposed by the projection
of the WFS solution on the null space basis of Z.
SVD of the transfer impedance matrix suggests an independent radiation mode control im-
plementation of AWFS. This could be achieved with r M independent LMS adaptive al-
gorithms which would independently control the source mode contributions in a real adaptive
control application. Work is in progress to implement AWFS using the currently developed
AWFS adaptive algorithms for a conguration like the one shown in Fig. 7.2 (p. 148). AWFS
performance in-room situation is being therefore investigated from a practical and signal pro-
cessing view point.
Most of the analytical developments for AWFS can be applied to active noise or vibration
control. To the authors knowledge, the use of an a priori solution like q
WFS
have not been
used for active control, this could be of potential interest. Eqs. (7.7) and (7.16) to (7.18) are
also typically encountered in inverse problems theory [Hansen, 1998]. Inverse problems are of
importance in acoustics [Nelson, 2001; Grard et al., 2005], where the use of a priori solutions
could also be applied.
7.11 Acknowledgments
This work was supported by NSERC (Natural Sciences and Engineering Research Coun-
cil of Canada), NATEQ (Fond Qubecois de la Recherche sur la Nature et les Technologies),
VRQ (Valorisation Recherche Qubec) and Universit de Sherbrooke and was conducted wi-
thin CIRMMT (Centre for Interdisciplinary Research in Music Media and Technology, McGill
University). The rst author (P.-A. G.) acknowledges Anthony Grard from Universit de Sher-
brooke for interesting discussions.
169
7.12 APPENDIX : Ambisonics review
The target wave eld p
(im)
(x, ) is dened as a plane wave in free eld
p
(im)
(R, , ) = A()e
jkRcos()
(7.27)
with cylindrical coordinates (R, , z), and is the direction of propagation of the plane wave.
This target plane wave eld is represented by a Fourier-Bessel series
p
(im)
(R, , ) = A()J
0
(kR) + 2A()
n=1
j
n
J
n
(kR) cos(n( )) (7.28)
where J
n
is the Bessel function of the rst kind and order n. Rewriting Eq. (7.28) gives
p
(im)
(R, ) = AJ
0
(kR) + 2A
n=1
j
n
J
n
(kR) cos(n) cos(n)+
2A
n=1
j
n
J
n
(kR) sin(n) sin(n). (7.29)
In practice, this series is truncated and expressed in vector form
p
(im)
(R, ) = Ac
T
h (7.30)
with
c
T
=
2
_
1/
2 cos() sin() . . . cos(n) sin(n) . . .

_
(7.31)
and
h
T
=
2
_
J
0
(kR)/
2 j cos()J
1
(kR) j sin()J
1
(kR) . . .
j
n
cos(n)J
n
(kR) j
n
sin(n)J
n
(kR) . . .
_
, (7.32)
where T denotes real transposition. Equation (7.32) is independent of the target wave eld de-
nition while Eq. (7.31) includes the target wave eld direction . The Fourier-Bessel coefcients
c are proportional to the outputs produced by harmonic directivity patterns on which the plane
target eld would impinge [see Eq. (7.31)]. In c, the rst coefcient produces omnidirectional
sensing, the second and the third produce perpendicular dipole patterns and this continues with
higher order circumferential harmonics.
170
The reproduction system is assumed to be in free eld and the reproduction sources (uni-
formly distributed over 2 radians) produce a set of plane waves at the origin of the coordinate
system
p
(rep)
(R, ) =
L
l=1
A
l
e
jkRcos(
l
)
, (7.33)
where A
l
is the unknown contribution of the plane reproduction wave l whose direction of
propagation is
l
. The reproduced eld is also expressed as truncated Fourier-Bessel series
p
(rep)
(R, ) =
L
l=1
A
l
c
T
l
h =

A
T
C
T
h (7.34)
with
A
T
= [A
1
. . . A
L
] , (7.35)
C = [c
1
. . . c
L
] (7.36)
c
l
=
2
_
1/
2 cos(
l
) sin(
l
) . . . cos(n
l
) sin(n
l
) . . .
_
T
, (7.37)
The nal step is the minimization of the sum of the quadratic reproduction error [(Ac
T
A
T
C
T
)
h[
2
, that is : the reproduced wave eld Fourier-Bessel coefcients

A
T
C
T
must approach,
in a least-mean-square (LMS) sense, the target wave eld Fourier-Bessel coefcients Ac
T
. The
minimization problem can readily be solved using the generalized pseudoinverse [Golub et van
Loan, 1996] denoted by

A = AC
c (7.38)
with
C
= V
c
+
c
U
H
c
, (7.39)
where the SVD of the matrix C is U
c
c
V
H
c
and
_
+
c
T
=
_
_
1/
1c
0 0
0 1/
2c
0 0
.
.
.
0 0 1/
Nc
0
_
_
NL
, (7.40)
where it was assumed that N L.
1c
, . . . ,
Nc
are the singular values of C. When all the Am-
bisonics reproduction sources are uniformly distributed over 2 radians, Eq. (7.38) becomes
A = A
C
T
L
c (7.41)
171
and this gives the following panning function (amplitude A
l
of plane waves reproduction sources
as function of and
l
)
A
l
=
A
L
_
1 + 2
N
n=1
cos(n(
l
))
_
. (7.42)
This corresponds to circular sinc function of
l
.
172
CHAPITRE 8
TRAITEMENT DE SIGNAL NUMRIQUE POUR LA WFS
ADAPTATIVE
8.1 Rsum franais
Ce chapitre correspond un manuscrit sur le traitement de signal numrique pour lAWFS.
Les notions introduites sont en fait lies aux ralisations large bande des concepts dAWFS
introduits aux deux prcdents chapitres. Ce manuscrit sera prochainement soumis au Journal
of the Acoustical Society of America.
Une premire partie dintroduction du chapitre expose les notions de WFS, dAWFS et de
reproduction de champs acoustiques dans la perspective des sujets ensuite prsents. Les al-
gorithmes large bande pour la ralisation de lAWFS sont par la suite dnis sur une base
analytique. Parmi ces algorithmes, on retrouve celui de la rfrence ltre LMS (ltered refe-
rence LMS, ou FXLMS) et celui bas sur la dcomposition en valeurs singulires du systme
lectroacoustique. un tel algorithme correspond lAWFS base sur le contrle indpendant
des modes de rayonnement. Sont aussi passes en revue les proprits de convergence de ces
algorithmes : la pnalisation de la solution adaptative par rapport la solution WFS introduit
une stabilisation des algorithmes de la mme faon que les versions leaky du FXLMS et du
FELMS stabilisent les versions classiques de ces deux mmes algorithmes. Lintensit de cette
pnalisation dicte la valeur rsiduelle des erreurs de reproduction et permet, du coup, de passer
dune solution purement de type WFS une solution de type minimisation maximale de lerreur
de reproduction, au choix et au besoin. Cette exibilit intrinsque lAWFS est une de ses qua-
lits remarquables. Une des plus importantes originalits contenue dans ce chapitre concerne le
dcouplage du systme lectroacoustique laide de sa dcomposition en valeurs singulires.
Des aspects prcis et propres un tel dcouplage sont dtailles et illustrs.
173
Suivant les dnitions des algorithmes, deux exemples de ralisation du traitement de signal
pour lAWFS sont voqus pour supporter les arguments analytiques. Dj dcrit au chapitre
7, le premier exemple correspond au systme 24 sources de reproduction dans des conditions
de champ libre. Ce cas est expos an dillustrer la bonne marche des algorithmes labri des
effets dun lieu de reproduction. Par contre, dans la mesure o lAWFS est une technique po-
tentielle de reproduction de champs acoustiques et, surtout, de compensation active de salle,
le second exemple est introduit : il comporte trois parois rigides qui produisent des rexions
franches. Dans les deux cas, il est montr que les algorithmes fonctionnent : lerreur de repro-
duction est rduite au niveau des capteurs de lerreur. De faon bien plus prometteuse, lAWFS
semble efcace dans le second cas : les rexions franches sont effectivement compenses par
le systme. Lalgorithme bas sur le contrle indpendant des modes de rayonnement dmontre
plusieurs avantages dont la possibilit de contrler les proprits de convergence (coefcient de
convergence et paramtre de pnalisation) de chacun des modes de rayonnement du systme.
Lensemble des notions et des rsultats pos dans ce chapitre conrme donc lefcacit pro-
bable de lAWFS pour lamlioration de la reproduction de champs acoustiques laide du
ltrage adaptatif et la prsence de capteurs de lerreur de reproduction dans la zone de repro-
duction.
Des rsultats de simulations complmentaires ceux prsents dans ce chapitre sont dcrits
en annexe (section B.2, page 365 et suivantes). Ils ajoutes une distinction plus marque entre
lalgorithme FXLMS et celui du contrle indpendant des modes de rayonnement pour lAWFS.
8.2 Adaptive wave eld synthesis and independent radiation mode control for
broadband active sound eld reproduction : Signal processing
Sound eld reproduction is a physical approach to the reproduction of the natural spatial
character of hearing. It is also useful in experimental acoustics and psychoacoustics. Wave
eld synthesis (WFS) is a known open-loop technology which assumes that the reproduction
environment is anechoic. A real reective reproduction space thus reduces the objective accu-
racy of WFS. Recently, adaptive wave eld synthesis (AWFS) was suggested as a combination
of WFS and active compensation. AWFS is based on the minimization of reproduction errors
with a departure penalty from the WFS solution. This paper focuses on signal processing for
AWFS. Classical adaptive algorithms are modied for AWFS : ltered-reference least-mean-
174
square (FXLMS). These modied algorithms give similar convergence properties than classical
equivalent leaky algorithms except that the WFS solution inuences in the adaptation. The paper
also introduces signal processing for independent radiation mode control of AWFS on the basis
of the plant decoupling. Simulation results for AWFS are introduced for free-eld and reec-
tive spaces. The two algorithms effectively reproduce the sound eld and compensate for the
reproduction errors at the error sensors. As an advantage over the other algorithms, independent
radiation mode control allows a more exible tuning of the algorithm.
8.3 Introduction
Following the constantly evolving digital signal processing and the relatively recent advent
of multichannel audio, spatial audio has gained more attention in the past decades from resear-
chers and practitioners for applications such as high-delity sound reproduction, music repro-
duction, virtual reality display, interactive multisensory environments, auralization and sound
installations [Kleiner et al., 1993; Scheirer, 1999; Camurri et Ferrentino, 1999; Jot, 1999; Wil-
son, 2003; Staff technical writer, 2005; Woszczyk et al., 2005]. The interest for immersion and
convincing multisensory environments is not new [Grau, 2003] and various techniques for spa-
tial audio have been introduced in the past [Poulin, 1957; Kleiner et al., 1993; Kendall, 1995a;
Verheijen, 1998; Poletti, 2000; Rumsey, 2001; Davis, 2003].
Two classes of approaches characterize spatial audio technologies : the perception simu-
lation and the sound eld simulation. The former method includes : traditional stereophonic
techniques (level-difference and time-difference stereophony [Blauert, 1999]) extended to mul-
tichannel systems, along with binaural technologies. The perception simulation approach, by
denition, directly adresses the perception and it is typically based on illusion [Snow, 1953].
Such illusions are usually created on the basis of knowledge from spatial hearing (which then
guides various types of practical stereophonic realization) or on the articial imitation of the ex-
ternal ear ltering on incident sound (giving the class of binaural technologies) [Blauert, 1999].
The method of sound eld simulation attempts to reproduce the physical stimulus (wave eld),
thereby reducing any perceptual considerations in the technology denition. Sound eld repro-
duction was investigated by researchers in the past decades [Camras, 1968; Berkhout et al.,
1993; Nelson et al., 1997; Verheijen, 1998; Start et al., 1999; Nicol et Emerit, 1999; Poletti,
2000; Nelson, 2002; Choi et Kim, 2004b; Epain et al., 2004; Takane et Sone, 2004; Keller
et al., 2006] and one of the most active and recent related matter is room compensation [Spors
175
et al., 2003a; Gauthier et al., 2005b; Betlehem et Abhayapala, 2005; Spors et al., 2005a; Fuster
et al., 2005; Gauthier et Berry, 2006], which is essential for sound eld reproduction in a real
reproduction space.
This paper deals with the problem of sound pressure eld reproduction using adaptive di-
gital signal processing applied to adaptive wave eld synthesis (AWFS) initially introduced by
[Gauthier et al., 2005c]. As recently pointed by the authors [Gauthier et Berry, 2006], inde-
pendent radiation mode control can be achieved by AWFS. The paper focuses on digital signal
processing realization for AWFS, including such independent control of radiation modes.
The concepts and results shown in this paper are not limited to audio applications. Indeed,
sound eld reproduction may also be applied to experimental acoustics [Veit et Sander, 1987;
Bravo et Elliott, 2004] or psychoacoustics [Epain et al., 2004; Keller et al., 2006]. These are
promising applications of sound eld reproduction.
Within this introductory section, the general problem of sound pressure eld reproduc-
tion and a review of corresponding technologies are presented. Section 8.4.1 introduces WFS.
Section 8.4.2 presents the FXLMS realization of AWFS. Section 8.4.3 poses the modied-
multichannel AWFS on the basis of independent radiation mode control including the plant
singular value decomposition (SVD) [Gauthier et al., 2005c; Gauthier et Berry, 2006]. Digi-
tal signal processing simulation results are reported in Sec. 8.5 for AWFS using the proposed
algorithms. Section 8.6 discusses the results.
8.3.1 Sound eld reproduction
In sound eld simulation, the main objective can be generally stated as the aim to recreate a
given physical quantity, such as sound pressure, sound intensity [Choi et Kim, 2004b; Merimaa
et Pulkki, 2005], spatial diffuseness [Merimaa et Pulkki, 2005], etc., over a certain space. This
can be achieved with a reproduction system including electroacoustical sources and receivers,
signal processing, and the desired physical output description. In several cases, usage of adap-
tive ltering implies the minimization of a cost function which is representative of the repro-
duction objective [Gauthier et al., 2005b; Gauthier et Berry, 2006]. Adaptive signal processing
for spatial sound reproduction has been considered in various forms by researchers (illustrative
examples are : [Asano et Swanson, 1995; Ise, 1999; Takane et al., 1999; Radlovi c et al., 2000;
Santilla n, 2001; Tam et Rafaely, 2002; Epain et al., 2004; Choi et Kim, 2004b; Gauthier et al.,
176
2005b,c; Spors et al., 2005a; Gauthier et Berry, 2006]).
8.3.2 Multichannel lters for adaptive sound reproduction
It is possible to dene two classes of multichannel sound reproduction systems based on
reproduction error minimization (in the least-mean-square sense) : the generalized cross-talk
cancelation [Tokuno et al., 1997; Kirkeby et al., 1998] and the generalized sound pressure eld
reproduction. Such a minimization can be achieved by direct inversion or by adaptive signal pro-
cessing using the least-mean-square (LMS) algorithms [Elliott, 2001]. Although providing only
approximate inverse lters, LMS and the corresponding adaptive methods have the advantage
of allowing for in-situ adaptive lter design using error receivers [Nelson et Elliot, 1992].
Fig. 8.1 (p. 178) introduces an adaptive realization of generalized cross-talk cancelation for
M reproduction points. In this case, the problem is to reproduce (by ltering the references
d
M
(n)) a set of signals (the desired signals

d
M
(n ), which are also the -sample delayed
reference signals ; is the modeling delay) at a set of M positions in the reproduction space
using L reproduction sources. Fig. 8.2 (p. 178) presents the generalized sound eld reproduc-
tion system. On both gures, w(z) is the control lter vector (or matrix W(z)) and G(z) the
acoustical plant responses (between reproduction sources and error sensors). Here, x(n) is the
reference signal that is used to dene a given simple source eld dened in space and time do-
mains through the target vector a(z) and

d
M
(n) (
d
M
(z) =a(z)z
x(z)) is the target wave eld

at the M error sensors. Passage from Fig. 8.1 (p. 178) to Fig. 8.2 (p. 178) is rather straightfor-
ward [Kirkeby et al., 1998]. Hence, if one is able to solve the generalized cross-talk cancelation
problem (Fig. 8.1 (p. 178)), the solution of the sound eld reproduction problem (Fig. 8.2 (p.
178)) follows for any target vector a(z). For the remaining developments, the focus is on the
generalized sound eld reproduction as shown in Fig. 8.2 (p. 178).
8.3.3 Wave Field Synthesis (WFS)
Work on WFS originates from the theoretical investigations by Berkhout in the late 80s
and in the early 90s [Berkhout et al., 1993; Verheijen, 1998; Start et al., 1999; Gauthier et al.,
2005b]. A major assumption is that the reproduction space is a free eld. From the Kirchhoff-
Helmholtz integral theorem, WFS operators are dened to link a given simple virtual source
177
Figure 8.1 Generalized cross-talk system using adaptive ltering. Capitalized subscripts
denote signal dimensions.
Figure 8.2 Generalized sound eld reproduction using adaptive ltering. Capitalized
subscripts denote signal dimensions.
(typically creating spherical or plane waves), fed by a monophonic signal, to a loudspeaker
array which reproduces the virtual sources acoustic eld (also called the target sound eld).
The problem is usually concerned with reproduction in the horizontal plane with a nite num-
ber of discrete sources using appropriate simplications of the integral formulation [Verheijen,
1998]. It is claimed that plane and spherical waves can approximately be reproduced using the
WFS concept in a planar listening area enclosed by the loudspeaker array. WFS studies have
investigated spatial aliasing [de Vries et al., 1994a; Spors et Rabenstein, 2006; Corteel, 2006b],
reproduction source type (electrodynamic, electrostatic, panels), source directivity [Verheijen,
1998], objective performance in-room situation [Klehs et Sporer, 2003; Sporer et Klehs, 2004]
1
,
compensation of listening room acoustics [Spors et al., 2003a, 2005a; Fuster et al., 2005].
On one hand, the benet of current WFS prototypes is their effectiveness to create a spatial
impression (in terms of localization) over a broad area surrounded by the loudspeakers. On the
other hand, WFS drawbacks are related to the synthesis operators which relie on an important
assumption : the reproduction rooms response is not considered in the process, except in speci-
c WFS research [Spors et al., 2003a, 2005a]. The typical WFS systemis consequently based on
1
Un article par P.-A. Gauthier et A. Berry correspondant au contenu du chapitre 4 est actuellement en traitement
pour publication chez Acta Acustica united with Acustica.
178
an open-loop architecture and active room compensation (ARC) for WFS is an active research
topic for objective sound eld reproduction in real situations [Elliott et Nelson, 1989; Asano
et Swanson, 1995; Bouchard et Quednau, 2000; Santilla n, 2001; Spors et al., 2003a; Gauthier
et al., 2005b,c; Spors et al., 2005a; Fuster et al., 2005].
8.3.4 Adaptive wave eld synthesis (AWFS)
In a recent paper [Gauthier et Berry, 2006], AWFS was dened as a possible practical com-
promise between WFS and active room compensation. AWFS is an adaptive version of WFS
using a reduced number of reproduction error sensors to reduce the computational burden and
system complexity. AWFS is based on a cost function to be minimized by the reproduction
sources. The cost function is a quadratic function of : (1) the reproduction errors and (2) the
adaptive lters departure from the WFS lters. Using a singular value decomposition (SVD)
of the plant matrix (frequency response functions between reproduction sources and error sen-
sors) [Gauthier et Berry, 2006], it was shown that the underlying AWFS mechanism is the
independent control of radiation modes. This suggested a decoupled implementation of AWFS
which is practically developed in this paper from a signal processing perspective.
8.4 Signal processing for adaptive wave eld synthesis
For a target sound eld produced by a virtual monopole with amplitude A [Pa m], a(z) is
dened as the z transform of discrete-time sequences having the frequency response functions
a(e
j
) = A[e
j
1
/r
1
e
j
2
/r
2
e
jm
/r
m
e
j
M
/r
M
]
T
(8.1)
where
m
is the time delay which corresponds to r
m
/c. The time convention is e
jt
, c [m/s]
is the sound phase velocity and r
m
= [x
(m)
m
x
o
[ represents the distance between the virtual
source in x
o
and the m-th error sensor in the reproduction space (Fig. 8.3 (p. 181)), x
(l)
l
is a
reproduction source position vector (x
(l)
1
, x
(l)
2
, ..., x
(l)
L
), x is the position of an arbitrary point in
the reproduced wave eld, and x
(m)
m
is the position of the m-th error sensor.
179
8.4.1 Review of WFS operators for AWFS
According to [Verheijen, 1998], the following general WFS operators are obtained in the
frequency domain
Q(x
(l)
l
, e
j
) =
_
jk
2
Acos()
e
j(kro)
e
j(Ts)
r
o
r
(ref)
(r
(ref)
+r
o
)
(8.2)
and the reproduced sound eld in free space is
p
(rep)
(x, e
j
) =
_

Q(x
(l)
l
, e
j
)H(e
j
)
e
jkr
r
dL (8.3)
where A is the target pressure eld amplitude (virtual source monopole amplitude), Q(x
(l)
l
, e
j
)
is the driving function (expressed as a monopole amplitude) for the reproduction sources along
the line L, k = /c is the wavenumber and e
jkr
/r (with r = [x
(l)
l
x[) is the complex sound
pressure produced at x by a unitary amplitude monopole source in x
(l)
l
(the position of the
reproduction source l). H(e
j
) represents a ctitious reconstruction lter frequency response,
which would typically corresponds to a band-pass lter. The exponent j(T
s
) has also been
articially added in Eq. (8.2) to ensure that both the sound eld reproduction problem in Fig. 8.2
(p. 178) and WFS assume the same modeling delay of samples, T
s
[s] is the sampling period.
It is assumed that the virtual source and the reproduction sources are both in the horizontal plane
(x
1
, x
2
). All other variables in Eq. (8.2) are dened in Fig. 8.3 (p. 181).
Both the reproduction source line L and the reference line could be of arbitrary shape [Start
et al., 1999]. To simplify the computation of r
(ref)
in Fig. 8.3 (p. 181), the reference line is cho-
sen as a circle centered at the virtual source and passing through the center of the reproduction
source array [Verheijen, 1998; Gauthier et Berry, 2006].
Practical WFS implementation using discrete reproduction sources on a nite line replaces
Eq. (9.2) by
p
(rep)
(x, e
j
) =
L
l=1
s
Q(x
(l)
l
, e
j
)H(e
j
)
e
jkr
r
(8.4)
where
s
is the reproduction source separation distance.
For WFS, a reproduction source is active if [[ < 90
o
where is shown in Fig. 8.3 (p.
181). For real applications the reproduction array is nite and some truncation effects appear
[Verheijen, 1998; de Vries et al., 1994a]. In comparison with a linear reproduction source array,
180
in x
o
(l)
l
. x
(ref)
(m)
m
is the m sensor position. L is the
1
x
2
plane.
a circular array reduces the diffraction or corner effects. These effects are also reduced using a
spatial weighting window which reduces the amplitude of the sources at the end of the activated
set. In this paper, half-Hanning window (with an half-length of one meter) is applied to the
amplitude of the driving function (Eq. (8.2)) [Verheijen, 1998; Gauthier et Berry, 2006].
The major drawbacks of WFS (since the free-eld assumptions are not respected) that would
be potentially compensated by AWFS are : roomcompensation, truncation effects correction and
loudspeaker responses correction.
8.4.2 FXLMS for AWFS
Classical FXLMS algorithm [Elliott, 2001] is adapted for the implementation of AWFS in
a discrete-time domain. The structure of the AWFS problem ts the one shown in Fig. 8.2 (p.
178).
The system is characterized by M sensors, L reproduction sources, one reference signal
181
and L FIR control lters each including I coefcients (see Fig. 8.2 (p. 178)). The multichannel
reproduction system can thus be described by (capitalized subscripts denote matrix dimensions)
e(n)
M1
=

d(n)
M1
R(n)
MLI
w(n)
LI1
(8.5)
with
e(n) = [e
1
(n) . . . e
M
(n)]
T
(8.6)
d(n) = [d
1
(n) . . . d
M
(n)]
T
(8.7)
w(n) = [ w
T
0
(n) . . . w
T
I1
(n)]
T
(8.8)
w
i
(n) = [w
1i
(n) . . . w
Li
(n)]
T
(8.9)
R(n) =
_
_
r
T
1
(n) r
T
1
(n 1) . . . r
T
1
(n I + 1)
r
T
2
(n) r
T
2
(n 1) . . . r
T
2
(n I + 1)
.
.
.
.
.
.
.
.
.
r
T
M
(n) r
T
M
(n 1) . . . r
T
M
(n I + 1)
_
_
(8.10)
Where a ltered reference vector was introduced
r
m
(n) = [r
1m
(n) . . . r
Lm
(n)]
T
(8.11)
The ltered reference r
lm
(n) corresponds to the reference signal convolved with the plant im-
pulse response from reproduction source l to error sensor m
r
lm
(n) =
J1
j=0
G
lmj
x(n j) (8.12)
where the J-coefcient plant MIMO (multiple-input-multiple-output) impulse responses are
stocked in G
LMJ
.
The general cost function for multichannel AWFS is
J
AWFS
= E[e
T
(n)e(n)] + w
T
(n) w(n) +( w(n) w
WFS
)
T
( w(n) w
WFS
) (8.13)
where the rst term represents the mathematical expectation (E[]) of the summation of the
quadratic reproduction errors, the second term represents a control effort penalty [Elliott, 2001]
and the third term corresponds to a quadratic penalty term for the coefcients w(n) deviation
from w
WFS
, the time-domain WFS operators. These time-domain WFS operators are obtained
from inverse discrete-time Fourier transform of the WFS operation Q(x
(l)
1
, (e
j
)) dened in Eq.
(8.2). In Eq. (8.13) the WFS operators w
WFS
have been dened similarly to the control lter
coefcient vector in Eq. (8.8).
182
The stochastic gradient, using instantaneous values of the gradient, of Eq. (8.13) is
J
AWFS
w
= 2[R
T
(n)R(n) + ( +)I] w(n) 2R
T
(n)
d(n) 2 w
WFS
. (8.14)
This gives a multichannel recursive algorithm
w(n + 1) = (1 ( +)) w(n) + w
WFS
+
R
T
(n)e(n) (8.15)
which corresponds to a modied version of the multichannel leaky LMS algorithm [Elliott,
2001] where , (1 ( + )), w
WFS
and

R
T
(n)e(n) are respectively the convergence
coefcient ( = 2), the leakage term, the WFS operator coefcient ( w
WFS
) reinjection in the
solution and the adaptive lter update according to the instantaneous errors. WFS departure term
in Eq. (8.13) introduces a leakage term in the lter update Eq. (8.15) plus a bias in the gradient
which is proportional to w
WFS
(2 w
WFS
). In Eq. (8.15), the matrix R
T
(n) has been replaced
by

R
T
(n) which uses a plant model to compute the estimated ltered reference.
As a simple demonstration of the leakage effect, assume that the reproduction errors are
articially forced to zero (e(n) =

0) and = 0. If w(n) ,= w
WFS
, the lter coefcients are
expressed by a variation on the WFS operator : w(n) = w(n) w
WFS
. In this case Eq. (8.15)
leads to w(n+1) = (1 ) w(n) so that w(n) vanishes with increasing n. In Eq. (8.15),
the lter adaptation would be initialized by a set of lter dened by w
WFS
in a preliminary stage
( w(0) = w
WFS
).
Analysis of convergence for FXLMS applied to AWFS is detailed in the remainder of this
section. Using these results, one may evaluate the convergence behavior of the multichannel
AWFS in comparison with standard FXLMS or leaky FXLMS.
Eq. (8.15) is rewritten using the error vector denition of Eq. (8.5)
w(n + 1) = w(n) + w
WFS
+R(n)
d(n)
_
(R
T
(n)R(n) + ( +)I)
w(n) (8.16)
which allows the derivation of the asymptotic lter coefcients w
= lim
n
E[ w(n)]
w
=
E[
R
T
(n)
d(n)] + w
WFS
E[
R
T
(n)R(n)] + ( +)I
(8.17)
where it is assumed that E[ w
] = w
and E[ w
WFS
] = w
WFS
since w
WFS
is constant for a
xed virtual source position. Equation (8.17) illustrates that the reproduction lters after conver-
gence of the adaptation algorithm are partly dened by the WFS operators to an extent determi-
ned by and partly by the more typical leaky LMS error attenuation.
183
An alternative form of Eq. (8.17) is in terms of the adaptive part of the reproduction lter
w
Adaptive
= w
w
WFS
(assuming = 0)
w
Adaptive
=
E[
R
T
(n)e
WFS
(n)]
E[
R
T
(n)R(n)] +I
(8.18)
e
WFS
(n) =

d(n) p
(rep)
WFS
(n) is the WFS instantaneous reproduction error vector and p
(rep)
WFS
(n)
is the sound pressure eld reproduced by WFS. As suggested by this equation, as p
(rep)
WFS
(n) ap-
proaches the target pressure

d(n), the adaptive contribution w
Adaptive
vanishes. Since Eq. (8.18)

formally corresponds to the convergence of standard leaky FXLMS adaptation where the tar-
get signals (disturbance in active noise control and target wave eld in sound eld reproduc-
tion) have been replaced by the WFS errors e
WFS
(n), this suggests that AWFS using modied
FXLMS (see Eq. (8.15)) is an additive combination of WFS operators and adaptive lters which
seek to reduce the WFS errors. Since e
WFS
(n) is practically not accessible, Eq. (8.18) should
only be regarded as an illustation of AWFS mechanism, not a practical implementation.
Using Eq. (8.17), and Eq. (8.15),
E[ w(n + 1) w
] = [I E[
R
T
(n)R(n) + ( +)I]]E[ w(n) w
] (8.19)
The eigenvalue decomposition of the matrix [I E[
R
T
(n)R(n) +( +)I]] is introduced
E[
R
T
(n)R(n) + ( +)I] = QVQ
1
(8.20)
and the transformed lter
v(n + 1) = Q
1
E[ w(n + 1) w
] (8.21)
where V is a diagonal matrix of eigenvalues and Q is the matrix of the eigenvectors. One can
rewrite Eq. (8.19) as a set of uncoupled update equations for the various convergence modes
since V is diagonal
v(n + 1) = [I V]v(n) (8.22)
Each convergence mode will converge provided that 0 < [1 V
i
[ < 1 with V
i
being the i-th
complex eigenvalue of the decomposition introduced in Eq. (8.20). This allows the following
criterion for the convergence factor which would provide stable convergence [Morgan, 1980;
Elliott, 2001]
0 < < 2
'[V
i
]
[V
i
[
2
(8.23)
184
This is a typical result for FXLMS for which convergence properties in relation with plant
responses are known [Elliott, 2001], thus supporting that modied FXLMS for AWFS has the
same convergence properties than classical FXLMS. Finally, the diagonal penalization terms
[( + )I] in Eq. (8.20) have the effect of stabilizing the standard FXLMS by compensating
for potentially small or negative eigenvalues V

i
[Elliott, 2001] where V
i
is the i-th eigenva-
lue of E[
R
T
(n)R(n)]. This effect can be shown by rewriting Eq. (8.23) using the eigenvalue
decomposition of E[
R
T
(n)R(n)]
0 < < 2
'[V
i
] + ( +)
[V
i
+ ( +)[
2
(8.24)
From the last equation, we note that both the control effort penalization and the WFS penali-
zation have the same effect in terms of convergence condition and may both equally stabilize
a system by compensating for small negative eigenvalues V

i
.
For the derivation of a more practical approximation of this convergence criterion, suppose
that the plant model is exact so that

R(n) = R(n) and

R
T
(n)R(n) is symmetric. In this case,
the eigenvalues V
i
are real and Eqs. (8.23) and (8.24) become
0 < < 2/V
i
i and 0 < < 2/(V
i
+ ( +)) i (8.25)
respectively. A more stringent convergence criterion is obtained with the summation of the ei-
genvalues replacing a unique eigenvalue in Eq. (8.25). The summation of the eigenvalues is
the trace of the original matrix, either E[R
T
(n)R(n)] or E[R
T
(n)R(n) + ( + )]. For the
multichannel situation, the trace of this matrix is difcult to evaluate. However, for the hy-
pothetical single-channel situation the matrix E[R
T
(n)R(n)] is the auto-correlation matrix of
the sole ltered reference signal so that one recovers the classical convergence criterion for a
single-channel situation
0 < <
2
(I( r
2
+ ( +)))
(8.26)
where r
2
is the mean-square value of the ltered reference [Elliott, 2001]. This conrms that, in
active sound eld reproduction like in active noise control, it is easier to derive an approximation
of the maximum convergence coefcient in a single-channel situation.
The various effects attributable to the WFS penalization for multichannel FXLMS are
investigated. It is assumed here that = 0. The trivial case is when is also 0 and AWFS
simply becomes a purely adaptive reproduction system without any regularization [Gauthier et
Berry, 2006]. The other extreme AWFS situation is when . Since in this limiting case
the eigenvalue V
i
are assumed to be small in comparison with , the convergence criterion of
185
Eq. (8.24) becomes
0 < _
2
with (8.27)
This means that as the deviation of w from w
WFS
is increasingly more penalized by a large ,
the convergence coefcient must be reduced to provide stable convergence of the adaptation.
With , one nds
w
= w(n) = w
WFS
(8.28)
where the maximum convergence coefcient ( = 2/) has been used in Eq. (8.15) along with
w(0) = w
WFS
.
Although sound eld reproduction using AWFS as dened by the adaptation algorithm of
Eq. (8.15) is readily applicable, some well-known disadvantages of multichannel FXLMS also
apply to AWFS. These are related to the slow FXLMS convergence properties and computatio-
nal load with an increasing number of lter coefcients I and reproduction sources L. Most of
the slow convergence properties of the multichannel FXLMS are related to the cross-coupling
paths and the non-at frequency responses of the electroacoustical multichannel plant between
the sources and the sensors [Elliott, 2001; Bai et Elliott, 2004]. Since a sound eld reproduction
system like a AWFS system implies many reproduction sources, this might limit the application
of FXLMS for AWFS. With this in mind, it would be interesting to transform the multichan-
nel problem in a set of independent single-channel systems. This is possible on the basis of
independent radiation mode control [Gauthier et Berry, 2006] and is related to the principal-
component LMS (PC-LMS) algorithm [Cabell et Fuller, 1999; Elliott, 2000; Bai et Elliott,
2004]. Section 8.4.3 denes the digital signal processing realization of independent radiation
mode control for AWFS [Gauthier et Berry, 2006] to evaluate the potential and feasibility of
such an algorithm.
8.4.3 AWFS with independent radiation mode control using singular value decomposition
This section presents the system preconditioning for independent radiation mode control
using parallel single-channel adaptive systems as already suggested in a previous paper on the
physical aspects of AWFS [Gauthier et Berry, 2006]. The control architecture is shown in Fig.
8.4 (p. 187). Before going in details in the following sections, some general ideas are presented.
Most of the signal nomenclature has already been described. The target wave eld is dened by
d
M
(n) in the upper branch. The independent LMS algorithms operate on the decoupled plant.
The plant G(z) is decoupled using the rst synthesis lter matrix
(s)
G
(z) and the analysis lter

186
Figure 8.4 Block diagram of the AWFS least-mean-square adaptive digital processing
implementation based on independent radiation mode control. Subscripts denotes signal
dimensions.
matrix
(a)
G(z).
Parts of this section follow the plant decoupling described by [Bai et Elliott, 2004]. It is
also related to the principal-component LMS (PC-LMS) [Cabell et Fuller, 1999]. However, this
paper includes new considerations for the null space of the plant response, which has proven to
be of importance for AWFS [Gauthier et Berry, 2006] and for realization and numerical aspects
of singular vectors reordering and modication to reduce the time-domain lter leakage in the
decoupling lters (synthesis and analysis lters). Moreover, the AWFS approach implies the
projection of the WFS operators on the SVD basis. These correspond to differences with Bais
work.
System decoupling and whitening using singular value decomposition (SVD) in the frequency
domain
The MIMOelectroacoustical plant G(z) is represented in the frequency domain by G(e
j
) =
G(z)
z=e
j
where j =
1. Using the SVD, the plant matrix can be expressed as

G(e
j
)
ML
= U(e
j
)
MM
(e
j
)
ML
V
H
(e
j
)
LL
(8.29)
187
with
(e
j
) =
_
1
(e
j
) 0
.
.
.
.
.
.
.
.
. [0]
M(LM)
0
M
(e
j
)
_
_
ML
(8.30)
where U is the column matrix of the left singular vectors, V is the column matrix of the right
singular vectors, (e
j
) is a pseudo-diagonal matrix of the real singular values
i
(e
j
) (ordered
on the main diagonal by decreasing amplitude). V should not be confused with the eigenvector
matrix introduced in Eq. (8.20). In Eq. (8.30), the plant matrix rank r was assumed to be M for
notation convenience and we assume L > M.
The rst radiation mode synthesis lter L M matrix
(s)
G
(e
j
) is dened by
(s)
G
(e
j
)
LM
= V(e
j
)
LL
[
+
(e
j
)]
LM
(8.31)
where the pseudo-inversion []
+
of the pseudo-diagonal matrix is dened as follows
+
(e
j
) =
_
_
1/
1
(e
j
) 0
.
.
.
.
.
.
.
.
. [0]
M(ML)
0 1/
M
(e
j
)
_
_
T
(8.32)
The rst synthesis lters are dened to create the source modes corresponding to the rst r
radiation modes. Each group of L synthesis lters create one of these source modes. Accor-
ding to this denition of the rst synthesis lter matrix, one notes that : (1) the
(s)
G
(e
j
) co-
lumns produces the range of the matrix G(e
j
) by its multiplication with the plant FRF matrix
(Im[G(e
j
)
(s)
G
(e
j
)] = Im[G(e
j
)]) and (2) Im[
(s)
G
(e
j
)] Span[Ker[G(e
j
)]]. (Im[]
denotes the image, or the range, of the given matrix, Span[] indicates the span of the vectors
and Ker[] denotes the null space (the kernel) of the matrix [Lancaster et Tismenetsky, 1985]).
The last point implies that the rst radiation mode synthesis lter matrix
(s)
G
(e
j
) does remove
the null space basis vectors from V(e
j
) by post-multiplication by
+
(e
j
) (with only r = M
non-zero elements) in Eq. (8.31). Alternatively, the 1/
i
can be replaced by 1 on the main diago-
nal of Eq. (8.32) so that the plant is decoupled but not whitened. In this specic case, the same
terminology and notation, for the synthesis lters, is used. For the simulations reported in this
paper, the plant is only decoupled, but not whitened.
An analysis lter matrix
(a)
G(e
j
)
MM
is also dened from the SVD
(a)
G(e
j
)
MM
= U
H
(e
j
)
MM
(8.33)
188
The analysis lter matrix is created to transform the physical sound pressure in the rst r pres-
sure modes. Each of the M groups of analysis lters produces the correspoding pressure mode.
The multiplication of the plant matrix by the rst synthesis lter matrix gives
G(e
j
)
(s)
G
(e
j
) = U(e
j
)(e
j
)V
H
(e
j
)V(e
j
)
+
(e
j
) = U(e
j
) (8.34)
Pre-multiplication of Eq. (8.34) by the analysis lter matrix then gives
(a)
G(e
j
)G(e
j
)
(s)
G
(e
j
) = I(e
j
) (8.35)
where the fact that both matrices V(e
j
) and U(e
j
) are unitary matrices has been used. Equa-
tion (8.35) allows plant decoupling and pre-whitening using synthesis and analysis lters. This
property is of fundamental importance for practical implementation of AWFS based on inde-
pendent radiation mode control [Gauthier et Berry, 2006]. If, as noted earlier, the plant is only
decoupled, one nds :
(a)
G(e
j
)G(e
j
)
(s)
G
(e
j
) =
(e
j
), where
(e
j
) is the rst MM
submatrix of (e
j
).
The previous description corresponds to the plant decoupling and whitening presented by
[Bai et Elliott, 2004] for two-channel cross-talk cancellation. We next proceed in the theoretical
development of the null space of the plant matrix (Ker[G(e
j
)]) which is needed for AWFS
[Gauthier et Berry, 2006].
The theoretical denition of the second radiation mode synthesis lter matrix
(s)
G
(e
j
)
(producing the null space) is
(s)
G
(e
j
)
L1
= V(e
j
)
LL
i
L1
(8.36)
where
i is a block vector dened by
i
L1
=
_
[
0]
1M
[
1]
1(LM)
_
T
. This lter matrix produces all
the radiation modes which belong to the null space of the plant matrix G(e
j
) so that, according
to the null space denition [Lancaster et Tismenetsky, 1985] G(e
j
)
(s)
G
(e
j
) =

0
M1
. Pos-
sible plant decoupling realization including the null space components is shown in Fig. 8.5 (p.
190). In this gure, the physical plant blocks include a black shadow. The signal dimensions (for
vector signals) are marked by lines that cross the given arrows. The dashed arrows and block
(G
(e
j
)) correspond to a real physical system : sound eld at any location except at the error
sensor locations.
In realistic applications, the frequency responses G(e
j
) must be identied and stored in an
estimated model

G(e
j
) before the SVD being applied. Since the model used for plant decou-
pling is not perfect (
G(e
j
) G(e
j
)), the right sides of Eqs. (8.34) and (8.35) should be repla-
189
Figure 8.5 Plant decoupling with rst and second synthesis lter matrices, and with analysis
lter matrix.
ced by

U(e
j
)
I(e
j
) and
I(e
j
), respectively, where
I(e
j
) (an approximation of the identity ma-
trix) represents the fact that decoupling is not perfect. This also applies to G(e
j
)
(s)
G
(e
j
) =
0
M1
where the right side should be replaced by
0(e
j
) which is not a perfect zero vector.
Time-domain lters from SVD in the frequency domain
The procedure to generate time-domain decoupling lters from the frequency response ma-
trices
(s)
G
(e
j
) and
(a)
G(e
j
) has been described by [Bai et Elliott, 2004]. For AWFS, a si-
milar procedure must also be applied to
(s)
G
(e
j
). Here, a short review of the procedure is
rst introduced before being adapted to the problem of sound eld reproduction. Moreover, a
supplementary modication of plant decoupling is introduced as an extension of the Bais work.
An illustrative example is also presented.
The frequency response matrices, that we nowtemporarily denote F(e
j
), are calculated (for
simulations) or measured (for practical implementations) at N frequencies regularly sampled.
This gives F(k) = F(e
j
)
=(2/N)k
(with F(e
j
) = F
(e
j
)). Where k now represents a fre-
quency index. Using inverse discrete-time Fourier transform (DTFT), a corresponding discrete-
time sequence matrix T(n) is obtained : F(k) T(n). A time delay of
SV D
samples is then
added for causality purposes. T(n) is then transformed to produce the lter coefcient matrix
T(z).
Although this procedure is readily applicable to derive the synthesis and analysis lters,
the SVD decoupling being independently computed at each frequency, the complex frequency
response functions may not be straightly taken for inverse DTFT to create time-domain lters
without risk. The limitation comes from the SVD denition that involves a singular value matrix
(e
j
) in which the singular values are ranked in decreasing order of magnitude. Left and right
190
singular vectors are accordingly ranked in the matrices U(e
j
) and V(e
j
). In some ideal cases
(like the free-eld situation considered for the AWFS denition [Gauthier et Berry, 2006]),
some singular values may be coincident over a frequency range so that left and right singular
vector ranking arbitrarly switches between the two singular values since they are equal down
to the numerical resolution. Even if the plant SVD does not include identical singular values
over the frequency range of interest, some singular values may decrease and some others may
increase as function of frequency up to a point where the singular values cross in amplitude. At
this point, the SVD calculation with classical numerical algorithms will introduce a switch in
the radiation mode ordering so that the frequency responses
(s)
G
(e
j
),
(s)
G
(e
j
),
(a)
G(e
j
)
and their components go through abrupt transitions over the frequency range of interest. Such
discontinuities (amplitude and phase) as function of frequency produces longer time responses
when inverse DTFT is applied. Applying a simple smoothing algorithm to the SVD matrices
in the frequency domain (that is radiation mode reordering so that they smoothly change as
function frequency) before taking the inverse DTFT had proven to greatly ameliorate the time
responses of the lters (they are more like ltered impulses with much less temporal leakage
and temporal aliasing).
An example of plant decoupling is presented for the reproduction source and error sensor
arrays shown in Fig. 8.6 (p. 192) for a innite eld.
Note that to increase the robustness of the reordering for the theoretical free-eld case repor-
ted in this paper, an artefact has been introduced for practical SVD decoupling demonstration.
A random variation (normal distribution with zero mean and 1 mm variance) of the source and
sensor positions (in the horizontal plane) proved, along with standard SVD algorithm and smoo-
thing process, to enhance the decoupling results. This was also applied to the second simulation
case reported in Sec. 8.5 Since a practical application using loudspeakers and microphones al-
ways results in various position errors, slightly different directivities and transducer responses,
such random artefact in the theoretical conguration is somewhat more representative of a real
situation than the otherwise geometrically perfect conguration.
An example of plant decoupling based on SVD and smoothing process is introduced in Figs.
8.7 (p. 193) to 8.10 (p. 194) for the conguration shown in Fig. 8.6 (p. 192). The four error sen-
sors are separated by 0.175 m along x
1
and x
2
. The source array has a diameter of 2 m and the
source separation is 0.2611 m. Note that this example does not include plant whitening. In Fig.
8.7 (p. 193), the 24 synthesis lter impulse responses for each source mode (corresponding to
the rst synthesis lters) are shown using 256 points in the time domain with a sampling fre-
191
12
11
13
10
14
9
15
8
16
7
17
x
2
6
18
5
19
4
20
3
21
2
22
1
23
24
x
1
Sources
Error sensors
Monitor sensors
Monitor sensors
Virtual source
Figure 8.6 Conguration of the reproduction source, error sensor and monitor sensor arrays.
Two different groups of monitor sensors are used : a linear array of 8 monitors or a circular
array of 24 monitors. , : virtual source in x
o
= [0, 4, 0] meters.
quency of 1200 Hz (conservative approximation of the minimal spatial aliasing frequency for the
given reproduction source separation distance is 634 Hz, at least two reproduction sources per
wavelength, so that a sampling frequency of 1200 Hz covers the frequency range of interest
2
).
These impulse responses have been delayed by 128 samples (
SV D
= 128). Each of the subplot
represents the L impulse responses of a column of the rst synthesis lter matrix
(s)
G
(z)
LM
to produce y
L
(n) from

y
M
(n). Without the smoothing algorithm before inverse DTFT, the time-
leakage of these lters had proven to be much more important. Fig. 8.8 (p. 193) shows the 4
analysis lters (for each pressure mode) in the time domain using
SV D
= 128 samples delay.
Each of the subplot represents the M impulse responses of a column of the analysis lter matrix
(a)
G(z)
MM
to transform the reproduction errors e
M
(n) into

e
M
(n).
To test the validity of the SVD decoupling using these lters, the plant decoupling of Fig.
8.5 (p. 190) has been simulated in the frequency domain using the synthesis and analysis lters
described above. The 4 impulse responses corresponding to the upper branch of Fig. 8.5 (p.
190), for each source mode being individually excited are shown in the time domain in Figs.
8.9 (p. 194) and 8.10 (p. 194). Theoretically, we should expect
(a)
G(e
j
)G(e
j
)
(s)
G
(e
j
) =
2
Une discussion plus approfondie de cet aspect est actuellement en processus de rvision pour publication chez
Acta Acustica united with Acustica. Cette discussion nest pas incluse dans cette thse.
192
50 100 150 200 250
0.15
0.1
0.05
0
0.05
A
m
p
.
Source mode #1
50 100 150 200 250
0.2
0
0.2
A
m
p
.
Source mode #2
50 100 150 200 250
0.2
0
0.2
A
m
p
.
Source mode #3
1 64 128 192 256
0.2
0
0.2
A
m
p
.
Source mode #4
Samples
Figure 8.7 Free-eld theoretical synthesis
lters in the time domain for the source modes
1 to 4. Each plot includes the 24 synthesis
lters to create the given source mode with the
24 reproduction sources. Each impulse
response includes 256 samples.
1 64 128 192 256
0.4
0.2
0
A
m
p
.
Pressure mode #1
1 64 128 192 256
0.5
0
0.5
A
m
p
.
Pressure mode #2
1 64 128 192 256
0.5
0
0.5
A
m
p
.
Pressure mode #3
1 64 128 192 256
0.5
0
0.5
A
m
p
.
Pressure mode #4
Samples
Figure 8.8 Free-eld theoretical analysis
lters in the time domain for the pressure
modes 1 to 4. Each plot includes the 4 analysis
lters to construct the pressure mode from the
4 pressure sensors. Each impulse response
includes 256 samples.
(e
j
). Note that this test has been performed by frequency domain multiplication so that the
128-samples delays are in fact an arbitrary adjustment to compensate for circular convolution
and ensure gure clarity, as we would normally obtain delays of 2
SV D
= 256 samples (as
suggested by upcoming equations). Clearly, the plant decoupling (whitening was excluded) is
effective since an impulse applied to the rst synthesis lter only gives a non-zero output for the
rst analysis lter. The same behavior applies for the other modes. This proves that broadband
plant decoupling using SVD as described previously is effective.
Although the same procedure is effective for the nullspace lters
(s)
G
(z) (the second syn-

thesis lters dened by Eq. (8.36)), i.e. it produces no sound pressure at the error sensor, the
193
1 64 128 192 256
2
0
2
(1;1)
A
m
p
.
1 64 128 192 256
2
0
2
(1;2)
A
m
p
.
1 64 128 192 256
2
0
2
(1;3)
A
m
p
.
1 64 128 192 256
2
0
2
(1;4)
A
m
p
.
Samples
1 64 128 192 256
2
0
2
(2;1)
1 64 128 192 256
2
0
2
(2;2)
1 64 128 192 256
2
0
2
(2;3)
1 64 128 192 256
2
0
2
(2;4)
Samples
Figure 8.9 Impulse responses of individual
components of the 4 4 matrix
(a)
G(e
j
)G(e
j
)
(s)
G
(e
j
) using the synthesis
and analysis lters shown in Figs. 8.7 (p. 193)
and 8.8 (p. 193). The (i, j) component
represents the output of pressure mode j when
source mode i input is a unitary impulse.
1 64 128 192 256
2
0
2
(3;1)
A
m
p
.
1 64 128 192 256
2
0
2
(3;2)
A
m
p
.
1 64 128 192 256
2
0
2
(3;3)
A
m
p
.
1 64 128 192 256
2
0
2
(3;4)
A
m
p
.
Samples
1 64 128 192 256
2
0
2
(4;1)
1 64 128 192 256
2
0
2
(4;2)
1 64 128 192 256
2
0
2
(4;3)
1 64 128 192 256
2
0
2
(4;4)
Samples
Figure 8.10 Figure 8.9 (p. 194) continued.
nullspace basis produces longer impulse responses so that the WFS operators, once projected
over this basis, are smeared over time and they are no more time-aligned with the projection
of the WFS operators on the rst r source modes. This is simply caused by the fact that the
nullspace basis has not been reordered by a smoothing algorithm over the frequency range. For
the nullspace basis, any smoothing operation is by far more complicated and less effective. The-
refore, an alternative solution was used for practical DSP implementation. The most simple but
effective solution is based on the fact that the WFS operators projected on the nullspace and then
synthesized by the second synthesis lters are time independent. This implies that the second
194
synthesis lters and the projection of the WFS operators on the nullspace can be constructed as
a single set of xed lters.
Projection of the WFS operators on the source modes and synthesis of the nullspace
As shown in the next section, the AWFS algorithm based on SVD decoupling requires the
projection of the WFS operators on the synthesis lters [Gauthier et Berry, 2006]. This is the
purpose of this section.
Once the rst radiation modes are re-ordered, it is possible to write the column-re-ordered
matrix V(e
j
) as a block matrix : V(e
j
)
LL
= [V
(e
j
)
LM
V
(e
j
)
L(LM)
] where V
was used to create the rst synthesis lter according to the method described in the previous
section while V
was used for the second synthesis lters. In a similar manner, (e

j
) is
made of two blocks :
ML
= [
MM
0
M(LM)
]. Therefore, the projection of the WFS
operators on the rst radiation modes is a vector of dimension M dened by

q
WFS
(e
j
) =
(e
j
)V
H
(e
j
)q
WFS
(e
j
). Here, each component of

q
WFS
represents a projection of the WFS
operators on the given source mode multiplied by the corresponding singular value. The multi-
plication by the singular value is needed since the rst synthesis lters are made fromV
(e
j
)
1
(e
j
)
according to the method described in the previous section. If the system is only decoupled, the
projection of the WFS operators becomes

q
WFS
(e
j
) = V
H
(e
j
)q
WFS
(e
j
). Taking the inverse
discrete-time Fourier transform (DTFT) of a component of

q
WFS
gives the impulse response
corresponding to the z transform of

w
WFS
i
for the i-th source mode. This impulse response is
non-causal and an additional delay of
SV D
is added to make it causal. The importance of the
resulting lter (projection of the WFS operators on the rst synthesis lters) will become clear
in the next section.
For the projection of the WFS operators on the nullspace, a different approach is used. Ra-
ther than directly projecting the WFS operators on the nullspace (with V
H
(e
j
)q
WFS
(e
j
)), a
simple approach is to substract the rst radiation mode contributions from the WFS operators so
that q
WFS
null
(e
j
) = [I
LL
V
(e
j
)
LM
V
H
(e
j
)
ML
]q
WFS
(e
j
) where both q
WFS
null
(e
j
)
and q
WFS
(e
j
) are L 1 vectors. The vector q
WFS
null
(e
j
) not only represents the WFS pro-
jection on the nullspace basis, it also corresponds to the projection of the WFS operators on
the nullspace combined with synthesis of the nullspace. Therefore, q
WFS
null
(e
j
) is simply the
part of q
WFS
(e
j
) which belong to the nullspace. This was dened without using the projec-
tion of the WFS operators on the nullspace basis. Since the impulse responses corresponding to
q
WFS
null
(e
j
) are non-causal, an additional delay of
SV D
is included in the impulse responses
195
for the synthesis of the WFS operators projected on the nullspace basis. This proved to be effec-
tive when projecting the WFS operators on the source modes and then reconstructing the WFS
operators from these source modes.
AWFS using SVD
Exploiting the nature of the physical AWFS solution [Gauthier et Berry, 2006] and the plant
decoupling described above, it is possible to dene an alternative controller architecture which
is different to the AWFS-modied FXLMS algorithm presented in Sec. 8.4.2 Several precon-
ditioning methods have been published for feedforward control [Cabell et Fuller, 1999; Cabell
et al., 2001; Elliott, 2001, 2000; Bai et Elliott, 2004]. Preconditioning using plant decoupling
has been treated using principal component LMS (PC-LMS) using SVD for tonal disturbances
[Cabell et Fuller, 1999; Blanger et al., 2006] or, equivalently, SVD controller for tonal distur-
bances [Elliott, 2000]. SVD decoupling has been recently extended for broadband signals using
a decoupling lter formulation in the frequency domain and inverse transformation towards the
time domain for two-channel cross-talk cancelation [Bai et Elliott, 2004].
The AWFS digital signal processing architecture presented here is based on independent
radiation mode control using SVD and is shown in Fig. 8.4 (p. 187). The upper branch includes
the target wave eld denition, that is

d
M
(n) at the reproduction error sensors. The second
branch represents the xed WFS contribution according to the WFS operators projection on the
nullspace. This part is non-adaptive. Note that the corresponding two dashed blocks in this gure
are now combined in a single operation with an additional delay of
SV D
samples. Therefore,
(s)
G
(e
j
) now represents the WFS operators projected on the nullspace basis. The third branch
includes the adaptive independent controller

w
i
, the rst synthesis lter matrix
(s)
G
(z), the
reproduction source signals y
L
(n) and the plant response G(z) to produce the reproduced sound
pressures p
(rep)
M
(n). The bottom branch includes the uncoupled plant model, the independent
LMS gradient algorithms and the analysis lter matrix
(a)
G(z) to transform the reproduction
errors into the SVD basis.
Let us consider the discrete-time formulation of Eq. (8.35). This is now expressed in the
z-transform domain (with the target signals

d
M
(n) being forced to zero)
e(z) =
(a)

G(z)G(z)
(s)

G
(z)
y(z) = z
2
SV D
y(z) (8.37)
so that plant decoupling and whitening are effective (as noted for Eq. (8.35)) except that the SVD
delays have been included : the decoupled-plant output

e(z) (as seen by the LMS algorithms) is
196
the delayed decoupled-plant input

y(z) (as seen by the AWFS LMS algorithms). If the system
is only decoupled, Eq. (8.37) is replaced by
e(z) =
(a)

G(z)G(z)
(s)

G
(z)
y(z) = z
2
SV D
(z)
y(z) (8.38)
For the sake of brevity, the following developments are presented for system uncoupling and
whitening. Minor modications, as noted later, are needed when the system is only decoupled.
Since the control system shown in Fig. 8.4 (p. 187) can be considered as a set of independent
single-channel radiation-mode controllers, for the m-th independent radiation mode controller,
the instantaneous error is
e
m
(n) =

d
m
(n) p
(rep)
m
(n) (8.39)
where

d
m
(n) is the m-th element of

d(n) passing through the analysis lter matrix and p
(rep)
m
(n)
is the m-th element of p
(rep)
(n) passing through the analysis lter matrix. This equation can be
rewritten as follows
e
m
(n) =

d
m
(n)

w
T
m
(n)x(n 2
SV D
) (8.40)
where

w
m
(n) is the J-coefcient vector associated to the control lter for the m-the radiation
mode and the reference signal vector is x(n) = [x(n) x(n 1) x(n I 1)]
T
. In this case
the cost function associated to the reproduction of the m-th radiation mode is expressed as
J
m
= E[ e
2
m
(n)] +
m
[

w
m
(n)

w
WFSm
]
T
[

w
m
(n)

w
WFSm
] (8.41)
where

w
WFSm
is the J-coefcient vector of the WFS operators projected on the m-th rst syn-
thesis lter as dened in the previous paragraphs. The gradient of this cost function is

J
m

w
m
= 2r
x
dm
(2
SV D
) + 2R
xx
(0)

w
m
(n) + 2
m

w
m
(n) 2
m

w
WFSm
(8.42)
with r
x
dm
(t) = E[
d
m
(n + t)x(n)] and R
xx
(t) = E[x(n + t)x
T
(n)]. Using Eq. (8.40), the
instantaneous value of the gradient becomes

J
m

w
m
= 2 e
m
(n + 2
SV D
)x(n) + 2
m

w
m
(n) 2
m

w
WFSm
(8.43)
Asingle-channel LMS algorithmwith a convergence coefcient
m
for the m-th controller gives
w
m
(n + 1) = (1
m
m
)

w
m
(n) +
m
e
m
(n + 2
SV D
)x(n) +
m
m

w
WFSm
(8.44)
The adaptation rule is, however, based on future values of the reproduction error e
m
(n+2
SV D
)
so that a modication of this algorithm is introduced as follows
w
m
(n + 1) = (1
m
m
)

w
m
(n) +
m
e
m
(n)x(n 2
SV D
) +
m
m

w
WFSm
(8.45)
197
where x(n 2
SV D
) represents the ltered reference in the SVD-transformed domain which
includes decoupling and whitening. This last equation can be implemented for each radiation
mode controller for practical applications of AWFS based on plant decoupling. If the plant
whitening is excluded, it is still possible to use the last equation as an adaptation algorithm
since x(n 2
SV D
) would then correspond to a delayed version of the reference signals. In
this case, one nds that this implementation would be related to the DXLMS (delayed-reference
LMS) algorithm [Poltmann, 1995; Ahn et Voltz, 1996; Chen et al., 1998].
As one can note, Eq. (8.45) exactly matches the structure of the single-channel AWFS sys-
tem.
Denoting

w
m
= lim
n
E[

w
m
(n)] and taking the expectation of Eq. (8.45) along with the
requirement that the convergence is achieved when E[

w
m
(n + 1)] = E[

w
m
(n)], one nds
w
m
=
r
x
dm
(2
SV D
) +
m

w
WFSm
R
xx
(0) +
m
I
=
E[
d
m
(n)x(n 2
SV D
)] +
m

w
WFSm
E[x(n 2
SV D
)x
T
(n 2
SV D
)] +
m
I
(8.46)
Assume that an AWFS system with independent radiation mode control is constructed using
the cost function of Eq. (8.41) along with the adaptation rule of Eq. (8.45). If plant decoupling
by SVD is not perfect, the instantaneous errors for the M controllers would be (in matrix form)
e(n) =

d(n)

W
T
(n)x(n 2
SV D
)
J1
j=0
C
j

W
T
(n j)x(n 2
SV D
j) (8.47)
where
C
j
=
_
_
C
11
j
C
1M
j
.
.
.
.
.
.
.
.
.
C
M1
j
C
MM
j
_
_
(8.48)
represents a ctitious effect of the rst M radiation modes on the rst M radiation modes. In
case of perfect plant decoupling C
j
is a diagonal matrix for all j. In Eq. (8.48),

W(n) is the
matrix of the column vector control lters for the rst M source modes
W(n) =
_
w
1
(n)

w
M
(n)
_
IM
(8.49)
Here, index j is used for convolution. Using Eq. (8.47) which gathers all the independent
controllers, the independent radiation mode control algorithm for AWFS would be rewritten
as follows (in replacement of Eq. (8.45))
W(n + 1) = (1 )

W(n) +x(n 2
SV D
)
e
T
(n) +

W
WFS
(8.50)
198
where

W
WFS
is the matrix of the WFS operators projected on the rst synthesis lters. The
structure of this matrix matches that of the control lters described by Eq. (8.49). Note that
for the sake of clarity, it is assumed that all the penalization parameters
m
and convergence
coefcient
m
are equal to a general penalization parameter =
m
and a general convergence
coefcient =
m
. This does not limit the following observations.
After insertion of Eq. (8.47) in the AWFS independent control adaptive algorithm of Eq.
(8.50), one would nd that the control lters converge toward an implicit expression for

W
different from Eq. (8.46)
=
R
x
d
(2
SV D
) +

W
WFS
J1
j=0
(R
xx
(j)

W
C
T
j
)
R
xx
(0) +I
(8.51)
where

W
represents the mathematical expectation of

W(n) when n . This development
includes two assumptions : (1) the cross-coupling C
j
does not change with time (in comparison
with the adaptation time) so that it might be removed from the expectation operation (as for the
lter coefcients

W(n)) and (2) for the convolution with respect to j, the controller coefcients
W are assumed time-invariant (

W(n j)

W(n) as long as the adaptation is slow over J
samples). In any case, for arbitrary C
j
, Eq. (8.51) suggests that as cross-coupling caused by
a imperfect plant decoupling increases, the coefcients C
j
become more important so that the
difference between Eqs. (8.51) and (8.46) increases. Equation (8.51) also highlights the fact that
as plant decoupling using SVD gets less effective (this might be caused by the slowly changing
plant response as function of time), the control lters converge toward the ones described by
Eq. (8.51). This last equation also shows that the independently implemented controllers will
then have mutual inuences : the right-hand side of Eq. (8.51) includes all the M controller
coefcient vectors

W
after convergence so that an explicit expression for

W
does not exist.

The independent controllers are then coupled even if their realization was originally not.
For practical applications, if C
j
becomes too important, a new plant identication and de-
coupling using SVD needs to be performed so that any undesirable or extreme behaviors would
be avoided.
8.5 Simulations results
In order to demonstrate the feasibility of an AWFS system based on the adaptive signal
processing described in this paper, simulations were performed for various acoustical situations.
199
8.5.1 Free eld
The system shown in Fig. 8.6 (p. 192) was simulated using a simple free-eld model : the re-
production sources were represented by monopoles with a sound pressure radiated eld e
jkr
/r
where r [m] is the distance from the source and k the wavenumber. The impulse responses from
the reproduction sources to the error sensors were then computed by IFFT. Since the function
e
jkr
/r generally involves fractional time delays [Laakso et al., 1996], Hanning windows were
applied in the time domain (centered on the main impulsion of the response) to reduce time
aliasing. For the free eld simulations, the circular group of monitor sensors shown in Fig. 8.6
(p. 192) is used.
Results of AWFS signal processing simulations for this case are shown in Figs. 8.7 (p. 193)
to 8.12 (p. 201). Figures 8.7 (p. 193) to 8.10 (p. 194) were already described in Sec. 8.4.3. Most
of the results, shown in Fig. 8.11 (p. 201) are described in terms of the E
LS
criterion which is
dened by
E
LS
(n) = e(n)
T
e(n) (8.52)
and corresponds to the sum of the squared reproduction errors. In Fig. 8.11 (p. 201), E
LS
is also
smoothed with a moving-average lter to enhance the gure readability.
The xed WFS solution is obtained by setting the convergence coefcient = 0 and the
penalization parameter = 0 in Eq. (8.15). Since = 0, the control lters then stick to the
WFS solution which is used as the initial value for the control lters. For the rst FXLMS
case, we used = 0.00004 and = 0 while = 0.00004 and = 10 were used for the
second FXLMS case. For the AWFS algorithm based on independent radiation mode control,
each radiation mode is associated to its own values of the convergence coefcients
1
= 0.0002,
2
=
3
= 0.001,
4
= 0.004 and penalization parameters
1
=
2
=
3
=
4
= 1. In all cases,
the size of the control lters

w
i
was set to 256 and was set to 0 . The adaptation coefcients
were chosen to approach the maximum value for stable convergence. This was evaluated by
simulations. A modeling delay of 16 samples, = 16, was used in these simulations. The SVD
delay was set to 128,
SV D
= 128. The rst and second synthesis lters and the analysis lters
all include 256 coefcients.
Figure 8.11 (p. 201) shows that the different algorithms effectively reduce the reproduc-
tion error in comparison with WFS. It is also possible to conclude on several points : (1) the
criterion E
LS
(n) at the error sensors can be reduced to a plateau level controlled by the pena-
200
0 2 4 6 8 10
10
4
10
3
10
2
10
1
10
0
E
L
S
(
n
)

0 2 4 6 8 10
10
2
10
1
Time [s]
E
L
S
(
n
)

(
m
o
n
i
t
o
r
s
)

WFS
AWFS, FXLMS, =0
AWFS, FXLMS, =10
AWFS, SVD
WFS
AWFS, FXLMS, =0
AWFS, SVD
AWFS, FXLMS, =10
Figure 8.11 Learning curves for the error
sensors and for the monitor sensors using
FXLMS and independent radiation mode
control algorithms in free eld.
1
6
12
18
24 1
64
128
192
256
0.02
0
0.02
Samples
Source no
A
m
p
.
1
6
12
18
24 256
320
384
448
512
0.02
0
0.02
Samples
Source no
A
m
p
.
A
m
p
.
A
m
p
.
Figure 8.12 Examples of the L resulting
control lters for AWFS by FXLMS (top) and
by independent radiation mode control
(bottom) in free eld.
lization parameter and (2) the FXLMS and independent radiation mode control realizations
of AWFS can reduce the residual criterion to a similar value. Although the FXLMS algorithm
can reach a similar residual criterion than AWFS based on independent radiation mode control,
the independent implementation allows for ne tuning of the convergence of each mode, which
is not possible with FXLMS. This is highlighted in Fig. 8.12 (p. 201), which shows the 24
control lters after convergence for the FXLMS and SVD-based algorithms. Note that for the
SVD-based algorithm, these control lters correspond to the multiplication of the adaptive lter
matrix (LM 256, with L = 24 and M = 4) with the rst synthesis lter matrix (M 256)
along with the addition of the nullspace synthesis lters (L 256). This then create the control
signals y
L
(n) as shown in Fig. 8.4 (p. 187).
201
Clearly, both algorithms result in a similar set of control lters. For the SVD-based algo-
rithm, the presence of the higher-order SVD radiation modes is visible from sources 1 to 12
where the spatial variation of the control lters is more pronounced [Gauthier et Berry, 2006].
This is because the independent radiation mode control allows for the faster convergence of
these higher order modes as compared to in the FXLMS algorithm which is based on uniform
values of and . The next simulation example for a semi-innite space provides more insight
of this point. Moreover, a uniform penalization parameter potentially too severely penalizes
the higher order modes so that they tend to be imposed by the corresponding WFS solution. The
higher order modes are of notable importance for the reduction of the reproduction error outside
the error sensor positions since they typically correspond to higher order spatial derivatives at
the error sensor array [Gauthier et Berry, 2006].
8.5.2 Semi-innite space delimited by a rigid oor and two hard walls
To further investigate the effectiveness of the AWFS algorithms for active sound eld repro-
duction, other simulations were performed for the system shown in Fig. 8.6 (p. 192) but here
the acoustical responses included three rigid surfaces (normal pressure gradient equal to zero on
these surfaces). The sources and the sensors are 1.22 m above a rigid oor. Two perpendicular
walls are also included as planes located at x
2
= 2m and x
1
= 6m. This conguration
roughly corresponds to a real laboratory space where an experimental AWFS system was re-
cently assembled and tested.
Although this reproduction space is simpler than a real listening room, it provides enough
departures with respect to the free eld situation to investigate AWFS in a reective reproduction
space and it ensures simple and illustrative results over a wide region of space.
The frequency spectrum of the four singular values of the plant frequency response is shown
in Fig. 8.14 (p. 203) where the FRF from reproduction source l = 1 to the error sensor m = 1 is
superimposed as an illustrative response of the system. Several points stem from this gure : (1)
the singular values are well separated in four continuous lines, but
2

3
, and (2) the dominant
singular value follows the typical FRF as function of frequency. As the plant response is more
complex than for the free-eld situation, it was observed that the radiation mode reordering
algorithm was useless in this situation, this is partly caused by the more pronounced separation
of the singular values as function of frequency. The sign changes modication algorithm (as
described in Sec. 8.4.3) was however needed for the modication of the rst synthesis and
202
x
3
x
1
x
2
Infinite rigid wall (x
1
=6)
Infinite rigid wall (x
2
=2)
Infinite rigid floor (x
3
=0)
Reproduction
source array
Figure 8.13 Circular reproduction source
array in three dimensional semi-innite space.
0 100 200 300 400 500 600
10
1
10
0
10
1
Freq. [Hz]
S
i
n
g
u
l
a
r

v
a
l
u
e
s

4
10
3
10
2
10
1
10
0
10
1
F
R
F

g
a
i
n

(
s
o
u
r
c
e

#
1
,

s
e
n
s
o
r

#
1
)
Figure 8.14 Left : Spectrum of the singular

values (
i
, i = 1...4) for the system with a
rigid oor (at x
3
= 0 [m]) and two hard walls
(at x
2
= 2 [m] and x
3
= 6 [m]). Right :
FRF gain from source #1 to sensor #1.
analysis lters matrices in the frequency domain before inverse DTFT.
Figs 8.15 (p. 204) and 8.16 (p. 204) present the rst synthesis lters
(s)
G
(z) (see Eq. (8.31))

and analysis lters
(a)
G(z) (see Eq. (8.33)) each of which includes 256 coefcients. Clearly,
these lters show a more complex response than those of the free-eld case (see Figs. 8.7 (p.
193) and 8.8 (p. 193)). The synthesis lters of the rst source mode clearly show an in-phase
response from all the reproduction sources, this is in agreement with our previous theoretical
results [Gauthier et Berry, 2006]. Note that, once again, the synthesis and analysis lters only
include plant decoupling, that is : the plant is not whitened in this case. A modelling delay of 16
samples, = 16, was used in these simulations. The SVD delay was set to 128,
SV D
= 128.
Comparaison of WFS and AWFS is reported in Fig. 8.17 (p. 205) in terms of the learning
curves for the various algorithms. For WFS, the following values were used : = 0 and = 0.
For the rst FXLMS case, we used = 0.00004 and = 0 while = 0.00004 and = 10
was used for the second FXLMS case. For the AWFS algorithm based on independent radiation
mode control, the convergence and penalization parameters were adjusted for each individual
radiation mode :
1
= 0.00015,
2
=
3
= 0.0004,
4
= 0.003 and
1
= 1,
2
=
3
=
0.1,
4
= 0.01. As the singular values get smaller for higher order modes, it is possible to
reduce the corresponding penalization parameter so that the convergence of these higher order
modes is not blocked by an excessively large penalization parameter. As it was shown in a
203
50 100 150 200 250
0.1
0.05
0
0.05
A
m
p
.
Source mode #1
50 100 150 200 250
0.05
0
0.05
A
m
p
.
Source mode #2
50 100 150 200 250
0.1
0
0.1
A
m
p
.
Source mode #3
50 100 150 200 250
0.2
0
0.2
A
m
p
.
Source mode #4
Samples
Figure 8.15 Synthesis lters in the time
domain for the source modes 1 to 4 for the
system with a rigid oor and two hard walls.
Each plot includes the 24 synthesis lters to
create the given source mode with the 24
reproduction sources. Each lter includes 256
coefcients.
50 100 150 200 250
0.4
0.2
0
A
m
p
.
Pressure mode #1
50 100 150 200 250
0.2
0
0.2
A
m
p
.
Pressure mode #2
50 100 150 200 250
0.4
0.2
0
0.2
A
m
p
.
Pressure mode #3
50 100 150 200 250
0.5
0
0.5
A
m
p
.
Pressure mode #4
Samples
Figure 8.16 Analysis lters in the time
domain for the pressure modes 1 to 4 for the
Each plot includes the 4 analysis lters to
construct the pressure mode with the 4 pressure
sensors. Each lter includes 256 coefcients.
previous paper on AWFS [Gauthier et Berry, 2006], the effect of the penalization parameter
i
is related to the corresponding singular value magnitude
i
. In all cases, the size of the control
lters was 256 and was set to 0 . According to the learning curves of Fig. 8.17 (p. 205), it is
clear that AWFS provides a reduction of the reproduction error both at the error and monitor
sensors as compared to WFS. As noted earlier, the residual reproduction error is controlled by
the penalization parameters or
m
.
The effects of the reective surfaces on sound eld reproduction in space are rst shown in
Figs. 8.18 (p. 205) to 8.20 (p. 206), which present the reproduced impulse responses (instanta-
204
0 2 4 6 8 10
10
4
10
3
10
2
10
1
10
0
E
L
S
(
n
)
0 2 4 6 8 10
10
2
10
1
Time [s]
E
L
S
(
n
)

(
m
o
n
i
t
o
r
s
)
WFS
AWFS, FXLMS, =0
AWFS, SVD
AWFS, FXLMS, =10
WFS
AWFS, FXLMS, =0
AWFS, SVD
AWFS, FXLMS, =10
sensors and for the monitor sensors using
FXLMS and independent radiation mode
control algorithms with the system with a rigid
oor and two hard walls.
1
2
3
4
5
6
7
8
1
16
32
48
64
80
0.1
0
0.1
0.2
Monitor no Samples
I
n
s
t
a
n
t
a
n
e
o
u
s

s
o
u
n
d

p
r
e
s
s
u
r
e

[
P
a
]
Direct wave fronts Walls and floor
Floor
First wall
and floor
Figure 8.18 Reproduced (thin lines) and
virtual (thick dashed lines) impulse responses
at the monitor sensor array (linear array shown
in Fig. 8.6 (p. 192)) for WFS with the system
with a rigid oor and two hard walls.
neous sound pressure) at the monitoring sensors for the linear monitor array shown in Fig. 8.6
(p. 192). For the WFS solution, one can clearly distinguish the undesirable reections reaching
the monitor array in Fig. 8.18 (p. 205). Each discrete reection is identied on this gure. The
FXLMS case, Fig. 8.19 (p. 206), is relative to a penalization parameter = 10. On this gure,
one can note the effective reduction of the reections. This reduction of room effects are most
notable for the oor and late reections. The attenuation of the room effects is especially noticed
at the central monitoring sensors (this region corresponds to the control region, that is monitor
sensors #4 and #5). An important advantage of AWFS based on independent radiation mode
control is the possibility to individually control each of the radiation mode with an individual
convergence coefcient and penalization parameter. This allows faster convergence of the higher
205
1
2
3
4
5
6
7
8
1
16
32
48
64
80
0.1
0
0.1
0.2
Monitor no Samples
I
n
s
t
a
n
t
a
n
e
o
u
s

s
o
u
n
d

p
r
e
s
s
u
r
e

[
P
a
]
in Fig. 8.6 (p. 192)) for AWFS by FXLMS
with the system with a rigid oor and two hard
walls.
1
2
3
4
5
6
7
8
257
272
288
304
320
336
0.1
0
0.1
0.2
Monitor no Samples
I
n
s
t
a
n
t
a
n
e
o
u
s

s
o
u
n
d

p
r
e
s
s
u
r
e

[
P
a
]
in Fig. 8.6 (p. 192)) for AWFS based on
independent radiation mode control with the
order radiation modes which are of crucial importance for the reproduction error minimization
outside the region dened by the error sensor array. The comparison between Fig. 8.19 (p. 206)
and Fig. 8.20 (p. 206) shows how the AWFS algorithm based on independent control effectively
reduces the undesirable reections at the monitoring sensors.
To further highlight the effectiveness of active sound eld reproduction and reection can-
cellation by AWFS, Figs. 8.21 (p. 207) to 8.23 (p. 208) are introduced. They provide a different
spatio-temporal representation of the reproduced impulse responses by WFS and AWFS after
convergence. These gures are based on AWFS control lters after convergence of the algo-
rithms presented in the learning curves of Fig. 8.17 (p. 205). On these gures, the circular re-
production source array is represented by a continuous thick circle. Note that the instantaneous
sound pressure elds at time t = 0.56s and t = 0.59s are magnied 5 times to enhance the
visibility of the late reections. Clearly the FXLMS and independent radiation mode control
AWFS algorithms, reduce the reective room response in the region conned by the reproduc-
tion source array. By comparing the reproduced sound eld obtained by FXLMS or independent
radiation mode control, it is clear the the second algorithm based on plant decoupling reduces
the reection over a wider region of space. This is a consequence of the faster convergence and
reduced penalization of the higher order radiation modes.
206
Figure 8.21 Reproduced sound eld at
different times by WFS for the system with a
rigid oor and two hard walls. The target
wavefront is identied by the dashed circular
line. The sound elds at times t = 0.56s and
t = 0.59s are magnied by a factor of 5 to
enhance the visibility of the late reections.
Figure 8.22 Reproduced sound eld at
different times by AWFS based on modied
FXLMS for the system with a rigid oor and
two hard walls. The target wavefront is
identied by the dashed circular line. The
sound elds at times t = 0.56s and t = 0.59s
are magnied by a factor of 5 to enhance the
visibility of the late reections.
207
Figure 8.23 Reproduced sound eld at different times by AWFS based on independent
radiation mode control for the system with a rigid oor and two hard walls. The target
wavefront is identied by the dashed circular line. The sound elds at times t = 0.56s and
t = 0.59s are magnied by a factor of 5 to enhance the visibility of the late reections.
8.6 Discussion
The previous analysis and simulation results suggest that AWFS can be used as an effective
system for active sound eld reproduction and active room compensation. However, several
other considerations are of interest for further research. They are discussed in this section.
As for most current WFS systems, the conguration retained here was a two-dimensional
distribution of reproduction sources. This is usually motivated for simplicity and lower cost.
208
Usage of compact sensor arrays can however easily be extended to three dimensions. For the
presented conguration, one can easily imagine an other error sensor pair vertically separated
but centered at the origin. This solution should not imply major additional complexity. Extension
of AWFS in three-dimensional spaces is a research avenue that could be investigated.
Moreover, it should be noted that the basic denition of AWFS is absolutely not limited to
the retained conguration. This conguration was chosen to illustrate the basic AWFS ideas
and to validate the algorithm. That is, the AWFS typical cost functions (see Eqs. (8.13 and
(8.41)) and the presented adaptive algorithms can be applied to any reproduction source and
reproduction error sensor conguration. This could be subject of further research and should
depend on the practical problem of interest.
8.7 Conclusion and perspectives
Adaptive wave eld synthesis, as introduced by the authors in a previous theoretical paper
[Gauthier et Berry, 2006], was originally proposed as a solution for active sound eld repro-
duction and active room compensation for WFS. AWFS is based on minimization of the re-
production errors with a departure penalty from the WFS solution. This paper pushed further
the understanding and denition of AWFS by analyzing broadband signal processing and im-
plementation on the basis of several algorithms : modied FXLMS and independent radiation
mode control based on plant decoupling by singular value decomposition.
It was shown theoretically that the application of classical adaptive algorithms for active
noise control such as FXLMS provides a practical implementation frame for AWFS. The conver-
gence properties of the modied FXLMS algorithm are very similar to the properties of the
classical leaky FXLMS algorithm. The main difference between these classical algorithms and
their modied counterparts for AWFS is the constant re-introduction of a scaled part of the WFS
solution at each sample in the adaptation rules. Plant SVD and AWFS based on independent ra-
diation mode control was then introduced. The corresponding adaptation equation showed that it
is possible to control the convergence of each of the radiation modes. This is a major advantage
of plant decoupling for AWFS along with reduction of the computational burden (partly caused
by the simplication of the adaptation rules and of the computation of the reference signals). In
comparison with other published results on plant preconditioning by SVD [Bai et Elliott, 2004],
further practical considerations for rst synthesis and analysis lters were presented in Sec.
209
8.4.3. It was shown that either a reordering algorithm or a sign change tracking algorithm (both
working in the frequency domain) are needed before any tractable time-domain implementation
of AWFS can be achieved. Moreover a special attention was devoted to the practical nullspace
denition which is of great importance for AWFS.
The reported simulation examples included 24 reproduction sources and 4 error sensors
in free eld and in a semi-innite space bounded by three rigid surfaces. The rst case was
introduced to validate the AWFS algorithms in a simple situation. It proved the workability
of the algorithms. The second case was introduced as a demonstration of the main interest of
AWFS : active sound eld reproduction and active room compensation. A simple semi-innite
space was chosen as an example where identiable discrete reected wave fronts impinge on the
sound eld reproduction system. In this example, it was demonstrated that in-plane AWFS can
effectively be used to compensate for undesirable room effects like reections in the vicinity of
the error sensors. These included reections from vertical and horizontal surfaces. It is therefore
possible to compensate for reections coming from horizontal surfaces with a planar horizontal
system using AWFS and a compact error sensor array.
From all these remarks and from the detailed results presented in Sec. 8.5, we conclude
that AWFS effectively works as a potential solution for room compensation and active sound
eld reproduction. We currently experimentally evaluate an AWFS system using the congu-
ration depicted in Fig. 8.6 (p. 192) in several environments : semi-anechoic chamber, arbitrary
laboratory space and a reverberation chamber. Experimental evaluation of physical AWFS per-
formance for active sound eld reproduction is thus a topic of current and immediate future
research.
Several other issues related to AWFS are open questions : evaluation of system size on per-
formance, possible use of several compact error sensor arrays in a larger distributed reproduction
region, modication of other classical adaptive algorithms (frequency domain implementation,
sparse adaptation and others [Garas, 1999; Elliott, 2000]) for AWFS and both subjective and
objective evaluations of AWFS performance in several reproduction rooms in comparison with
WFS.
210
8.8 Acknowledgments
Council of Canada), NATEQ (Fond Qubecois de la Recherche sur la Nature et les Techno-
logies), VRQ (Valorisation Recherche Qubec) and Universit de Sherbrooke. This research
has been conducted in collaboration with CIRMMT (Centre for Interdisciplinary Research in
Music Media and Technology, McGill University).
211
CHAPITRE 9
RSULTATS DEXPRIMENTATIONS DE SYNTHSE DE
CHAMPS SONORES ADAPTATIVE
Au terme des considrations abordes dans les chapitres prcdents, ce neuvime et dernier
chapitre propose, sous la forme dun manuscrit
1
, une synthse des rsultats exprimentaux en
reproduction de champs acoustiques par AWFS.
Suivant un rappel des notions de WFS et dAWFS, le chapitre relate des exprimenta-
tions harmoniques et large bande pour trois lieux aux proprits acoustiques diffrentes qui
couvrent un spectre assez vaste pour poser une valuation critique des performances objectives
de lAWFS comme mthode de reproduction de champs acoustiques et comme mthode de com-
pensation des lieux de reproduction. Les lieux utiliss sont une chambre semi-anchoque, un
espace de laboratoire standard et une chambre rverbrante avec quelque morceaux de matriaux
acoustiques. Ces lieux sont dcrits la section C.4 la page 390. Le systme exprimental, dont
la conguration correspond celle expose aux deux prcdents chapitres, est dcrit lannexe
C (section C.4).
Il est dmontr que la WFS souffre dune performance objective rduite lorsque la rponse
acoustique de la salle devient plus importante, et ce en accord avec les rsultats initiaux prsents
au chapitre 4. La synthse de champs sonores adaptative (AWFS), en minimisant les erreurs de
reproduction et lcart de la solution par rapport la WFS, permet daugmenter la performance
objective de la reproduction de champs sonores en compensant les erreurs de reproduction au-
tant causes par le lieu de reproduction que par les imperfections du systme lectroacoustique
utilis, et ce, pour les trois espaces de reproduction considrs. Cette augmentation de la per-
formance objective dmontre exprimentalement lefcacit de lAWFS alors que les chapitres
1
Manuscrit dont Philippe-Aubert Gauthier est le premier auteur et Alain Berry le second, sera prochainement
soumis pour valuation par des pairs. Selon les plans actuels, le manuscrit sera soumis au Journal of the Acoustical
Society of America.
212
prcdents avaient plutt dni le principe et pos une comprhension thorique de la mthode.
Cest ainsi que plusieurs notions proposes dans un cadre thorique sont vries : lAWFS
base sur le contrle indpendant des modes de rayonnement permet dlargir la taille de la
rgion de contrle efcace, les rexions acoustiques discrtes sont amenuises, etc. Un nouvel
algorithme qui implique quelques modications supplmentaires celles poses au chapitre 8
pour le FXLMS est aussi sollicit : il se base sur des connaissances et notions issues de lAWFS
par le contrle indpendant des modes de rayonnement. Un tel algorithme pourrait faire lobjet
de recherches futures tant donn lintrt des rsultats obtenus et le fait que peu de temps y fut
ddi dans cette thse.
Loriginalit principale de ce chapitre vient du fait que cest la premire et unique mise en
place exprimentale de lAWFS. Qui plus est, ces expriences sont une dmonstration de la
possibilit deffectuer un dcouplage large bande par la dcomposition en valeurs singulires
pour un systme rel.
Ce dernier chapitre, par le biais de la dmonstration pratique de lefcacit de lAWFS,
conclut donc le travail de recherche expos par cette thse et complte latteinte des objectifs
dcrits au chapitre 3.
Des rsultats exprimentaux supplmentaires et des considrations thoriques qui supportent
certains points exposs dans ce chapitre sont prsents aux sections B.2, C.5 et C.6.
9.1 Adaptive wave eld synthesis and independent radiation mode control for active
sound eld reproduction : Experimental results
Sound eld reproduction nds applications in music reproduction, spatial audio, sound en-
vironment reproduction and experimental acoustics. For generic audio applications, sound eld
reproduction can be used to articially reproduce the spatial character of natural hearing. The
objective is then to reproduce a sound eld in a real reproduction environment. Wave eld
synthesis (WFS) is a known open-loop technology which assumes that the reproduction envi-
ronment is anechoic. For WFS, the room response thus reduces the quality of the physical sound
eld reproduction. In recent research papers, adaptive wave eld synthesis (AWFS) was dened
as a potential solution to compensate for these quality reductions from which WFS objective
performance suffers. In this paper, AWFS is experimentally investigated as an active sound eld
213
reproduction system with a limited number of reproduction error sensors to compensate the res-
ponse of the listening environment. Several digital signal processing algorithms for AWFS are
used for comparison purpose, one of which is based on independent radiation mode control.
A new promising algorithm for AWFS is also investigated. For the three tested reproduction
spaces (hemi-anechoic chamber, standard laboratory space and reverberation chamber), AWFS
performed propagating sound eld reproduction better than WFS.
9.2 Introduction
Following the constantly evolving digital signal processing and the relatively recent advent
of multichannel audio, spatial audio has gained more attention in the past decades from resear-
chers and practitioners for applications such as high-delity sound reproduction, music repro-
duction, virtual reality display, interactive multisensory environments, auralization and sound
installations [Camurri et Ferrentino, 1999; Wilson, 2003; Rumsey, 2001; Staff technical writer,
2005; Woszczyk et al., 2005; Blesser et Salter, 2007]. The interest for immersion and convin-
cing multisensory environments is not new[Grau, 2003] and various techniques for spatial audio
have been introduced in the past [Poulin, 1957; Kendall, 1995a; Verheijen, 1998; Poletti, 2000;
Rumsey, 2001; Davis, 2003].
Sound eld reproduction attempts to reproduce the physical stimulus (wave eld), thereby
avoiding any perceptual considerations in the implementation. Sound eld reproduction was
investigated by researchers in the past decades [Berkhout et al., 1993; Nelson et al., 1997;
Verheijen, 1998; Start et al., 1999; Nicol et Emerit, 1999; Poletti, 2000; Nelson, 2002; Choi et
Kim, 2004b; Epain et al., 2004; Takane et Sone, 2004; Keller et al., 2006] and one of the most
active and recent related matters is room compensation [Spors et al., 2003a; Gauthier et al.,
2005b; Betlehem et Abhayapala, 2005; Spors et al., 2005a; Fuster et al., 2005; Gauthier et
Berry, 2006], which is essential for sound eld reproduction in a real reproduction space on the
basis of objective, physically measurable, performances. This is especially true when acoustical
treatment of the reproduction space is not possible, like for sound eld reproduction in vehicle
mock-ups where the visual reproduction of the original space is important.
This paper deals with the problem of sound pressure eld reproduction using adaptive di-
gital signal processing applied to adaptive wave eld synthesis (AWFS) initially introduced by
[Gauthier et al., 2005c]. More specically it validates the AWFS concept on the basis of expe-
214
riments.
The concepts and results shown in this paper are not limited to audio applications. Indeed,
sound eld reproduction may also be applied to experimental acoustics [Veit et Sander, 1987;
Bravo et Elliott, 2004], psychoacoustics [Epain et al., 2004; Keller et al., 2006], sound environ-
ment reproduction or even as a vibroacoustics design tool. These are promising applications of
sound eld reproduction.
This paper is divided in ve parts. In this introductory section, sound eld reproduction,
wave eld synthesis (WFS) and adaptive wave eld synthesis (AWFS) are described on the
basis of recent research literature. Section 9.2.3 presents a summary of signal processing for
AWFS. This aspect has been fully described in an earlier paper
2
. The complete experimental
procedures and setups are described in section 9.4. Results of experiments with AWFS are then
reported in section 9.5 for three different reproduction spaces. Section 9.6 discusses the results
and draws the major concluding remarks following the experiments.
9.2.1 Sound eld reproduction
For sound eld reproduction, the main objective can be generally stated as the aim to re-
create a given acoustical property of the sound eld, such as sound pressure, sound intensity
[Choi et Kim, 2004b; Merimaa et Pulkki, 2005], spatial diffuseness [Merimaa et Pulkki, 2005],
etc., over an extended region of space. This can be achieved with a reproduction system inclu-
ding electroacoustical sources and receivers, signal processing, and the desired physical target
description. In several of these cases, usage of adaptive ltering implies the minimization of
a cost function which is representative of this reproduction objective [Gauthier et al., 2005b;
Gauthier et Berry, 2006]. Adaptive signal processing for spatial sound reproduction has been
considered in various forms by researchers [Asano et Swanson, 1995; Ise, 1999; Takane et al.,
1999; Radlovi c et al., 2000; Santilla n, 2001; Epain et al., 2004; Choi et Kim, 2004b; Gauthier
et al., 2005b,c; Spors et al., 2005a; Gauthier et Berry, 2006].
2
Cet article est en fait le manuscrit prsent au chapitre 8.
215
9.2.2 Wave eld synthesis (WFS)
Works on WFS originate from the theoretical propositions by Berkhout in the late 80s and in
the early 90s [Berkhout et al., 1993; Verheijen, 1998; Start et al., 1999; Gauthier et al., 2005b].
WFS is developed as follows : From the Kirchhoff-Helmholtz integral theorem, WFS operators
are dened to link a given simple virtual source (typically creating spherical or plane waves
in an horizontal plane, the listening plane), fed by a monophonic signal, to a loudspeaker array
which reproduces the acoustic eld of the virtual source (that is the target, or virtual, sound
eld). The problem is usually limited to reproduction in the horizontal plane with a nite num-
ber of discrete sources using appropriate simplications of the integral formulation [Verheijen,
1998]. With WFS systems, it is claimed that plane and spherical waves can approximately be
reproduced in a broad planar listening area surrounded by the loudspeaker array. WFS studies
have investigated : spatial aliasing [de Vries et al., 1994a; Start et al., 1995; Spors et Rabenstein,
2006; Corteel, 2006b], reproduction source type (electrodynamic, electrostatic, panels), source
directivity [Verheijen, 1998], objective performance in-room situation [Klehs et Sporer, 2003;
Sporer et Klehs, 2004]
3
, acoustic room compensation [Spors et al., 2003a, 2005a; Fuster et al.,
2005] and WFS equalization [Corteel, 2006a].
On one hand, the benet of current WFS prototypes is their effectiveness in transmitting a
spatial impression (in terms of localization) over a broad area surrounded by the loudspeakers.
On the other hand, WFS drawbacks related to the denition of the synthesis operators which as-
sumes that the reproduction rooms response or electroacoustical system limits [Corteel, 2006a]
are not considered in the process, except in specic research [Spors et al., 2003a, 2005a; Corteel,
2006a]. The typical WFS system is consequently based on an open-loop architecture assuming
a free eld as the reproduction space. Active room compensation or system equalization for
WFS is an active research topic for objective sound eld reproduction in real situation [Elliott
et Nelson, 1989; Asano et Swanson, 1995; Bouchard et Quednau, 2000; Santilla n, 2001; Spors
et al., 2003a; Gauthier et al., 2005b,c; Spors et al., 2005a; Fuster et al., 2005; Corteel, 2006a].
Review of WFS operators for AWFS
The description of the WFS operators follows the convention introduced in Fig. 9.1 (p.
218). According to [Verheijen, 1998], the following general WFS operators are obtained in the
3
Voir aussi le chapitre 4 de cette thse qui fut aussi soumis comme manuscrit a Acta Acustica united with
Acustica.
216
frequency domain
Q(x
(l)
l
, e
j
) =
_
jk
2
A(e
j
) cos()
e
j(kro)
e
j(Ts)
r
o
r
(ref)
(r
(ref)
+r
o
)
(9.1)
and the reproduced sound eld in free space is
p
(rep)
(x, e
j
) =
_

Q(x
(l)
l
, e
j
)H(e
j
)
e
jkr
r
dL (9.2)
where A(e
j
) is the target pressure eld amplitude (virtual monopole source amplitude), Q(x
(l)
l
, e
j
)
is the driving function (expressed as a monopole amplitude linear density, also known as the
WFS operators) for the reproduction sources along the line L, k = /c is the wavenumber and
e
jkr
/r (with r = [x
(l)
l
x[) is the complex pressure produced at x by a unitary amplitude
monopole source in x
(l)
l
(the position of the reproduction source l). In Eq. (9.2), H(e
j
) repre-
sents a ctitious reconstruction lter frequency response, which would typically correspond to a
band-pass lter. The phase shift j(T
s
) has also been articially added in Eq. (9.1) to ensure
that both the active sound eld reproduction and WFS assume the same modeling delay of
samples, T
s
[s] is the sampling period. The modeling delay simply delays the target signals from
an integer number of, typically, few samples. It is assumed that the virtual source and the repro-
duction sources are both in the horizontal plane (x
1
x
2
). All the other geometrical variables
in Eq. (9.1) are dened in Fig. 9.1 (p. 218).
Both the reproduction source line L and the reference line can be of arbitrary shape [Start
et al., 1999]. To simplify the computation of r
(ref)
in Fig. 9.1 (p. 218), the reference line is cho-
sen as a circle centered at the virtual source and passing through the center of the reproduction
source array [Verheijen, 1998; Gauthier et Berry, 2006].
Practical WFS implementation using discrete reproduction sources on a nite line implies
replacing Eq. (9.2) by
p
(rep)
(x, e
j
) =
L
l=1
Q(x
(l)
l
, e
j
)H(e
j
)
e
jkr
r

s
(9.3)
where
s
is the reproduction source separation distance. This is the theoretical reproduced
sound eld assuming free eld conditions.
For WFS, a reproduction source is active if [[ < 90
o
where is shown in Fig. 9.1 (p.
218). In real applications the reproduction array is nite and some truncation effects appear
[Verheijen, 1998; de Vries et al., 1994a]. In comparison with a linear reproduction source array,
217
in x
o
(l)
l
. x
(ref)
(m)
m
is the m-th sensor position. L is the
1
x
2
plane.
a circular array reduces the diffraction or corner effects. These effects are also reduced using a
spatial weighting window which reduces the amplitude of the reproduction sources at the end
of the activated set. In this paper, a half-Hanning window (with a half-length of one meter) is
applied to the amplitude of the driving function (Eq. (9.1)) [Verheijen, 1998; Gauthier et Berry,
2006].
The major drawbacks of WFS are : room effects (since the free-eld assumptions are not
respected), truncation effects and loudspeaker responses [Corteel, 2006a]. These drawbacks are
potentially compensated by AWFS which minimizes the reproduction errors without regard to
the origins of the reproduction errors.
9.2.3 Adaptive wave eld synthesis (AWFS) and independent radiation mode control
In a recent paper [Gauthier et Berry, 2006], AWFS was suggested as a practical compromise
between WFS and active room compensation, that usually requires a large amount of sensors.
AWFS automatically adapts the WFS operators typically with a reduced amount of reproduction
error sensors to minimize the computational burden of multichannel adaptation. AWFS is based
218
on a cost function to be minimized. Although implemented here in a specic conguration, the
AWFS concept described by this cost function can readily be applied to any conguration. The
cost function is a quadratic function of : (1) the reproduction errors and (2) the adaptive lters
departure from the WFS operators. The penalization of the departure from the WFS operators
is the major originality of AWFS in comparison with other research on sound eld reproduction
using active noise control techniques.
Via the singular value decomposition (SVD) of the plant matrix (frequency response func-
tions [FRFs] between reproduction sources and error sensors) involved in AWFS, it was shown
that the underlying AWFS mechanism is the independent control of radiation modes [Gauthier
et Berry, 2006]. This suggested a practical implementation of AWFS which had already been
thoroughly described from a a signal processing perspective
4
.
In this paper, the performance of AWFS based on modied ltered-reference least-mean-
square (FXLMS) and independent radiation mode control algorithms is derived from experi-
ments with a real AWFS system in three different acoustical situations. Moreover, a practical
yet promising compromise between modied FXLMS and independent radiation mode control
for AWFS is suggested and tested. This paper therefore validates the AWFS concepts, previously
investigated in theory [Gauthier et Berry, 2006]
5
, with experimental results.
9.3 Signal processing for AWFS
Two different types of AWFS experiments were performed. The rst implementation invol-
ved a broadband target wave eld. In that case, the implementation was off-line since it was
impossible, according to the computational load, to make it run in real time. The second imple-
mentation involved an harmonic target wave eld to reduce the computational load. Accordin-
gly, this second implementation was running on-line. The two corresponding signal processing
implementations are now briey described. The reader is refereed to earlier publications for a
complete description and analysis of the algorithms
6
.
4
Voir le manuscrit prsent par le chapitre 8.
5
Voir aussi le manuscrit prsent par le chapitre 8 et soumis au Journal of the Acoustical Society of America.
6
Voir le manuscrit prsent par le chapitre 8.
219
9.3.1 Broadband AWFS
For all AWFS algorithms presented here, the general cost function is dened by
J
AWFS
= E[e
T
(n)e(n)] +( w(n) w
WFS
)
T
( w(n) w
WFS
) (9.4)
where the control lters are I-taps FIR(nite impulse response) lters w(n) = [ w
T
0
(n) . . . w
T
I1
(n)]
T
with w
i
(n) = [w
1i
(n) . . . w
Li
(n)]
T
, the WFS operators are saved in w
WFS
, the reproduc-
tion errors are e(n) = [e
1
(n) . . . e
M
(n)]
T
=

d
M
(n) p
M
(n),

d
M
(n) are the target signals at
the M error sensors, p
M
(n) are the reproduced signals at the M error sensors, is a penali-
zation parameter, n is the sample index and E[] denotes mathematical expectation. There is L
loudspeakers in the reproduction source array.
Off-line realization of AWFS based on independent radiation mode control is achieved ac-
cording to the block diagram shown in Fig. 9.2 (p. 221). The plant is described by the M L
G(z) transfer function matrix between the reproduction sources and the errors microphones. Via
the plant G(z) singular value decomposition (SVD), one nds the rst synthesis lters
(s)
G
(z)
and second synthesis lters
(s)
G
(z) which create the source modes at the reproduction sources

according to the implementation depicted in Fig. 9.2 (p. 221). Note that the SVD produces the
radiation modes, each of which includes a source mode (at the reproduction source array), a
corresponding singular value and pressure mode (at the error sensor array). The corresponding
analysis lters (from the pressure modes) are dened to transform the physical reproduction
errors into the SVD basis. The target sound eld

d
M
(n) is dened by the top branch of Fig. 9.2
(p. 221) where one also nds the modelling delay . Each single-channel controller

w
m
inde-
pendently operates to minimize the corresponding transformed reproduction error e
m
(n) (the
m-th element of

e
M
(n)). The m-th independent least-mean-square (LMS) algorithm uses the
following adaptation rule
w
m
(n + 1) = (1
m
m
)

w
m
(n) +
m
e
m
(n)x(n 2
SV D
) +
m
m
w
WFSm
(9.5)
where

w
m
(n) is the coefcient vector of the m-th radiation mode controller at sample n,
m
is a convergence coefcient,
m
is the m-th radiation mode regularization parameter (note that
m
does not necessarily equal included in Eq. (9.4)), e
m
(n) is the m-th radiation mode ins-
tantaneous reproduction error at sample n, x(n 2
SV D
) is the time history (the past I ltered
reference signal samples) of the ltered reference signal (x(n)),
SV D
is the delay (in samples)
introduced in the synthesis and analysis lters [Gauthier et Berry, 2006], and

w
WFSm
is the
projection of the WFS operators on the m-th radiation mode synthesis lters. For a detailed
220
implementation based on independent radiation mode control. Subscripts denotes signal
dimensions.
description of this algorithm, see the chapter 8
7
.
Alternatively, AWFS can be implemented on the basis of a modication of the leaky FXLMS
algorithm [Elliott, 2000]. The corresponding block diagram is shown in Fig. 9.3 (p. 222). For
the moment, it is assumed that matrix the T is the M M identity matrix. In this case, the
adaptation rule is
w(n + 1) = (1 ) w(n) + w
WFS
+
R
T
(n)e(n) (9.6)
with
R(n) =
_
_
r
T
1
(n) r
T
1
(n 1) . . . r
T
1
(n I + 1)
r
T
2
(n) r
T
2
(n 1) . . . r
T
2
(n I + 1)
.
.
.
.
.
.
.
.
.
r
T
M
(n) r
T
M
(n 1) . . . r
T
M
(n I + 1)
_
_
(9.7)
where r
m
(n) = [r
1m
(n) . . . r
Lm
(n)]
T
is the ltered reference signal vector. The ltered refe-
rence is a set of ML signals obtained from the convolution of the reference signal x(n) by the
plant ML impulse responses. In Eq. (9.6), R(n) is evaluated from an identied system, so that
an approximate

R(n) is used.
For broadband AWFS, the adaptation rules Eqs. (9.5) and (9.6) are applied off-line once the
plant is identied from measurements. More details on the practical implementation of these
algorithms are given in Sec. 9.4.
7
Dans le manuscrit pour soumission, cette rfrence au chapitre 8 de cette thse sera remplace par larticle
ventuellement publi sur le traitement du signal.
221
implementation based on the modication of the FXLMS algorithm for AWFS. Subscripts
denotes signal dimensions.
9.3.2 Harmonic AWFS
It is possible to use the previous algorithms for the AWFS of an harmonic sound eld. In this
case, each control, synthesis and analysis lter includes only two coefcients and the SVD-based
algorithm then corresponds to a modied version of the PC-LMS (principal-component LMS
algorithm) [Cabell et Fuller, 1999; Elliott, 2000]. The difference with the PC-LMS comes from
the penalization by the departure to the WFS solution. The block diagram of Fig. 9.2 (p. 221)
is still a valid schematic representation of the implementation except that
SV D
= 0 [Elliott,
2000]. It is then possible to rewrite the adaptation rule as follows for the m-th independent
controller
y
m
(n + 1) = (1
m
m
) y
m
(n) +
m
e
m
(n) +
m
m
y
WFSm
(9.8)
where y
m
(n) is the m-th complex control input at sample n,
m
is the m-th controller conver-
gence coefcient,
m
is the m-th controller regularization parameter, e
m
(n) is the m-th radiation
mode complex reproduction error and y
WFSm
is the projection of the WFS complex input on
the m-th radiation mode complex synthesis lter. This modied PC-LMS has some well-known
properties [Elliott, 2000]. It is a good compromise between the multichannel FXLMS and the
multichannel Newton algorithm when identical convergence coefcients and regularization pa-
rameters are used for all independent controllers :
m
= and
m
= . The other important
property, as for the broadband implementation described previously, is that it is possible to ne
tune the convergence properties of each radiation mode by using different
m
and
m
for each
radiation mode for each corresponding controller. This latter property was explored for the re-
ported experiments.
The modied FXLMS algorithm for harmonic AWFS can also be written on the basis of
222
complex variables for a given radial frequency
o
[rad/s]. We then nd
y(n + 1) = (1 )y(n) +G
H
(e
jo
)e(n) +y
WFS
(9.9)
where y(n) is the L coefcients complex control input vector at sample n, G(e
jwo
) the plant
complex response (a M L matrix) at frequency
o
, e(n) the M coefcients complex repro-
duction error vector and y
WFS
the L coefcients complex WFS solution vector. The superscript
H denotes Hermitian transposition.
For AWFS with harmonic wave eld, the two adaptation rules Eqs. (9.8) and (9.9) are com-
puted on-line once the plant is identied from measurements. The practical implementation of
these algorithms is detailed in Sec. 9.4.
9.4 Experimental protocol
This section describes the experimental setups and the two experimental methods which
have been used for practical AWFS implementation.
9.4.1 Experimental setups
The tested system includes L = 24 reproduction sources and M = 4 reproduction error
sensors. The complete system is shown in Fig. 9.4 (p. 224). The reproduction sources create a
2m-diameter circular array in the horizontal plane. Sources are separated by 26cm, thus giving
an approximate minimal spatial aliasing frequency of 634Hz (/2 = 26cm) [Spors et Raben-
stein, 2006]
8
. This minimal spatial aliasing frequency gives the frequency range of interest for
the reported experiments. The error microphones form a cross, in the same horizontal plane
than the reproduction sources, and their separation along x
1
and x
2
axes are 17.5cm. Sources
and sensors stand 1.22m above the oor.
The loudspeakers are M-Audio DX4 studio monitors (amplied two-way cabinets). The
microphones are PCB 130D10/130P10. For the off-line broadband AWFS implementation,
the loudspeakers and the microphones are connected to a signal conditionner (PCB 482A20)
and a computer using Motu sound cards (24 analog inputs and 24 analog outputs). In this
8
ce sujet, on consultera aussi le chapitre 4 de cette thse.
223
12
11
13
10
14
9
15
8
16
... 8
7
17
x
2
6
18
5
19
1 ...
4
20
3
21
2
22
1
23
24
2

m
x
1
Sources
Error sensors
Monitoring sensors
Sources: 24
Sensors: 4
Figure 9.4 Schematic AWFS setup made of
24 reproduction sources, 4 reproduction error
sensors and 8 monitoring sensors. : typical
virtual source position.
Figure 9.5 Schematic representation of the
AWFS instrumentations, (a) : broadband, (b) :
harmonic.
setup, the AWFS signal processing presented in Sec. II.A operates off-line. The setup is sche-
matically shown in Fig. 9.5(a). For the second setup involving harmonic target wave elds, the
loudspeakers and microphones are connected to reconstruction and anti-aliasing lters (440 Hz
low-pass, 8-th order Butterworth), respectively, before connection to a dSpace station used
for on-line harmonic AWFS (as described in Sec. 9.3.2). The dSpace station is built around
a Texas Instrument TMS320C40 oating point Digital Signal Processor (DSP). The setup is
shown in Fig. 9.5 (p. 224)(b). For these two material setups, the experimental methods differ.
The system is pictured in Fig. 9.6 (p. 226).
9.4.2 Methods of experiments
Two types of reproduction methods are reported. For the rst type, the AWFS algorithms
operate off-line. In this case, the experimental procedure is as follows : (1) Identication of
the plant impulse responses (from all reproduction sources to all error sensors). Sweep sine
identication was used to cover from 0 to 600 Hz. The number of coefcients vary according
to the reproduction environment. (2) Off-line running, by simulation, of the AWFS algorithms
224
described in Sec. 9.3.1. (3) Rendering, with the real electroacoustical system, of the AWFS
solution after convergence of the control lters. (4) Measurement of the reproduced sound elds.
The reproduced sound eld measurements are based on reproduced impulse responses (from the
reference signal to the eight monitor microphones [see Fig. 9.4 (p. 224)]). Broadband AWFS
results shown in Sec. 9.5 include measurements of the reproduced sound elds using sweep
sines.
For the second type of experiments, the objective is to evaluate the performance of AWFS
with an on-line adaptation system. To reach this goal, several practical trade-offs are included to
reduce the computational burden so that on-line adaptation can be performed using the available
dSpace station. For harmonic sound eld reproduction in the time domain, all the AWFS
lters (including : controllers

w
m
, target operators a(z), synthesis [
(s)
G
(z) and
(s)
G
(z)] and
analysis [
(a)
G(z)] lters shown in Fig. 9.2 (p. 221)) are implemented using two-coefcients FIR
lters. In this very specic situation, the computational load is drastically reduced and on-line
adaptation is possible using the algorithm described in Sec. 9.3.2.
For both types of AWFS realization, the convergence coefcients used in the adaptive algo-
rithms (Eqs. (9.5) and (9.8)) are set near the maximum values which guaranteed stability and
convergence of the adaptation.
9.5 AWFS experiments
This part presents the results of experiments with the AWFS system. The rst section des-
cribes the acoustical characteristics of the reproduction rooms. The following sections present
the AWFS results for these different environments.
9.5.1 Acoustical characteristics of the reproduction rooms
The three reproduction environments were selected to cover a large spectrum of reverbe-
ration properties. These three environments are : (1) a hemi-anechoic chamber, (2) a standard
laboratory space, (3) a reverberant chamber.
The hemi-anechoic chamber (Fig. 9.6 (p. 226)) has a volume of 125m
3
(6.556.253.05m)
225
Figure 9.6 Experimental AWFS setup in the
hemi-anechoic chamber.
0 50 95 160 220 310 400 440 500
60
50
40
30
20
10
0
10
20
Freq. [Hz]
G
a
i
n

(
d
B

r
e
f
.

1
)
Hemianechoic chamber
Reverberant chamber
Arbitrary laboratory space
Figure 9.7 Typical identied FRFs (from a
reproduction source to an error microphone) in
the hemi-anechoic chamber, standard
laboratory space and reverberant chamber.
with a oor surface of 41m
2
. A typical FRF (transfer function between a reproduction source
and an error microphone) is shown in Fig. 9.7 (p. 226). In this situation, the FRFs are smooth
and the dip around 310Hz is created by the destructive interference with the oor reection at
this frequency. In the hemi-anechoic chamber, the error sensor signals are mostly dominated by
the direct sound eld of the reproduction sources. There is however a strong reection from the
concrete oor.
The volume of the standard laboratory space (see Fig. 9.17 (p. 236)) is 469m
3
(8.23
14.02 4.06m) with a oor surface of 115m
2
. The typical FRF shown in Fig. 9.7 (p. 226)
is more complex and shows various dips. The reverberation radius was estimated to be more
than 1.4m (according to spatial sound pressure level decay curves from an omnidirectional
loudspeaker) with broadband noise. It is then concluded that in this standard laboratory space,
the error sensors are roughly equally exposed to the direct sound eld of the reproduction source
and the eld reected by the room walls.
The volume of the reverberant chamber is 142m
3
with a oor surface of 46.5m
2
(7.56.2
3.05m). Several sheets of damping material were placed in corners of the room to reduce the
excessively long reverberation time. Without these materials the most important damping object
was the system operator. Any movement of the operator then inuenced the observed response
226
and stability of the system. The typical FRF shown in Fig. 9.7 (p. 226) has gains that vary
strongly with frequency and the transitions from frequency to frequency are very sharp. The
reverberation radius was estimated to be between 0.45m and 0.51m for broadband signal. The-
refore, in this highly reverberant space, the error sensors are mostly exposed to the diffuse sound
eld of the reproduction sources since the mean distance between the reproduction sources and
the error sensors is 1m. This is an hostile environment both for WFS and AWFS.
These reproduction rooms represent three possible situations between nearly free eld and
diffuse eld.
9.5.2 Hemi-anechoic space
Broadband AWFS
The broadband off-line demonstration of AWFS is interesting because it validates the com-
plete AWFS concept, as described in previous papers [Gauthier et Berry, 2006]
9
. The broadband
nature of the off-line system places a general point of view on the results. Some of the more spe-
cic interpretations will become clearer with the on-line harmonic realization of AWFS.
In a preliminary stage, the system FRFs are identied using sweep sines with an average
over 200 realizations. The resulting impulse responses include 256 coefcients. The sampling
rate is 1200 Hz for all the reported experiments. Using the identied plant, the modied FXLMS
algorithm shown in Fig. 9.3 (p. 222) (see also Eq. (9.6)) can readily be applied.
The independent radiation mode control implementation of Fig. 9.2 (p. 221) however re-
quires an additional initialization step. Singular value decomposition of the system plant in the
frequency domain is achieved as described by Gauthier and Berry
10
for each frequency. This
gives the radiation modes (source mode, singular values and pressure modes) at each frequency.
A phase optimization algorithm is then applied in the frequency domain to smooth the source
and pressure modes phase responses. Inverse discrete-time Fourier transform is then applied
to obtain the synthesis lters and analysis lters in the time domain for AWFS based on inde-
pendent radiation mode control. Note that using such synthesis and analysis lters, the plant is
9
Voir aussi le chapitre 8.
10
Voir le chapitre 8.
227
uncoupled but not whitened
11
. The synthesis lters
(s)
G
(z) for the rst four source modes are

shown in Fig. 9.8 (p. 229). Each group of synthesis lters (there are four groups of 24 lters)
produces one of the source mode at the reproduction source array. The analysis lters for the
four pressure modes are shown in Fig. 9.9 (p. 229). Each group of analysis lters (there are
four groups of 4 lters) transforms the physical acoustical pressures in the pressure mode ba-
sis. Interestingly, the synthesis and analysis lters show a sharp concentrated time response :
time leakage is reduced in comparison with other SVD lters presented by other researchers
[Bai et Elliott, 2004]. This is mostly marked for the rst and forth radiation modes lters. As
one can note, for the rst source and corresponding pressure mode, the 24 synthesis lters and
the 4 analysis lters are very similar. This supports the original hypothesis [Gauthier et Berry,
2006] that the rst radiation mode typically corresponds to an approximation of sound pres-
sure at the sensor array. The second and third radiation modes correspond to sound pressure
gradients at the sensor array, while the forth radiation mode corresponds to a nite approxi-
mation of second-order mixed spatial derivatives at the sensor array. Harmonic results in the
hemi-anechoic chamber will clearly support these observations.
Results of AWFS are compared to sound eld reproduced by classical WFS. Figure 9.10 (p.
230) shows the reproduced impulse responses (from the virtual source to the monitoring sensor
array shown in Fig. 9.4 (p. 224)). The transfer function units are [1/m] since we divide a sound
pressure [Pa] by a virtual monopole amplitude [Pa m]. The virtual source is a spherical source
located at x
o
= [0, 4, 0] m. Clearly, the direct eld of the reproduced impulse responses approach
the target impulse responses (also shown in the gure). After the direct wave front passage,
appears the reection from the oor appears and, instants later, the low frequency echo of the
hemi-anechoic chamber impinges the monitoring array. This echo is caused by the chamber
which is hemi-anechoic only above as 150 Hz. Moreover, an other physical imperfection of
the WFS reproduced sound eld appears : the direct wavefront has an undesirable coloration
(the impulse is spread over 2 or 3 samples, passing from positive to negative values), possibly
caused by the loudspeaker response or the WFS approximations. Equalization of the WFS direct
wavefront was considered by [Corteel, 2006a].
Figures 9.11 (p. 230) and 9.12 (p. 231) shows that AWFS can effectively compensate for
discrepancies between the target wave eld and the reproduced wave eld.
Figure 9.11 (p. 230) rst shows the learning curves of the AWFS algorithms. The criterion
E
LS
is the moving average of the quadratic summation of the instantaneous reproduction error at
11
Considrez le chapitre 8 ce sujet.
228
50 100 150 200 250
0.2
0.1
0
A
m
p
.
Source mode #1
50 100 150 200 250
0.1
0
0.1
A
m
p
.
Source mode #2
50 100 150 200 250
0.1
0
0.1
A
m
p
.
Source mode #3
1 64 128 192 256
0.2
0.1
0
0.1
A
m
p
.
Source mode #4
Samples
Figure 9.8 First synthesis lters
(s)
G
(z) in
the time domain for the source modes #1 to
#4 in the hemi-anechoic chamber. Each plot
includes the 24 synthesis lters to create the
given source mode with the 24 reproduction
sources. Each lter includes 256 coefcients.
50 100 150 200 250
0.2
0
0.2
A
m
p
.
Pressure mode #1
50 100 150 200 250
0.4
0.2
0
0.2
0.4
A
m
p
.
Pressure mode #2
50 100 150 200 250
0.2
0
0.2
A
m
p
.
Pressure mode #3
1 64 128 192 256
0.2
0
0.2
A
m
p
.
Pressure mode #4
Samples
Figure 9.9 Analysis lters
(a)
G
(z) in the time

domain for the pressure modes #1 to #4 in the
hemi-anechoic chamber. Each plot includes the
4 analysis lters to catch the pressure mode
with the 4 pressure sensors. Each lter includes
256 coefcients.
the error sensor array (i.e. the moving average of e
T
M
(n)e
M
(n)). The AWFS algorithms all work
to minimize this criterion down to a point imposed by the regularization parameter (see Eqs.
(9.5) and (9.6)). Clearly, all the AWFS algorithms reduce the E
LS
criterion after convergence,
with respect to the xed WFS solution. The convergence coefcient was set to 0.00001 for
the modied FXLMS algorithm. For the independent radiation mode control algorithm, the
convergence coefcients were set to
1
= 0.0001,
2
=
3
= 0.0004 and
4
= 0.002 for the
four radiation modes. The penalization parameter for the FXLMS algorithm was set to = 0
and = 20. For the reproduced sound eld obtained with the modied FXLMS (see Fig. 9.12
(p. 231)), we used = 20. The penalization parameters for the AWFS based on independent
radiation mode control were
1
= 2,
2
=
3
= 0.2 and
4
= 0.1. The penalization parameters
229
1
2
3
4
5
6
7
8
0.02
0.04
0.06
0.08
0.5
0
0.5
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
Time [s]
Direct and target
wave fronts
Floor
reflection
Low frequency
reflection
Monitor no
Figure 9.10 Reproduced (thick gray lines) and
virtual (thin black lines) impulse responses at
the monitoring sensor array (shown in Fig. 9.4
(p. 224)) for WFS with the system in the
hemi-anechoic chamber.
0 2 4 6 8 10
10
2
10
1
10
0
10
1
E
L
S
(
n
)
Time [s]
WFS
AWFS, FXLMS, =0
AWFS, FXLMS, =20
AWFS, SVD
sensors using FXLMS and independent
radiation mode control algorithms with the
system in the hemi-anechoic chamber.
impose a plateau for E
LS
after convergence, as it can be seen in Fig. 9.11 (p. 230). Note that the
E
LS
criterion is not normalized so that although the WFS reproduced sound eld approach the
target sound eld, a criterion of E
LS
of nearly one is observed.
Although these learning curves show that the algorithms are effective and that reproduc-
tion errors are reduced at the central sensor array (see Fig. 9.4 (p. 224)), it does not show what
happens outside the error sensor array. The impulse responses (from the virtual source to the mo-
nitoring sensor array shown in Fig. 9.4 (p. 224)) reproduced by AWFS are shown in Fig. 9.12
(p. 231). Clearly, the imperfections of WFS shown in Fig. 9.10 (p. 230) are partly corrected
by AWFS even outside the error sensor array (note that monitors #4 and #5 correspond to two
of the error sensors). Both the modied FXLMS and independent radiation mode control algo-
rithms reduce these imperfections. The oor reection is attenuated and the low frequency echo
disappears from the sound eld reproduced by AWFS. Beyond simply reducing the undesirable
room effects in the reproduced sound eld, the direct sound eld reproduced by AWFS is closer
to the target wave eld than the sound eld reproduced by WFS (both in terms of amplitude
and time-delay). Therefore, AWFS compensates for the room effects, for the loudspeaker colo-
rations and, possibly, for some classical WFS approximations which introduce physical errors
in the reproduced sound eld.
A closer comparative study of Fig. 9.12(a) and (b) highlights some distinctions between
230
1
2
3
4
5
6
7
8
0.02
0.04
0.06
0.08
0.5
0
0.5
Monitor no Time [s]
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
1
2
3
4
5
6
7
8
0.24
0.26
0.28
0.3
0.5
0
0.5
Monitor no Time [s]
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
(a)
(b)
(p. 224)) for AWFS ((a) : FXLMS algorithm
with = 20, (b) : independent radiation mode
control) with the system in the hemi-anechoic
chamber.
0.6 0.3 0 0.3 0.6
10
1
10
0
Normalized energies of the errors
0.6 0.3 0 0.3 0.6
10
1
10
0
0.6 0.3 0 0.3 0.6
10
1
10
0
0.6 0.3 0 0.3 0.6
10
1
10
0
x
1
[m]
Position #1
Position #2
Position #3
Position #4
Figure 9.13 Normalized energies of the error
signals at each monitoring microphone for four
virtual source positions in the hemi-anechoic
chamber. Position #1 : x
o
= [0, 4, 0], position
#2 : x
o
= [4, 0, 0], position #3 :
x
o
= [0, 1.5, 0] and position #4 :
x
o
= [1.19, 0.91, 0]. denote WFS errors,
: errors of AWFS by FXLMS and : errors
of AWFS by independent radiation mode
control.
231
the FXLMS and independent radiation mode control realizations of AWFS. The independent
radiation mode control algorithm achieves a better sound eld reproduction at the farther mo-
nitoring sensors. This is clearly visible for the direct sound eld reproduced by independent
radiation mode control, in which case the negative sign excursion of the impulse responses one
or two samples after the direct wave front passage is drastically reduced. This is caused by the
possibility to ne tune each of the radiation mode with the independent radiation mode control-
ler realization of AWFS. For the FXLMS case, the higher-order radiation modes are often too
much penalized and their possible benecial contribution in the sound eld reproduction process
is greatly diminished.
A different representation of the results allows for a general comparison between WFS and
the two AWFS algorithms in terms of the reproduction error reduction as function of space.
This is shown in Fig. 9.13 (p. 231) where the normalized energies of the errors at each of the
monitoring microphones are computed from the differences between the virtual and reproduced
impulse responses (IRs) shown in Figs. 9.10 (p. 230), 9.12 (p. 231) and others, measured for
different virtual source positions. The normalized energies are computed as the sums of the
quadratic error signals (differences between virtual IRs and reproduced IRs in the time domain)
over the length of the IRs normalized by the total quadratic sum of the virtual IR, divided by the
number of monitoring microphones. The normalization is thus achieved by division by the mean
virtual IR energies of the monitoring microphones. According to the results shown in Fig. 9.13
(p. 231), the AWFS algorithms reduce on the average the reproduction errors in comparison
with WFS by controlling the reproduction error at the four error sensors (two of which are
monitors number #4 and #5). As suggested in previous theoretical publications
12
, AWFS based
on independent radiation mode control effectively provides a larger reproduction region of since
the higher order modes are included in the controller in that case. Note that the size of the
effective control region is also blurred by the fact that this type of representation includes all
the frequencies at once. AWFS by modied FXLMS provides a signicant reproduction error
reduction at the two central monitoring microphones, but the reproduction errors are not so small
for the other monitoring microphones. AWFS performs better than WFS for all the reported
virtual source positions.
12
Pour linstant, on se rfre au chapitre 8 et la rfrence [Gauthier et Berry, 2006].
232
Harmonic AWFS
The on-line harmonic AWFS system was tested for a similar environment. In comparison to
broadband experiments, it is difcult to visualize the passage of the reproduced wave front in
the case of an harmonic wave eld. It is however easier to observe the on-line stability of the
algorithm and evaluate the size of the effective control region at several frequencies.
According to the FRF shown in Fig. 9.7 (p. 226), the following frequencies were selected for
on-line AWFS : 95 , 160 , 220 , 310 and 400 Hz. The 95 and the 310 Hz were selected for their
peculiar responses in the FRF while the other frequencies were selected to cover the frequency
range below the source array spatial aliasing frequency (roughly 634 Hz).
After the 24 4 system was identied with two-coefcients adaptive FIR lters, the algo-
rithms were initialized. This includes the SVD of the plant transfer matrix for each frequency
along with phase and amplitude calibration of the microphones. Examples of source modes and
pressure modes are shown at 220 Hz in Figs. 9.14 (p. 234) and 9.15 (p. 234). Several observa-
tions can be drawn : (1) the pressure modes correspond to simple multipole patterns (monopole,
two orthogonal dipoles and a quadrupole) at the error sensor array and (2) these modes are
similar to the theoretically reported radiation modes [Gauthier et Berry, 2006]. Several experi-
mental tests have also shown that plant decoupling is effective and robust : each radiation mode
controller doesnt inuences the other independent controllers. It was also observed that a null
sound pressure is produced at the sensor array when only the second synthesis lters
(s)
G
(z)
are excited [Gauthier et Berry, 2006]. We recall that the second synthesis lters are obtained
from the system plant null space. They are xed and they create zero sound pressure at the error
sensors.
For the modied FXLMS algorithm, the convergence coefcient was set to 0.01 for all
frequencies while the penalization parameter was xed to 0.1 (except at 220 Hz were = 1).
The AWFS algorithm based on independent convergence coefcients and penalization of the
radiation mode control algorithm parameters were adjusted to obtain a similar residual error
level than for the FXLMS but the higher-order radiation modes were less penalized than for the
FXLMS algorithm when possible, to increase the quality of the reproduction outside the error
sensor location [Gauthier et Berry, 2006]. This was achieved using either an identical parameter
m
= for all radiation mode or
m+1
<
m
. The coefcients used in the experiments are
shown in Tab. 9.1.
233
0 5 10 15 20 25
0.5
0
0.5
A
m
p
.
1
= 3.9461
Source modes
0 5 10 15 20 25
0.5
0
0.5
A
m
p
.
2
= 0.68892
0 5 10 15 20 25
0.5
0
0.5
A
m
p
.
3
= 0.65553
0 5 10 15 20 25
0.5
0
0.5
Source number (l)
A
m
p
.
4
= 0.084841
Real
Imaginary
Figure 9.14 First four measured source modes
at 220Hz in the the hemi-anechoic chamber.
Figure 9.15 Measured pressure modes at
220Hz in the hemi-anechoic chamber. , sensor
position ; , positive real part ; , negative real
part ; +, positive imaginary part ; , negative
imaginary part. Symbol diameter illustrates the
magnitude of the corresponding value. Dashed
lines : equivalent computed free eld
directivity.
Freq. [Hz]
m

m
95 0.02, 0.2, 0.2, 1 0.01, 0.01, 0.01, 0.01
160 0.02, 0.2, 0.2, 2 0.1, 0.1, 0.1, 0.1
220 0.02, 0.2, 0.2, 2 0.1, 0.1, 0.1, 0.1
310 0.02, 0.1, 0.1, 0.2 0.1, 0.1, 0.1, 0.1
400 0.02, 0.1, 0.1, 0.2 0.1, 0.01, 0.01, 0.001
Tableau 9.1 Convergence coefcients and regularization parameters for harmonic AWFS
based on independent radiation mode control in hemi-anechoic space.
234
To evaluate the performance of the sound eld reproduction algorithms outside the error sen-
sor location, the linear monitoring array, along x
1
, including 8 microphone positions (separated
by 17.5 cm) was used to evaluated E
LS
after convergence for each of these monitoring posi-
tions. The corresponding criterion E
LS
(n) is the moving average of e
i
(n)
T
e
i
(n)/(d
i
(n)
T
d
i
(n))
where d
i
(n) is the desired signal and i, the monitor position number (see Fig. 9.4 (p. 224)). The
results are summarized in Fig. 9.16 (p. 236) where the colormap axis represents E
LS
at each of
the monitor position along x
1
. The WFS performance is reduced in comparison with the adap-
tive algorithms. This highlights the main interest of AWFS. Using the FXLMS algorithm, the
error is effectively reduced near the error sensors. However, as frequency increases, the control
region is spatially reduced. This is a well-known phenomenon in active noise control and it is
also a consequence of the overly penalized higher-order radiation modes when = 0.1. Moreo-
ver, the maximum convergence coefcient that ensures the FXLMS algorithm convergence is
limited by the inverse of the rst radiation mode singular value so that higher-order modes have
not reached convergence in the results of Fig. 9.16 (p. 236)
13
. A uniform penalization parameter
also blocks the convergence of the higher-order modes (with smaller singular values) since a
large penalization parameter in comparison to the singular value, blocks the convergence of the
corresponding mode [Elliott, 2001; Gauthier et Berry, 2006]. Using the independent radiation
mode control algorithm, each radiation mode is individually tuned. This produces (Fig. 9.16 (p.
236)) a larger control region at the highest frequency (specially visible at 400 Hz) since control
of the higher-order radiation modes implies control of higher-order spatial derivatives of the
sound eld at the error sensor array (see Fig. 9.15 (p. 234)). At lower frequencies, as the wa-
velength increases, the rst radiation mode is dominant over the entire monitoring sensor array
so that the importance of the higher-order modes is reduced. As example, at 95 Hz and 160 Hz
the acoustic wavelengths are 3.6 m and 2.14 m respectively while 400 Hz implies a 0.86 m wa-
velength. This explains why the FXLMS algorithm create a large effective control region at low
frequencies : the rst radiation mode covers a wider region of space with long wavelengths.
Along with the possibility to ne tune the convergence properties of each radiation mode, the
SVD-based algorithm involves less computation that the FXLMS during each sampling period :
the computation time is approximately reduced by two.
Other virtual source positions were tested to verify the effects of distance and angular po-
sition on active sound eld reproduction by AWFS. Similar observations apply : (1) the AWFS
algorithms perform better than WFS and (2) at higher frequency the SVD-based implementation
implies a larger effective control region outside the error sensor array (as already shown in Fig.
9.16 (p. 236) for 400 Hz).
13
Voir le chapitre 8 ce sujet.
235
-0.5
0
0.5
95 160 220 310 400

WFS

x
1

[
m
]
-0.5
0
0.5
95 160 220 310 400
AWFS by FXLMS
-0.5
0
0.5
95 160 220 310 400
Freq. [Hz]
AWFS by ind. radiation mode control
x
1

[
m
]
x
1

[
m
]
0 0.05 0.1 0.15 0.2 0.25
E
LS
Figure 9.16 Normalized E
LS
criterion at the
monitoring sensors for various frequencies and
harmonic reproduction algorithms after
convergence in the hemi-anechoic chamber.
From top to bottom : WFS, AWFS based on
FXLMS and AWFS based on independent
radiation mode control. The measurement
points are denoted by dots. Thick dashed lines
are the 0.1 contour lines, thin dashed lines are
the 0.25 contour lines and thin solid lines are
the 0.5 contour lines.
Figure 9.17 Experimental AWFS setup in the
laboratory space.
236
9.5.3 Standard laboratory space and reverberation chamber
This section summarizes the results obtained for the laboratory space and the reverberation
chamber. As these two reproduction environments enhance the room on effect on WFS, only
parts of the results are shown to support the effectiveness of AWFS to compensate for room
effect. The system in the standard laboratory space is shown in Fig. 9.17 (p. 236).
Broadband AWFS
Since the rooms IRs were longer than for the hemi-anechoic space, the identied IRs and
control lters where selected to have 512 coefcients for the laboratory space and 1024 for
the reverberant chamber (instead of 256 in the hemi-anechoic chamber) with an average over
200 realizations at a sampling rate of 1200 Hz. The resulting synthesis and analysis lters are
shown in Figs. 9.18 (p. 238) and 9.19 (p. 238) for the laboratory space. Once again, a phase
optimization algorithm is applied in the frequency domain to smooth the source and pressure
modes phase responses before inverse discrete-time Fourier transform. Moreover, a bandpass
lter (forth-order Butterworth, 60 Hz to 540 Hz) is applied to all synthesis and analysis lters
to reduce DC components that tend to appear in long SVD lters. Clearly the responses of
the synthesis and analysis lters are longer than for the hemi-anechoic room. These lters are
again concentrated impulses and showa reduced time-leakage. The radiation modes still provide
a nite approximation of pressure, perpendicular pressure gradients and second-order mixed
spatial derivative of pressure at the error sensor array. This will become clear with the harmonic
results.
Measured impulse responses reproduced by classical WFS are shown in Fig. 9.20 (p. 239)
for the laboratory space and in Fig. 9.21 (p. 239) for the reverberant chamber. It is possible to
distinguish the direct wave front reproduced by WFS and the oor reection. The late parts of
the responses are blurred by multiple reections from the concrete irregular ceiling, furniture,
distant objects and hard walls. The difference between the WFS reproduced sound eld and
virtual sound eld at the monitor sensor array is seriously increased in comparison with WFS in
the hemi-anechoic room.
AWFS was tested to reduce the reproduction errors at the four error microphones. For AWFS
by FXLMS in laboratory space, the convergence parameter was set to 0.000002, and the
penalization parameter was set to 0 or 30. For AWFS by independent radiation mode control,
237
100 200 300 400 500
0.1
0.05
0
0.05
A
m
p
.
Source mode #1
100 200 300 400 500
0.05
0
0.05
A
m
p
.
Source mode #2
100 200 300 400 500
0.04
0
0.04
A
m
p
.
Source mode #3
1 128 256 384 512
0.1
0
0.1
A
m
p
.
Source mode #4
Samples
Figure 9.18 First synthesis lters
(s)
G
(z) in
the time domain for the source modes #1 to
#4 in the laboratory space. Each plot includes
the 24 synthesis lters to create the given
source mode with the 24 reproduction sources.
Each lter includes 512 coefcients.
100 200 300 400 500
0
0.2
0.4
A
m
p
.
Pressure mode #1
100 200 300 400 500
0.2
0
0.2
A
m
p
.
Pressure mode #2
100 200 300 400 500
0.1
0
0.1
A
m
p
.
Pressure mode #3
1 128 256 384 512
0.4
0
0.4
A
m
p
.
Pressure mode #4
Samples
Figure 9.19 Analysis lters
(a)
G(z) in the
time domain for the pressure modes #1 to #4
in the laboratory space. Each plot includes the
4 analysis lters to catch the pressure mode
with the 4 pressure sensors. Each lter includes
512 coefcients.
the individual convergence coefcients were set to
1
= 0.0000075,
2
=
3
= 0.00003 and
4
= 0.00015, and the penalization parameters were set to
1
= 2,
2
=
3
= 0.2 and
4
= 0.1.
For AWFS by FXLMS in the reverberant chamber, = 0.0000005, and was set to 0 or 50.
For AWFS by independent radiation mode control, the individual convergence coefcients were
1
= 0.0000125,
2
=
3
= 0.00005 and
4
= 0.00025, and the penalization parameters were
set to
1
= 4,
2
=
3
= 0.4 and
4
= 0.04. The convergence coefcients are smaller than for
the hemi-anechoic case because the size of the control lters is increased.
The reproduced impulse responses by AWFS are shown in Figs. 9.22 (p. 240) and 9.23 (p.
240). The imperfections of WFS shown in Figs. 9.20 (p. 239) and 9.21 (p. 239) are partly correc-
238
1
2
3
4
5
6
7
8
0.02
0.04
0.06
0.08
0.5
0
0.5
Monitor no Time [s]
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
Direct wave front
Floor
reflection
laboratory space.
1
2
3
4
5
6
7
8
0.02
0.04
0.06
0.08
0.5
0
0.5
Monitor no Time [s]
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
reverberant chamber.
ted by AWFS even outside the error sensor array. Both the modied FXLMS and independent
radiation mode control algorithms reduce these imperfections for the two reproduction spaces.
Remarkably, the room compensation is achieved over a wide time range. Again, more than sim-
ply reducing the undesirable room effect in the reproduced sound eld, AWFS more closely
reproduces the direct sound eld than WFS. One notes that the AWFS algorithm based on inde-
pendent radiation mode control creates a larger room compensation region along the monitoring
microphone array.
The normalized energies of the errors at each of the monitor microphones are shown in Figs.
9.24 (p. 241) and 9.25 (p. 241) for the laboratory space and reverberant chamber respectively.
The AWFS algorithms reduce on the average the reproduction errors in comparison to WFS
by controlling the reproduction errors at the four error sensors. AWFS based on independent
radiation mode control effectively gives a larger reproduction region as the higher order modes
are included in the controller in that case. As for AWFS in the hemi-anechoic space, AWFS
by modied FXLMS results in a small reproduction error at the two central monitoring micro-
phones, but the reproduction errors are not reduced for the other monitoring microphones. This
again highlights the benets of AWFS based on independent radiation mode control. AWFS
performs better than WFS for all the reported virtual source positions in the two reproduction
environments.
239
1
2
3
4
5
6
7
8
0.02
0.04
0.06
0.08
0.5
0
0.5
Monitor no Time [s]
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
1
2
3
4
5
6
7
8
0.46
0.48
0.5
0.5
0
0.5
Monitor no Time [s]
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
(a)
(b)
control) with the system in the laboratory.
1
2
3
4
5
6
7
8
0.02
0.04
0.06
0.08
0.5
0
0.5
Monitor no Time [s]
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
1
2
3
4
5
6
7
8
0.88
0.9
0.92
0.94
0.5
0
0.5
Monitor no Time [s]
I
m
p
.

r
e
s
p
o
n
s
e

[
1
/
m
]
(a)
(b)
control with
m
= 0) with the system in the
reverberant chamber.
Harmonic AWFS
For the sake of brevity, the harmonic AWFS results are only reported for the laboratory
space. Consistent results were obtained for the reverberant chamber. According to the typical
FRF shown in Fig. 9.7 (p. 226), the following frequencies were selected for on-line AWFS :
133 , 160 , 220 , 280 , 340 and 400 Hz.
Examples of pressure modes are shown for 220 Hz in Fig. 9.26 (p. 243). Again the radiation
240
0.6 0.3 0 0.3 0.6
10
1
10
0
0.6 0.3 0 0.3 0.6
10
1
10
0
0.6 0.3 0 0.3 0.6
10
1
10
0
0.6 0.3 0 0.3 0.6
10
1
10
0
0.6 0.3 0 0.3 0.6
10
1
10
0
x
1
[m]
Position #1
Position #2
Position #3
Position #5
virtual source positions in the laboratory space.
Position #1 : x
o
= [0, 4, 0], position #2 :
x
o
= [4, 0, 0], position #3 : x
o
= [0, 1.5, 0]
and position #5 : x
o
= [2.8289, 2.8234, 0].
denote WFS errors, : errors of AWFS by
FXLMS and : errors of AWFS by
independent radiation mode control.
0.6 0.3 0 0.3 0.6
10
1
10
0
0.6 0.3 0 0.3 0.6
10
1
10
0
0.6 0.3 0 0.3 0.6
10
1
10
0
0.6 0.3 0 0.3 0.6
10
1
10
0
x
1
[m]
Position #1
Position #2
Position #3
Position #4
Position #1
virtual source positions in the reverberant
chamber. Position #1 : x
o
= [0, 4, 0], position
#2 : x
o
= [4, 0, 0], position #3 :
x
o
= [0, 1.5, 0] and position #4 :
x
o
= [1.19, 0.91, 0]. denote WFS errors,
: errors of AWFS by FXLMS and : errors
of AWFS by independent radiation mode
control.
241
Freq. [Hz]
m

m
133 0.01, 0.1, 0.1, 0.5 0.1, 0.01, 0.01, 0.001
160 0.02, 0.1, 0.1, 0.5 0.1, 0.01, 0.01, 0.001
220 0.02, 0.2, 0.2, 0.5 0.1, 0.01, 0.01, 0.001
280 0.02, 0.1, 0.1, 0.5 0.1, 0.01, 0.01, 0.0005
340 0.02, 0.1, 0.1, 0.5 0.1, 0.01, 0.01, 0.001
400 0.02, 0.1, 0.1, 0.5 0.1, 0.01, 0.01, 0.001
Tableau 9.2 Convergence coefcients and regularization parameters for harmonic AWFS
based on independent radiation mode control in laboratory space.
modes correspond to simple multipole patterns : monopole, two orthogonal dipoles and tesseral
quadrupole at the sensor array. This supports the previous and general remarks on the radiation
modes for various theoretical reproduction space [Gauthier et Berry, 2006].
For AWFS by the modied FXLMS algorithm, the convergence coefcient was set to
0.01 for all frequencies while the penalization parameter was xed to 1 (except at 133 Hz and
160 Hz where = 0.0005 and 0.005 respectively). The AWFS algorithm based on independent
radiation mode control convergence coefcients and penalization parameters were then adjusted
to reach a roughly similar residual error level at the error sensors than for the FXLMS but each
higher-order radiation modes were less penalized than for the FXLMS algorithm when possible
to increase the performance outside the error sensor location [Gauthier et Berry, 2006]. This
was achieved using either
m
= or
m+1
<
m
. The used coefcients are shown in Tab. 9.2.
The results are summarized in Fig. 9.27 (p. 243), for a virtual source in x
o
= [0, 4, 0], where
the color axis represents the already described E
LS
normalized criterion at each of the monitor
position along x
1
. As one can note, the WFS performance is reduced in comparison with the
other algorithms. As for the hemi-anechoic results, using the FXLMS algorithm, the error is
effectively reduced near the error sensors. However, as frequency increases, this control region
is spatially reduced. On that matter, most of the detailed comments and explanations for the
hemi-anechoic chamber results apply. The AWFS based on independent radiation mode control
advantageously produces, as shown in Fig. 9.27 (p. 243), a larger control region since the higher-
order radiation modes typically imply higher-order spatial derivatives at the error sensor array
(see Fig. 9.26 (p. 243)). Even more clearly than for the hemi-anechoic chamber results, the
AWFS algorithm based on independent radiation mode control systematically enlarges the ef-
fective reproduction region in comparison with AWFS based on the modication of the FXLMS
algorithm.
242
Figure 9.26 Measured pressure modes at
220Hz in the laboratory. , sensor position ; ,
positive real part ; , negative real part ; +,
positive imaginary part ; , negative imaginary
part. Symbol diameter illustrates the magnitude
of the corresponding value. Dashed lines :
equivalent computed free eld directivity.
-0.5
0
0.5
133160 220 280 340 400
WFS
x
1

[
m
]
-0.5
0
0.5
133160 220 280 340 400
AWFS by FXLMS
-0.5
0
0.5
133160 220 280 340 400
AWFS by ind. radiation mode control
Freq. [Hz]
x
1

[
m
]
x
1

[
m
]
0 0.05 0.1 0.15 0.2 0.25
E
LS
LS
criterion at the
monitoring sensors for various frequencies and
harmonic algorithms after convergence in the
laboratory. From top to bottom : WFS, AWFS
based on FXLMS and AWFS based on
independent radiation mode control. The
measurement points are denoted by dots. Thick
dashed lines are the 0.1 contour lines, thin
dashed lines are the 0.25 contour lines and thin
solid lines are the 0.5 contour lines.
243
9.5.4 Importance of the higher order radiation modes
The importance of the higher order radiation modes is highlighted by a specic set of experi-
ments with broadband off-line AWFS. Figure 9.28 (p. 245) shows the normalized energies of the
reproduction errors for WFS, AWFS and AWFS by independent radiation mode control where
only a limiter number of radiation modes are controlled. This was measured in the standard
laboratory space for the virtual source position located in x
o
= [0, 4, 0]. As expected, AWFS
by independent radiation mode control approaches AWFS by FXLMS when the rst radiation
mode is the only controlled mode. As the number of controlled radiation mode increases, the size
of the effective active sound eld reproduction region increases thus supporting the assumption
that higher order radiation modes tend to provide a larger control region.
The size of the active sound eld reproduction effective region is shown in Fig. 9.29 (p. 245)
in relation to the acoustic wavelength. In this gure, several harmonic AWFS algorithms with
w
WFS
=

0 are presented for a harmonic wave eld at 400 Hz in laboratory space. The WFS
solution is forced to zero to only illustrates the effects of the individual radiation modes one
to four. Clearly, when AWFS based on independent radiation mode control includes only one
radiation mode, the results correspond to AWFS by FXLMS. When the number of higher order
modes included in AWFS based on independent radiation mode control increase, the size of the
effective control region increases from a quarter wave length (one radiation mode) to half the
wave length (four radiation modes). This supports the previous observation on the importance
of the higher radiation modes to enlarge the effective active sound eld reproduction region. The
adaptation coefcients and penalization parameters are identical to those of Tab. 9.2.
9.5.5 Modication of the FXLMS algorihtm for AWFS
The radiation modes obtained from plant SVD correspond to nite approximations of pres-
sure, orthogonal pressure gradients and tesseral quadrupole (second-order mixed derivative) at
the sensor array. This is supported by the experimental pressure modes shown in Figs. 9.15 (p.
234) and 9.26 (p. 243). At the light of these results, it is possible to suggest a simple modica-
tion to the FXLMS algorithm for AWFS that automatically takes into account the higher order
spatial derivatives at the error sensor array using a transformation matrix T (see Fig. 9.3 (p.
222)) different than the identity matrix. We recall that all the previously reported experiments
with AWFS based on FXLMS used T = I. This matrix can be used to simultaneously evaluate
244
0.6 0.4 0.2 0 0.2 0.4 0.6
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
2
3
4
x
1
[m]
N
o
r
m
a
l
i
z
e
d

e
n
e
r
g
i
e
s

o
f

t
h
e

e
r
r
o
r
s
WFS
AWFS, FXLMS, =30
AWFS, SVD, 4 modes
AWFS, SVD, mode 1 only
AWFS, SVD, modes 1,2 and 3
signals at each monitoring microphone for
different AWFS realizations. Square denote
WFS errors, circles AWFS by FXLMS
( = 30), AWFS by independent radiation
mode control, AWFS by AWFS control of
the rst radiation mode only and by AWFS
control of the rst to third radiation modes.
0.5 0 0.5
10
2
10
1
10
0
10
1
x
1
[m]
E
L
S

(
m
o
n
i
t
o
r
s
)
AWFS, FXLMS
SVD with first mode only
SVD with modes 1 to 3
SVD with all modes
/2
0.8575 m
/4
LS
criterion at the
monitoring sensors for harmonic algorithms at
400Hz after convergence in the laboratory
space using AWFS with w
WFS
= 0. The wave
length and some corresponding fractions are
included.
the pressure, rst-order spatial derivatives of sound pressure and second-order mixed spatial
derivative of sound pressure at the sensor array so that the plant response is not from 24 loud-
speakers to 4 microphones but from 24 loudspeakers to 4 sound eld components. In this case,
the inherent problem of higher order radiation mode convergence in the FXLMS algorithm for
AWFS with T = I can be overcome. Note that this modied adaptive algorithm still works with
a fully-coupled system. Examples of such transformation matrix for active noise control using
spatially weighted error signals or for modal control are given by [Fuller et al., 1996] and [Kuo
et Morgan, 1996].
A broadband experiment was conducted using a matrix T dened by
T =
_
_
1 1 1 1
4 0 0 4
0 4 4 0
12 12 12 12
_
_
(9.10)
so that the FXLMS algorithm now works with pressure error, two gradients errors (multiplied
by 4) and a second-order mixed spatial derivative (multiplied by 12). The amplication of the
245
0.6 0.4 0.2 0 0.2 0.4 0.6
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
2
3
4
x
1
[m]
N
o
r
m
a
l
i
z
e
d

e
n
e
r
g
i
e
s

o
f

t
h
e

e
r
r
o
r
s

WFS
AWFS, FXLMS, =50
AWFS, SVD
AWFS, TFXLMS, =200
Figure 9.30 Normalized energies of the error signals for the modied FXLMS in the
reverberant chamber. Squares denote WFS errors, circles errors of AWFS by FXLMS ( = 30,
with 512 coefcients), errors of AWFS by independent radiation mode control with 512
coefcients, and + errors of AWFS by FXLMS using pressure, pressure gradient and double
derivative control with T ,= I in Fig. 9.3 (p. 222).
nite gradients and second-order mixed difference was needed so that each corresponding errors
have roughly similar amplitudes. If a normalized FXLMS algorithm (where each of the ML
ltered reference signals are normalized [Kuo et Morgan, 1996; Elliott, 2000]) was used in
replacement of Eq. (9.6), such amplication would have been useless. A convergence coefcient
= 0.000001 was used along with a penalization parameter = 200 for the reverberant
chamber.
The resulting reproduction errors, expressed as normalized energies of the differences bet-
ween target IRs and reproduced IRs at the monitor microphones, are shown in Fig. 9.30 (p.
246) for the reverberant chamber. The FXLMS algorithm with T ,= I reaches a performance
very similar to the SVD-based algorithm. Higher order radiation modes are better controlled
than with the original FXLMS. For the laboratory space (not shown in the gures), the FXLMS
algorithm using T ,= I (as dened by the last equation) reduced the reproduction errors. But in
comparison to the FXLMS with T = I, the size of the effective region was not as large as for
AWFS based on independent radiation control.
In this modied FXLMS algorithm, the contribution and penalization of each individual
radiation mode are not achieved using independent convergence and penalization parameters
but using the transformation and scaling matrix T. It thus seems that the FXLMS algorithm
using T ,= I is a potential complementary implementation for AWFS. This would be more
246
effective than AWFS based on independent radiation mode control when the electroacoustical
plant impulse responses are too long to obtain convenient SVD synthesis and analysis lters.
Such a realization of AWFS with FXLMS working with nite spatial differences could be the
subject of further experiments and investigation as it is potentially simpler than AWFS based
on independent radiation mode control. The reported results using the transformation matrix T
should be regarded as a glimpse into a set of new possibilities.
9.6 Conclusion
This paper has investigated the objective performances of adaptive wave eld synthesis
(AWFS) to compensate for the room effects or any sound eld reproduction errors, on wave
eld synthesis (WFS) in experimental situation. The basic idea of AWFS is a simple combi-
nation of active noise control principles and classical WFS based on the Kirchhoff-Helmholtz
integral. Such a combination is entirely contained in the AWFS general cost function [Gauthier
et Berry, 2006]
14
which consists of minimization of the reproduction errors (typically caused by
the room response
15
or the system limitation [Corteel, 2006a]) at several points in space, along
with a regularization that penalizes the adaptive solution departure from the classical WFS so-
lution. This penalization is the major originality in the AWFS solution in comparison with other
sound eld reproduction techniques based on active sound control and adaptive ltering.
The results presented in this paper show that the AWFS system successfully achieves active
sound eld reproduction in more or less reective spaces : hemi-anechoic chamber, standard
laboratory space and reverberant chamber. These experiments validate the AWFS concept and
demonstrate the physical possibility of progressive sound eld reproduction in reective rooms.
For the three rooms, it was shown that AWFS based on modied FXLMS and AWFS based
on independent radiation mode control reduce the reproduction errors with respect to WFS re-
production errors in the reproduction region bounded by the circular reproduction source array.
AWFS based on independent control provides an extended effective area of sound eld repro-
duction since each radiation mode convergence is independently adjusted so that higher order
modes converge in the allowed time. Since these higher-order modes are of great importance to
enlarge the effective reproduction region, the possibility to control them independently is a ma-
jor advantage of AWFS based on independent radiation mode control in comparison to modied
14
Voir aussi les considrations exposes au chapitre 8 de cette thse.
15
Tel que montr au chapitre 4.
247
FXLMS, which does not allow such independent control of each radiation mode convergence.
From the set of experiments reported, the following conclusions can be drawn :
On the basis of a dedicated harmonic AWFS experiment, the increase of effective control
region have been mostly noticed for higher frequency where the effective control region
while including the rst four radiation modes reaches a little more than half the wave
length.
A modication to the FXLMS algorithm for AWFS including an error transformation
matrix T showed to increase the performance of FXLMS algorithm close to independent
radiation mode control. This is an interesting compromise which should be subject of
further research.
The choice between the FXLMS algorithm with an error ltering matrix T and inde-
pendent radiation control algorithm based on plant SVD depends on the situation : they
provide similar performances but the SVD-based algorithm allows for easier tuning of
each of the radiation mode while the FXLMS algorithm with T ,= I might be more
convenient for systems having long impulse responses.
One of the original contributions from these results is that they establish, for the rst time to
the authors knowledge, the validity of the AWFS concept based on independent radiation control
(including SVD broadband lters) for broadband impulse reproduction by the way of controlled
experiments. Bai and Elliott already considered SVD plant decoupling for cross-talk cancelation
[Bai et Elliott, 2004], but their paper was limited to theoretical investigations. Moreover, at the
heart of the AWFS concept, is the denition of an a priori solution (WFS) which, to the authors
knowledge, was never used nor experimentally tested within an adaptive signal processing or
active noise control architecture. Although the broadband application of AWFS was already
theoretically considered in a previous paper
16
, this paper on experimental AWFS conrms the
practical interest of AWFS.
The reported experiments were performed with a specic reproduction source and error
sensor conguration. However, AWFS is not limited to a specic conguration. These experi-
ments with AWFS were performed to evaluate the method. AWFS could be tested with different
congurations or for different practical problems : sound environment reproduction, mock-up
with sound eld simulation system, etc. A typical AWFS extension would for exemple include
more loudspeakers and more error sensors. Indeed, we expect that a larger effective reproduc-
tion region is achievable with a compact sensor array which would includes more sensors, like
a dense circular microphone array. Three-dimensional congurations of either loudspeaker or
16
On parle du manuscrit prsent au chapitre 8.
248
microphone arrays could also be implemented within the AWFS framework.
The tested AWFS system and implementation should be regarded as proto-AWFS. Indeed,
before AWFS can be used for a practical application, several modications should be done. As
an exemple, to reduce the obstruction of the error sensors in the listening area, the control lters
can be calculated off-line for the needed virtual source positions and saved, after which the error
sensors can be removed. An example of effective bank of compensation lters for WFS direct
sound eld equalization has been reported by [Corteel, 2006a]. On that matter, AWFS could
be used for WFS direct sound eld equalization as described by [Corteel, 2006a]. Moreover,
several adaptive algorithms could be applied to AWFS, such as frequency domain adaptation,
sparse adaptation, etc. [Elliott, 2001] to improve the convergence properties of the algorithm
or to reduce the computational burden. The modied FXLMS algorithm with an error-ltering
matrix T is also a promising compromise.
Future research on AWFS should be conducted within a specic practical application such as
sound environment reproduction or sound reproduction in a dedicated listening room to evaluate
the potential of the method in real situations, possibly using more reproduction sources and more
error sensors. In this specic case, AWFS and the corresponding algorithms should also be tested
and evaluated on the basis of subjective performance, that is sound localization, sound quality
or preference tests. The effects of the amount of penalization and the effect of the modelling
delay on perception should also be addressed.
In a time when more and more researchers are working on spatial sound using multichannel
electroacoustical devices for multimedia applications, it is worth noting that the current period
will decisively inuence the next generation of spatial sound reproduction systems and corres-
ponding aural culture (examples of considerations for spatial aural culture are given by [Blesser
et Salter, 2007]). As [Altman, 1992] judiciously pointed it for the very specic case of cinema
sound in the 1930s, a similar examination of the current situation in spatial sound is needed.
This discussion should take place within more general multidisciplinary debates and investiga-
tions on the very fundamental problem of conictual visions implied by either a representation
or a reproduction paradigm in multimedia displays.
249
Acknowledgments
Council of Canada), NATEQ (Fond Qubecois de la Recherche sur la Nature et les Techno-
logies), VRQ (Valorisation Recherche Qubec) and Universit de Sherbrooke. This research
has been conducted in collaboration with CIRMMT (Centre for Interdisciplinary Research in
Music Media and Technology, McGill University). The authors acknowledge the contribution
of Emmanuel Corratg who contributed to the construction of the harmonic AWFS system and
to the harmonic experiments.
250
CONCLUSION
Often called distortions, on the theory that sound recording is a science of reproduction
rather than an art of representation, the variables introduced by sounds material heteroge-
neity, along with the system constituted to record (that is, represent) it, lie at the very heart
of lm sound. R. Altman
Par le biais de cette citation de Rick Altman [Altman, 1992], on retrouve une vocation plus
complexe du point initial de lintroduction de cette thse, savoir lapparamment insoluble et
toujours actuel problme li la dualit entre les notions de reproduction et de reprsentation
en restitution sonore, quelle quelle soit. Dans la mesure o cette thse inscrit son propos dans
un contexte scientique, il est clair que la discussion qui suit et la mise en contexte des notions
dveloppes dans les chapitres prcdents ne peuvent que se dvouer principalement au premier
axe mentionn par Altman : la science de la reproduction. Dans les paragraphes qui suivent, on
accorde tout de mme une certaine place aux deux visions.
Cest ainsi que la proposition dAltman, quoique prsentant des intentions rsolument tour-
nes vers le son au cinma, saisit parfaitement un dilemme fondamental de la restitution sonore.
En pratique, il est en effet bien connu que la reproduction sonore optimale selon, par exemple,
un concensus dauditeurs dune impression auditive donne est difcilement possible dans la
mesure o tous les sujets exposs lenvironnement sonore restitu porteront des apprciations
et des jugements subjectifs qui diffront tous autant quils sont. Les impressions sont discu-
tables, variables et multiples. Et ce, dautant plus que le responsable de la reproduction sonore
donne dans la ligne des pratiques en studio tente de reprsenter sa propre exprience,
(relle ou imagine), et toute la singulire individualit quelle transporte, dun vnement, ou
environnement, sonore. Le point critique qui doit tre saisi dans cette remarque est en fait celui
de la comparaison une rfrence mobile : variable et multiple. Tous et chacun comparent la
restitution une certaine rfrence : leur propre exprience toutes diffrentes mme dans le
cas original, si cas orignal il y a. Et puis, par concision, nous nvoquons ni les critiques usuelles
envers la notion doriginal [Sterne, 2003] ni, si cet original existe, les dbats autour de ce que
251
cette appellation dsigne exactement : stimulus physique quantiable ou perception auditive.
Le constat de Altman est en parfait accord avec les pratiques actuelles ou passes pour
lenregistrement de la musique sur support xe et en cinma. Il participe mme aux dni-
tions et volutions de ces pratiques : cest une affaire de reprsentation denvironnements ou
dvnements sonores, rels ou ctifs, souvent narratifs. Cest ainsi que, systmatiquement, les
ingnieurs du son exagrent les dynamiques sonores, ltrent les enregistrements, torturent les
dimensions relatives des sources sonores, caricaturent des sonorits connues, caviardent les im-
perfections et remplacent mme certains sons vrais par dautres faux
17
, mais qui, lors dune
projection cinmatographique, collent mieux avec le corpus visuel ou accentuent affections et
perceptions de lauditeur. Tout a, donc, dans le but de rejoindre un idal de reprsentation.
Dune part du ct du crateur et dune autre part du ct de laudience et de ses attentes. Qui
plus est, ces deux extrmes et leurs coutes respectives sont inuencs par leurs cultures, leurs
connaissances et leurs gots [Schafer, 1977; Altman, 1992; Blesser et Salter, 2007]. Cest une
affaire desthtique, voire de style.
Par contre, avec quelques considrations contextuelles, on dgage vite cet apparent dilemme
de la representation et de la reproduction de toutes apories : deux paradigmes, deux contextes.
Sil est tout fait pertinent de miser sur une dmarche de reprsentation et daccentuation au
cinma, dans les jeux vidos, en situation de concert ampli et en musique enregistre comme
il le fut propos au paragraphe prcdent, dautres contextes sont en faveur dune dmarche
scientique, objective, de reproduction physique.
Cest donc, nalement, une affaire de contexte et de rfrence. Rfrence perue ou rf-
rence physique, immuable et quantiable.
Par del ces traditions bien plus propres la reprsentation qu la reproduction, la repro-
duction physique de champs acoustiques ou denvironnements sonores se taille en fait une niche
notable et en parfaite relation de diffrenciation avec les approches de reprsentation cites plus
haut. Peut-tre de faon bien moins courante dans lunivers du cinma ou des studios, on trouve
plusieurs recherches rcentes sur la reproduction physique, et non sur la reprsentation, den-
17
Dans ce cas bien prcis, il est convenu de parler de bruitage. Quoique cette pratique ne date pas dhier, elle
reste dactualit et contamine mme les dimensions sonores des jeux vidos actuels qui misent sur un bassin
dchantillons pour crer une trame sonore interactive. Les bruiteurs doivent alors imiter des sons de pas dans la
neige, sur le bois, dans la rue et toute une plthore dautres vnements sonores avec des objets et accessoires
parfois bien loin de la ralit laquelle ils seront associs.
252
vironnements sonores bruyants tels ceux des voitures [Leuridan, 2000; Genuit et Bray, 2002;
Perisse et al., 2003; Janssens et al., 2003], des simulateurs de bangs supersoniques [Epain et al.,
2004] ou des simulateurs de cabines davion
18
. Dans la plupart de ces cas, cest un contexte de
recherche scientique (par exemple psychoacoustique) ou de dveloppements technologiques
(rduction de bruit, design vibro-acoustique, etc.) qui dicte une approche de reproduction phy-
sique. Cette faon daborder le problme dcoule directement du contexte. Dans le premier cas,
soit une recherche de nature scientique, on cherche contrler les conditions dexprimenta-
tions : elles doivent tre quantiables, xes, immobiles par rapport une rfrence qui hrite
des mmes adjectifs. Dans le second cas, la reproduction physique de champs acoustiques est
souvent sollicite comme outil de conception ou comme outil dvaluation de la qualit sonore
[Becker et Sapp, 2001; Vecchio et al., 2003; Weber et al., 2003; Sorrentino, 2003; Bellmann,
2003; Keller et al., 2006]. Cet outil permet alors dcouter, a priori, lenvironnement sonore
ou le bruit dun produit avant mme la fabrication des premiers prototypes. Un autre exemple
typique de cet outil est lcoute deffets acoustiques simuls pour un produit existant donn, on
value alors des modications possibles pour ce mme produit. Cette mthode, de plus en plus
courante [Leuridan, 2000; Sottek, 2003; Perisse et al., 2003; Falch et al., 2003; Genuit et Bray,
2002; Janssens et al., 2003], permet damenuiser lampleur plus classique des problmatiques
vibro-acoustiques en ingnierie mcanique, soit la correction a posteriori des problmes sonores
dcouverts lors des premiers essais avec les premiers prototypes. Ces correctifs a posteriori im-
pliquent une boucle dessais et derreurs parfois trop coteuse. Qui plus est, elle permet dviter
une conception vibro-acoustique laveugle. Typiquement, cette mthode est un n mtissage
de mesures vibro-acoustiques sur des produits ou des prototypes existants et de modlisations
thoriques diverses (quoique plus couramment bases sur des modles de sources et de chemin
de transfert, sur la SEA [Statistical Energy Analysis], etc.). On note ce sujet la proximit
technique de telles approches, synthses physiques de bruits, denvironnements sonores ou de
lieux, avec les techniques de synthse sonore en musique qui se basent sur la modlisation phy-
sique dinstruments de musique ou dobjets mcaniques [Cook, 2002]
19
. Quest-ce qui dans ces
exemples favorise donc une approche de reproduction physique ? La rponse est simple : on
cherche une reproduction sonore prvisionnelle sur la base de paramtres physiques connus et
18
[Morelli, 1995; Begault, 1998; He et al., 1998; Weber et al., 2003; Sorrentino, 2003; Bellmann, 2003; Sottek,
2003; Krebs et al., 2003; Hamann et al., 2004; Hsiao et al., 2004; Rizzi et Sullivan, 2005; Keller et al., 2006;
Chevret et al., 2006; Shi et al., 2006]
19
La modlisation physique dinstruments de musique ou dobjets mcaniques vibrants est aussi de plus en plus
utilise pour le jeu vido pour lequel la trame sonore doit tre la fois crdible et interactive. La modlisation
physique pour la synthse de sons permet par exemple la gnration de bruits de pas bien plus varis et dynamiques
que de tels bruits qui seraient uniquement bass sur des enregistrements sonores de pas en diffrents lieux, sur
diffrentes surfaces. De tels exemples sont dcrits par Cook [Cook, 2002].
253
contrlables dans une dmarche dingnierie de la conception, et on se doit de pouvoir tablir
un lien paramtrique clair et explicite entre les variables de conception et une perception sonore
subjective individuelle.
On revient donc la rfrence comme contexte diffrenciateur pour la reprsentation et la
reproduction. Comme on vient de le voir pour la reproduction, la rfrence est externe, inva-
riable et unique, dnie sur une base de paramtres physiques. Lors de telles ralisations, on se
doit par contre de valider physiquement la reproduction : valuation objective de la reproduc-
tion par rapport ce qui doit tre reproduit. Les imprcisions physiques, ou les distortions va-
riables comme les appelle Altman, devront donc tre acceptes comme telles dans un contexte
de reproduction et, ultimement, la perception rsultante, ou plutt, les perceptions individuelles
rsultantes seront peut-tre inuences par de telles distortions mais elles seront, au moins, rap-
portables une base de paramtres objectifs qui permettent par exemple des modications de
design ou ltablissement dune observation dont la scienticit ne peut tre mise en doute.
10.1 Structure de la conclusion
Cette conclusion est divise en quelques sections thmatiques. Dans un premier temps, une
discussion gnrale des rsultats est expose la section 10.2. En une telle section, on tente
de fournir une discussion intgrant tous les chapitres de cette thse tout en ouvrant chacun des
thmes spciques vers des amliorations ou des axes de recherche complmentaires possibles.
Suivant ce rappel des rsultats et observations, un rsum gnral situe loriginalit principale
de la recherche tout en identiant les mcanismes de recherche qui furent loeuvre pour ce
projet de doctorat (section 10.3). Plusieurs perspectives de recherche pour des travaux hypoth-
tiques ou futurs sont nonces et mises en contexte aux sections 10.4 et 10.5 dans lesquelles
on aborde dabord des perspectives techniques spciques puis des perspectives technologiques
plus gnriques qui touchent les axes que nous souhaiterions dvelopper.
10.2 Discussion et rappel des rsultats
Lensemble des observations et des rsultats prsents dans cette thse sont maintenant pas-
ss en revue. On favorise une vision large qui mise sur une srie de questions de recherche et
qui, en plus de formaliser le raisonnement propos dans cette thse, suivent les divisions par
254
chapitre de la thse.
Dans un premier temps, il fut possible de rpondre une premire question gnrale, savoir
quelles sont les techniques de reproduction de champs acoustiques, par lentremise dune revue
de littrature complte (chapitre 2). Cette revue, en proposant dabord une classication gn-
rale, recouvre lensemble des techniques de spatialisation sonore. Dans un contexte de simula-
tion de champs acoustiques, une distinction fut pose entre le problme intrieur et extrieur, se-
lon la position relative de laudience par rapport aux sources acoustiques de reproduction. Dans
le cadre des problmes intrieurs de reproduction, les deux techniques les plus classiques sont
la WFS et lAmbisonie. Tel que montr la section A.6, les quations de lAmbisonie peuvent
tre obtenues partir de la WFS suivant un certain nombre de conditions et hypothses. Cest
ainsi que lAmbisonie est un cas particulier et limit de la WFS. Le point faible de lAmbisonie
dcoule de son application approximative dans la pratique courante. Souvent, les utilisateurs
ne connaissent pas les fondements de lAmbisonie et les hypothses fondamentales ne sont pas
respectes. Aussi, les deux hypothses de base de lAmbisonie classique ne sont que trs peu
souvent respectes : situation de reproduction dnie par un champ libre et ondes planes comme
sources de reproduction. La WFS souffre elle aussi de certaines de ces hypothses de base, no-
tamment celle comme quoi le lieu de reproduction est aussi un champ libre. Ce sont donc les
points faibles des techniques de reproduction de champs acoustiques les plus communes.
Suivant un intrt initial plus marqu pour la WFS, il fut ncessaire de se questionner sur
la qualit objective de la reproduction par WFS dans une situation relle, un studio dcoute
dans notre cas. Des mesures de rponses impulsionnelles reproduites au niveau dune antenne
de moniteurs furent effectues pour diffrentes positions de sources virtuelles (chapitre 4 et an-
nexe C). Les rponses rsultantes dmontrent clairement que la WFS parvient reproduire le
champ direct du champ acoustique reproduire. Par contre, suivant le passage du champ direct,
les ondes diffractes et rchies par le lieu de reproduction creusent un cart majeur entre le
champ acoustique reproduire et le champ reproduit. Typiquement, ces artfacts trouvent cho
dans les fonctions de rponse en frquence mesures : colorations remarquables et indsirables,
apparition de formants de salle et de crevasses dans les rponses en frquence. Toutes ces obser-
vations forment des points qui sont devenus des axes damlioration possible de la reproduction
de champs acoustiques laide du contrle actif. Par contre, si de telles mesures de champs
acoustiques reproduits taient refaire, diffrents aspects devraient tre amliors : un nombre
plus important de sources virtuelles, couvrir une plage de distances de sources virtuelles plus
vaste pour valuer la courbure des fronts dondes reproduits, procdure dvaluation subjective
simultane et mesures spatiales de la rponse acoustique de la salle an didentier avec cer-
255
titude la prsence des modes de rsonance ou des formants de salle. Il reste que les rsultats
prsents au chapitre 4 sont nettement sufsants pour illustrer les dfaillances de la WFS en
salle sur une base de critres objectifs.
La troisime question de recherche fut par la suite pose an dvaluer lhypothse initiale
du projet : savoir sil est possible dutiliser des techniques issues du contrle actif du bruit pour
lamlioration de la reproduction de champs acoustiques. Dans cette perspective, le chapitre 5
prsente des rsultats de simulations thoriques. Le problme de la reproduction de champs
acoustiques fut alors pos, pour une cavit rectangulaire en trois dimensions (voir section A.1),
comme une fonction cot visant la minimisation de la somme des erreurs quadratiques de repro-
duction en un certain nombre de points de lespace avec une chantillonnage spatial rgulier.
la lumire de ces simulations prliminaires, il fut vite possible de conclure que la minimisation
des erreurs de reproduction permet effectivement de reproduire une onde progressive virtuelle.
Du coup, ces simulations illustrent la possiblit physique de produire des champs acoustiques
progressifs dans des lieux dont les dimensions et le temps de rverbration correspondent aux
recommandations typiques pour les salles dcoute disposant de systmes strophoniques
plus de deux voies. Ce qui constitue une premire originalit de cette thse. Cette orginalit
est aussi renchrie par des considrations au niveau des mcanismes physiques impliqus dans
la reproduction dondes progressives dans des espaces clos. Il fut montr que ces mcanismes
varient selon le rapport de la frquence dintrt la frquence de Schroeder. La conclusion
essentielle de ce premier chapitre doriginalit est simple : les techniques de contrle actif du
bruit peuvent tre transposes vers le problme de la reproduction de champs acoustiques. Des
informations complmentaires sont aussi prsentes la section A.1 et lannexe B.
Alors que lhypothse favorisant lusage des techniques de contrle actif du bruit dans un
contexte de reproduction de champs acoustiques fut valide, la question ncessitant une consi-
dration est celle concernant la mthode dhybridation entre la WFS et le contle actif an
damliorer les performances objectives de la WFS. Cet aspect fut dabord touch au chapitre
6 dans lequel lAdaptive WFS (AWFS) fut dnie comme une minimisation de la somme
des erreurs quadratiques de reproduction et une pnalisation de Tikhonov avec solution a priori
[Hansen, 1998]. Pour intgrer le contrle actif la solution WFS xe, la solution a priori de
lAWFS est, justement, la WFS. Dans un contexte de reproduction de champs acoustiques, et
peut-tre mme dans un contexte plus large (acoustique, vibration, problmes inverses en acous-
tique, contrle actif du bruit), cest une des plus importantes originalits de cette thse. Comme
chapitre de dnition de lAWFS, le chapitre 6 a prsent une vision extrieure lAWFS : en
passant par un certain nombre de simulations, une tude comparative fonctionnant cas par cas,
256
selon la gomtrie, a offert une premire validation de lide de lAWFS sans toutefois fournir
une analyse dtaille de lAWFS.
Ce qui amne la quatrime question de recherche : savoir quels sont les mcanismes
propres lAWFS. Et cela, dans le but ventuel den tirer prot, que ce soit au niveau de la
conception dun systme dAWFS, de la comprhension des facteurs et paramtres dimpor-
tance ou au niveau des ralisations en traitement du signal. Les mcanismes fondamentaux
de lAWFS furent tudis au chapitre 7 (et aussi la section A.3 la page 302) avec la d-
composition en valeurs singulires du systme lectroacoustique. Ce chapitre a mis en relief
limportance du contrle indpendant des modes de rayonnement entre les sources de repro-
duction et les capteurs de lerreur de reproduction. Tel quillustr la section A.3, les modes
de rayonnement dordre plus levs sont dune importance remarquable dans llargissement de
la zone de rduction de lerreur par lAWFS. Quoique ce premier contact avec les mcanismes
internes propres lAWFS fut sufsant pour poursuivre les recherches, diffrentes dimensions
mriteraient dtre tudies plus en profondeur : considrations tridimensionnelles, effet tho-
rique de paramtres de rgularisation indpendants pour chacun des modes de rayonnement
20
et
inuences de la conguration gomtrique des antennes de sources et de capteurs de lerreur.
Suivant la dnition de lAWFS et la comprhension de ses mcanismes fondamentaux
propres, la cinquime question de recherche approche les applications pratiques et concerne
les laborations des algorithmes de traitement du signal adaptatif pour la ralisation de lAWFS
dans le domaine temporel. Ces algorithmes furent dnis au chapitre 8. Des modications au
leaky FXLMS classique amnent son quivalent pour lAWFS. Les proprits de convergence
de cette version modie du FXLMS sont proches de la version originale et sont notamment ca-
ractrises par une lente convergence des modes dordre suprieur puisque le coefcient de
convergence maximal est essentiellement born par le premier mode de convergence de lalgo-
rithme. Pour la conguration tudie dans cette thse, les modes dordre suprieur correspondent
des drives spatiales dordre suprieur au niveau des capteurs de lerreur et permettent donc
llargissement de la zone effective de reproduction active de champs acoustiques. Cest dans
cette mesure que lAWFS base sur le contrle indpendant des modes de rayonnement devient
des plus intressantes : elle permet le n contrle des proprits individuelles de convergence de
chacun des modes et les modes dordre suprieur peuvent donc converger en un temps conve-
nable. Ainsi, pour ce second algorithme dAWFS, mme si les erreurs de reproduction rsi-
duelles aux capteurs de lerreur sont comparables celles du cas trait par FXLMS modi,
20
Cet aspect ne fut pas abord dans le chapitre 7 mais sut mriter notre attention lors des simulations en traitement
du signal en AWFS et lors des exprimentations (chapitres 8 et 9).
257
la zone effective est largie dans lespace. Les modes dordres suprieurs (auxquels corres-
pondent de plus faibles valeurs singulires) prsentent en effet des erreurs de reproduction bien
plus ngligeables dans lerreur totale au niveau des capteurs de reproduction que le premier
mode qui domine lerreur de reproduction au niveau de ces mmes capteurs. Ces observations
sont en accord avec celles poses au chapitre 7. Au-del des thmes abords au chapitre 8, il
est ais den imaginer dautres dignes dattention : tudes spciquement ddies au couplage
des modes de rayonnement avec la dgradation de la dcomposition en valeurs singulires,
tudes des variations des modes de rayonnement en fonction de la frquence, dveloppement
dautres algorithmes de rarrangement des modes de rayonnement, dveloppement dautres al-
gorithmes (domaine frquentiel, ltres en treillis, warped FIR, etc.) et tude de linarit de
ladaptation. Une ralisation dans le domaine frquentiel est surement celle qui est la plus digne
dintrt dans limmdiat. Elle permettrait possiblement lusage dun paramtre de pnalisation
variable en fonction de la frquence. En effet, pour linstant, lintensit de la pnalisation nest
pas seulement dtermine par le paramtre de rgalurisation, mais bien par sa valeur relative
la valeur singulire correspondante (voir lannexe A). Cest ainsi quun paramtre indpendant
de la frquence, tel que pos dans cette thse, introduira une pnalisation variable en fonction de
la frquence, selon lvolution frquentielle des valeurs singulires. La ralisation de lAWFS
avec un algorithme dans le domaine frquentiel permettrait possiblement de compenser cette
variabilit.
Ces algorithmes crs pour lAWFS permettent le passage de la thorie la pratique et donc,
de se questionner sur lefcacit de lAWFS exprimentale. Cest le dernier thme de cette thse
qui fut prsent au chapitre 9. Deux types de ralisations sont sollicits pour lvaluation exp-
rimentale de lAWFS : AWFS en ligne pour des champs harmoniques et AWFS hors ligne pour
des champs large bande (toujours limite par le repliement spatial). Les exprimentations en
AWFS harmonique ont permis de mieux visualiser la taille de la rgion de reproduction efcace
en fonction de la frquence. Il fut observ, en accord avec les pratiques en contrle actif du
bruit, que la taille de la rgion de reproduction efcace est plus grande en basses frquences
quen hautes frquences et que, principalement, lalgorithme dAWFS bas sur le contrle in-
dpendant des modes de rayonnement offre la possibilit, comme suggr plus tt, dlargir la
taille de cette rgion, mme en plus hautes frquences, en permettant la convergence des modes
de rayonnement dordres suprieurs par le biais de coefcients de convergence plus levs pour
ces modes, autrement, ralentis ou surpnaliss. Soit un avantage notable de cet algorithme. Pour
vrier lefcacit de lAWFS reproduire un champ acoustique et attnuer leffet du lieu de
reproduction, chacune de ces deux ralisations fut teste dans trois lieux diffrents (voir la sec-
tion C.4.3 la page 401). Les lieux choisis partent dun espace semi-anchoque, deffet rduit,
258
un espace de laboratoire quelconque, deffet mixte entre champ direct et rverbr au niveau
des capteurs de lerreur, puis une chambre rverbrante, deffet majeur aux capteurs de lerreur
qui sont alors domins par le champ rverbr. Dans les trois lieux, les ralisations large bande
ou harmonique de lAWFS ont su amliorer la reproduction de champs acoustiques et rduire
leffet du lieu de reproduction en comparaison avec la WFS et ce, de faon remarquable. Ce qui
valide les hypothses poses tout au long de cette recherche, rejoint lobjectif principal de cette
recherche et conrme lintrt des ides originales inclues dans la dnition de lAWFS. On
note aussi une bonne consistance entre les rsultats prsents dans ce chapitre concernant les
exprimentations et les formes thoriques des modes de rayonnement prsentes ds le chapitre
7. En plus des algorithmes dvelopps au chapitre 8, une simple modication supplmentaire
de lalgorithme FXLMS pour lAWFS fut effectue la lueur des acquis issus de lAWFS ba-
se sur le contrle indpendant des modes de rayonnement. Cette modication simple permet
de contrler les modes de rayonnement dordre suprieur tout en vitant la dcomposition en
valeur singulire du systme lectroacoustique. Cest une piste de recherche intressante pour
la suite des travaux sur lAWFS.
Parmi les dimensions voques dans les deux derniers chapitres, une dentre elles mrite-
rait une attention qui devrait se concrtiser pour parachever les dveloppements sur lAWFS.
On rappelle dabord lintrt de pnaliser de faon indpendante les modes de rayonnement
en AWFS par le biais des
i
. En pratique, ce paramtre est un paramtre dutilisation laiss
la discrtion de lutilisateur qui pourrait alors passer de la WFS classique lAWFS ou une
sorte dAmbisonie modie et ralise en boucle ferme (voir la section 7.8.1 la page 160 ce
sujet). Cette possibilit ajoute une avantageuse exibilit lAWFS en pratique. Par contre, lef-
fet des paramtres indpendants de pnalisation nest pas ncessairement simple et clairement
concevable pour un utilisateur. On pourrait ainsi penser une rgle de dduction des paramtres
indpendants de rgularisation partir des valeurs singulires des modes de rayonnement et
dun paramtre de pnalisation utilis pour le premier mode. Un exemple simple serait ( la
lumire des considrations sur les facteurs de ltrage la section A.3.4) :
i
=
1
2
i
/
2
1
o les
i
pourraient tre les valeurs singulires moyennes en frquence. Lutilisateur ne xerait alors
quun seul paramtre :
1
. Ce genre de rgle mriterait dtre valid en pratique, autant selon
un point de vue objectif que subjectif. Une autre rgle de dduction des paramtres de pnali-
sation pour chaque mode de rayonnement pourrait tre la suivante :
i
=
2
i
. Elle est inspire
des proprits des facteurs de ltrage (section A.3.4). Par contre, toutes ces rgles rduisent
potentiellement la exibilit inhrente au contrle indpendant des modes de rayonnement, soit
lajustement, au besoin, des paramtres de chacun des modes.
259
Figure 10.31 Modle dynamique du couplage entre recherche (connaissances),
dveloppement technologique (applications) et innovation (ventes) selon Stokes et Nicolas
(2006). Dans le cadre de cette thse, on part de la WFS vers lAWFS en sollicitant des
connaissances fondamentales existantes.
Dans lensemble, cest ce qui complte le rappel et la discussion des rsulats. Les points
discuts et ouverts sur des considrations futures taient trs proches des ralisations effectues
lors de cette thse. Ils peuvent donc tre vris facilement avec les moyens actuels. Les sections
suivantes soulignent loriginalit de la recherche selon une vision plus gobale et posent des bases
dides qui sassemblent pour former des perspectives de recherche plus larges dans la ligne
de lAWFS.
10.3 Rsum du processus et des originalits de la recherche
Une faon simple et lgante de comprendre la dynamique et les mcanismes de recherche
impliqus dans le cadre de ce projet consiste projeter les activits de recherche ralises sur un
modle dynamique gnral de la recherche, du dveloppement et de linnovation. Cette approche
permet aussi de souligner, tout en les structurant, la contribution et loriginalit propres aux
travaux prsents. Un tel modle est expos la gure 10.31 (p. 260) qui prsente, de bas en
haut, les transformations possibles des trois types (connaissances, applications et ventes) selon
cinq processus diffrents identis au centre de la gure.
Pour lamlioration de la reproduction de champs acoustiques laide du contrle actif, le
260
point de dpart est la synthse de champs de type WFS, soit une technologie connue. De l, par
une recherche applique, lAWFS est atteinte grce des connaissances mathmatiques exis-
tantes (problmes inverses [Hansen, 1998], rgularisation de Tikhonov avec ou sans solution a
priori [Hansen, 1998] et dcomposition en valeurs singulires de matrices [Lancaster et Tisme-
netsky, 1985]). En parallle la WFS, on peut aussi classer lAmbisonie et le contrle actif du
bruit dans les technologies et connaissances existantes qui ont marqu la naissance de lAWFS.
Le projet passe donc principalement par deux transformations dapplications et de connais-
sances pour rejoindre une technologie originale. On note aussi que la dnition de lAWFS a
permis dtablir des connaissances amliores au sujet de liens numriques et conceptuels pos-
sibles entre WFS et Ambisonie (chapitre 7). Ce qui, dans loptique du modle de la gure 10.31
(p. 260), ajoute une troisime transformation dans le projet damlioration de le reproduction
de champs acoustiques. Les originalits principales de cette thse et les points diacritiques sont
donc disposes le long de ces trois axes de transformations de techniques et de savoirs connus.
10.4 Intgration des rsultats de recherche aux pratiques actuelles en reproduction
spatiale du son, considrations pratiques et ouvertures diverses
Cette section offre des pistes de discussion au sujet de lintgration possible de lAWFS ou
des connaissances produites dans ltat actuel des pratiques et des technologies de spatialisation
sonore. Diffrentes pistes sont abordes. En comparaison avec la section 10.2 qui a prsent des
possibilits trs proches des travaux prsents dans cette thse, la prsente section favorise un
point de vue plus large et moins strict.
10.4.1 De la WFS vers la AWFS
Depuis quelques annes, soit mme aprs le commencement de ce projet de recherche en
2003, la WFS a gagn en visibilit et en usage en dehors des sphres de recherche auxquelles
elle tait initialement inscrite. Cest ainsi que lon note lexistence de compagnies (IOSONO,
Sonic Emotion etc.) offrant des solutions WFS commerciales et mme, depuis peu, des logiciels
libres pour la WFS (Wonder et BruteFIR par exemple ; Wonder est linterface graphique
et le programme qui gnre les oprateurs de la WFS alors que BruteFIR effectue le ltrage
en temps rel des frquences dchantillonnage audio). Ces dispositions rcentes ont favoris
la popularit des systmes WFS.
261
Mme si, dans cette thse, lAWFS fut labore sur des plateformes comme Matlab, il se-
rait possible et intressant de convertir ces programmes en quivalents plus courants. On pour-
rait, par exemple, dabord intgrer les capacits des Java Sound Applets
21
dans Matlab pour
ensuite penser une application dAWFS entirement construite en Java. Une des limitations
actuelles de lAWFS large bande vient de sa ralisation en temps diffr. Cet obstacle pour-
rait tre aisment contourn par, justement, toute la reconstruction des codes informatiques de
lAWFS. Dans la mesure o le systme prsent dans cette thse fut dvelopp pour les pilotes
ASIO, il est tout fait pensable dimaginer une version de lAWFS qui soit plus proche du
streaming en temps rel avec des pilotes plusieurs pistes comme ASIO. Une telle approche
permettrait le dpart et larrt de fonctions indpendantes interagissant avec les pilotes ASIO
en temps rel. Cette dimension constitue une piste de dveloppement qui pourrait tre explore
pour la popularisation de lAWFS. Il est aussi probable que ces possibilits soient intgres aux
suites du projet (voir la section 10.5 sur les ouvertures de recherche court et moyen terme).
Dans ces optiques de dveloppement, il est pensable dimaginer la combinaison de lAWFS
aux applications plus populaires de la WFS.
10.4.2 Utilisation de plusieurs antennes de microphones compactes en AWFS et
encombrement de la zone dcoute
Le systme principal prsent dans cette recherche tait centr autour dune antenne com-
pacte faite de quatre capteurs. Des simulations et des analyses par dcomposition en valeurs
singulires furent par contre aussi ralises pour dautres congurations dantennes de micro-
phones.
Parmi ces autres vrications, on trouve lexemple de plusieurs antennes de microphones
compactes mais spares dans lespace. En termes concrets, on pense par exemple deux an-
tennes compactes de quatre microphones (comme celle tudie dans la thse) dispose en des
zones plus ou moins loignes (loignes en ce sens o le critre dchantillonnage spatial ne
serait pas respect). Une telle conguration serait en fait une rponse une critique vidente que
peut recevoir le systme dAWFS prsent dans cette thse : savoir lencombrement central
de lantenne des capteurs de lerreur. Dans la mesure o cette thse avait comme objet principal
llaboration et ltude dune technique de reproduction physique, cette critique reste secon-
21
Voir le site http ://www.jsressources.org ce sujet.
262
daire. Par contre, lutilisation de plusieurs antennes compactes (encore plus denses que celles
utilises dans cette thse, on pense par exemple au microphone quatre capsules de Sound
Field Research) permet de dgager une zone dcoute tout en sondant lerreur de reproduction.
Plus spcialement et par le biais de simulations thoriques, la dcomposition en valeurs
singulires de systmes plusieurs antennes de microphones compactes a dmontr des pro-
prits remarquables. Les modes de rayonnement restent tous comparables aux composantes
Ambisoniques (telles que dveloppes au chapitre 7). On observe par contre des couples de
composantes Ambisoniques chaque antenne compacte. Par exemple, si le premier mode de
rayonnement correspond lvaluation de la pression en phase aux deux antennes compactes,
le deuxime mode correspond quant lui lvaluation de la pression hors-phase aux deux an-
tennes compactes. Et il en est de mme pour les autres modes de rayonnement : les gradients en
phase aux deux antennes forment un mode de rayonnement alors que les deux mmes gradients
hors-phase aux deux antennes forment typiquement le mode de rayonnement suivant. Ces ob-
servations supportent et largissent les liens entre WFS, AWFS et Ambisonie tout en soulignant
des avenues de recherche possibles pour lAmbisonie plus classique. Qui plus est, les modica-
tions nales de lalgorithme FXLMS pour lAWFS (chapitre 9) peuvent toujours tre ralises
partir de lallure des modes de rayonnement obtenus par la SVD du systme.
Il est fort parier que lusage de plusieurs antennes de microphones compactes pourrait, dans
le cas de systme denvergure plus importante, largir la zone efcace de lamlioration de la
reproduction tout en librant de lespace dcoute. Pour amliorer des ralisations pratiques, on
peut aussi penser lusage dantennes de microphones trs compactes, commerciales
22
ou non.
De telles antennes ou grappes de microphones sont tellement compactes que lencombrement
peut tre rduit de faon signicative. Si lantenne devient trs compacte, avec des distances
de sparation de lordre du centimtre, lappariement en phase des microphones devient plus
critique et mriterait des considrations supplmentaires.
Une autre implication de lusage dantennes de microphones compactes est lie avec lchan-
tillonnage spatial qui samliore avec la compacit croissante de lantenne (rduction des dis-
tances de sparation). Des tudes analytiques et thoriques au niveau du repliement spatial im-
pliqu par des sources de reproduction dont la distance de sparation est plus importante que
celle associe aux capteurs de lerreur devraient aussi tre entreprises dans loptique des possibi-
lits mentionnes. Il est ainsi peut-tre possible de repousser la frquence de repliement spatial
de la reproduction de champs acoustiques par contrle vers les hautes frquences sans devoir
22
Le microphone Ambisonique de Sound Field Research semble encore tout dsign.
263
user dune densit de sources de reproduction qui de la pratique.
10.4.3 Murs de haut-parleurs et acoustique des salles variable
Comme on les retrace souvent dans les livres et les publications en acoustique des salles,
certains systmes lectroacoustiques sont proposs comme des solutions au problme dacous-
tique des salles variable [Berkhout et al., 1993; Jouhaneau, 1997; Kuttruff, 1999] : prolongement
articiel ou changement du temps de rverbration [Kleiner, 1990; Kawamura et al., 1993; Ber-
khout et al., 1993; Poletti, 2003], etc. Typiquement la WFS avait dj t propose pour la
production dune acoustique des salles variable avec des considrations spatiales plus nes que
celles des solutions proposes auparavant. Dans certains cas, on imagine des grilles de haut-
parleurs disposes sur des murs qui permettent alors la synthse en temps rel de rexions
acoustiques virtuelles [Blesser et Salter, 2007]. Il ne devient pas seulement question dajou-
ter une rverbration une prise de son effectu sur scne, mais bien de modier la rexion
des lieux pour crer des rexions virtuelles qui sont dictes par lincidence des ondes directes
sur la paroi active, peu importe leurs provenances. On parle vraiment dacoustique des salles
virtuelles.
Les grilles, ou les murs, de haut-parleurs et de microphones ont t, dans le cas de recherche
spcique [Bravo et Elliott, 2004], utiliss pour la synthse dun champ de pression acoustique
diffus sur un plan faisant face un chantillon de partition devant subir une mesure de trans-
mission dans des conditions de laboratoire typiques : entre une chambre rverbrante et une
chambre semi-anchoque (ou anchoque). Lobjectif est alors de compenser pour les imper-
fections de la chambre rverbrante qui, habituellement, ne respecte pas la dnition de champs
diffus ncessaire la mesure de perte par transmission.
Les notions propres aux dveloppements de lAWFS proposes dans cette thse pourraient
ventuellement tre modies pour de telles applications. Cest une piste de recherche envisa-
geable.
264
10.4.4 Reproduction de champs acoustiques par rduction de la diaphonie et modication de
lAWFS
Une des limitations de lAWFS vient de ladaptation du systme qui implique la prsence de
microphones de mesure dans lespace de reproduction. Une solution ce problme est base sur
ladaptation de lAWFS la rduction de la diaphonie applique la reproduction de champs
acoustiques. La solution est simple, au lieu de tenter de reproduire un champ virtuel prescrit,
on cherche reproduire une pression blanche un seul des quatre microphones, les autres ne
devant pas voir de pressions acoustiques leurs membranes. On rduit donc la diaphonie entre
les microphones. Si lopration est rpte autant de fois quil y a de microphones (supposons
encore M), les M groupes de ltres de contrle rsultants peuvent tre par la suite aliments
par M signaux quelconques qui sont en fait les signaux dsirs aux microphones. Cette seconde
opration ne ncessite plus la prsence des microphones dans lespace de reproduction lors de
la restitution et rgle donc possiblement le problme de lencombrement. Cette approche peut
tre dautant plus facile utiliser que lapplication est spcique (pour une installation xe).
Elle pourrait, par exemple, tout fait remplir les besoins de la reproduction denvironnement
bruyants tels quexposs plus loin.
10.4.5 Simplications pour des usages Ambisoniques courants
tant donn le lien clair entre les composantes Ambisoniques classiques issues de trans-
formations spatiales de champs acoustiques reproduire et reproduit sur la base de sries de
Fourier-Bessel (harmoniques cylindriques) et lanalyse de systmes lectroacoustiques laide
de la dcomposition en valeurs singulire (SVD), il semble que des recherches pourraient tre
guides par la possibilit de fournir des composantes Ambisoniques adaptes des congura-
tions pratiques relles. En effet, les quations Ambisoniques viennent dun modle thorique
simpli lextrme : sources de reproduction sans coloration crant des ondes planes et espace
de reproduction inni. Avec la SVD, il serait possible dextraire les composantes Ambisoniques
partir dun systme rel identi. Cest une piste de dveloppement qui prend naissance grce
aux travaux labors dans cette thse.
265
10.4.6 Type de sources de reproduction
Mme si le concept damlioration de la reproduction de champs acoustiques par AWFS fut
valid exprimentalement avec un systme de haut-parleurs lectrodynamiques, dautres sources
lectroacoustiques pourraient tre utilises pour lAWFS. Certaines de ces sources, comme les
panneaux lectroacoustiques, ont dj offert dexcellents rsultats au niveau de lapprciation
subjective de la WFS. Des sources acoustiques misant sur la vibration de panneaux ou de pa-
rois murales avec des actionneurs inertiels ont dj aussi offert de bons rsultats en WFS. Point
remarquable ce sujet : toutes ces sources lectroacoustiques sloignent bien plus que les
haut-parleurs lectrodynamiques avec cabinet du modle utilis la base du dveloppement de
la WFS, soit la source ponctuelle. LAWFS pourrait donc potentiellement compenser toutes ces
erreurs supplmentaires de diffrence entre le modle de source et la source relle de reproduc-
tion pour la WFS. Dans une voie oppose, des sources lectroacoustiques linaires verticales
23
appartiennent un autre type de sources de reproduction qui, contrairement aux deux prc-
dents, sapproche des modles de sources linaires de la WFS
24
. Ce genre de sources pourrait
aussi tre utilis pour lAWFS. Par contre, en comparaison avec des haut-parleurs lectrodyna-
miques, tous les autres types de haut-parleurs mentionns sont bien plus dispendieux. Ce qui
peut donc limiter leurs usages courants dans un contexte de WFS ou dAWFS.
10.4.7 Application la strophonie et la rduction de la diaphonie
Plusieurs savoirs qui proviennent du dveloppement et de la dnition de lAWFS pourraient
tre transfrs la rduction de la diaphonie pour deux haut-parleurs et deux capteurs de lerreur
de reproduction (aux positions des oreilles de lauditeur) comme on le retrouve dans le Stro-
Dipole [Kirkeby et al., 1998], dans les travaux de Bai [Bai et Elliott, 2004], notamment, et
dans plusieurs cas gnraux [Ward et Elko, 1999; Kirkeby et al., 1999; Kim et al., 2002]. Par le
dcouplage du systme par SVD, on recoupe les travaux de Bai [Bai et Elliott, 2004] qui mrite-
raient une dmonstration exprimentale et des tudes plus appronfondies. On note demble que
les rsultats thoriques et exprimentaux prsents dans cette thse supportent lintrt du pr-
conditionnement du systme tel quexpos par Bai qui avait, originalement, limit ses parutions
des considrations thoriques. Cest ainsi que les variantes des algorithmes de rarrangement
de la disposition des modes de rayonnement avant la production des ltres temporels correspon-
23
La corporation Bohlender Graebener fabrique par exemple des sources verticales de presque deux mtres.
24
Certaines adaptations de la WFS seraient tout de mme prvoir.
266
dant aux ltres de synthse et aux ltres danalyse (voir le chapitre 8) pourraient tre appliqus
lapproche de Bai qui, selon nos suppositions, devraient grandement amliorer la qualit des
ltres de dcouplage et de blanchiment utiliss par Bai. Dans tous les cas, ce transfert des acquis
au niveau de la cration des ltres de dcouplage devrait tre tudi pour en valuer le poten-
tiel dans un contexte de rduction de la diaphonie pour un systme deux haut-parleurs et deux
capteurs de lerreur. Lalgorithme modi de FXLMS pour lAWFS fonctionnant sur la base des
diffrences spatiales nies (chapitre 9) pourrait aussi tre sollicit pour ce genre dapplications.
10.4.8 Aspects de recherche divers
Parmi les points de recherche prsents dans cette thse, et de faon plus pointue, certains
aspects techniques ou thoriques prcis pourraient faire lobjet de nouvelles recherches ou dap-
profondissements. La liste suivante prsente les plus importants de ces points sans toutefois les
dcrire de faon aussi ne que dans les paragraphes prcdents.
tude de la relation entre lexpansion en valeurs singulires dune fonction continue (et
son quivalent discret utilis au chapitre 7) applique en acoustique avec les descriptions
de champs transforms (Fourier-Bessel, harmoniques sphriques, etc) pour la reproduc-
tion de champs acoustiques [Hansen, 1998; Williams, 1999; Poletti, 2000, 2005].
tude de la dcomposition en valeurs singulires pour des antennes de sources planes ou
sphriques et des antennes de capteurs en trois dimensions.
tude de la dcomposition en valeurs singulires pour des systmes de reproduction en
trois dimensions (antennes de sources et de capteurs). Il serait intressant dtendre un
lien plus gnral (en passant par lexpansion en valeurs singulires) avec les thories
gnrales en deux (et trois) dimensions de la reproduction et de la description de champs
acoustiques [Poletti, 2000]
Approfondissement de la mthode de construction de ltres de dcouplage et des ltres
du noyau dune matrice par dcomposition en valeurs singulires.
tudes paramtriques sur leffet des paramtres gnraux du contrleur AWFS (nombre
de coefcients, etc.).
Approfondissement de lutilit et de lusage de lalgorithme FXLMS pour lAWFS base
sur les diffrences spatiales nies.
Les connaissances acquises lors de cette recherche ont aussi donn naissance des ides qui
ne sont pas lies directement la reproduction de champs acoustiques mais qui pourraient faire
267
lobjet de recherches caractre fondamental, de dveloppements technologiques et dintrts
commerciaux considrables. La liste suivante prsente une courte description de quelques ides
de recherche. Les propositions demeurent gnrales pour viter une divulgation systmatique
dides originales.
Cration de rverbration articielle diffuse sur des canaux synthtiss partir du noyau
des fonctions de transfert directes dun systme de reproduction sonore (5.1, etc.).
Cration de canaux de diffusion de sons dambiance ou de sons diffus partir du noyau des
fonctions de transfert directes dun systme de rerproduction sonore (5.1, etc. ou mme
les systmes utiliss pour la reproduction denvironnements sonores).
Analyse de rseaux de microphones, utiliss en prise de son [Rumsey, 2001; AES Staff
writer, 2005], par le biais de la dcomposition en valeurs singulires.
Rduction de la diaphonie par ltrage adaptatif lors de la prise de son multipiste en si-
multan (application aux enregistrements de batterie ou mme la prise de son pour la
reproduction et la synthse denvironnements sonores bruyants).
Mthode de synthse optimale de ltres du noyau et des ltres des modes de rayonnement
dun systme lectroacoustique.
Application des mthodes de traitement de limage numrique pour la localisation dirr-
gularits et lidentication de motifs dans des mesures vibratoires ou acoustiques.
Pour la pnalisation dans les problmes inverses en gnral : tude des fonctions de base
des courbes en L (voir un exemple la gure 5.4 (p. 91)) et des liens avec lusage de la
condition de Picard pour ltablissement dun paramtre de pnalisation optimal dans les
problmes inverses en acoustique.
Ces deux listes, nullement exhaustives, devraient tre considres comme des fatras dides
qui voquent un mince aperu des possibilits connexes aux travaux prsents dans cette thse.
La section suivante trace des pistes pour de futures recherches qui ne seraient pas spciquement
inuences par lAWFS mais dans lesquelles on peut aisment inscrire la suite de nos travaux
de recherche.
268
10.5 Perspectives de recherches futures
Sans verser dans la vaticination, les recherches entreprises par une plthore de chercheurs
de par le monde et la disponibilit de plus en plus marque des systmes de WFS
25
suggrent
quelques interprtations possibles quant au futur plus ou moins immdiat de la reproduction du
caractre spatial de laudition. Ce qui distingue ce qui est prsent ici de ce qui fut propos aux
sections prcdentes, vient du fait que ces perspectives correspondent des thmes que nous
souhaiterions dvelopper dans les prochaines annes.
Lensemble des branches possibles pour des recherches futures sur le sujet peut se diviser en
deux. Dabord des solutions gnriques plus proches de la reproduction de la musique et du ci-
nma qui doivent tre adaptes plusieurs situations et congurations tout en se connectant sur
un systme de transmission ou dchange de donnes multimdia brutes pour n de reproduc-
tion. Ensuite, des solutions plus spciques qui doivent tenir compte dun contexte trs prcis
dutilisation et dun cahier des charges tout aussi prcis et particulier. Pour le deuxime type,
des travaux de recherche et de dveloppement doivent tre entrepris pour chacun des cas traits.
Cette voie semble riche en terme de problmes de recherche et en dcouvertes potentielles.
Ainsi, en guise dexemple du second type, si une des applications, et un des contextes parti-
culiers dusage, de la reproduction physique de champs acoustiques fut lie un outil de concep-
tion aux premiers paragraphes de cette conclusion, elle peut aussi tre utilise comme produit de
vente et de dmonstration des effets de traitements acoustiques optionnels auquel des acheteurs
doivent faire face. On pense par exemple une forme nouvelle dauralisation (dauralization
en anglais qui quivaut visualisation mais dans le domaine auditif) qui impliquerait des
sources acoustiques couples des imitations visuelles et spatiales denvironnements donns.
La diffrence avec lauralisation classique vient alors de lusage de haut-parleurs plutt que
de casques dcoute. Cest un axe de recherche que nous souhaiterions dvelopper dans un
futur immdiat. Ce genre de travaux, qui se branchent sur un problme spcique, doit tre
aliment par des besoins commerciaux ou industriels concrets qui proviennent carrment de
lindustrie. Dans ce cas, les difcults et opportunits rencontres peuvent surgir par lexistence
de contraintes pratiques svres ou de compromis possibles tant donn la spcicit du cas et
les points essentiels qui mritent une attention.
25
On note plus spcialement une monte de lintrt pour la WFS depuis un ou deux ans : de plus en plus de
chercheurs en Amrique du Nord ddis ce thme, projets dtudiants de premier cyle, disponibilit de logiciels
libres de WFS, parutions de brochures de vulgarisation, etc.
269
10.6 Conclusion
Cette thse fut ddie la description de lamlioration physique de la reproduction de
champs acoustiques laide du contrle actif. Les hypothses de dpart tant la proximit de la
synthse de champs acoustiques de type WFS et du contrle actif du bruit dans un paradigme
plus gnral de reproduction de champs acoustiques, les objectifs atteints comme on peut le
prouver en liant les chapitres et la conclusion de cette thse aux objectifs poss au chapitre
3 furent alors dnis comme une possible combinaison de ces savoirs et techniques pour
lamlioration de la reproduction de champs acoustiques.
La solution donne en rponse ces objectifs et, implicitement, ces questions de recherche
sest cristalise dans la dnition de la reproduction de champs acoustiques de type AWFS, soit
la WFS adaptative. Le caractre scientique et les originalits de cette thse se sont assembls
tout au long des travaux pour former un ensemble. Dans une perspective plus gnrale, on note
principalement trois originalits technologiques qui se dmarquent des autres points dorigina-
lit. De ces trois originalits principales, deux dcoulent de la premire qui, elle, est la dnition
de lAWFS par le biais dun objectif de minimisation de lerreur de reproduction en des points
de lespace tout en vitant tout loignement par rapport la solution de type WFS, pose a
priori. De l suivent les deux autres originalits majeures. Premirement lanalyse des propri-
ts de lAWFS et ltablissement de sa ralisation pratique sur la base de la dcomposition en
valeurs singulires du systme et, deuximement, la cration dun lien conceptuel entre AWFS,
WFS et Ambisonie. Qui plus est, ces concepts furent valids exprimentalement : un systme
fut construit et test.
Si lon considre ces travaux de recherche dans un contexte historique plus vaste de repro-
duction du son, de spatialisation sonore ou mme darchitecture auditive (pour utiliser un
nologisme dactualit) [Blesser et Salter, 2007], on doit conserver lesprit que ces travaux
sinscrivent dans une vaste et riche suite historique [Sterne, 2003; Blesser et Salter, 2007] qui,
tel que propos en cette conclusion, gnrera tout autant de nouveauts et de recherches dans un
avenir proche et plus lointain. Et ce, dautant plus que lintrt pour la spatialisation sonore est
en croissance tous les niveaux : acadmique, commercial, rsidentiel, etc. Les progrs en cette
voie ne pourront se faire que par laccumulation de recherches telle que celle prsente par cette
thse. Cest un travail de dure qui doit impliquer maints chercheurs talentueux de plusieurs
disciplines.
270
Ce qui, indirectement, voque une des difcults remarquables pour la suite des recherches
sur la reproduction spatiale du son : soit ltablissement et lachvement de projets multidisci-
plinaires. Quoique le terme soit en vogue et que le nombre de programmes de subventions qui
encouragent de tels types de recherche, la recherche multidisciplinaire et ses rouages internes
restent peupls de difcults et dentraves diverses. En soit, la recherche, ou les travaux, multi-
disciplinaire devrait, elle-mme faire lattention de recherches et dtudes favorisant diffrents
points de vue : historique, pdagogique, etc.
Quoiquil en soit, la lueur des rsultats et publications impliqus dans la production de
cette recherche, la reproduction spatiale du son semble dote dun avenir prometteur et digne de
travaux futurs.
271
BIBLIOGRAPHIE
AES (2003) Binaural audio in the era of virtual reality A digest of research papers presented at recent
AES conventions, Journal of the Audio Engineering Society, vol. 51, no 11, p. 10661072.
AES STAFF WRITER (2005) Multichannel audio systems and techniques, Journal of the Audio Enginee-
ring Society, vol. 53, no 4, p. 329335.
AES TECHNICAL COMITTEE ON MULTICHANNEL AND BINAURAL AUDIO TECHNOLOGY (2001)
Multichannel sound systems and operation, Audio Engineering Society.
AHMAD R., KUNDU T. (2005) Modeling of phased array transducers, J. Acoust. Soc. Am., vol. 117,
no 4, p. 17621776.
AHN S.S., VOLTZ P.J. (1996) Convergence of the delayed normalized LMS algorithm with decreasing
step size, IEEE Transactions on Signal Processing, vol. 44, no 12, p. 30083016.
AHNERT W. (1987) Complex simulation of acoustic sound elds by the Delta Stereophony System (DSS),
Journal of the Audio Engineering Society, vol. 35, no 9, p. 643652.
ALLISON R.F. (1976) The sound eld in home listening rooms, II, Journal of the Audio Engineering
Society, vol. 24, no 1, p. 1419.
ALTMAN R. (1992) Sound theory Sound practice, AFI Film reader.
APEL A., RDER T., BRIX S. (2004) Equalization of wave eld synthesis systems, Convention paper
6121, AES 116th convention.
ASANO F., SWANSON D.C. (1995) Sound equalization in enclosures using modal reconstruction, J.
Acoust. Soc. Am., vol. 98, no 4, p. 20622069.
AUDIO ENGINEERING SOCIETY (1981) 100 years with stereo : The beginning, Journal of the Audio
Engineering Society, vol. 29, no 5, p. 368372.
AUSTIN L. (2001) Sound diffusion in composition and performance practice II : An interview with Am-
brose Field, Computer Music Journal, vol. 25, no 4, p. 2130.
272
BAI M.R., ELLIOTT S.J. (2004) Preconditioning multichannel adaptive ltering algorithms using EVD-
and SVD-based signal prewhitening and system decoupling, Journal of Sound and Vibration, vol. 270,
no 4-5, p. 639 655.
BAI M.R., LIN C. (2005) Microphone array signal processing with application in three-dimensional
spatial hearing, Journal of the Acoustical Society of America, vol. 117, no 4 I, p. 2112 2121.
BAI M.R., TUNG C.W., LEE C.C. (2005) Optimal design of loudspeaker arrays for robust cross-talk
cancelllation using the Taguchi method and the genetic algorithm, J. Acoust. Soc. Am., vol. 117, no 5,
p. 28022813.
BALLOU et al. G. (1991) Handbook for sound engineers, Howard W. Sams Company.
BARBOUR J.L. (2003) Elevation perception : Phantom images in the vertical hemi-sphere, Proceedings
of the AES 24th international conference, p. 138145.
BASTYR K.J., CAPONE D.E. (2003) On the Acoustic Radiation from a Loudspeakers Cabinet, Journal
of the Audio Engineering Society, vol. 51, no 4, p. 234243.
BAYLES F. (1992) Musique acousmatique, Buchet/Castel.
BECKER J., SAPP M. (2001) Synthetic soundelds for the rating of spatial perceptions, Applied Acous-
tics, vol. 62, p. 217228.
BEGAULT D. (1998) Virtual acoustics, aeronautics, and communications, Journal of the Audio Enginee-
BEGAULT D.R. (1994) 3-D sound for virtual reality and multimedia, AP Profesionnal.
BEGAULT D.R. (1999) Virtual acoustics, aeronautics, and communications, Journal of the Audio Engi-
neering Society, vol. 46, p. 520530.
BELLMANN M. (2003) Evaluation of vibration perception in pasenger vehicles and aircrafts, Acta Acus-
tica, vol. 89, no SUPP., p. S11.
BERANEK L.L. (1954) Acoustics, McGraw-Hill Book Company.
BERG J., RUMSEY F. (2003) Systematic evaluation of perceived spatial quality, Proceedings of the AES
24th international conference, p. 184198.
BERKHOUT A.J. (1988) A holographic approach to acoustic control, Journal of the Audio Engineering
Society, vol. 36, no 12, p. 977995.
BERKHOUT A.J., BOONE M.M., DE VRIES D. (1995) Generation of sound elds using wave eld
synthesis, an overview, Active 95.
273
BERKHOUT A.J., BOONE M.M., KESSELMAN C. (1984) Acoustic impulse response Measurement : A
new technique, Journal of the Audio Engineering Society, vol. 32, no 10, p. 740746.
BERKHOUT A.J., DE VRIES D., BOONE M.M. (1980) A new method to acquire impulse response in
concert halls, Journal of the Acoustical Society of America, vol. 68, no 1, p. 179183.
BERKHOUT A.J., DE VRIES D., SONKE J.J. (1997) Array technology for acoustic wave eld analysis
in enclosures, J. Acoust. Soc. Am., vol. 102, no 5, p. 27572770.
BERKHOUT A.J., DE VRIES D., VAN DEN OETELAAR B.W. (1999) A wave eld extrapolation approach
to acoustical modeling in enclosed spaces, Journal of the Acoustical Society of America, vol. 105,
no 3, p. 17251733.
BERKHOUT A.J., DE VRIES D., VOGEL P. (1992) Wave front synthesis : A new direction in electro-
acoustics, Proceedings of the 93rd AES Convention, p. 3379 (F2).
BERKHOUT A.J., DE VRIES D., VOGEL P. (1993) Acoustic control by wave eld synthesis, Journal of
the Acoustical Society of America, vol. 93, no 5, p. 27642778.
BETLEHEM T., ABHAYAPALA T.S. (2005) Theory and design of sound eld reproduction in reverberant
rooms, Journal of the Acoustical Society of America, vol. 117, no 4 I, p. 2100 2111.
BHARITKAR S., KYRIAKAKIS C. (2004) Nonlinear projection algorithm for evaluating multiple listener
equalization performance, Convention paper 6206, Proceedings of the 117th AES Convention.
BHARITKAR S., KYRIAKAKIS C. (sans date) Eigenilters for signal cancellation.
BLANGER P., BERRY A., ST-AMANT Y., RAJAN S. (2006) Active structural acoustic control of a Bell
407 main transmission, Proceedings of the 62nd American Helicopter Society Annual Forum.
BLAUERT J. (1999) Spatial hearing The psychophysics of human sound localization, The MIT Press.
BLEDA S., LPEZ J.J., ESCOLANO J., PUEO B. (2005) Design and implementation of a compatible
wave eld synthesis authoring tool, Convention paper 6402, Proceedings of the 118th AES Conven-
tion.
BLEINSTEIN N. (1984) Mathematical methods for wave phenomena, Academic Press.
BLESSER B., SALTER L.R. (2007) Spaces speak Are you listening ?, MIT Press.
BLUMLEIN A.D. (1933) Improvements in and relating to sound-transmission, sound-recording and
sound-reproducing systems, British Patent Specication 394,325.
BOONE M.M. (2001) Acoustic rendering with wave eld synthesis, ACM siggraph and enrographics
campre : Acoustic rendering for virtual environments.
274
BOONE M.M., OUWELTJES O. (1997) Design of a loudspeaker system with a low-frequency cardioidlike
radiation pattern, Journal of the Audio Engineering Society, vol. 45, no 9, p. 702707.
BOONE M.M., VERHEIJEN E.N.G. (1997) Qualication of sound generated by wave eld synthesis for
audio reproduction, Convention paper 4457, AES 102nd convention.
BOONE M.M., VERHEIJEN E.N.G., TOL P.F.V. (1995) Spatial sound-eld reproduction by wave-eld
synthesis, Journal of the Audio Engineering Society, vol. 43, no 12, p. 10031012.
BORWICK J. (1988) Loudspeaker and headphone handbook, Butterworths.
BOUCHARD M. (2002) Numerically stable fast convergence least-squares algorithms for multichannel
active sound cancellation systems and sound deconvolution systems, Signal Processing, vol. 82, p.
721736.
BOUCHARD M. (2003) Multichannel afne and fast afne projection algorithms for active noise control
and acoustic equalization systems, IEEE transactions on speech and audio processing, vol. 11, no 1,
p. 5460.
BOUCHARD M., QUEDNAU S. (2000) Multichannel recursive-least-squares algorithms and fast-
transversal-lter algorithms for active noise control and sound reproduction systems, IEEE transac-
tions on speech and audio processing, vol. 8, no 5, p. 606618.
BOULANGER R. (2000) The Csound book : Perspectives in software synthesis, sound design, signal
processing, and programming, The MIT Press.
BRADLEY J.S., SOULDORE G.A. (1995) The inuence of late arriving energy on spatial impression,
Journal of the Acoustical Society of America, vol. 97, no 4, p. 22632271.
BRANDSTEIN M., WARD D. (2001) Microphone array Signal processing techniques and applications,
Springer.
BRAVO T., ELLIOTT S.J. (2004) Variability of low frequency sound transmission measurements, J.
Acoust. Soc. Am., vol. 115, no 6, p. 29862997.
BREGMAN A.S. (1990) Auditory scene analysis : The perceptual organization of sound, The MIT Press.
BREL P.V. (1951) Sound insulation and room acoustics, Chapman & Hall Ltd.
BRIX S., SPORER T., PLOGSTIES J. (2001) CARROUSO An european approach to 3D-audio, AES
Convention.
BRUNEAU M. (1983) Introduction aux thories de lacoustique, Universit du Maine.
275
BUCHNER H., SPORS S., KELLERMANN W. (2004) Full-duplex systems for sound eld recording and
auralization based on wave eld synthesis, Convention paper, AES 116th convention.
BURKHARD M.D., SACHS R.M. (1975) Anthropometric manikin for acoustic research, Journal of the
Acoustical Society of America, vol. 58, no 1, p. 214222.
CABELL R., PALUMBO D., VIPPERMAN J. (2001) A principal component feedforward algorithm for
active nosie control : Flight test results, IEEE Transactions on Control Systems Technology, vol. 9,
no 1, p. 7683.
CABELL R.H., FULLER C.R. (1999) A principal component algorithm for feedforward active noise and
vibration control, Journal of Sound and Vibration, vol. 227, no 1, p. 159181.
CABRERA D., TILLEY S. (2003) Vertical localization and image size effects in loudspeaker reproduction,
Proceedings of the AES 24th international conference, p. 146153.
CAMRAS M. (1968) Approach to recreating a sound eld, Journal of the Acoustical Society of America,
vol. 43, no 6, p. 14251431.
CAMURRI A., FERRENTINO P. (1999) Interactive environments for music and multimedia, Multimedia
Systems, vol. 7, p. 3247.
CAULKINS T., CORTEEL E., WARUSFEL O. (2003) Wave eld synthesis interaction with the listening
environment, improvements in the reproduction of virtual sources situated inside the listening room,
Proceedings of the 6th international conference on digital audio effects (DAFX).
CHEN G., SONE T., ABE M. (1996) Effects of multiple secondary paths on convergence properties in
active noise control systems with LMS algorithm, Journal of Sound and Vibration, vol. 195, no 1, p.
217228.
CHEN G., SONE T., SAITO N., ABE M., MAKINO A. (1998) The stability and convergence characteris-
tics of the delayed-X LMS algorithm in ANC systems, Journal of Sound and Vibration, vol. 216, no 4,
p. 637648.
CHENG C.I., WAKEFIELD G.H. (2001) Moving sound source synthesis for binaural electroacoustic
music using interpolated head-related transfer functions, Computer Music Journal, vol. 25, no 4, p.
5780.
CHEVRET P., MAIER R., NOGUES J., PERISSE J., THIRARD C. (2006) Towards virtual sound for air-
craft simulation, Acoustics Bulletin, vol. 31, no 1, p. 2527.
CHOI J.W., KIM Y.H. (2002) Generation of an acoustically bright zone with an illuminated region using
multiple sources, J. Acoust. Soc. Am., vol. 111, no 4, p. 16951700.
276
CHOI J.W., KIM Y.H. (2004a) Active controls for the enhancement of sound eld, Proceedings of Active
2004.
CHOI J.W., KIM Y.H. (2004b) Manipulation of sound intensity within a selected region using multiple
sources, J. Acoust. Soc. Am., vol. 116, no 2, p. 843852.
CHUN I., RAFAELY B., JOSEPH P. (2003) Experimental investigation of spatial correlation in broadband
reverberant sound elds, Journal of the Acoustical Society of America, vol. 114, no 4, p. 19951998.
CLOZIER C. (2001) The Gmebaphone and Cybernphone instrument, Computer Music Journal, vol. 25,
no 4, p. 8190.
COOK P.R. (2002) Real sound synthesis for interactive applications, A K Peters.
COOPER D.H., BAUCK J.L. (1989) Prospects for transaural recording, Journal of the Audio Engineering
Society, vol. 37, no 1/2, p. 319.
CORTEEL E. (2006a) Equalization in an extended area using multichannel inversion and wave eld
synthesis, Journal of the Audio Engineering Society, vol. 54, p. 11401161.
CORTEEL E. (2006b) On the use of irregurlarly spaced loudspeaker arrays for wave eld synthesis,
potential impact on spatial aliasing frequency, Proceedings of the 9th international conference on
digital audio effects (DAFX).
CORTEEL E., HORBACH U., PELLEGRINI R.S. (2002) Multichannel inverse ltering of multiexciter dis-
tributed mode loudspeakers for wave eld synthesis, Convention paper 5611, 112th Audio Engineering
Society Convention.
CROCKER M.J. (1998) Handbook of acoustics, John Wiley and Sons.
CROWHURST N.H. (1957) Basic requirements for a stereophonic system, Journal of the Audio Enginee-
DAMISCH H. (1987) Lorigine de la perspective, Ides et recherches, Flammarion.
DANIEL J. (2001) Reprsentation de champs acoustiques, application la transmission et la repro-
duction de scnes sonores complexes dans un contexte multimdia, Ph.D. thesis, Universit Paris 6.
DANIEL J. (2003) Spatial sound encoding including near eld effect : introducing distance coding lters
and a viable, new ambisonic format, Proceedings of the AES 23th international conference.
DANIEL J., RAULT J.B., POLACK J.D. (1999) Acoustic properties and perceptive implications of ste-
reophonic phenomena, AES 16th International conference on spatial sound reproduction.
277
DAPELO R., MACELLONI S. (1999) A real time algorithm sterephonic-multi-channel localization of
moving sound sources, Proceedings of the AES 16th international conference, p. 470477.
DAVIS D., DAVIS C. (1997) Sound system engineering, Focal Press.
DAVIS M.F. (2003) History of spatial coding, Journal of the Audio Engineering Society, vol. 51, no 6, p.
554569.
DE DIEGO M., GONZALEZ A., FERRER M., PIERO G. (2002) Performance comparison of multichan-
nel active noise control equalizers, Proceedings of Active 2002, p. 413424.
DE VINCI L. (1987) Trait de la peinture, Berger-Levrault.
DE VRIES D. (1996) Sound reinforcement by waveeld synthesis : Adaptation of the synthesis operator
to the loudspeaker directivity characteristics, Journal of the Audio Eng. Soc., vol. 44, no 12, p. 1120
1132.
DE VRIES D., BOONE M.M. (1999) Wave eld synthesis and analysis using array technology, IEEE
workshop on applications of signal processing to audio and acoustics.
DE VRIES D., BOONE M.M. (2003) Experience with a wave eld synthesis system based on multi-
actuator panel loudspeaker, Proceedings of the AES 24th international conference, p. 29.
DE VRIES D., BRIX S., HULSEBOS E. (2002) Measurements of church impulse responses using a cir-
cular microphone array for natural spatial reproduction of a choir concert recording, Proceedings of
the 21st AES Conference, p. 153158.
DE VRIES D., REIJNEN A.J., SCHONEWILLE A. (1994a) The wave eld synthesis concept applied to
generation of reections and reverberation, Convention paper 3813, AES 96th convention.
DE VRIES D., START E.W., VALSTAR V.G. (1994b) The wave eld synthesis concept applied to sound
reinforcement : Restrictions and solutions, Convention paper 3812, AES 96th convention.
DELALANDE F. (2001) Le son des musiques, Buchet/Chastel.
DELLER J.R. (1994) Tom, Dick, and Mary discover the DFT, IEEE Signal Processing Magazine, vol. 11,
no 2, p. 36 50.
DENES P.B., PINSON E.N. (1963) La chane de communication verbale, Les laboratoires du Tlphone
Bell.
DICKASON V. (2000) The loudspeaker design cookbook, Audio Amateur Press.
DOBBINS P.F. (1984) The use of non-ideal microphones in directional arrays, 75th AES Convention, p.
Convention preprint 2062.
278
DRUYVESTEYN W.F., GARAS J. (1997) Personal sound, Journal of the Audio Engineering Society,
vol. 45, no 9, p. 685701.
EARGLE J. (1986) Handbook of recording engineering, Van Nostrand Reinhold Company.
ELLIOTT S. (2001) Signal processing for active control, Academic Press.
ELLIOTT S.J. (1993) Radiation modes and the active control of sound power, J. Acoust. Soc. Am.,
vol. 94, no 4, p. 21942204.
ELLIOTT S.J. (2000) Optimal controllers and adaptive controllers for multichannel feedforward control
of stochastic disturbances, IEEE Transactions on Signal Processing, vol. 48, no 4, p. 10531060.
ELLIOTT S.J., BHATIA L.P., DEGHAN F.S., FU A.H., STEWART M.S., WILSON D.W. (1994) Practi-
cal implementation of low-frequency equalization using adaptive digital lters, Journal of the Audio
ELLIOTT S.J., BOUCHER C.C., NELSON P.A. (1992) The behavior of a multichannel active control
system, IEEE Transactions on signal processing, vol. 40, no 5, p. 10411052.
ELLIOTT S.J., NELSON P.A. (1989) Multiple-point equalization in room using adaptive digital lters,
ELMORE W.C., HEALD M. (1969) Physics of waves, Dover.
EPAIN N., FRIOT E., RABAU G. (2004) Indoor sonic boom reproduction using ANC, Proceedings of
Active 2004.
ESCOLANO J., PUEO B., BLEDA S., LPEZ J.J. (2005) An approach to discrete-time modelling aura-
lization for wave eld synthesis applications, Convention paper 6425, Proceedings of the 118th AES
Convention.
EVANS M.J., TEW A.I., ANGUS J.A.S. (sans date) Spatial audio teleconferencing Which way is
better ?, diffus sur Internet.
FAHLINE J.B. (2004) Computing uid-coupled resonance frequencies, mode shapes, and damping loss
factors using the singular value decomposition, Journal of the Acoustical Society of America, vol.
115, no 4, p. 1474 1482.
FAHNLINE J.B. (1995) Active control of the sound radiated by a vibrating body using only a layer of
simple sources, J. Acoust. Soc. Am., vol. 97, no 4, p. 22492254.
FAHY F. (2003) Comment on Development of panel loudspeaker system : design evaluation and enhan-
cement [J. Acoust. Soc. Am. 106, 2751-2761 (2001)] (L), Journal of the Acoustical Society of America,
vol. 113, no 1, p. 4344.
279
FALCH C., NOISTERING M., WARUM S., HLDRICH R. (2003) Room simulation for binaural sound
reproduction using measured spatiotemporal impulse responses, Proceedings of the 6th international
conference on digital audio effects (DAFX).
FARINA A., UGOLOTTI E. (1999) Subjective comparison between stereo dipole and 3D ambisonic sur-
round systems for automotive applications, Proceedings of the AES 16th international conference, p.
532543.
FENG J., GAN W.S. (1998) Broadband active noise compressor, IEEE signal processing letters, vol. 5,
no 1, p. 1114.
FIELDER L.D. (2001) Practical Limits for Room Equalization, Proceedings of the AES 11th convention.
FIELDER L.D. (2003) Comments on Analysis of traditional and reverberation-reducing methods of
room equalization, Journal of the Audio Engineering Society, vol. 51, no 12, p. 11861192.
FONTANA F., GIBIN L., ROCCHESSO D. (1999) Common pole equalization of small rooms using a two-
step real-time digital equalizer, Proc. 1999 IEEE Workshop on applications of signal processing to
audio and acoustics, p. W991,W994.
FORD N., RUMSEY F., NIND T. (2003) Evaluating spatial attributes of reproduced audio events using a
graphical assessment language Understanding differences in listener depictions, Proceedings of the
AES 24th international conference, p. 171183.
FRAUNHOFER, INSTITUT INTEGRIERTE SCHALTUNGEN (2003) Operation manual for the Fraunhofer
wave eld synthesis system, Fraunhofer, IIS, Arbeitsgruppe Elecktronische Medientechnologie.
FREIHEIT R.R. (2003) Active acoustics for music rehearsal rooms, J. Acoust. Soc. Am., vol. 114, no 4,
Pt. 2, p. 2342.
FULLER C.R., ELLIOTT S.J., NELSON P.A. (1996) Active control of vibration, Academic Press.
FUSTER L., LPEZ J.J., GONZLEZ A., ZUCCARELLO P.D. (2005) Room compensation using multi-
channel inverse lters for wave eld synthesis systems, Convention paper 6401, AES 118th convention.
GAO F.X.Y., SNELGROVE W.M. (1992) Adaptive linearization of a loudspeaker, Convention paper
3377, 93rd Audio Engineering Society Convention.
GARAS J. (1999) Adaptive 3D sound systems, Technische Universiteit Eindhoven.
GARAS J., SOMMEN P. (sans date) Adaptive ltering approach to multichannel audio reproduction sys-
tems, diffus sur Internet.
GARCIA-BONITO J., ELLIOTT S.J., BOUCHER C.C. (1997) Generation of zones of quiet using virtual
microphone arrangement, Journal of the Acoustical Society of America, vol. 101, no 6, p. 34983516.
280
GARDNER W.G. (1998) 3-D audio using loudspeakers, Kluwer Academic Publishers.
GAUTHIER P.A., BERRY A. (2006) Adaptive wave eld synthesis with independent radiation mode
control for active sound eld reproduction : Theory, Journal of the Acoustical Society of America,
vol. 119, no 5, p. 27212737.
GAUTHIER P.A., BERRY A., WOSZCZYK W. (2005a) Creative sound projection using compact loud-
speaker arrays, MusicWorks, vol. 93, p. 1416.
GAUTHIER P.A., BERRY A., WOSZCZYK W. (2005b) Sound-eld reproduction in-room using optimal
controle techniques : Simulations in the frequency domain, Journal of the Acoustical Society of Ame-
rica, vol. 117, no 2, p. 662678.
GAUTHIER P.A., BERRY A., WOSZCZYK W. (2005c) valuation objective de la synthse de champs
acoustiques et recherches rcentes sur la reproduction de champs acoustiques en salle, 73 Congrs de
lACFAS.
GENEREUX R. (1992) Adaptive lters for loudspeakers and rooms, Convention paper 3375, 93rd Audio
Engineering Society Convention.
GENUIT K., BRAY W.R. (2002) Prediction of sound and vibration in virtual automobile, Sound and
Vibration, vol. 36, no 7, p. 1219.
GERZON M.A. (1973) Periphony : With-height Sound Reproduction, Journal of the Audio Engineering
Society, vol. 21, no 1, p. 210.
GERZON M.A. (1985) Ambisonics in multichannel broadcasting and video, Journal of the Audio Engi-
neering Society, vol. 33, no 11, p. 859871.
GIOMI F., MEACCI D., SCHWOON K. (2003) Live electronics in Luciano Berios music, Computer
Music Journal, vol. 27, no 2, p. 3046.
GLASGAL R. (2003) Surround ambiophonics recording and reproduction, Proceedings of the AES 24th
international conference, p. 1120.
GOLUB G.H., VAN LOAN C.F. (1996) Matrix computations, John Hopkins University Press, 3
e
ed.
GOVER B.N., RAYN J.G., STINSON M.R. (2003) Designing a spherical microphone array for the di-
rectional analysis of reections and reverberation, Convention paper 5862, Proceedings of the 115th
AES Convention.
GOVER B.N., RYAN J.G., STINSON M.R. (2004) Measurements of directional properties of reverberant
sound elds in rooms using a spherical microphone array, J. Acoust. Soc. Am., vol. 116, no 4, p.
21382148.
281
GRARD A., BERRY A., MASSON P. (2005) Control of tonal noise from subsonic fans. Part 1 : Recons-
truction of aeroacoustic sources from far-eld acoustic pressure, Journal of Sound and Vibration, vol.
288, p. 10491075.
GRAU O. (2003) Virtual art From illusion to immersion, MIT Press.
GRIESINGER D. (1995) Design and performance of multichannel time variant reverberation enhance-
ment systems, Active 95.
GRIESINGER D. (1997) The psychoacoustics of apparent source width, spaciousness and envelopment
in performance spaces, Acustica, acta acustica, vol. 83, p. 721731.
GUILLAUME M., GRENIER Y. (2006) Sound eld analysis based on generalized prolate spheroidal wave
sequences, Convention paper, AES 120th convention.
HAMANN S., WALTER W., FINTERWALDER R. (2004) Development of a simulator audio system based
on COTS sound synthesis software, AIAA Modeling and Simulation Technologies Conference, vol. 2,
p. 673681.
HANSEN C. (1998) Rank-decient and discrete ill-posed problems, SIAM.
HARTMANN W.M. (1983) Localization of sound in rooms, Journal of the Acoustical Society of America,
vol. 74, no 5, p. 13801391.
HARTMANN W.M., WITTENBERG A. (1999) On the externalization of sound images, Journal of the
Acoustical Society of America, vol. 99, no 6, p. 36783688.
HATZIANTONIOU P.D., MOURJOPOULOS J.N. (2004) Errors in real-time room acoustics dereverbera-
tion, J. Audio Eng. Soc., vol. 52, p. 883899.
HE Y., DJORDJEVICH A., LUO F. (1998) Sound rendering and its application in virtual cockpit, Procee-
dings of the International Conference on Signal Processing, vol. 2, p. 14121415.
HENRIKSEN F.E. (2002) Space in electroacoustic music : Composition, performance and perception of
musical space, Thse de doctorat (City University, Londre).
HIYAMA K., KOMIYAMA S., HAMASAKI K. (2002) The minimum number of loudspeakers and its ar-
rangement for reproducing the spatial impression of diffuse sound eld, AES Convention.
HONDA S., HAMADA H. (1999) Active noise control around a humans head using adaptive prediction
method, Active 99, p. 13051316.
HORBACH U., BOONE M.M. (1999) Future transmission and rendering formats for multichannel sound,
282
HSIAO F.B., HAN S.Y., HSIEH S.C., WANG L.K. (2004) Sound source separation and identication for
aircraft Cockpit Voice Recorder, Journal of Aerospace Computing, Information and Communication,
p. 466483.
HULSEBOS E., DE VRIES D. (2002) Parametrization and reproduction of concert hall acoustics measu-
red with a circular microphone array, Convention paper 5579, Proceedings of the 112th AES Conven-
tion.
HULSEBOS E., SCHUURMANS T., DE VRIES D., BOONE R. (2003) Circular microphone array for dis-
crete multichannel audio recording, Convention paper 5716, Proceedings of the 114th AES Conven-
tion.
HULSEBOS E.M. (2004) Auralization using wave eld synthesis, Thse de doctorat, Universit Tech-
nique de Delft.
IHLE M., KROSCHEL K., RIEDLINGER R. (2000) A novel noise suppresion algorithm using a very small
microphone array, Convention paper 5252, AES 109th Convention.
ISE S. (1999) A principle of sound eld control based on the Kirchhoff-Helmholtz Integral Equation and
the theory of inverse system, Acta Acustica, vol. 85, p. 7887.
JACQUES R., ALBRECHT B., MELCHIOR F., DE VRIES D. (2005) An approach for multichannel recor-
ding and reproduction of sound source directivity, Convention paper, AES 119th convention.
JAFFE J.C. (2003) Electronic architecture : An acousticians approach, J. Acoust. Soc. Am., vol. 114, no
4, Pt. 2, p. 2341.
JANSSENS K., ADAMS M., PONSEELE O.V.D., DEBLAUWE F. (2003) The integration of experimental
models in a real-time virtual car sound engineering environment, Computational and Experimental
Methods, vol. 9, p. 213222.
JESSEL M. (1973) Acoustique thorique : propagation et holophonie, Masson et cie.
JIN C., BEST V., VAN SCHAIK A., CARLILE S. (2003) Psychoacoustic evaluation of a perceptual
spatial-audio coding technique for speech and noise, Proceedings of the AES 24th international confe-
rence, p. 9499.
JOT J.M. (1999) Real-time signal processing of sounds for music, multimedia and interactive human-
computer interfaces, Multimedia Systems, vol. 7, p. 5569.
JOUHANEAU J. (1997) Acoustique des salles et sonorisation, Lavoisier Tec&Doc.
JOUHANEAU J. (2000) Notions lmentaires dacoustique, lectroacoustique, ditions TEC & DOC.
JUNGER M.C., FEIT D. (1993) Sound, structures, and their interactions, Acoustical Society of America.
283
KABAL P. (1983) Stability Of Adaptive Minimum Mean Square Error Equalizers Using Delayed Adjust-
ment, IEEE Transactions on Communications, vol. CM-31, no 3, p. 430 432.
KAHANA Y., NELSON P.A., YOON S. (1999) Experiments on the synthesis of virtual acoustic sources
in automotive interiors, Proceedings of the AES 16th international conference, p. 218232.
KAWAKAMI F., SHIMIZU Y. (1990) Active eld control in auditoria, Applied Acoustics, vol. 31, p. 47
75.
KAWAMURA A., MATSUMOTO M., NUMAZU H., SERIKAWA M. (1993) The multi-channel sound eld
control system in a multi-purpose hall, Applied Acoustics, vol. 38, p. 319332.
KELLER M., ROURE A., MARROT F. (2006) Acoustic eld reproduction for psychoacoustic experi-
ments : application to aircraft interior noise, Proceedings of Active 2006.
KENDALL G.S. (1995a) A 3-D Sound Primer : Directional Hearing and Stereo Reproduction, Computer
KENDALL G.S. (1995b) The decorrelation of audio signals and its impact on spatial imagery, Computer
KIM G.T., LEE B.H. (1990) 3-D sound source reconstruction and eld reprediction using the Helmholtz
integral equation, J. Sound Vib., vol. 136, no 2, p. 245261.
KIM S.M., HAN D., WANG S. (2002) A direct inverse method for cross-talk cancellation in a stereo
reproduction system, Proceedings of Active 2002, p. 425436.
KIM S.M., WANG S. (2003) A Wiener lter approach to the binaural reproduction of stereo sound,
Journal of the Acoustical Society of America, vol. 114, no 6, p. 31793188.
KINSLER L.E., FREY A.R., COPPENS A.B., SANDERS J.V. (2000) Fundamentals of acoustics, John
Wiley and Sons.
KIRKEBY O., NELSON P.A. (1993) Reproduction of plane wave sound elds, Journal of the Acoustical
Society of America, vol. 94, no 5, p. 29923000.
KIRKEBY O., NELSON P.A. (1999) Digital lter design for inversion problems in sound reproduction,
Journal of the Audio Engineering Society, vol. 47, no 7/8, p. 583595.
KIRKEBY O., NELSON P.A., HAMADA H. (1998) The stereo-dipole A virtual source imaging system
using two closely spaced loudpseakers, Journal of the Audio Engineering Society, vol. 46, no 5, p.
387395.
284
KIRKEBY O., NELSON P.A., ORDUA-BUSTAMANTE F., HAMADA H. (1995) Inverse Filter Design
and Equalization Zones in Multichannel Sound Reproduction, IEEE Transactions on speech and audio
processing, vol. 3, no 3, p. 185192.
KIRKEBY O., NELSON P.A., ORDUA-BUSTAMANTE F., HAMADA H. (1996) Local sound eld repro-
duction using digital signal processing, Journal of the Acoustical Society of America, vol. 100, no 3,
p. 15841593.
KIRKEBY O., ORDUNA F., NELSON P.A., HAMADA H. (1993) Inverse ltering in sound reproduction,
Measurement + Control, vol. 26, p. 261266.
KIRKEBY O., RUBAK P., JOHANSEN L.G., NELSON P.A. (1999) Implementation of cross-talk cancel-
lation networks using warped FIR lters, Proceedings of the AES 16th international conference, p.
358365.
KLEHS B., SPORER T. (2003) Wave eld synthesis in the real world : Part 1 In the living room,
Convention paper 5727, AES 114th convention.
KLEINER M. (1990) Subjective perception of sound eld simulation and variable acoustics by some
passive and electroacoustic systems, Applied Acoustics, vol. 31, p. 197205.
KLEINER M., DALENBACK B.I., SVENSSON P. (1993) Auralization An overview, Journal of the Audio
KOMIYAMA S., NAKAYAMA Y., ONO K., KOIZUMI S. (2003) A loudspeaker-array to control sound
image distance, Acoust. Sci. & Tech., vol. 24, no 5, p. 242249.
KORENAGA Y., ANDO Y. (1993) A sound-eld simulation system and its application to a seat-selection
system, Journal of the Audio Engineering Society, vol. 41, no 11, p. 920930.
KREBS W., BUTIKOFER R., PLUSS S., THOMANN G. (2003) Modeling of three-dimensional sound
directivity patterns of helicopters, Acta Acustica, vol. 89, no 2, p. 273279.
KUHN C., PELLEGRINI R., LECKSHAT D., CORTEEL E. (2003) An approach to miking and mixing of
music ensembles using wave eld synthesis, Convention paper 5929, Proceedings of the 115th AES
Convention.
KUO S.M., MORGAN D.R. (1996) Active noise control systems, John Wiley and Sons.
KURIYAMA J., FURUKAWA Y. (1989) Adaptive loudspeaker system, Journal of the Audio Engineering
Society, vol. 37, no 11, p. 919926.
KUSTER M., DE VRIES D., BEER D., BRIX S. (2005) Structural and acoustic analysis of multi-actuator
panel, Convention paper, AES 118th convention.
285
KUSTER M., DE VRIES D., HULSEBOS E.M., GISOLF A. (2004) Acoustic imaging in enclosed spaces :
Analysis of room geometry modications on the impulse response, J. Acoust. Soc. Am., vol. 116, no 4,
p. 21262137.
KUTSCHBACH H. (2003) Verication for spatial sound systems, Proceedings of the AES 24th internatio-
nal conference, p. 100107.
KUTTRUFF H. (1999) Room acoustics, Spon press.
LAAKSO T.I., VLIMKI V., KARJALAINEN M., LAINE U.K. (1996) Splitting the unit delay, IEEE
Signal Processing Magazine, vol. 13, no 1, p. 30 60.
LANCASTER P., TISMENETSKY M. (1985) The theory of matrices, Academic Press.
LEBOUCHER E., MICHEAU P., BERRY A., LESPRANCE A. (2002) A stability analysis of a decentra-
lized adaptive feedback active control system of sinusoidal sound in free space, J. Acoust. Soc. Am.,
vol. 111, no 1, p. 189199.
LENNOX P.P., MYATT T., VAUGHAN J.M. (1999) From surround to true 3-D, Proceedings of the AES
16th international conference, p. 126135.
LEURIDAN J. (2000) Towards sound quality engineering of the virtual car : From a computer game to
an engineering tool, Europena Journal of Mechanical en Environmental Engineering, vol. 45, no 2, p.
9597.
LOKKI T., HIIPAKKA J., SAVIOJA L. (1999) Immersive 3-D sound reproduction in a virtual room, Pro-
ceedings of the AES 16th international conference, p. 172177.
LPEZ J.J., BLEDA S., PUEO B., ESCOLANO J. (2005) A sub-band approach to wave-eld synthesis
rendering, Convention paper 6403, Proceedings of the 118th AES Convention.
LOPEZ J.J., GONZALEZ A. (2001) Experimental Evaluation of Cross-Talk Cancellation Regarding
Loudspeakers Angle of Listening, IEEE Signal Processing Letters, vol. 8, no 1, p. 1315.
LU H., WU S. (2003) Helmholtz equation least square method for transient neareld acoustic hologra-
phy, J. Acoust. Soc. Am., vol. 114, no 4, Pt. 2, p. 2443.
MAHIEUX Y., EMERIT M., HELLEQUIN L., MARRO C. (1997) Optimization of sensor placement for
microphone arrays, 102nd AES Convention, p. Convention preprint 4451.
MAHIEUX Y., TOURNEUR G.L., SALIOU A. (1995) A microphone array for multimedia workstations,
98th AES Convention, Convention preprint 3995.
MALHAM D.G. (2001) Toward reality equivalence in spatial sound diffusion, Computer Music Journal,
vol. 25, no 4, p. 3138.
286
MALHAM D.G., MYATT A. (1995) 3-D Sound Spatialization using Ambisonic Techniques, Computer
MANIKAS A., PROUKAKIS C. (1998) Modeling and estimation of ambiguities in linear arrays, IEEE
transactions on signal processing, vol. 46, no 8, p. 21662179.
MASSA F. (1985) Some personal recollections of early experiences on the new frontier of electroacous-
tics during the late 1920s and early 1930s, Journal of the Acoustical Society of America, vol. 77, no 4,
p. 12961302.
MDUSE, QUBEC (2003) Mois Multi, Pamphlet publicitaire.
MELCHOR F., BRIX S., SPORER T., RODER T., KLEHS B. (2003) Wave eld synthesis in combination
with 2D video projection, Proceedings of the AES 24th international conference, p. 3040.
MERIMAA J. (2002) Applications of a 3-D microphone array, Convention paper 5501, AES 109th
Convention.
MERIMAA J., PULKKI V. (2005) Spatial impulse response rendering I : Analysis and synthesis, Journal
of the Audio Engineering Society, vol. 53, no 12, p. 11151127.
MEYER D.G. (1984) Digital control of loudspeaker array directivity, Journal of the Audio Engineering
Society, vol. 32, no 10, p. 747754.
MITSUKI M., MIYASAKA M., OZAWA K. (2005) Reproduced sound pressure level yielding the maxi-
mum auditory presence : Further study on effects of reproduced SPLs on auditory presence, Acoustical
Sciences and Technologies, vol. 26, no 1, p. 7981.
MIYAZAKI H., WATANABE T., KISHINGA S., KAWAKAMI F. (2003) Active eld control (AFC) electro-
acoustic enhancement system using acoustical feedback control, J. Acoust. Soc. Am., vol. 114, no 4,
Pt. 2, p. 2342.
MIYOSHI M., KANEDA Y. (1988) Inverse Filtering of Room Acoustics, IEEE Transactions on Acoustics,
Speech, and Signal Processing, vol. 36, no 2, p. 145152.
MIYOSHI M., KANEDA Y. (1991) Active control of broadband random noise in a reverberant three-
dimensional space, Noise Control Eng. J., vol. 36, p. 8590.
MOORE B.C.J. (1989) An introduction to the psychology of hearing, Academic Press.
MORELLI E.A. (1995) Estimating noise characteristics from ight test data using optimal Fourier smoo-
thing, Journal of aircraft, p. 689695.
MORGAN D.R. (1980) An analysis of multiple correlation cancellation loops with a lter in the auxiliary
path, IEEE Transactions on Acoustics, Speech, and Signal Processing, vol. 28, no 4, p. 454467.
287
MORSE P.M. (1953) Methods of theoretical physics, Part I, McGraw-Hill.
MORSE P.M. (1995) Vibration and sound, Acoustical society of America.
MORSE P.M., INGARD K.U. (1968) Theoretical acoustics, McGraw-Hill.
MURPHY D.T., BEESON M.J. (2003) Modelling spatial sound occlusion and diffraction effect using the
digital waveguide mesh, Proceedings of the AES 24th international conference, p. 207216.
MURRAY J.D. (1984) Asymptotic analysis, Springer-Verlag.
NAKANAYASHI K. (1975) A method of analyzing the quadraphonic sound eld, Journal of the Audio
NEELY S.T., ALLEN J.B. (1979) Invertibility of a room impulse response, Journal of the Acoustical
Society of America, vol. 66, no 1, p. 165169.
NEHER T., BROOKES T., RUMSEY F. (2003) Unidimensional simulation of the spatial attribute en-
semble depth for training purposes. Part 1 : Pilot study into early reection pattern characteristics,
NELSON P.A. (1994) Active control of acoustic elds and the reproduction of sound, Journal of Sound
and Vibration, vol. 177, no 4, p. 447477.
NELSON P.A. (2001) A review of some inverse problems in acoustics, International journal of acoustics
and vibration, vol. 6, no 3, p. 118134.
NELSON P.A. (2002) Active control for virtual acoustics, Active 2002, p. 6790.
NELSON P.A., ELLIOT S.J. (1992) Active control of sound, Academic Press.
NELSON P.A., HAMADA H., ELLIOTT S.J. (1992) Adaptive inverse lters for stereophonic sound re-
production, IEEE Transactions on signal processing, vol. 40, no 7, p. 16211632.
NELSON P.A., KAHANA Y. (2001) Spherical harmonics, singular-value decomposition and the head-
related transfer function, Journal of Sound and Vibration, vol. 239, no 4, p. 607 637.
NELSON P.A., KIRKEBY O., TAKEUCHI T. (1997) Sound elds for the production of virtual acoustic
images, Journal of Sound and Vibration, vol. 204, no 2, p. 386396.
NELSON P.A., ORDUA-BUSTAMANTE F., ENGLER D., HAMADA H. (1996a) Experiments on a system
for the synthesis of virtual acoustic sources, Journal of the Audio Engineering Society, vol. 44, no 11,
p. 9901007.
288
NELSON P.A., ORDUA-BUSTAMANTE F., HAMADA H. (1996b) Multichannel signal processing tech-
niques in the reproduction of sound, Journal of the Audio Engineering Society, vol. 44, no 11, p.
973989.
NELSON P.A., ROSE J.F.W. (2005) Errors in two-point sound reproduction, J. Acoust. Soc. Am., vol.
118, no 1, p. 193204.
NELSON P.A., YOON S.H. (2000) Estimation of acoustics source strength by inverse method : Part I,
conditionning of the inverse problem, Journal of Sound and Vibration, vol. 233, no 4, p. 643668.
NEW ADVENTURES IN SOUND ART (2003) Sound in space The use of space in musique and sound
art, New Adventures in Sound Art.
NICOL R., EMERIT M. (1999) 3D-sound reproduction over an extensive listening area : A hybrid method
derived from holophony and ambisonic, Proceedings of the AES 16th international conference, p. 436
453.
NIELSEN S.H. (1993) Auditory distance perception in different rooms, Journal of the Audio Engineering
Society, vol. 41, no 10, p. 755770.
NOISTERNIG M., SONTACCHI A., MUSIL T., HOLDRICH R. (2003) A 3D ambisonics based binaural
sound reproduction system, Proceedings of the AES 24th international conference, p. 237241.
NORRIS J.W. (1999) Creating virtual surround using dipole and monopole pressure elds, Proceedings
of the AES 16th international conference, p. 461469.
OPPENHEIM A.V., SCHAFER R.W. (1989) Discrete-time signal processing, Prentice-Hall.
ORDUA F., ENGLER D., NELSON P.A., HAMADA H. (1995) Subjective evaluation of a virtual source
emulation system, Active 95.
PANOFSKY E. (1975) La perspective comme forme symbolique, Les ditions de minuit.
PARK M., RAFAELY B. (2005) Sound-eld analysis by plane-wave decomposition using spherical mi-
crophone array, J. Acoust. Soc. Am., vol. 118, no 5, p. 30943103.
PASSELLA K., SHARIF B.S., DOBRUCKI A., HINTON O.R. (2001) The wave eld analysis and syn-
thesis of an acoustic eld in rooms using the concept of a direction of arrival algorithm, Convention
Paper 5355, Proceedings of the 110th AES Convention.
PELLIGRINI R.S. (2002) Perception-based design of virtual rooms for sound reproduction, Proceedings
of the AES 22nd International Conference on Virtual, Synthetic and Entertainment Audio.
PERISSE J., MAGAND F., HENRY M., CHOUTEAU S., LECLERC N. (2003) SD-Lab : An interactive
sound design simulatori for vehicle interior noise, Acta Acustica, vol. 89, no SUPP., p. S90.
289
PETRAUSCH S., RABENSTEIN R. (2006) Efcient 3D simulation of wave propagation with the functional
transformation method, Proceedings of the 18th Sympoisum of Simulation Technique, ASIM.
PHOTIADIS D.M. (1990) The relationship of singular value decomposition to wave-vector ltering in
sound radiation problems, J. Acoust. Soc. Am., vol. 88, no 2, p. 11521159.
PIERCE A.D. (1991) Acoustics An Introduction to its physical principles and applications, Acoustical
Society of America.
PLEGSTIES J., BAUM O., GRILL B. (2003) Conveying spatial sound using MPEG-4, Proceedings of the
AES 24th international conference, p. 5865.
POLETTI M. (2003) Control of early and late energy in rooms with the variable room acoustics system,
J. Acoust. Soc. Am., vol. 114, no 4, Pt. 2, p. 2341.
POLETTI M.A. (2000) A unied theory of horizontal holographic sound systems, Journal of the Audio
POLETTI M.A. (2005) Three-dimensional surround sound systems based on spherical harmonics, Jour-
nal of the Audio Engineering Society, vol. 53, no 11, p. 10041025.
POLTMANN R.D. (1995) Conversion of the delayed LMS algorithm into the LMS algorithm, IEEE Signal
Processing Letters, vol. 2, no 12, p. 223.
POULIN J. (1957) Son et espace, La Revue Musicale. Vers une musique exprimentale, sous la direction
de Pierre Schaeffer, numro spcial, vol. 236.
PUDDIE RODGERS C.A. (1981) Pinna transformations and sound reproduction, Journal of the Audio
Engineering Society, vol. 29, p. 226234.
PUEO B., ESCOLANO J., BLEDA S., LPEZ J.J. (2005) An approach for wave eld synthesis high power
applications, Convention paper 6428, Proceedings of the 118th AES Convention.
PULKKI V., MERIMAA J. (2006) Spatial impulse response rendering II : Reproduction of diffuse sound
and listening tests, Journal of the Audio Engineering Society, vol. 54, no 1/2, p. 320.
RAATGEVER J., BILSEN F.A. (1986) A central spectrum theory of binaural processing. Evidence from
dichotic pitch, Journal of the Acoustical Society of America, vol. 80, no 2, p. 429441.
RADLOVI
C B.D., KENNEDY R.A. (2000) Nonminimum-phase equalization and its subjective impor-
tance in room acoustics, IEEE Transactions on speech and audio processing, vol. 8, no 6, p. 728737.
RADLOVI
C B.D., WILLIAMSON R.C., KENNEDY R.A. (2000) Equalization in an acoustic reveberant

environment : Robustness results, IEEE Transactions on speech and audio processing, vol. 8, no 3, p.
311319.
290
RAFAELY B. (2004) Plane-wave decomposition of the sound eld on a sphere by spherical convolution,
J. Acoust. Soc. Am., vol. 116, no 4, p. 21492157.
REITER U., SCHULDT M., DANTELE A. (2003) Determination of sound source obstruction in virtual
scenes, Proceedings of the AES 24th international conference, p. 201206.
RENAULT S., RYMEKO F., BERRY A. (2000) Active noise control in enclusure with virtual microphone,
Canadian Acoustics, vol. 28, no 3, p. 7273.
RIEDERER K.A.J. (1998) Repeatability analysis of head-related transfer function measurements, AES
105th convention, preprint 4846.
RIZZI S., SULLIVAN B. (2005) Synthesis of virtual environments for aircraft community noise impact
studies, 11th AIAA/CEAS Aeroacoustics Conference, vol. 4, p. 22912306.
ROADS C. (1996) The computer music tutorial, MIT Press.
ROCCHESSO D. (1995) The Ball within the Box : A sound-processing Metaphor, Computer Music Jour-
nal, vol. 19, no 4, p. 4757.
RDENAS J.A., AARTS R.M., JANSSEN A.J.E.M. (2003) Derivation of an optimal directivity pattern
for sweet spot widening in stereo sound reproduction, Journal of the Acoustical Society of America,
vol. 113, no 1, p. 267278.
ROMANO A. (1987) Three-dimensional image reconstruction in audio, Journal of the Audio Engineering
Society, vol. 35, no 10, p. 749759.
ROSE J., NELSON P., RAFAELY B., TAKEUCHI T. (2002) Sweet spot size of virtual acoustic imaging
systems at asymmetric listener locations, J. Acoust. Soc. Am., vol. 112, no 5, Pt. 1, p. 19922002.
ROURE A., ALBARRAZIN A. (1999) The remote microphone technique for active noise control, Active
99, p. 12331244.
RUMSEY F. (2001) Spatial audio, Focal Press.
RUMSEY F. (2002) Spatial quality evaluation for reproduced sound : Terminology, meaning, and a scene-
based paradigm, J. Audio Eng. Soc., vol. 50, no 9, p. 651666.
SANTILLA

N A.O. (2001) Spatially extended sound equalization in rectangular rooms, J. Acoust. Soc.
Am., vol. 110, no 4, p. 19891997.
SAUSALITO AUDIO WORKS (sans date) Acoustic Lens Technology for Loudspeakers : An Introduction,
http ://www.SAWonline.com.
291
SAVIOJA L., HUOPANIEMI J., LOKKI T., VNNEN R. (1999) Creating interactive virtual acoustics
environments, Journal of the Audio Engineering Society, vol. 47, p. 675705.
SCHAFER R.M. (1977) The soundscape The tuning of the world, Destiny.
SCHAPHORST R. (1996) Videoconferencing and videotelephony : Technology and standards, Artech
House.
SCHEIRER E.D. (1999) Structured audio and effects processing in the MPEG-4 multimedia standard,
Multimedia Systems, vol. 7, p. 1122.
SCHLEGEL P.A. (1994) Azimuth estimates by human subjects under free-eld and headphone conditions,
Audiology, vol. 33, p. 93116.
SCHOBBEN D.W.E., AARTS R.M. (2005) Personalized multi-channel headphone sound reproduction
based on active noise control, Acta Acustica unied with acustica, vol. 91, no 3, p. 440449.
SHERBURNE P. (2002) Sound Art/Sound Bodies : Electronic musics anatomy Lessons, Parachute, , no
107, p. 6879.
SHI X.L., SHEN W.Q., SONG Z.S. (2006) Research and implementation of a sound simulation system
for ight simulator, Journal of system simulation, vol. 18, no 9, p. 24612464.
SNOW W.B. (1953) Basic principles of stereophonic sound, Journal of the SMPTE, vol. 61, p. 567589.
SNYDER S.D., TANAKA N. (1993) Modication to overall system response when using narrowband
adaptive feedforward control systems, Journal of dynamic systems, measurement, and control, vol.
115, p. 621626.
SONKE J.J., DE VRIES D., LABEEUW J. (1998) Variable acoustics by wave eld synthesis : A closer
look at amplitude effects, Convention paper 4712, AES 104th convention.
SORRENTINO A. (2003) Identication of a vribro-acoustic comfort index for aircraft : The IDEA PACI
project, Acta Acustica, vol. 89, no SUPP., p. S11.
SOTTEK R. (2003) Virtual binaural auralisation of product sound quality importance and application in
practice, Acta Acustica, vol. 89, no SUPP., p. S99.
SOULODRE G.A., LAVOIE M.C., NORCROSS S.G. (2003) Objectives measures of listener envelopment
in multichannel surround systems, Proceedings of the AES 24th international conference, p. 111122.
SPORER T., KLEHS B. (2004) Wave eld synthesis in the real world : Part 2 In the movie theatre,
Convention paper 6055, AES 116th convention.
292
SPORS S., BUCHNER H., RABENSTEIN R. (2004) Efcient active listening room compensation for wave
eld synthesis, Convention paper 6119, AES 116th convention.
SPORS S., KUNTZ A., RABENSTEIN R. (2003a) An approach to listening room compensation with wave
eld synthesis, Proceedings of the AES 24th international conference, p. 7082.
SPORS S., KUNTZ A., RABENSTEIN R. (2003b) Listening room compensation for wave eld synthesis,
IEEE International Conference on Multimedia and Expo (ICME).
SPORS S., RABENSTEIN R. (2006) Spatial aliasing artifacts produced by linear and circular loudspea-
ker arrays used for wave eld synthesis, Convention paper, AES 120th convention.
SPORS S., RENK M., RABENSTEIN R. (2005a) Limiting effects of active room compensation using wave
SPORS S., SEUBERTH D., RABENSTEIN R. (2005b) Multi-exciter panel compensation for wave eld
synthesis, Proceedings of the Annual German Conference on Acoustics (DAGA).
STAFF TECHNICAL WRITER (2005) Loudspeaker array technology, Journal of the Audio Engineering
Society, vol. 53, no 11, p. 10811084.
START E.W., DE VRIES D., BERKHOUT A.J. (1999) Wave Field Synthesis Operators for Bent Line
Arrays in 3D Space, Acustica, acta acustica, vol. 85, p. 883892.
START E.W., ROOVERS M.S., DE VRIES D. (1997) In situ measurements on a wave eld synthesis
system for sound enhancement, Convention paper 4454, AES 102nd convention.
START E.W., VALSTAR V.G., DE VRIES D. (1995) Application of spatial bandwidth reduction in wave
STEARNS S.D., DAVID R.A. (1988) Signal processing algorithms, Prentice-Hall.
STEINBERG J.C., SNOW W.B. (1934) Auditory perspective Physical factors, Journal of the AIEE,
vol. 53, no 11, p. 1215.
STEINKE G. (1996) Surround sound The new phase, Convention paper 4286, AES 100th convention.
STERN JR. R.M., COLBURN H.S. (1978) Theory of binaural interaction based on auditory-nerve data
IV. A model for subjective lateral position, Journal of the Acoustical Society of America, vol. 64, no 1,
p. 127140.
STERNE J. (2003) The audible past Cultural origins of sound reproduction, Duke University Press.
STEWART G.W. (2001) Matrix algorithms Volume II : Eigensystems, SIAM.
293
STOUGHTON R. (1993) Source imaging with minimum mean-squared error, J. Acoust. Soc. Am., vol. 94,
no 2, p. 827834.
STRAUSS M., SONTACCHI A., NOISTERNIG M., HOLDRICH R. (2003) A Spatial Audio Interface for
Desktop Applications, Proceedings of the AES 24th international conference, p. 6669.
TAKANE S., SONE T. (2004) A new theory for active suppression of reected sound waves from the
walls based on Kirchhoff-Helmholtz boundary integral equation, Acoust. Sci. & Tech., vol. 25, no 1,
p. 3744.
TAKANE S., SUZUKI Y., MIYAJIMA T., SONE T. (2003) A new theory for high denition virtual acoustic
display named ADVISE, Acoust. Sci. & Tech., vol. 24, no 5, p. 276283.
TAKANE S., SUZUKI Y., SONE T. (1999) A New Method for Global Sound Field Reproduction Based on
Kirchhoff s Integral Equation, Acustica, Acta Acustica, vol. 85, p. 250257.
TAKEUCHI T., NELSON P.A. (2002) Optimal source distributions for binaural synthesis over loudspea-
kers, J. Acoust. Soc. Am., vol. 112, no 6, p. 27862797.
TAM P.S., RAFAELY B. (2002) Adaptive sound equalisation using constrained frequency-domain lters,
Proceedings of Active 2002, p. 401412.
THEILE G. (1993) The new sound format 3/2 stereo, Convention paper 3550a, AES 94rd convention.
THEILE G., WITTEK H. (2004) Wave eld synthesis : A promising spatial audio rendering concept,
Acoustical Sciences and Technologies, vol. 25, no 6, p. 393399.
THEILE G., WITTEK H., REISINGER M. (2003) Potential wave eld synthesis application in the multi-
channel stereophonic world, Proceedings of the AES 24th international conference, p. 4357.
TICHENER P.F. (1992) Adaptive lters for audio An overview with application examples, Convention
paper 3374, 93rd Audio Engineering Society Convention.
TOHYAMA M., SUZUKI A. (1989) Interaural cross-correlation coefcients in stereo-reproduced sound
elds, Journal of the Acoustical Society of America, vol. 85, no 2, p. 780786.
TOKUNO H., KIRKEBY O., NELSON P.A., HAMADA H. (1997) Inverse lter of sound reproduction
systems using regularization, IEICE Transactions on Fundamentals Electronics Cummunications and
Computer Sciences, vol. 80, no 5, p. 809820.
TOOLE F.E. (2006) Loudspeakers and rooms for sound reproduction A scientic review, Journal of the
Audio Engineering Society, vol. 54, no 6, p. 451476.
TORICK E. (1998) Highlights in the history of multichannel sound, Journal of the Audio Engineering
Society, vol. 46, no 1/2, p. 2731.
294
TROCHIMCZYK M. (2001) From circles to nets : On the signication of spatial sound imagery in new
musics, Computer Music Journal, vol. 25, no 4, p. 3956.
USHER J., WOSZCZYK W. (2003) Design and testing of a graphical mapping tool for analyzing spatial
audio scenes, Proceedings of the AES 24th international conference, p. 157170.
UTO S., HAMADA H. (1995) Transform domain adaptive audio equalizer for active control of sound
eld, Active 95.
VAN DER HEIDE E. (2002) A world beyond the loudspeaker,
http ://utopia.ision.nl/users/heide/world_beyond.html.
VARLA A., M A., MARTIKAINEN I., PILCHNER M., SHOUSTAL R., ANET C. (1999) Design of room
for multichannel audio monitoring, Proceedings of the AES 16th international conference, p. 523531.
VECCHIO A., POLITO T., JANSSENS K., AUWEARAER H.V.D. (2003) Real-time sound quality evalua-
tion of aircraft interior noise, Acta Acustica, vol. 89, no SUPP., p. S53.
VEIT I., SANDER H. (1987) Production of spatially limited diffuse sound eld in an anechoic room,
VERHEIJEN E.N.G. (1995) Evaluation of loudspeaker arrays for wave els synthesis in audio reproduc-
tion, Convention paper 3974, AES 98th convention.
VERHEIJEN E.N.G. (1998) Sound reproduction by wave eld synthesis, Thse de doctorat, Universit
Technique de Delft.
VERONESI W.A., MAYNARD J.D. (1989) Digital holographic reconstruction of sources with arbitrarily
shaped surfaces, J. Acoust. Soc. Am., vol. 85, no 2, p. 588598.
VERSCHUUR D.J., KAIZER A.J.M., DRUYVESTEYN W.F., DE VRIES D. (1988) Wigner representation
of loudspeaker responses in a living room, Journal of the Audio Engineering Society, vol. 36, no 4, p.
203212.
VNNEN R., WARUSFEL O., EMERIT M. (2002) Encoding and rendering of perceptual sound scenes
in the CARROUSO project, Proceedings of the AES 22nd International Conference on Virtual, Syn-
thetic and Entertainment Audio.
WANG K., H. GE Y.D. (2001) Adaptive parametric schemes for analysis and synthesis of musical si-
gnals, Journal of the Audio Engineering Society, vol. 49, no 5, p. 353365.
WARD D.B., ELKO G.W. (1999) Effect of Loudspeaker Position on the Robustness of Acoustic Crosstalk
Cancellation, IEEE Signal Processing Letters, vol. 6, no 5, p. 106108.
295
WATANABE Y., TOKUNO H., HAMADA H., NELSON P.A. (1999) Sound reproduction for telecommuni-
cations system using auditory cues in virtual acoustic environment, Active 99, p. 12931304.
WEBER R., BAUMANN I., FREESE N., KRUSE R., MELLERT V. (2003) Psychoacoustic analysis of
sound in the cabin of passenger aircrafts, Acta Acustica, vol. 89, no SUPP., p. S10.
WIDROW B., WALACH E. (1995) Adaptive inverse control, Prentice-Hall.
WIGHTMAN F.L. (1992) The dominant role of low-frequency interaural time differences in sound loca-
lization, Journal of the Acoustical Society of America, vol. 91, no 3, p. 16481661.
WIGHTMAN F.L., KISTLER D.J. (1989a) Headphone simulation of free-eld listening. I : Stimulus syn-
thesis, Journal of the Acoustical Society of America, vol. 85, no 2, p. 858867.
WIGHTMAN F.L., KISTLER D.J. (1989b) Headphone simulation of free-eld listening. II : Psychophy-
sical validation, Journal of the Acoustical Society of America, vol. 85, no 2, p. 868878.
WILLIAMS E.G. (1999) Fourier acoustics Sound radiation and neareld acoustical holography, Aca-
demic Press.
WILLIAMS E.G., HOUSTON B.H., HERDIC P.C. (2003) Fast fourier transform and singular value de-
composition formulations for patch neareld acoustical holography, Journal of the Acoustical Society
of America, vol. 114, no 3, p. 1322 1333.
WILLIAMS M. (2003) Multichannel sound recording practice using microphone arrays, Proceedings of
the AES 24th international conference, p. 289304.
WILSON S. (2003) Information arts : Intersections of art, science, and technology, The MIT Press.
WOSZCZYK W., COOPERSTOCK J., ROSTON J., MARTENS W. (2005) Shake, rattle, and roll : getting
immersed in multisensory, interactive music via broadband networks, Journal of the Audio Enginee-
WU S.F., ZHAO X. (2002) Combined Helmholtz equation-least squares method for reconstructing
acoustic radiation from arbitrarily shaped objects, Journal of the Acoustical Society of America, vol.
112, no 1, p. 179 188.
YANG J., GAN W.S., TAN S.E. (2003) Improved sound separation using three loudspeakers, Acoustics
research letters online, vol. 4, no 2, p. 4752.
YOKOTA T., SAKAMOTO S., TACHIBANA H. (2004) Sound eld simulation method by combining nite
difference time domain calculation and multi-channel reproduction technique, Acoustical Sciences
and Technologies, vol. 25, no 1, p. 1523.
296
YON S., TANTER M., FINK M. (2003) Sound focusing in rooms : The time-reversal approach, Journal
of the Acoustical Society of America, vol. 113, no 3, p. 15331543.
YOON S.H., NELSON P.A. (2000) Estimation of acoustics source strength by inverse method : Part II,
experimental investigation of methods for choosing regularization parameters, Journal of Sound and
Vibration, vol. 233, no 4, p. 669705.
ZHAO X., WU S.F. (2005) Reconstruction of vibroacoustic elds in half-space by using hybrid near-eld
acoustical holography, Journal of the Acoustical Society of America, vol. 117, no 2, p. 555 565.
ZIELI
NSKI S.K., RUMSEY F., BECH S., DE BRUYN B., KASSIER R. (2003) Computer games and
multichannel audio quality The effect of division of attention between auditory and visual modalities,
ZIOMEK L.J. (1995) Fundamentals of acoustic eld theory and space time signal processing, CRCPress.
ZMOLNIG J.M., SONTACCHI A., RITSCH W. (2003) The IEM-Cube, A periphonic re-/production, Pro-
ceedings of the AES 24th international conference, p. 2125.
ZLZER U. (1997) Digital audio signal processing, John Wiley & Sons.
ZVONAR R. (sans date) A History of Spatial Music, http ://www.zvonar.com/writing/spatial_music/History.html.
ZWICKER E., FASTL H. (1999) Psycho-acoustics, Springer.
297
ANNEXE A
DVELOPPEMENTSTHORIQUESCOMPLMENTAIRES
Cette annexe rassemble tous les dveloppements thoriques qui ne sont pas prsents dans
le corps de la thse mais qui demeurent ncessaires au support des propositions et rsultats
principaux.
Les sections gnrales de cette annexe sont : la dnition des modes propres dune salle
lgrement amortie aux surfaces (A.1), limportance du nombre de conditionnement (A.2), les
dveloppements au sujet du contrle optimal de type AWFS (Adaptive Wave Field Synthesis)
(A.3), la dcomposition en valeurs singulires de lAWFS (A.3.3, page 308), les facteurs de l-
trages pour lAWFS (A.3.4, page 311) une revue de lAmbisonie (A.4, page 313), le dveloppe-
ment des oprateurs de la WFS (A.5, page 327) et la transformation des oprateurs frquentiels
de la WFS vers le domaine temporel (A.7, page 347). La section A.6 prsente un lien entre
lholophonie et lambisonie. La section A.8 (page 354) introduit les proprits gnrales de la
dcomposition en valeurs singulires. La section A.9 prsente quelques notions du traitement
du signal pour lAWFS base sur le contrle indpendant des modes de rayonnement.
A.1 Modes propres dune salle lgrement amortie aux surfaces
Au chapitre 5, un modle acoustique de salle rectangulaire aux parois lgrement amortis-
santes (dimpdance relle, soit de ractance nulle et de conductance non nulle) est introduit.
Les paragraphes qui suivent prsentent le dveloppement ncessaire son obtention.
Le dveloppement se base sur lquation donde harmonique homogne et les conditions
298
limites telles que dnies au chapitre 5 :
2
p(x) +k
2
p(x) = 0 et (A.1)
p(y) n = jk(y)p(y) (A.2)
o p [Pa] est la pression acoustique, x [m] une position dans le volume de la salle, y [m] une
position sur les surfaces de la salle, k [rad/s] le nombre donde et ladmittance acoustique
spcique et adimensionnelle des surfaces de la salle.
Par sparation spatiale de lquation diffrentielle (A.1) et pour un trio dindices modaux
n
x1
, n
x2
et n
x3
dcrit par n = (n
x1
, n
x2
, n
x3
), le mode propre n scrit
n
(x) =
n
x1
(x
1
)
n
x2
(x
2
)
n
x3
(x
3
)/A
n
(A.3)
avec
A
n
=
_
V
n
x1
n
x2
n
x3
dV (A.4)
Comme solution aux quations (A.1) et (A.2), on pose a priori une solution qui ressemble
aux modes propres dune cavit rigide la gomtrie quivalente
n
xi
(x
i
) = cos
_
q
n
xi
x
i
L
xi
+j
n
xi
_
(A.5)
o L
xi
est la longueur de la salle selon x
i
. On cherche q
n
xi
et
n
xi
complexes qui devraient
satisfaire lquation donde spare et les conditions limites.
Dans le problme considr, lutilit dun terme cosinus complexe se dmontre aisment en
notant, pour une constante k = k
R
+jk
I
complexe, lgalit suivante
cos(kx) =
Propagation selon x
..
e
jkrx
e
k
I
x
2
+
Propagation selon x
..
e
jkrx
e
k
I
x
2
(A.6)
qui permet lapparition dune onde progressive selon x et dune onde progressive selon x. Ces
deux ondes progressives prsentent aussi une rduction damplitude avec la distance, rduction
contrle par lampleur de la partie imaginaire de k. Cest ainsi que q
n
xi
complexe dans lqua-
tion (A.5) permet lapparition de composantes propagatives vers les surfaces alors que le terme
de phase
n
xi
permet de dcaler le mode en accord avec le systme de coordonnes.
En considrant une normale n qui pointe vers lextrieur du volume de la salle, les conditions
limites, pour x
i
= 0 et x
i
= L
xi
, (quation (A.2)) sont
_
n
xi
(x
i
)
x
i
_
x
i
=0
= [jk(x
i
)]
x
i
=0
et (A.7)
299
_
n
xi
(x
i
)
x
i
_
x
i
=L
xi
= [jk(x
i
)]
x
i
=L
xi
(A.8)
et elles deviennent (avec lquation (A.5))
tan(j
n
xi
) =
jkL
xi
q
n
xi
et tan(q
n
xi
+j
n
xi
) =
jkL
xi
q
n
xi
(A.9)
Ces deux dernires conditions limites peuvent tre combines pour obtenir
(q
n
xi
n
xi
) = 2 arctan
_
j
i
q
n
xi
_
n
xi
(A.10)
avec
i
= kL
xi
/. Si on utilise arctan(x) = x +O(x
3
), la dernire quation devient
(q
n
xi
n
xi
) = 2
_
j
i
q
n
xi
_
+O(
3
) n
xi
(A.11)
avec petit. Pour n
xi
= 0, on trouve
q
0
xi
=
_
2j
i
+O(
3
) (A.12)
et donc, et en ngligeant les puissances suprieures de , tel quutilis au chapitre 5,
q
0
xi

_
2j
i
=
1
j
_
2jkL
xi
(A.13)
Pour n
xi
,= 0, une approximation supplmentaire doit tre utilise. Lquation (A.11) peut
tre crite comme suit, pour petit,
(q
2
n
xi
q
n
xi
n
xi
) + 2j
i
= q
n
xi
O(
3
) 0 (A.14)
Les racines de cette quation quadratique en q
n
xi
sont
q
n
xi

n
xi
2
n
2
xi
8j
i
2
=
n
xi
2

n
xi
2
1
8jkL
xi
2
n
2
xi
(A.15)
et, avec lexpression en srie de Taylor du premier ordre :
1 x = 1 x/2, deviennent
q
nxi

n
xi
2

n
xi
2

2jkL
xi
2
n
xi
(A.16)
q
nxi
n
xi
2jkL
xi
2
n
xi
(A.17)
si on prend laddition pour et la soustraction pour .
300
Connaissant les expressions de q
n
xi
, on retrouve nalement lexpression de la phase
n
xi

partir de la premire quation (A.9) (toujours avec arctan(x) = x +O(x
3
))
n
xi
=

i
q
n
xi
+O(
3
)
kL
xi
q
n
xi
(A.18)

n
xi
(x
i
) = cos
_
q
n
xi
x
i
L
xi
+
jkL
xi
q
n
xi
_
(A.19)
Les quations (A.5), (A.13), (A.17) et (A.19) forment le schma modal utilis au chapitre 5.
A.2 Signication du nombre de conditionnement
Au chapitre 5, on value le nombre de conditionnement de la matrice dimpdance de
transfert Z pour diffrents systmes. Ce nombre fut aussi utilis en situation exprimentale. Le
nombre de conditionnement de Zest rvlateur de la sensibilit du systme dquations linaires
Zq = p
(rep)
ou Zq = p
(im)
en ce sens que (Z) limite les variations de la norme relative de la
solution q en relation avec les normes relatives de faibles variations sur Z, p
(rep)
ou p
(im)
(toutes
deux notes p pour la suite du dveloppement).
Soit le systme dquations linaires perturb qui suit
[Z +Z] q() = p + p (A.20)
avec q(0) = q. q() est diffrentiable aux environs de = 0 : dq/d = Z
1
( p Zq) et
lexpression en srie de Taylor de q() est
q() = q + [dq/d]
=0
+O(
2
) (A.21)
Avec une norme p (note [[ [[
p
) pour les matrices et les vecteurs [Golub et van Loan, 1996] et
avec la valeur absolue comme norme du scalaire , on trouve (sachant que [[A[[
p
[[x[[
p
[[
b[[
p
pour tout systme dquations linaires)
[[q() q[[
p
[[q[[
p
[[ [[Z
1
[[
p
_
[[ p[[
p
[[q[[
p
+[[Z[[
p
_
+O(
2
) (A.22)
Comme dnition de , on utilise cette relation [Golub et van Loan, 1996] : (Z) = [[Z[[
p
[[Z
1
[[
p
,
et sachant que [[ p[[
p
[[Z[[
p
[[q[[
p
, on trouve
[[q() q[[
p
[[q[[
p
(Z)(
Z
+
p
) +O(
2
) (A.23)
301
avec les variations relatives
Z
et
p
Z
= [[ [[Z[[
p
/[[Z[[
p
(A.24a)
p
= [[ [[ p[[
p
/[[ p[[
p
(A.24b)
Lquation (A.23) illustre la signication et limportance de en terme de sensibilit du systme
dquations linaire Zq = p. Cest ainsi que toutes variations relatives sur Z ou p limitent la va-
riation relative de la solution q. Pour la reproduction de champs acoustiques telle quaborde au
chapitre 5, cest essentiellement la variation
p
qui fut considre. Dans ce contexte de travail
plus particulier et propre la reproduction de champs, un important est donc tmoignage dune
situation peu souhaitable en pratique puisque des changements relatifs dans le champ repro-
duire
p
(im) impliqueraient dimportants changements relatifs dans la solution q. Un dordre
lev pourra ainsi amplier, de plusieurs ordres, les variations dans le champ reproduire
p
(im)
au niveau des amplitudes des sources q. Telle est donc la signication de dans le contexte du
chapitre 5.
A.3 Contrle optimal et AWFS
On peut imaginer, en complment la fonction cot de lquation (5.18) ( la page 89), une
autre fonction cot correspondant une approche dite de contrle optimal par AWFS
J
AWFS
= e
H
e +(q q
WFS
)
H
(q q
WFS
) (A.25)
qui, aprs dveloppement, prend la forme typique dune fonction quadratique Hermitienne de q
J
AWFS
= q
H
(Z
(m)
H
Z
(m)
+I)q q
H
(Z
(m)
H
p
(im)
+q
WFS
)
( p
(im)
H
Z
(m)
H
+q
H
WFS
)q + ( p
(im)
H
p
(im)
+q
H
WFS
q
WFS
) (A.26)
dont le minimum se trouve avec les valeurs dintensit des sources optimales q
(opt)
suivantes
q
(opt)
=
_
Z
(m)
H
Z
(m)
+I
_
1
_
Z
(m)
H
p
(im)
+q
WFS
_
(A.27)
Lquation (A.27) suggre linterprtation suivante : avec laccroissement de , on passe
dune approche de minimisation rgularise des erreurs de reproduction (approche qui amne
les erreurs quadratiques un minimum) jusqu une contribution de plus en plus importante de
la solution pose a priori au dtriment de la rduction de la contribution de la part de la solution
302
qui minimise lerreur quadratique seule. videmment, en posant q
WFS
=

0 on retrouve une
fonction cot reprsentative de la minimisation rgularise de lerreur. En pratique, lquation
(A.27) est implante comme suit pour les simulations de lAWFS dans le domaine frquentiel
q
(opt)
=
_
Z
(m)
H
Z
(m)
+I
_
1
_
Z
(m)
H
p
(im)
_
+
_
Z
(m)
H
Z
(m)
+I
_
1
q
WFS
(A.28)
En cherchant la partie purement optimale de lquation (A.27)
1
, on trouve lexpression suivante
pour les intensits de sources optimales
q
(opt)
=
_
Z
(m)
H
Z
(m)
+I
_
1
_
Z
(m)
H
e
WFS
_
+ q
WFS
(A.29)
o e
WFS
= p
(im)
p
(rep)
WFS
est lerreur de reproduction par WFS seule. Mme si les quations
(A.28) et (A.29) sont quivalentes, la seconde dmontre le travail en parallle effectu par le
contrle optimal et la WFS alors que le contrle optimal tente de rduire lerreur produite par
WFS. Ainsi, mme en appliquant lAWFS avec les quations (A.28) ou (A.27), les mcanismes
en jeu correspondent ceux quil fut possible de souligner avec lquation (A.29). Tel que
prsent au chapitre 8, on remarque le mme comportement lors de la ralisation de lAWFS
par traitement de signal adaptatif.
Lquation (A.25) sapplique bien dans le cas o le nombre de capteurs est plus important
que le nombre de sources
2
. On peut galement modier lquation de contrle optimal classique
pour le cas o le nombre de capteurs est moindre que le nombre de sources tout en incluant lide
de lAWFS. Le dveloppement se rsume comme suit. La fonction cot est la suivante avec des
multiplicateurs de Lagrange

J
AWFS
= (q q
WFS
)
H
(q q
WFS
) +
H
e +e
H
(A.30)
Les vecteurs gradients complexes sont alors les suivants
J
AWFS
R
+j
J
AWFS
I
= 2
_
p
(im)
Z
(m)
H
q
_
(A.31a)
J
AWFS
q
R
= 2q
R
2q
WFS
R
2
R
Z
(m)
R
+ 2
I
Z
(m)
I
(A.31b)
J
AWFS
q
I
= 2q
I
2q
WFS
I
2
R
Z
(m)
I
2
I
Z
(m)
R
(A.31c)
1
Cette partie essentiellement attribuable la minimisation de lerreur serait par exemple q
(opt)
Adapt
= q
(opt)
q
WFS
.
2
Cette mme fonction cot peut par contre tre utilise dans le cas o le nombre de capteurs est moindre que
le nombre de sources tant donn que la prsence de la rgularisation de Tikhonov produit une forme quadratique
Hermitienne dnie positive et non pas semi-dnie positive comme sil ny avait pas de rgularisation.
303
J
AWFS
q
R
+j
J
AWFS
q
I
= 2
_
q q
WFS
Z
(m)
H
_
(A.31d)
o les indices R et I reprsentent les parties relles et imaginaires des diffrentes variables,
respectivement.
En posant les quations (A.31a) et (A.31d) gales

0, on trouve facilement

(opt)
et q
(opt)
qui minimisent la fonction cot de lquation (A.30)
(opt)
=
_
Z
(m)
Z
(m)
H
_
1 _
p
(im)
Z
(m)
q
WFS
(A.32a)
q
(opt)
= q
WFS
+Z
(m)
H
_
Z
(m)
Z
(m)
H
_
1 _
p
(im)
Z
(m)
q
WFS
(A.32b)
En dveloppant quelque peu la dernire quation reprsentative dune formulation de contrle
optimal correspondant lAWFS, on trouve
q
(opt)
= q
WFS
+Z
(m)
H
_
Z
(m)
Z
(m)
H
_
1
_
p
(im)
p
(rep)
WFS
_
(A.33a)
q
(opt)
= Z
(m)
H
_
Z
(m)
Z
(m)
H
_
1
e
WFS
+q
WFS
(A.33b)
o p
(rep)
WFS
= Z
(m)
q
WFS
fut introduit pour reprsenter le champ reproduit par WFS aux capteurs
derreur et e
WFS
= p
(im)
p
(rep)
WFS
reprsente lerreur de reproduction par la WFS seule. Lqua-
tion (A.33b) expose le fait que les intensits optimales des sources de reproduction (pour un
nombre de capteurs moindre quun nombre de sources) ajoutent algbriquement une compo-
sante q
WFS
de telle sorte que lerreur de reproduction e soit nulle. Cet ajout (reprsent par le
premier terme de la partie de droite de lquation (A.33b)) correspond un problme typique
de contrle optimal (toujours pour un nombre de capteurs moindre quun nombre de sources)
de la reproduction de champs acoustiques pour lequel le champ reproduire serait e
WFS
, soit le
manque gagner pour la WFS en relation avec le champ reproduire.
Mme si, dans la tradition des tudes de contrle optimal, la relation entre le nombre de
capteurs et le nombre de sources dtermine lusage de lune des deux fonctions cot prsentes,
il est possible de se contenter de celle dnie par le cas sur-dtermin (M > L, le cas de
lquation (A.25)) dans la mesure o la matrice Hessienne de cette fonction est dnie positive
mme si M < L. Ce qui est le cas avec > 0 et qui peut sexpliquer facilement en se basant
sur la notion de dnie positive pour les fonctions quadratiques gnrales.
Le terme quadratique et la matrice Hessienne de la premire fonction cot de lquation
(A.25) peuvent tre dvelopps comme suit
q
H
[Z
(m)
H
Z
(m)
+I]q = q
H
Z
(m)
H
Z
(m)
q + q
H
Iq (A.34)
304
o Z
(m)
H
Z
(m)
est dnie positive si L < M, et semi-dnie positive si L M. Dans les
deux cas, on peut gnraliser en notant quelle est au moins semi-dnie positive et que I est
videmment toujours dnie positive de telle sorte que
q
H
Z
(m)
H
Z
(m)
q 0 et (A.35a)
q
H
Iq > 0 (A.35b)
q
H
Z
(m)
H
Z
(m)
q +q
H
Iq > 0 > 0 (A.35c)
Lingalit (A.35c) montre donc que le terme quadratique de la fonction quadratique (quation
(A.25)) de q est bel et bien dni positif mme si M Lgrce lintroduction de la pnalisation
() qui, il faut le noter, joue le mme rle que la rgularisation de Tikhonov utilise au chapitre 5
en terme de rgularisation de linversion de la matrice. Pour cette raison, la fonction cot (A.25)
est utilise dans tous les cas dAWFS considrs aux chapitres 6 et 7.
A.3.1 Interprtation mathmatique du problme physique de lAWFS partir dun problme
inverse
La minimisation de lcart dune solution optimale par rapport une solution pose a priori
peut tre interprte dune autre faon si le problme suivant, plus gnral, est considr comme
point de dpart
Z
(m)
()q() = p
(im)
() (A.36)
alors que la pression p
(im)
() est pose et que lon cherche q(). On suppose que le cas consi-
dr est sous-dtermin (M < L, o M est le nombre de capteurs et L le nombre de sources).
La matrice dimpdance de transfert Z
(m)
ML
() est dcompose selon ses valeurs singulires (on
laisse tomber la dpendance en frquences pour allger la notation) [Elliott, 2001]
Z
(m)
= U
MM
ML
V
H
LL
(A.37)
o est la matrice pseudo-diagonale des valeurs singulires. Les matrices Uet Vsont des ma-
trices unitaires et construites partir des vecteurs propres des matrices Z
(m)
Z
(m)
H
et Z
(m)
H
Z
(m)
respectivement. Ces deux matrices (Uet V) sont de rang r qui est lui-mme gal ou infrieur
M car M < L. Cette dcomposition permet lintroduction des vecteurs de pression reproduire
(
p
(im)
) et des vecteurs dintensit des sources (
q) transforms
p
(im)
= U
H
p
(im)
et

q = V
H
q (A.38)
305
Lquation sous-dtermine rsoudre (A.36) peut donc scrire comme suit
q =

p
(im)
(A.39)
Pour trouver une solution cette quation, il faudrait que le vecteur p
(im)
ne soit constitu
que des premires pressions transformes (il y en a M). Ce qui se formalise comme suit
u
H
i
p
(im)
= 0 i > r (A.40)
o u
i
reprsente la colone i de la matrice U. Cette possibilit ne peut survenir que si M L.
Dans le cas contraire, on doit trouver une solution qui minimise lerreur quadratique
J =
_
Z
(m)
q p
(im)
H
_
Z
(m)
q p
(im)
(A.41)
Ce qui correspond une approche typique en problmes inverses sous-dtermins concidant,
en partie, lquation (A.25).
La solution (il peut y en avoir plusieurs puisque le systme dquation est sous-dtermin),
est la projection de p
(im)
sur u
i
i r la partie indtermine est reprsente par la contribution
des autres vecteurs v
i
i > r. Il est donc possible dcrire toutes les solutions comme suit
q =
r
i=1
p
(im)
i
i
v
i
+
L
i=r+1
i
v
i
(A.42)
o p
(im)
i
est la composante i du vecteur de pression reproduire transform (
p
(im)
),
i
la valeur
singulire i (en ordre dcroissant) de la matrice Z
(m)
, v
i
la colonne i de la matrice V et
i
des scalaires indtermins qui dmontrent, justement, la nature sous-dtermine du problme
de lquation (A.36) lorsque M < L. r est le rang de la matrice (r M, avec M < L).
Dans ce cas, la solution q peut prendre, comme les valeurs
i
qui reprsentent la contribution
du vecteur source v
i
dans la dnition de q, une innit de valeurs diffrentes. Ce qui reprsente
lindtermination de lquation (7.16).
Tel quexpose la section prcdente, une des approches possibles consiste trouver une de
ces solutions qui soit la plus proche dune solution pose a priori. Dans le contexte de lAWFS,
cest ce qui correspond lquation (A.25). Une approche, plus spcique dans sa formulation
et prsentant un point de vue quelque peu diffrent de celui expos la section prcdente,
consiste minimiser la somme des carts quadratiques entre les contributions des composantes
de sources v
i
( p
(im)
i
/
i
i r et
i
i > r) et les projections de la solution q
WFS
sur v
i
i.
306
Ce qui revient poser la fonction cot suivante
J(
i
) =
r
i=1
_
p
(im)
i
/
i
q
H
WFS
v
i
_
2
+
L
i=r+1
_
i
q
H
WFS
v
i
_
2
(A.43)
pour laquelle on trouve un minimum en imposant
i
= q
H
WFS
v
i
i > r (A.44)
En considrant les deux quations prcdentes, on remarque donc que les r M premires
contributions des vecteurs v
i
sont entirement dtermines par la composante de pression
reproduire transforme p
(im)
i
et la valeur singulire non-nulle correspondante
i
(cest ce qui
correspond aux termes de la premire somme de lquation (7.16)) alors que les valeurs
i
correspondent aux projections de la solution pose a priori sur les vecteurs v
i
pour les L
r autres contributions. Cest ainsi que la solution pose a priori est dcompose sur la base
des v
i
i > r (comme le propose lquation (A.44)) pour dterminer la valeur, auparavant
indtermine lquation (7.16), des contributions de v
i
dans q.
Mme si lapproche de minimisation par rapport une solution pose a priori prsente
dans cette sous-section propose une interprtation mathmatique claire et couramment sollici-
te en problmes inverses linaires, on se base plutt sur la formulation quadratique introduite
lquation (A.25) qui correspond plus une approche pratique et permet la simple ralisation
dun algorithme du gradient de type leaky sur la base dune rgularisation par optimisation
(lquation (A.25) correspond en effet une rgularisation par lintroduction dun nouvel l-
ment minimiser, pondr par , alors que lapproche en cette section cherchait plutt dter-
miner les valeurs
i
i > r qui minimisent systmatiquement lcart entre la solution pose
a priori et la solution q de lquation (A.36)). En agissant ainsi, il devient ais de modier des
algorithmes adaptatifs comme le FXLMS.
Par contre, il est montr plus loin que les deux approches (celle base sur les problmes
inverses la section A.3.1 et celle plus proche du contrle optimal la section A.3) sont par-
faitement quivalentes et introduisent la notion de contrle plusieurs canaux indpendants par
transformation. Lensemble de cette possibilit est prsent la section A.3.3 et aux chapitres 7
et 8.
307
A.3.2 Dmonstration de lquivalence de lAWFS et dun problme classique des
moindres-carrs
Soit un problme classique des moindres-carrs dni comme suit pour le cas de la repro-
duction de champs acoustiques par contrle optimal sans pnalisation
min
_
e
H
e
_
= min
_
_
p
(im)
Z
(m)
q
H
_
p
(im)
Z
(m)
q
_
(A.45)
o x
H
x = [[x[[
2
2
reprsente la norme deux (la norme Eucldienne) au carr dun vecteur x.
Posons maintenant un autre problme reprsentatif de lAWFS
min
_
[[e[[
2
2
+[[q q
WFS
[[
2
2
_
= min
_
[[ p
(im)
Z
(m)
q[[
2
2
+[[q q
WFS
[[
2
2
_
(A.46)
de telle sorte quil soit possible, en introduisant deux nouvelles matrices en blocs
Z
(m)
=
_
Z
(m)
I
_
et (A.47a)
p
(im)
=
_
p
(im)
q
WFS
_
(A.47b)
dcrire lobjectif de minimisation (A.46) comme suit
min
_
[[
p
(im)

Z
(m)
q[[
2
2
_
. (A.48)
ce qui correspond exactement la structure du problme classique des moindres-carrs pos
lquation (A.45). Ce qui prouve que la minimisation de la somme des erreurs quadratiques avec
une pnalisation de lcart par rapport la solution pose a priori demeure un problme simple
des moindres-carrs. Quoiquil soit possible dutiliser lquation (A.48) pour trouver la solution
optimale qui minimise cette fonction, on se contente dutiliser lquation (A.28) pour le calcul
numrique de la solution optimale dans le corps de cette thse.
A.3.3 AWFS base sur le contrle indpendant des modes de rayonnement par
dcomposition en valeurs singulires
Dans cette section, on prouve lquivalence des quations (7.18) et (A.25). Le dcouplage
des distributions dintensit de sources de lAWFS correspondante est par la suite prsent.
308
LAWFS fut dabord caractrise par lobjectif de minimisation de la fonction cot suivante
J
AWFS
= e
H
e +(q q
WFS
)
H
(q q
WFS
) (A.49)
avec e = p
(im)
Z
(m)
q. La matrice dimpdance de transfert est encore dcompose en ses
valeurs singulires de telle sorte que son expansion en valeurs singulires soit
Z
(m)
= UV
H
avec (A.50a)
U
H
U = UU
H
= I, V
H
V = VV
H
= I, (A.50b)
q = V
H
q,

p
(im)
= U
H
p
(im)
et

p
(rep)
= U
H
p
(rep)
(A.50c)
Les colonnes des matrices Uet Vsont les vecteurs orthonormaux u
i
et v
i
respectivement. u
i
et v
i
sont en fait les vecteurs singuliers de gauche et de droite, pour la matrice Z
(m)
, et forment
des bases orthonormales des espaces vectoriels complexes C
L
et C
M
respectivement. En sup-
posant que le dveloppement est effectu dans le domaine frquentiel (toutes les matrices et les
vecteurs sont fonction de la frquence ), on peut travailler avec les distributions dintensit de
sources transformes

q et la fonction cot devient dabord
J
AWFS
(
q) =
_
p
(im)
Z
(m)
V
q
_
H
_
p
(im)
Z
(m)
V
q
_
+
_
V
q V
q
WFS
_
H
_
V
q V
q
WFS
_
(A.51)
tant donn que V est unitaire, on trouve directement
J
AWFS
(
q) =
_
p
(im)
Z
(m)
V
q
_
H
_
p
(im)
Z
(m)
V
q
_
+
_
q
WFS
_
H
_
q
WFS
_
(A.52)
qui peut, en utilisant les pressions transformes (
p
(rep)
et

p
(im)
) et lexpansion en valeurs singu-
lires de Z
(m)
, devenir
J
AWFS
(
q) =
_
U
p
(im)
U
q
_
H
_
U
p
(im)
U
q
_
+
_
q
WFS
_
H
_
q
WFS
_
(A.53)
et puisque la matrice Uest aussi unitaire, on trouve que lquation (A.49) devient la suivante
J
AWFS
(
q) =
_
p
(im)
q
_
H
_
p
(im)
q
_
+
_
q
WFS
_
H
_
q
WFS
_
(A.54)
Le passage de lquation (A.49) la prcdente illustre deux faits : 1) il est possible de travailler
en composantes dintensit de sources et de pressions transformes sans changer la nature de la
minimisation et 2) le problme est diagonalis en un certain nombre de problmes indpendants
puisque est une matrice pseudo-diagonale.
309
Les valeurs des sources transformes qui minimisent la prcdente quation sont
q
(opt)
=
_
H
+I
1
_
p
(im)
+
q
WFS
_
(A.55)
et puisque est une matrice pseudo-diagonale, le problme de contrle optimal est dcoupl.
On poursuit le dveloppement pour dmontrer la nature dune telle approche de contrle ind-
pendant base sur les transformes de pressions et de sources (ce qui peut en fait correspondre
aux modes de rayonnement de lantenne de sources couple lantenne de capteurs, voir le
chapitre 7).
On introduit une nouvelle matrice
A =
H
+I =
_
2
1
+ 0 0
0
2
2
+ 0 0
.
.
. 0
.
.
. 0 0
.
.
. 0
2
r
+ 0
.
.
.
0 0
.
.
. 0
0 0
_
_
LL
(A.56)
o typiquement, le rang r de Z
(m)
est M avec M < L. Linverse de Ase trouve aisment
A
1
=
_
_
1/(
2
1
+) 0 0
0 1/(
2
2
+) 0 0
.
.
. 0
.
.
. 0 0
.
.
. 0 1/(
2
r
+) 0
.
.
.
0 0
.
.
. 0
0 0 1/
_
_
LL
(A.57)
et la solution optimale devient
q
(opt)
= A
1
p
(im)
+A
1
q
WFS
. (A.58)
Puisque A
1
est diagonale et que est pseudo-diagonale, le problme est entirement dcoupl
et chacun des termes de

q
(opt)
est individuellement dni
q
i
=
_
i
(
2
i
+
i
)
p
(im)
i
+

i
(
2
i
+
i
)
q
WFS
i
, i r M
q
WFS
i
,
i
,= 0 et i > r
0,
i
= 0 et i > r
(A.59)
310
La dernire quation dmontre le mcanisme de contrle qui est dissimul sous lAWFS gn-
rale de lquation (A.49) (on note aussi quil devient possible de rgulariser indpendamment
les distributions de sources transformes par
i
). Ainsi, seules les r premires transformes de
distributions dintensit de sources sont utiles pour le contrle au niveau des M capteurs. De
plus, le reste des distributions dintensit de sources pour i > r est exclusivement dni par la
solution pose a priori et ce, indpendamment de la pnalisation
i
, tant que
i
> 0. En bref, la
dernire quation dmontre la nature de la redondance qui existe dans tout systme de contrle
actif pour lequel M < L. Ainsi, mme en rduction du bruit (en contrle actif du bruit), il suft
de placer q
WFS
=
0 pour pouvoir appliquer les mmes observations que celles qui dcoulent de
lAWFS optimale.
Finalement, selon la thorie des matrices, on remarque que si le rang r de la matrice dimp-
dance de transfert est gal M (avec M < L), le noyau (ou lespace nul) de la matrice Z
(m)
est
lensemble des vecteurs singuliers v
i
i > r : Ker[Z
(m)
] = Null[Z
(m)
] = q : Z
(m)
q =

0.
Limage, ou ltendue, de la matrice Z
(m)
est quant elle dnie par Ran[Z
(m)
] = p
(rep)
:
p
(rep)
= Z
(m)
q, et pour la matrice Z
(m)
ltendue correspond en fait au span des vecteurs
singuliers u
i
. Limage et le noyau de la matrice jouent des rles distincts dans lquation (A.59)
A.3.4 Facteurs de ltrage pour lAWFS
Pour comprendre leffet de sur la rgularisation individuelle des modes de rayonnement,
on utilise la dnition des facteurs de ltrage. De faon gnrale, les facteurs de ltrage f
i
(pour
chaque mode de rayonnement i) dterminent pour une mthode de rgularisation donne
lamortissement ou le ltrage des composantes i de la SVD dans la solution [Hansen, 1998].
Pour la rgularisation de type Tikhonov, des formulations explicites des f
i
existent [Hansen,
1998].
La solution AWFS donne par lquation (A.59) peut tre crite diffremment sous forme
matricielle (avec les dimensions en indice) [Hansen, 1998] :
q
(opt)
L1
= V
LL
LL
[
+
]
LM
U
H
MM
e
WFS
M1
+ q
WFS
L1
(A.60)
avec = diag(f
i
) i L. La matrice
+
(issue de la dnition du pseudo-inverse) est quant
311
elle dnie comme suit :
+
=
_
_
1/
1
0 0
0 1/
2
0 0
.
.
.
0 0 1/
M
0
_
_
T
(A.61)
de telle sorte que lquation (A.60) puisse tre crite avec une sommation
q
(opt)
=
r
i=1
f
i
u
H
i
e
WFS
i
v
i
+q
WFS
=
L
i=1
q
i
v
i
(A.62)
o
q
i
= f
i
u
H
i
e
WFS
i
+ q
WFS
i
(A.63)
Les facteurs de ltrage f
i
sont essentiellement attribuables la mthode de rgularisation privi-
lgie (ici, la mthode de Tikhonov gnralise avec une matrice identit comme oprateur de
rgularisation) [Hansen, 1998].
Connaissant la solution q
(opt)
selon lquation (A.59), on trouve les facteurs de ltrage sui-
vants aprs des dveloppements algbriques :
f
i
=
_
_
_
2
i
(
2
i
+
i
)
i r
0 i > r et i < L
(A.64)
Dans le cas gnral de la pnalisation,
i
= .
Les facteurs de ltrage f
i
varient entre 1 et 0 et expriment la rduction dimportance attri-
bue la contribution u
H
i
e
WFS
/
i
de la composante i dans la solution. Un f
i
= 1 implique
une contribution i essentiellement attribuable u
H
i
e
WFS
/
i
(attnuation totale de lerreur de la
WFS, ce qui peut inclure lannulation totale de q
WFS
i
) alors quun f
i
approchant 0 implique
une contribution essentiellement attribuable la solution pose a priori q
WFS
i
dans lquation
(A.63). Cette transition est plus claire en considrant une criture quivalente lquation (A.63)
[Hansen, 1998] :
q
i
= f
i
p
(im)
i
i
+ (1 f
i
) q
WFS
i
. (A.65)
Comprenant limportance des facteurs de ltrage, il est possible de tracer leur forme gnrique
(quation (A.64)) en fonction de a
i
=
i
/
2
i
(ce qui donne f
i
= 1/(1 + a
i
)) la gure A.1
(p. 313). Ce type de courbes, propre la rgularisation gnralise de Tikhonov avec solution
a priori, dnit les courbes lmentaires qui forment les courbes en L (voir le chapitre 5 et la
rfrence [Hansen, 1998] ce sujet).
312
10
4
10
2
10
0
10
2
10
4
10
4
10
3
10
2
10
1
10
0
a
i
f
i
f
i
=
i
2
/(
i
2
+
i
) avec a
i
=
i
/
i
2
f
i
1f
i
f
i
=1
f
i
=1/a
i
a
i
=
1

f
i
=0.5
Figure A.1 Facteur de ltrage f
i
gnrique en fonction de a
i
=
i
/
2
i
.
A.4 La thorie derrire lambisonie
Comme point de dpart, une onde progressive plane doit tre reproduite
p
(im)
(R, , ) = Ae
jkRcos()
(A.66)
dans un espace aux coordonnes cylindriques (R, , z) o est la direction de propagation de
londe plane harmonique pour laquelle on suppose une direction de propagation dans le plan
horizontal, ce qui, demble, rvle le principal intrt technologique de lambisonie, soit la
reproduction de la direction darrive du son.
Il est possible dexprimer le champ dsir sous la forme dune srie de Fourier-Bessel
3
p
(im)
(R, , ) = AJ
0
(kR) + 2A
n=1
j
n
J
n
(kR) cos(n( )) (A.67)
que lon peut transformer ainsi avec une simple identit trigonomtrique
p
(im)
(R, , ) = AJ
0
(kR)+2A
n=1
j
n
J
n
(kR) cos(n) cos(n)+2A
n=1
j
n
J
n
(kR) sin(n) sin(n)
(A.68)
3
Lquation (A.67) peut tre drive autrement : partir des modes de phase puis des modes damplitude dun
champ horizontal inni[Poletti, 2000]. En transformant un champ de pression harmonique en deux dimensions
p(R, , ) en une distribution quivalente de sources planes linni en fonction de , il est possible dcrire
cette distribution priodique de sources (selon ) par srie de Fourier pour trouver le spectre de cette distribution
angulaire. Chaque composante du spectre de la srie de Fourier de la distribution de sources planes pondre un
mode de phase ou un mode damplitude dterminant la pression sur un cercle une distance r de lorigine [Poletti,
2000]. Lexpansion en modes damplitude mne aussi lquation (A.67).
313
La fonction J
n
est une fonction de Bessel du premier type et dordre n. En pratique, cette srie
ne pourra jamais tre value jusqu n = . Il est consquemment raisonnable de reformuler
(A.66) sous la forme dun produit scalaire de deux vecteurs
p
(im)
(r, ) = Ac
T
h (A.69)
o
c
T
=

2
_
1/
2 cos() sin() . . . cos(n) sin(n) . . .

_
(A.70a)
h
T
=

2
_
J
0
(kR)/
2 j cos()J
1
(kR) j sin()J
1
(kR) . . . j
n
cos(n)J
n
(kR) j
n
sin(n)J
n
(kR) . . .
_
(A.70b)
Les coefcients c
n
sont donc les coefcients de lexpansion et ce sont eux qui dterminent
entirement la nature du champ original p
(im)
(ils sont les seuls varier avec , la direction de
propagation de londe plane reproduire). Avec ce symbolisme et le jargon ambisonique, on
note que le vecteur c des coefcients de la srie reprsente lencodage de limage reproduire
p
(im)
(R, , ). En situation denregistrement ou de prise de son ambisonique, on cherche
trouver ces coefcients (lencodage de linformation spatiale qui dcrit le champ original). Lors
de la prise de son relle, on chercherait donc les valeurs suivantes lors de lopration dencodage
c
o
= 1 (A.71)
c
1
=
2 cos() (A.72)
c
2
=
2 sin() (A.73)
.
.
.
.
.
.
c
2n1
=
2 cos(n) (A.74)
c
2n
=
2 sin(n) (A.75)
.
.
.
.
.
.
Si la pression reproduire p
(im)
est connue a priori (comme dans le cas de londe progressive
plane dnie lquation (A.66)), lensemble des coefcients c
i
sont aisment valuables
partir de (A.70a). Malgr le fait que ces coefcients soient tous valuables, la srie devra tre
nie pour n de calcul. Le vecteur c inclura alors 2N + 1 coefcients o N est lordre de
troncature de la srie de Fourier-Bessel. En pratique, si p
(im)
est un champ rel, on se tourne vers
la captation laide de microphones (cest la prise de son relle). Les trois premiers coefcients
de la srie (soit c
0
, c
1
et c
2
) correspondent respectivement aux sorties de microphones de type
omnidirectionnel (c
0
) et bidirectionnel (c
1
et c
2
, placs angle droit). Ainsi, titre dexemple,
une onde progressive reproduire pour laquelle = 0 produira un signal aux bornes du capteur
omnidirectionnel et du capteur bidirectionnel pour lequel laxe est align avec la direction de
propagation de londe progressive plane reproduire. Ces trois capteurs devraient thoriquement
314
tre situs au mme point. Selon les conventions technologiques du format ambisonique, un tel
encodage sera quali de premier ordre en deux dimensions et les variables suivantes dcrivent
lencodage dune direction de propagation
W = Ac
o
= A, (A.76)
X =
2Ac
1
= 2Acos() (A.77)
Y =
2Ac
2
= 2Asin() (A.78)
Dans le cas dun systme ambisonique du second ordre en deux dimensions, deux coefcients
dencodage doivent tre ajouts
U =
2Ac
3
= 2Acos(2) (A.79)
V =
2Ac
4
= 2Asin(2) (A.80)
Ce type de captation peut aisment tre ralis laide du microphone Soundeld spcia-
lement conu pour la prise de son ambisonique [Rumsey, 2001; Nicol et Emerit, 1999]. En
pratique, il est possible de mesurer seulement les trois coefcients dordre zro et un (du moins,
pour une mesure dans le plan horizontal) puisque les capteurs dordres plus levs ne sont quau
stade de la recherche quoique de plus en plus populaires en exprimentation avec des capsules
de microphones peu dispendieuses (on pense par exemple aux antennes de capteurs circulaires).
Invitablement, la srie de Fourier-Bessel reprsentative de p
(im)
est donc tronque dans le cas
de la captation relle dun champ reproduire. La troncature est du premier ordre et dnit
consquemment ltendue spatiale de la convergence de la srie de Fourier-Bessel. Dautres d-
tails thoriques au sujet de la troncature prsentent un rapport clair avec la ralisation thorique
et pratique de lAWFS, soit le sujet principal de cette thse. Ces aspects sont prsents aux
chapitres 7 et 8.
Maintenant que c est prescrit, il est dsirable dapprocher p
(im)
= Ac
T
h par p
(rep)
. Pour
produire p
(rep)
, une srie de L haut-parleurs est place de telle sorte que le rseau quidistant
forme un cercle autour du point dcoute. On suppose de plus que la distance de ces sources de
reproduction est importante en comparaison avec la longueur donde de telle sorte que larrive
des fronts donde au point dcoute puisse tre reprsente par la superposition dondes pro-
gressives planes (chacune delles correspond la position angulaire dun haut-parleur) au point
dcoute que lon suppose au centre du rseau circulaire de haut-parleurs. Cest ainsi que lon
crit p
(rep)
(R, , ) aux environs immdiats du point dcoute
p
(rep)
(R, , ) =
L
l=1
A
l
e
jkRcos(
l
)
(A.81)
315
o
l
= l2/L est la position angulaire du haut-parleur l et A
l
est lamplitude de londe plane
produite par le haut-parleur l du total de L haut-parleurs
4
. leur tour, chacune de ces ondes
planes peut tre reprsente par une srie de Fourier-Bessel
p
(rep)
(R, ) =
L
l=1
A
l
c
T
l
h =

A
T
C
T
h (A.82)
o
A
T
= [A
1
. . . A
L
] (A.83a)
C = [c
1
. . . c
L
] (A.83b)
c
l
=
2
_
1/
2 cos(
l
) sin(
l
) . . . cos(n
l
) sin(n
l
) . . .
_
T
(A.83c)
Tous les coefcients de la srie de Fourier-Bessel attribuables chacun des haut-parleurs (c
l
)
sont thoriquement valuables puisque la position angulaire (
l
) des haut-parleurs de reproduc-
tion est connue. La matrice C dcrit donc le champ spatial produit par lensemble des L haut-
parleurs dans la limite de lapproximation des champs des haut-parleurs par des ondes planes.
Connaissant maintenant les dnitions du champ reproduire et du champ reproduit selon leurs
expansions de Fourier-Bessel, le problme de reproduction est pos comme suit aux environs
du point dcoute
p
(rep)
(R, ) = p
(im)
(R, )

A
T
C
T
h = Ac
T
h (A.84)
Quoique cette appellation peut porter confusion, la matrice C est aussi baptise matrice den-
codage puisquelle encode les contributions

A des sources de reproduction en des coefcients
semblables ceux utiliss lors de lencodage du champ reproduire. Avec (A.84), on cherche
A pour trouver lamplitude des ondes planes qui doivent tre produites par chacun des haut-
parleurs pour approcher le champ p
(im)
par p
(rep)
. On obtient le systme algbrique suivant
C
A = Ac (A.85)
qui peut tre rsolu mme si le nombre de haut-parleurs L et le nombre de coefcients 2N + 1
ne permettent pas que Csoit une matrice carre. Dans cet ordre dide, et an de rester gnral,
lquation (A.85) est rsolue laide de la dnition du pseudo-inverse de C [Golub et van
Loan, 1996; Elliott, 2001]. On trouve ainsi
A = AC
+
c (A.86)
o lexposant
+
reprsente la pseudo-inversion. En adhrant la dnition formelle du pseudo-
inverse [Elliott, 2001], la dtermination de (A.85) qui est fonction des dimensions de C et
donc de

A est automatiquement prise en compte.
4
En pratique la srie des amplitudes A
l
donne les gains relatifs entre les sources de reproduction puisque le
reste, dans un contexte audio, est une question dajustement de volume.
316
Dans le cas le plus courant, le nombre de sources de reproduction est plus important que
le nombre de coefcients utiliss dans lencodage du champ reproduire p
(im)
et du champ
reproduit p
(rep)
. En cette situation, lquation (A.85) est sous-dtermine et le pseudo-inverse
scrit de telle sorte que
A = AC
T
[CC
T
]
1
c (A.87)
Cette dernire quation reprsente donc le dcodage
5
du champ reproduire (initialement en-
cod par la dnition de c) sur une srie de L haut-parleurs de telle sorte que la reproduction
dsire soit atteinte dans la limite thorique des hypothses de champ libre et de production
dondes planes par des sources de reproduction.
En pratique, une des congurations les plus communes en reproduction ambisonique inclut
au stade du dcodage une ceinture de L haut-parleurs quidistants entre eux et par rapport
au point dcoute (le centre de la ceinture) de telle sorte que
m
= l2/L. Dans ce cas, les
sources sont gomtriquement distribues sur les pointes dun polygone rgulier dans le plan
horizontal et le pseudo-inverse C
+
devient simplement C
T
/L et le nombre doprations attri-
buables linversion de CC
T
est considrablement rduit puisque linversion est remplace par
une simple transposition de moindre dimension. Lquation (A.87) devient donc, pour la plupart
des applications ambisoniques,
A = A
C
T
L
c (A.88)
Le dveloppement prcdent forme la base de la technologie ambisonique de reproduction
spatiale du son. Dans cet ordre dide, la matrice C
T
/L est habituellement baptise matrice de
dcodage de base pour basic decoding matrix. Maintes variantes et versions optimises (du
point de vue physique ou du point de vue perceptif) sont introduites dans la littrature spcialise
mais vont au-del des bases ncessaires au dveloppement prsent dans cette thse. Diffrentes
mthodes de dcodage ambisonique pouvant sadapter des congurations de haut-parleurs
commerciales (comme le surround 5.1, Lexicon, etc. [Rumsey, 2001]) sont ainsi proposes
et optimises selon certains critres physiques ou perceptifs. Des corrections de la dnition de
lencodage et du dcodage ambisonique qui tiennent compte de la nature sphrique plutt que
de la nature plane de la rayonnement des sources de reproduction dmontrent un accroissement
considrable de la qualit physique de la reproduction sur un espace plus tendu avec un systme
ambisonique dordre plus lev [Daniel, 2001]. Il est aussi possible de tenir compte au niveau
de lencodage du rayon de courbure des fronts donde reproduire.
5
titre informatif, le dcodage ambisonique est parfois prsent comme le principe de rencodage puisque
lobjectif est de retrouver lencodage c laide des L sources de reproduction.
317
Il est possible dtablir les quations ambisoniques partir de la formulation de la thorie
de lholophonie. Pour ce faire, on doit dvelopper lexpression de lquation (A.88) pour une
source de reproduction l
A
l
=
A
L
c
T
l
c =
A
L
_
1 + 2
N
n=1
[cos(n) cos(n
l
) + sin(n) sin(n
l
)]
_
(A.89)
qui donne nalement
A
l
=
A
L
_
1 + 2
N
n=1
cos(n(
l
))
_
(A.90)
Aprs dveloppement, il est possible de montrer que lquation (A.90) est en fait une fonction
sinc circulaire de (
l
) une constante A prs [Poletti, 2000]. Cette quation est utilise
au chapitre 8. Le reste du lien entre holophonie et ambisonie est prsent la section A.6, soit
aprs le dveloppement des oprateurs de la WFS sur la base de lholophonie.
Interprtation pratique du dveloppement des quations ambisoniques
Maintenant que les quations dencodage et de dcodage de base sont tablies pour un sys-
tme ambisonique, les quelques remarques suivantes sont formules quant aux implications
pratiques attribuables un tel dveloppement.
Ds le dbut du dveloppement, lquation (A.67) prsentait une onde progressive plane
sous la forme dune srie de Fourier-Bessel pour laquelle les harmoniques circulaires taient
valus par rapport la direction de propagation de londe ( dans cos(n( ))). En utilisant
une identit trigonomtrique pour transformer lquation (A.67) en (A.68), la partie attribuable
la direction de propagation a pu tre entirement place dans le vecteur c alors que la par-
tie attribuable la position dintrt (R, ) sest entirement retrouve dans le vecteur

h. En
scindant ces deux dpendances angulaires, les coefcients c
i
sont apparus. Ils correspondent
des motifs de directivit de microphones idals. titre dexemple, les directivits sont pr-
sentes pour les cinq premiers coefcients (c
0
, c
1
et c
2
donnent un systme ambisonique du
premier ordre et lajout de c
3
et c
4
donne un systme du second ordre) sur la gure A.2 (p.
319). Ce passage thorique, bien simple, est ncessaire puisquil permet lutilisation de capteurs
dont laxe principal de directivit ne doit pas ncessairement correspondre avec la direction de
propagation . Ce qui permet une ralisation pratique de la prise de son ambisonique avec des
capteurs acoustiques aux directivits prescrites. On note aussi la correspondance entre les motifs
de la gure A.2 (p. 319) et lallure des modes de pression thoriques et exprimentaux prsents
aux chapitres 7 et 9.
318
30
210
60
240
90
270
120
300
150
330
180 0
c
0
c
1
c
2
c
3
c
4
Figure A.2 Motifs de directivit attribuables
aux cinq premiers harmoniques cylindriques de
lambisonie en deux dimensions.
Figure A.3 Partie relle ( gauche) et partie
imaginaire ( droite) dune onde progressive
plane reprsente par une srie de
Fourier-Bessel limite N = 4. La srie inclut
donc 5 termes pour reprsenter londe plane de
la gure A.5 (p. 320).
En sattardant lencodage dun champ reproduire par le biais de la mesure des compo-
santes de c, on note que plus le nombre de coefcients est important, plus la srie de Fourier-
Bessel converge sur une large zone de lespace. Pour supporter cette allgation, les gures A.3
(p. 319) A.5 (p. 320) prsentent les champs de pression avec des sries de Fourier-Bessel plus
ou moins tronques. Clairement, plus lordre de la troncation est lev, plus la zone spatiale de
convergence de la srie est importante. Cest essentiellement ce qui explique la recherche dun
systme ambisonique dordre plus lev qui ncessiterait en fait des capteurs de pression dordre
plus lev. Cet accroissement de la rgion de convergence provient dune particularit des fonc-
tions de Bessel du premier type. On sait en fait que pour de trs petites valeurs de x, J
n
(x) x
n
.
Ce qui permet dexprimer la particularit dintrt comme suit :
d
m
Jn(0)
dx
m
=
mn
m! et revient
admettre que la drive dordre m (value x = 0) de la fonction de Bessel dordre n est nulle
sauf si m = n, dans ce cas, la drive en question donne n! lorigine. Consquemment, une
srie de Bessel permet dajuster progressivement et indpendamment les valeurs des drives
dordre de plus en plus lev lorigine. Sachant quen augmentant progressivement lordre
dni le plus lev lorigine, on augmente ltendue de la dnition de la rgion voisine de
lorigine, on tend avec laccroissement de lordre de troncation de la srie vers une dnition
319
plane reprsente par une srie de
Fourier-Bessel limite N = 8. La srie inclut
donc 17 termes pour reprsenter londe plane
de la gure A.5 (p. 320).
plane.
globale et non plus une vers dnition uniquement locale, ou voisine, selon une approximation
du premier ordre. Ainsi, soit comme le dveloppement approximatif dune fonction en srie de
Taylor autour dun point, plus lordre de la srie est lev, plus lapproximation sera able pour
des points plus loigns que le point original dvaluation de la srie. Cette remarque au sujet
des contributions spatiales des harmoniques cylindriques de la srie Fourier-Bessel est aussi lie
avec lallure et leffet des modes de pression prsents aux chapitres 7 et 9.
On peut maintenant illustrer un lien important entre la troncature dune srie de Fourier-
Bessel pour la description ambisonique dun champ de pression et le changement de nature
de la distribution de sources planes, postes linni, laquelle distribution produirait le mme
champ. Le champ original, avant la reprsentation par srie de Fourier-Bessel tronque, peut
aussi tre reprsent par une distribution angulaire dondes planes en fonction de . Cette mme
distribution angulaire dondes planes peut tre reprsente par une srie de Fourier tant don-
ne sa priodicit en fonction de , on parle alors de spectre angulaire du champ de pression
dcompos en ondes planes. On remarque en fait, selon Poletti [Poletti, 2000], que la troncature
de la srie de Fourier-Bessel correspond exactement la troncature du spectre angulaire de la
distribution dondes planes quivalentes. Plus la troncature est dordre faible, plus le spectre
angulaire sloignera de lidal : cest--dire dune seule impulsion sur une priode de distri-
bution angulaire dans le cas dun champ plan de pression reproduire. En augmentant lordre
de la reprsentation de Fourier-Bessel, et donc du spectre angulaire, la distribution angulaire de
sources planes devient plus ne et approche, avec laccroissement de lordre, de plus en plus une
impulsion priodique en tout en conservant lallure dune fonction sinc circulaire (quation
(7.42)). Dans les cas dAWFS considrs aux chapitre 6 et 7, il est possible de voir une corres-
320
pondance entre les distributions dintensit de sources de reproduction et lordre de troncature
attribuable la distribution spatiale des capteurs de lerreur : on note que les distributions de
sources correspondent, grossirement, lallure de la distribution angulaire tronque mention-
ne en ce paragraphe. Les diffrences viennent de la proximit des sources de reproduction qui
ne provoquent pas des ondes planes aux capteurs dans les cas prsents au chapitre 6. Lessentiel
des dtails ce sujet est prsent de faon plus prcise au chapitre 7.
titre de complment, les gures A.6 (p. 322) A.8 (p. 324) prsentent des rsultats de
simulations de reproduction ambisonique laide de douze sources de reproduction. Tel que
mentionn plus tt, on assume que les ondes issues des sources de reproduction sont des ondes
progressives planes. Cette approximation demeure valide tant que les sources de reproduction
sont sufsamment loignes du point dcoute (soit au centre des champs illustrs). Comme
il est possible de le voir sur ces gures, les gains panoramiques prsentent des distributions
diffrentes selon lordre dencodage du systme (voir quation (7.42)). Les champs reproduits
sont, quant eux, valables sur une zone plus tendue au fur et mesure que lordre de lencodage
augmente. Encore une fois, il faut garder lesprit le fait que cette approximation des ondes
issues des haut-parleurs par des ondes planes est surtout valide au centre des champs illustrs
sur ces trois gures.
321
Figure A.6 Gains panoramiques, champ acoustique reproduire et champ reproduit pour un
systme ambisonique du premier ordre avec 12 sources de reproduction. Chaque courbe
reprsente le gain dune des sources pour diffrentes directions de reproduction.
322
systme ambisonique du second ordre avec 12 sources de reproduction. Chaque courbe
323
systme ambisonique du troisime ordre avec 12 sources de reproduction. Chaque courbe
324
A.4.1 Ambisonie comme un cas particulier du contrle optimal de la reproduction spatiale du
son
partir dune approche de contrle optimal dans le domaine des frquences en incluant les
hypothses acoustiques (ondes planes) de lambisonie de base, il est possible de retrouver les
quations ambisoniques. Ce lien dmontre simplement que la reproduction ambisonique tente
de minimiser lerreur de reproduction ou la somme des amplitudes des sources, selon la nature
de la dtermination du systme (dtermin ou sous-dtermin). On pourrait donc aussi afrmer
que les technologies ambisoniques forment un cas particulier du contrle optimal (ralis en
boucle ouverte et bas sur un modle approximatif) de la reproduction.
La dmonstration suit les tapes suivantes. Lerreur de reproduction se dnit ainsi
e(R, ) = p
(im)
(R, ) p
(rep)
(R, ) (A.91)
soit de la mme faon quelle fut initialement introduite au chapitre 5, mais en coordonnes
cylindriques cette fois. Adoptons maintenant les hypothses initiales ambisoniques : 1) cest
la reproduction de la direction qui nous intresse, on prend donc un champ reproduire d-
ni par une onde progressive plane p
(im)
(R, ) = Ae
jkRcos()
, 2) on suppose que les sources
relles de reproduction sont sufsamment loignes du point dcoute pour que la pression so-
nore reproduite corresponde la superposition dondes progressives planes dont les directions
de propagation correspondent aux positions angulaires des L sources relles. Suivant ces hy-
pothses au sujet de lapproximation par des ondes planes aux environs du centre dcoute,
lcriture suivante est propose, tout comme elle fut introduite la section A.4
e(R, ) = Ac
T
h

A
T
C
T
h (A.92)
Si on transforme cette erreur spatiale de reproduction en un vecteur derreur sur les coefcients
c (ce qui revient diviser lquation (A.92) par
h)
e
(c)
= Ac
T

A
T
C
T
(A.93)
o e
(c)
est un vecteur ligne de telle sorte quil soit possible de formuler une fonction quadratique
reprsentative de lintention de minimiser la somme des erreurs quadratiques sur chacun des
coefcients de lexpansion de Fourier-Bessel. Cette fonction quadratique est la suivante
J
c
= e
(c)
e
T
(c)
(A.94)
J
c
= Ac
T
cAAc
T
C
A

A
T
C
T
cA+

A
T
C
T
C
A (A.95)
325
On note que les coefcients de lexpansion (introduite initialement lquation (A.66)) sont
toujours rels. Quoiquelle puisse paratre loin de la ralit du contrle actif ou du contrle opti-
mal, lide de minimiser la somme des erreurs sur les coefcients dune dcomposition en srie
de Fourier-Bessel nest pas si trangre au contrle optimal. Dans le cas dtude thorique du
contrle optimal des perturbations dans des structures vibrantes, il est par exemple trs commun
de transformer la rponse dune structure en une srie modale ou mme en une expansion poly-
nomiale. Le minimum de la fonction cot est obtenu en remplaant

A par

A
(opt)
qui se dnit
gnralement comme suit en contrle optimal [Elliott, 2001]
A
(opt)
= AC
+
c (A.96)
Ce qui correspond exactement la solution ambisonique propose par lquation (A.86). Conti-
nuons nanmoins la dmarche de contrle optimal classique.
Selon la taille de la matrice C, trois cas particuliers et bien connus en contrle actif du bruit
se prsentent et dnissent la nature de la pseudo-inversion.
Si le systme est surdtermin (plus de coefcients que de sources L < 2N +1), le pseudo-
inverse de C donne comme amplitudes optimales
A
(opt)
= A[C
T
C]
1
C
T
c (A.97)
En pratique, ce cas correspond la reproduction dune onde plane prescrite thoriquement et
pour laquelle les coefcients de la srie de Fourier-Bessel pourraient tre facilement valus
pour un nombre plus important que la quantit de sources relles L. Avec une telle situation, il
nest pas possible damener les erreurs e
(c)
zro. Lusage du pseudo-inverse reprsente donc
la minimisation de la fonction cot introduite plus tt.
Si le systme (A.93) est dtermin (autant de coefcients que de sources relles), les ampli-
tudes optimales sont trouves par inversion directe (puisque C est une matrice carre)
A
(opt)
= AC
1
c (A.98)
En pratique, ce cas particulier correspondrait une prise de son relle de L coefcient avec
lusage de L haut-parleurs. Cest un cas spcique, ou rare, voire inutilis, en pratique. Cette
fois, toutes les erreurs e
(c)
peuvent tre amenes zro.
Le troisime cas, lors de la sous-dtermination, correspond une situation lgrement dif-
frente pour laquelle une innit de combinaisons possibles (en terme des composantes de

A)
326
peut amener les erreurs de reproduction zro. Dans ce cas, le pseudo-inverse donne la solution
unique suivante
A
(opt)
= aC
T
[CC
T
]
1
c (A.99)
qui minimise en fait la somme des efforts quadratiques (
A
T

A) tout en garantissant que e
(c)
=
0.
Ce troisime et dernier cas prsente les quations ambisoniques les plus courantes, cest--
dire celles introduites lquation matricielle (A.87). Ce qui dmontre bien quune approche
ambisonique est en fait une approche de contrle optimal (de minimisation) des erreurs sur
lencodage du champ reproduit en relation avec lencodage de lobjectif dni par le champ
reproduire sous lhgmonie des deux hypothses des ondes progressives planes reproduire et
produites par les sources relles de reproduction prises individuellement. Lessentiel des liens
entre AWFS et ambisonie est prsent au chapitre 7.
A.5 Dveloppement des oprateurs de synthse de la WFS dans le domaine frquentiel
Cette section prsente le dveloppement des oprateurs de synthse tels quils sont utiliss en
diffrentes sections de cette thse. Le dveloppement propos suit celui de Verheijen [Verheijen,
1998] quoique dautres dveloppements puissent tre raliss.
Comme point de dpart, on considre lquation intgrale de Kirchhoff-Helmholtz avec les
fonctions de Green dun milieu homogne (G
)
p(x) =
_
S
_
p(y)
(x[y) G
(x[y)
p(y)
_
ndS x V (A.100)
pour laquelle la prsente notation est introduite la gure A.9 (p. 328). La fonction de Green
est dnie comme suit
2
G
(x[y) +k
2
G
(x[y) = (x y) (A.101a)
G
=
e
jkr
4r
+ F (A.101b)
o r = [x y[ et F est une fonction de x qui doit satisfaire lquation dHelmholtz homogne.
An de dvelopper (A.100), on prcise la dnition du gradient de la pression comme suit
dp(y)
dn
=

p(y) n = j
o
v
n
(y) (A.102)

p(x) =
o
u(x)
t
= j
o
v(x) (A.103)
327
Figure A.9 Notation utilise pour lquation
(A.100).
Figure A.10 Notation utilise pour lobtention
des intgrales de Rayleigh.
o v
n
(y) est la vitesse particulaire v projete sur le vecteur n(x) alors que x = y S. Ce qui
permet la nouvelle criture de (A.100)
p(x) =
_
S
_
p(y)
(x[y) n j
o
v
n
(y)G
(x[y)
_
dS x V (A.104)
La drive directionnelle de la fonction de Green (
(x[y) n) se dveloppe comme suit
(x[y) n =
r
G
(x[y) cos (A.105)

=

r
_
e
jkr
4r
+F
_
cos (A.106)
An de se diriger vers les intgrales de Rayleigh I et II, posons F = 0 pour commencer de telle
sorte que (A.106) devienne
r
_
e
jkr
4r
_
cos =
(jkr 1)e
jkr
4r
2
cos (A.107)
Lquation (A.104) devient donc
p(x) =
_
S
_
p(y)
jkr 1
r
2
e
jkr
4
cos j
o
v
n
(y)
e
jkr
4r
_
dS x V (A.108)
Cest partir de la dernire quation que les formulations intgrales de Rayleigh I et II seront
labores. Ces deux nouvelles intrgrales formeront alors un point de dpart pour la drivation
des oprateurs de synthse selon la nature des sources de reproduction.
La principale raison qui permet de scinder lquation (A.104) en deux intgrales de Rayleigh
est consquence de la nature de lapplication, la reproduction de champs acoustiques dans ce
328
cas. On sait en fait que la prsence de deux termes (rayonnement monopolaire et rayonnement
dipolaire) dans lintgrale de Kirchhoff-Helmholtz est attribuable au fait suivant
p(x) =
_
_
_
0 x / V
_
S
_
p(y)
jkr1
r
2
e
jkr
4
cos j
o
v
n
(y)
e
jkr
4r
_
dS x V
(A.109)
Dans lintgrale, les deux types de rayonnements (monopolaire et dipolaire) superposs qui
forment une source de Huygens [Jessel, 1973] (ou la lucarne de Huygens) sannulent mutuel-
lement pour x / V de telle sorte que lquation (A.109) soit vraie.
En synthse de champs acoustiques, o p(y) provient du champ reproduire, il nest pas
ncessaire que p(x) = 0 x / V puisque V est essentiellement lespace dcoute et ce qui
advient en dehors de V nest pas profondment inuent sur la qualit de la reproduction dans V .
Pour cette raison, il nest pas ncessaire, ou obligatoire, en WFS pratique dinclure la fois les
sources monopolaires et les sources dipolaires sur S. Cela se concrtise avec les deux intgrales
de Rayleigh.
On trouve lintgrale de Rayleigh I en imposant une forme particulire S et en dnissant
F dans G
.
S devient lunion dun plan x
3
= 0 (S
1
) et dun hmisphre (S
2
) de rayon R. Cette
transformation de S est prsente la gure A.10 (p. 328). Lensemble des sources dnissant
le champ reproduire (soit p
(im)
(y)) appartient lespace o x
3
< 0 (soit lextrieur de
V +S
1
+S
2
6
). On rappelle que, dans le cas de la gure A.10 (p. 328), x
3
S
1
et x
3
est positif
lorsquil pntre V . Si le rayon R de lhmisphre S
2
tend vers linni, la contribution de S
2
dans lintgration sur S devient ngligeable (en accord avec la condition de Sommereld) et seul
S
1
, ds lors un plan inni, demeure important dans lintgration sur S. Suivant ces modications
de S lquation (A.100) est maintenant rcrite
p(x) =
_
S
1
_
p(y)

n
_
e
jkr
4r
+F(y)
_
_
e
jkr
4r
+F(y)
_
p(y)
n
_
dS x V (A.110)
Posons F = e
jkr
/4r
avec r
, le vecteur miroir de r par rapport S

1
, de telle sorte que le
6
On utilise loprateur + plutt que pour reprsenter lunion des trois objets puisque leur intersection est un
ensemble vide [Jessel, 1973].
329
premier terme de lintrgrale (A.110) soit nul. Le dveloppement suivant prouve cette allgation
F(y)
n
=

r
_
e
jkr
4r
_
r
n
(A.111)
=

r
_
e
jkr
4r
_
r
n
(A.112)
=

n
_
e
jkr
4r
_
(A.113)
p(x) =
1
2
_
S
1
j
o
v
n
(y)
e
jkr
r
dS
1
(A.114)
r
= r sur S (A.115)
Lquation (A.114) est lintgrale de Rayleigh I qui reprsente le rayonnement dune distri-
bution continue de sources monopolaires sur S
1
pour reconstruire p(x) x V [Junger et Feit,
1993]. On note quavec une telle quation p(x) ,= 0 x / V .
Cest de la mme faon, mais en posant F = e
jkr
/4r
, que lintrgrale de Rayleigh II

est obtenue. La drive directionnelle de F se dveloppe, dans ce cas, comme suit
F(y)
n
=

r
_
e
jkr
4r
_
r
n
(A.116)
=

r
_
e
jkr
4r
_
r
n
(A.117)
=

n
_
e
jkr
4r
_
(A.118)
Dans ce cas, (A.110) devient
p(x) =
_
S
1
_
p(y)

n
_
e
jkr
4r

e
jkr
4r
__
dS
1
(A.119)
=
_
S
1
_
2p(y)

n
_
e
jkr
4r
__
dS
1
(A.120)
et puis nalement
p(x) =
1
2
_
S
1
p(y)
jkr 1
r
2
e
jkr
cos dS
1
(A.121)
Lquation (A.121) est lintgrale de Rayleigh II qui reprsente le rayonnement dune distribu-
tion de sources dipolaires sur S
1
.
Ainsi, selon la nature monopolaire ou dipolaire des sources de reproduction, cest lintr-
grale de Rayleigh I ou II qui servira de point de dpart au dveloppement des oprateurs de
330
synthse de la WFS. An dallger le prsent document, les dveloppements seront limits aux
cas o les sources de reproduction sont de type monopolaire.
Les intgrales de Rayleigh suggrent donc quil est possible de reproduire un champ acous-
tique pour x
3
> 0 en alimentant convenablement une distribution continue de sources de re-
production. Cest le principe thorique dholophonie [Jessel, 1973]. En pratique, on ne peut
atteindre un plan de sources inni ni mme une distribution continue de sources. Pour cette rai-
son, les prochaines tapes simplient les intgrales de Rayleigh an dobtenir des oprateurs de
synthse ralisables.
La premire simplication concerne lapproximation de lintgrale de surface par une int-
grale de ligne. La nomenclature est maintenant lgrement prcise la gure A.11 (p. 332).
En relation avec lintroduction de cette gure, on remarque simplement quun vecteur x dcrit
tout point appartenant V
1
+ S + V
2
, quun vecteur y dcrit tout point appartenant la surface
S et quun vecteur x
dcrit toute position de source virtuelle pose lintrieur de V

1
. Toujours
sur cette gure le point S
o
correspond la position de la source virtuelle, le point M une des
sources secondaires de reproduction et le point P au point dvaluation de la reproduction de
la pression p
(rep)
(x). Lindice
o
fait, quant lui, rfrence la projection dun vecteur ou dune
dimension dans le plan x
1
x
3
.
Posons dabord un champ de pression acoustique reproduire
p
(im)
(x, ) = S()D(, , )
e
jk|xx
|
[x x
[
x S +V
2
(A.122)
o S() est lamplitude monopolaire de la source virtuelle et D sa directivit (pour kr 1). Si
cest ce champ p
(im)
(x) qui produit v
n
sur S, le champ reproduit par des sources monopolaires
sur la surface S sera dni comme suit selon lintrgrale de Rayleigh I
p
(rep)
(x, ) =
1
2
_
S
j
o
v
n
(y)
e
jkr
r
dS x V
2
(A.123)
Un plan de sources de reproduction nest pas une solution pratique, on cherche dabord rem-
placer, par approximation, cette intgration de surface par une intgration de ligne (sur la ligne
pointille horizontale L prsente la gure A.11 (p. 332)).
Trouvons dabord v
n
(y) en fonction du champ de pression, de la source virtuelle, dni par
331
Figure A.11 Notation prcise pour lobtention des oprateurs de synthse de la WFS.
lquation (A.122).
j
o
v
n
(y) = S()

x
3
_
D(, , )
e
jkr
_
(A.124)
= S()
_
D(, , )
x
3
e
jkr
+D(, , )

x
3
_
e
jkr
__
(A.125)
La drive du second terme, entre crochets, se dveloppe ainsi
x
3
_
e
jkr
_
=
(jkr
1)
r
2
e
jkr
r
x
3
(A.126)
=
(jkr
1)
r
2
e
jkr
cos cos (A.127)

La drive de la directivit D se dveloppe quant elle comme suit
D
x
3
=
D
x
3
+
D
x
3
o (A.128a)
= arctan
_
x
1
x
o1
x
3
x
o3
_
et (A.128b)
= arctan
_
x
2
x
o2
_
(x
1
x
o1
)
2
+ (x
3
x
o3
)
2
_
(A.128c)
332
Il devient simple de dvelopper /x
3
et /x
3
x
3
=
sin
r
cos
(A.129)
x
3
=
sin cos
r
(A.130)
Avec ces nouveaux dveloppements, lquation (A.125) peut tre reformule comme suit
7
j
o
v
n
(y) = S()
e
jkr
_
sin
r
cos
D

sin cos
r
+
(jkr
1)
r
Dcos cos
_
(A.131)
Cette quation peut donc remplacer le terme j
o
v
n
dans lintrgale de Rayleigh I. Plutt que
de le raliser tout de suite, on considre lintrgrale de Rayleigh I comme deux intrgrales de
lignes
p
(rep)
(x) =
1
2
_

j
o
v
n
(y)
e
jkr
r
dx
2
dx
1
=
_

Idx
1
(A.132)
On sintresse la premire intgration I qui est ralise sur la ligne verticale pointille croisant
M tel quillustr la gure A.11 (p. 332). De faon gnrale, cette intrgrale de ligne est crite
comme suit
I =
_

f(x
2
)e
j((x
2
))
dx
2
(A.133)
En trouvant une approximation cette intgrale de ligne, le problme technologique de la re-
production de p
(im)
par une distribution de sources sur S par WFS est remplac par celui dune
distribution de sources sur une ligne horizontale L S. En considrant le dveloppement de
j
o
v
n
prsent lquation (A.131) et lquation (A.133), on trouve les dnitions suivantes
pour f(x
2
) et (x
2
).
f(x
2
) =
1
2
S()
r
r
_
sin
r
cos
D

sincos
r
+
(jkr
1)
r
Dcos cos
_
(A.134)
e
j(x2)
= e
jkr
e
jkr
= e
jk(r+r
)
(x
2
) = k(r +r
) (A.135)
Lorsque 1, il est possible dutiliser lapproximation de la phase stationnaire pour
7
Le dveloppement de ces rsultats est ici omis pour allger le texte. Il est possible de supporter ces allgations
en considrant les rsultats de Verheijen [Verheijen, 1998]. On note par contre quune erreur est prsente dans le
dveloppement de Verheijen. Ce dernier assume que la drive /x
3
(telle que dveloppe lquation (A.130))
est positive alors quun accroissement de x
3
implique un angle positif plus faible pour > 0 et un angle ngatif
plus faible pour < 0. Il est possible de le prouver par observation de la gure A.11 (p. 332) et en gardant lesprit
que x
o
V
1
0 cos 1 et 1 sin 1. Lerreur de Verheijen na pas de rpercussion sur le reste du
dveloppement parce que le terme fautif en question est nglig plus loin.
333
remplacer I [Verheijen, 1998; Bleinstein, 1984; Junger et Feit, 1993]
8
comme suit
I f(x
o
2
)e
j(x
o
2
)
2j
2
(x
o
2
)/x
2
2
(A.136)
o x
o
2
est le point de phase stationnaire le long de x
2
. Ce qui revient dire que la contribution la
plus importante lintrgrale (A.133) est attribuable au point de phase stationnaire le long de x
2
dans ce cas. Le point de phase stationnaire est trouv en imposant la drive de la phase zro :
(x
o
2
)/x
2
= 0. Puisque (x
2
) = k(r +r
) et par observation de la gure A.11 (p. 332), il est

clair que le point de phase stationnaire est atteint lorsque x
o
2
= 0 (ou lorsque y
o
2
= 0 puisque
quon value la phase (x
2
) uniquement sur la surface S, soit lorsque x = y S). On note
aussi que lon suppose que p
(im)
provient dune source virtuelle dans le plan horizontal x
1
x
3
.
Pour valuer lapproximation (A.134), il faut trouver
2
(x
2
)/x
2
2
et f(x
2
)pour les valuer
x
o
2
.
Avec (A.134), f(y
o
2
) se trouve aisment comme suit
f(y
o
2
) =
1
2
S()
r
o
r
o
_
sin
r
o
D
+
jkr
o
1
r
o
Dcos
_
(A.137)
= 0 avec y
o
2
= 0 (A.138)
8
En bref, lapproximation de la phase stationnaire (ou, de faon quivoque, la mthode de la phase stationnaire)
est issue de lanalyse asymptotique [Murray, 1984]. Dans le cas dune expansion asymptotique dune intgration
de type Fourier (I() =
_
b
a
f(t)e
j(t)
dt) qui inclut un argument oscillatoire e
j(t)
et une fonction de phase
(t) monotonique, certaines expressions (issues des quelques premiers termes de lexpansion asymptotique de
lintrgrale) proposent une approximation lintgration. La mthode de la phase stationnaire intervient lorsque
la fonction de phase prsente un ou plusieurs extremums sur le domaine dintgration. Dans ce cas, ce sont ces
points qui contribuent le plus I, ce qui permet une approximation telle que prsente dans le texte principal de
cette thse. Lorsque le point stationnaire (d(t)/dt = 0|
t=to
) est dordre premier (seule la premire drive est
nulle) et lorsquil ne se trouve pas lune des bornes dintgration, il est possible dutiliser la formule de la phase
stationnaire [Bleinstein, 1984; Junger et Feit, 1993] comme dans cette thse. titre dexemple, la mthode de la
phase stationnaire peut tre utilise pour trouver lexpansion asymptotique des fonctions de Bessel lorsquelles sont
dabord reprsentes sous la forme dintgrales. Elle est aussi sollicite en rayonnement des structures en champ
lointain [Junger et Feit, 1993].
334
Lorsque kr
o
2
9
, cest le deuxime terme de (A.137) qui domine f(y
o
2
) de telle sorte que
f(y
o
2
)
1
2
_
(jkr
o
1)
r
o
Dcos
_
(A.139)
La recherche de
2
(x
2
)/x
2
2
(utilise en (A.136)) implique un dveloppement plus fasti-
dieux. Il est trs brivement rsum comme suit
(x
2
) =

2
(x
2
)
x
2
2
(A.140)
(x
2
) = k(r +r
) avec (A.141)
r =
_
(x
1
y
1
)
2
+ (x
2
y
2
)
2
+ (x
3
y
3
)
2
et (A.142)
r
=
_
(x
o1
y
1
)
2
+ (x
o2
y
2
)
2
+ (x
o3
y
3
)
2
(A.143)

(x
0
2
) = k
_
r
o
+r
o
r
o
r
o
_
(A.144)
Connaissant maitenant f(x
o
2
), (x
o
2
) et
(x
o
2
), il est possible dcrire (A.132) selon lapproxi-
mation (A.136)
p
(rep)
(x, ) =
S()
2
_

1
r
o
r
o
_
(jkr
o
1)
r
o
cos D(, 0, )
_
e
jkro
e
jkr
_
2j
k
_
ro+r
o
ror
o
_dx
2
(A.145)
p
(rep)
(x, ) = S()
_
j
2
_

[(jkr
o
1) cos D(, 0, )]
e
jkro
r
o
e
jkr
o
(r
o
)
2
o
r
o
+r
o
1
k
dx
2
(A.146)
Ayant suppos plus tt que kr
o
2, une approximation supplmentaire est introduite ((jkr
1) devient jkr
o
)
p
(rep)
(x, ) =
S()
2
_

1
r
o
r
o
_
(jkr
o
)
r
o
cos D(, 0, )
_
e
jkro
e
jkr
_
2j
k
_
ro+r
o
ror
o
_dx
2
(A.147)
p
(rep)
(x, ) = S()j
_
jk
2
_

cos D(, 0, )
e
jkro
r
o
e
jrr
o
r
o
r
o
+r
o
dx
2
(A.148)
Il est nalement possible dinterprter lquation (A.147) de telle sorte que lon trouve les op-
rateurs de synthse. Puisque
e
jro
ro
correspond au rayonnement en x dune source monopolaire en
9
Dans ce cas, on assume que la source virtuelle est loigne de la ligne de sources de reproduction. Cette
hypothse approximative introduit une restriction (distance importante entre la source virtuelle et les sources de
reproduction) qui nest pas respecte en pratique puisque la position dune source virtuelle est laisse la discrtion
de lutilisateur. Lorsque la source virtuelle devient trs proche dune source relle, lhypothse mentionne impose
une coloration de +3 dB/octave qui, normalement, ne devra pas re prsente. Cette allgation est supporte par
des simulations introduites la section 4.3.1 et plus prcisment la gure 4.13 (p. 54).
335
y, il est possible dtablir que lamplitude monopolaire de cette source serait Q(y, ) avec
p
(rep)
(x) =
_

Q(y, )
e
jkro
r
o
dx
2
avec (A.149)
Q(y, ) = S()j
_
jk
2
cos D(, 0, )
e
jkr
o
_
r
o
/(r
o
+r
o
) (A.150)
En alimentant une suite de sources monopolaires par une amplitude dnie par (A.150), on
obtiendrait donc p
(rep)
(x) qui, dans la limite des approximations de la phase stationnaire et de
kr
o
2, devrait correspondre au champ virtuel dsir, soit p
(im)
(x).
Une des consquences importantes de lapproximation par la mthode de la phase station-
naire est la prsence de r
o
(soit la position du point dcoute P en relation avec la ligne de
sources) dans la dnition des amplitudes monopolaires de reproduction (A.150). Ainsi, les
amplitudes en question devraient tre modies si la position de lauditeur change. tant donn
que cette ncessit est peu pratique, la WFS typique inclut une dernire approximation technolo-
gique. Dans lquation (A.150), la position de lauditeur essentiellement incluse par la prsence
de r
o
est xe constante et devient x
(ref)
3
de telle sorte que r
o
ne soit plus la position dcoute
mais simplement la position dune ligne de rfrence en face de la ligne de sources de reproduc-
tion. La ligne de rfrence est spare de la ligne de sources par x
(ref)
3
mtres. Cette dcision
implique que p
(rep)
(x) nest pas gale p
(im)
(x) en dehors de cette ligne de rfrence. Pour
prciser, on note que seule lamplitude de p
(rep)
(x) ne correspond pas lamplitude de p
(im)
(x),
cest--dire quil ny a pas derreur sur la phase des champs reproduits en dehors de la ligne de
rfrence. Le manque en amplitude provient de labsence des contributions sur la surface ori-
ginale S voque par lintgrale de Rayleigh I pour des sources monopolaires de reproduction
[Verheijen, 1998].
Tel que mentionn plus tt, le prsent dveloppement suivait celui de Verheijen [Verheijen,
1998], lexception de lusage de e
jt
dans notre cas. Cest ce qui explique les diffrences
entre le prsent dveloppement et celui de Verheijen. An de valider le prsent dveloppement,
la gure A.12 (p. 337) prsente des simulations en champs libres. Sur ces gures, les sources de
reproduction sont des monoples discrets reprsents par des points noirs et la ligne de rfrence
est prsente comme un trait pointill. Le passage dune formulation continue telle que celle de
lquation (A.149) une formulation discrte implique lapproximation suivante
_
b
a
f(x)dx
N
n=1
f(x
n
) avec x
1
= a et x
N
= b (A.151)
o N points sont uniformment distribus entre a et b. correspond la distance de sparation
des points. Pour cette simulation, p
(rep)
correspond approximativement p
(im)
. Ce qui valide le
336
Figure A.12 Simulation de la reproduction par WFS en champ libre (selon le dveloppement
de la section A.5).
prsent dveloppement.
Les quations (A.149) et (A.150) reprsentent donc le champ reproduit et les amplitudes
ncessaires pour le construire dans le cas restrictif de sources de reproduction monopolaires
places sur une ligne droite. En suivant un dveloppement similaire celui introduit en ces der-
nires pages, il est possible de trouver les oprateurs de synthse dans le domaine des frquences
pour des sources de reproduction de type diple et pour des sources places sur une ligne quel-
conque (ce qui correspond plus la pratique). Ces dvelopppements ne sont pas prsents ici
mais leurs rsultats sont introduits au sein du tableau A.1 la page 338. Il est important de noter
que chaque cas comporte certaines particularits, autant au niveau de la dnition du problme
quau niveau de la notation utilise. De plus, la validit de la dnition du champ reproduit est
limite au plan horizontal.
An de prciser lusage des termes dans chacun des cas, le lecteur est pri de se rfrer la
gure A.11 (p. 332) pour une description gnrale, la gure A.13 (p. 339) dans le cas dune
source virtuelle lavant des sources de reproduction et la gure A.14 (p. 339) pour des sources
de reproduction disposes sur une ligne quelconque. On note ainsi que, de faon gnrale, les
angles et sont utiliss pour dcrire la directivit D(, , ) de la source virtuelle, langle
337
Tableau A.1 Oprateurs de synthse de la WFS dans le domaine des frquences
CAS PARTI-
CULIERS DE
REPRODUCTION
AMPLITUDES DES SOURCES (Q(y, )) CHAMP REPRODUIT (p
(rep)
(x))
(1) Sources de
reproduction de
type monople
disposes sur
une ligne droite.
x
o
V
1
.
S()j
_
jk
2
cos D(, 0, )
e
jkr
o
_
x
(ref)
3
/(x
(ref)
3
+r
o
)
_
Q(y, )
e
jkro
ro
dx
2
(2) Sources de
reproduction de
type diple dispo-
ses sur une ligne
droite. x
o
V
1
.
S()j
_
1
2jk
D(, 0, )
e
jkr
o
_
x
(ref)
3
/(x
(ref)
3
+r
o
)
_
Q(y, )jk cos

e
jkro
ro
dx
2
(3) Sources de
reproduction de
type monople
disposes sur
une ligne droite.
x
o
V
2
de
telle sorte que la
source est devant
S.
S()j
_
k
2j
cos
e
jkr
o
_
x
(ref)
3
/(x
(ref)
3
r
o
)
_
Q(y, )
e
jkro
ro
dx
2
(4) Sources de
reproduction de
type monople
disposes sur une
ligne quelconque.
x
o
V
1
.
S()j
_
jk
2
cos
e
jkr
o
_
r
(ref)
o
/(r
(ref)
o
+r
o
)
_
Q(y, )
e
jkro
ro
dl
(5) Sources de
reproduction
de type diple
disposes sur une
ligne quelconque.
x
o
V
1
.
S()j
_
1
2jk
e
jkr
o
_
r
(ref)
o
/(r
(ref)
o
+r
o
)
_
Q(y, )jk cos

e
jkro
ro
dl
sert au calcul de la directivit des sources de reproduction (avec une directivit unitaire dans le
cas des monoples et avec cos dans le cas des diples) et langle est quant lui introduit
pour lvaluation de j
o
v
n
(y
o
) la position des sources de reproduction. En ce qui a trait aux
distances, r
o
explicite la distance (dans le plan horizontal) entre la source virtuelle et une source
338
Figure A.13 Notation prcise pour
lobtention des oprateurs de synthse de la
WFS dans le cas dune image reproduire qui
inclut une source virtuelle lavant des sources
de reproduction.
Figure A.14 Notation prcise pour
lobtention des oprateurs de synthse de la
WFS dans le cas dune ligne de sources
(monoples ou diples quelconques).
de reproduction, r
o
correspond la distance (toujours dans le plan horizontal) entre une source
de reproduction et un point de lespace dcoute, x
(ref)
3
dnit la distance, selon x
3
, entre la ligne
de source L et la ligne de rfrence (en traits discontinus sur lensemble des gures). Finalement
et pour toutes les gures de notation, les indices
o
font rfrence au plan horizontal pour lequel
la phase est minimale alors que lexposant

est utilis pour spcier que la variable sous
lexposant concerne la source virtuelle. Pour les cas (3), (4) et (5) prsents au tableau A.1, on
remarque que la directivit D nest pas incluse. Cest--dire quon suppose implicitement que
la source virtuelle est omnidirectionnelle dans ces trois situations.
Pour supporter la validit des oprateurs de synthse dnis au tableau A.1, les gures A.15
(p. 340) A.18 (p. 341) prsentent limage reproduire (p
(im)
) et les champs reproduits (p
(rep)
).
Dans lensemble de ce dveloppement, les sources - virtuelles ou de reproduction - taient
toujours dcrites par le biais des amplitudes monopolaires Q et S. Dans les autres parties de
cette thse, les sources taient dcrites par le biais q
(vol)
, cest--dire des sources dinjection de
volume. q
(vol)
tait dans ce cas lamplitude de lintensit de la source (traduction littrale de
339
Figure A.15 Simulation de la reproduction par WFS en champ libre avec lutilisation de
diples comme sources de reproduction.
monoples pour la cration dune source virtuelle devant les sources de reproduction.
340
monoples (distribus sur une ligne quelconque) comme sources de reproduction.
diples (distribus sur une ligne quelconque) comme sources de reproduction.
341
source-strength amplitude) qui peut tre aisment relie lamplitude monopolaire comme
suit
q
(vol)
=
4Q
j
(A.152)
A.5.1 Reproduction dondes planes
Pour la reproduction dondes planes, en pratique, les oprateurs de synthse de la WFS
doivent tre modis. Quoiquil soit possible de redriver les oprateurs de synthse partir
du point de dpart (la dnition dun champ reproduire), il est possible de se contenter
10
, par
observation des oprateurs prsents la table A.1, de modier quelques termes pour retrouver
les oprateurs de synthse pour la reproduction dondes approximativement planes.
Pour obtenir une approximation donde plane en x, on impose un coefcient de correction
damplitude qui corrige la rduction damplitude attribuable la distance dune source ponc-
tuelle
p
(im)
(x, ) = [x x
o
[S()
e
jk|xx
o
|
[x x
o
[
= r
corr
S()
e
jk|xx
o
|
[x x
o
[
(A.153)
Par contre, on note que la correction nest seulement valide quau point x, pour cette raison,
on impose un point de rfrence x
(ref)
corr
qui, en plus dappartenir la ligne de rfrence, sera
expos une amplitude S(). On favorisera, comme point de rfrence, le centre de lantenne
de reproduction. Dans ce cas, le facteur de correction est r
corr
= [x
(ref)
corr
x
o
[.
En comparaison avec les oprateurs de la WFS dvelopps plus haut, la seule diffrence est
attribuable lamplitude de la source virtuelle qui devient r
corr
S(). Dans ce cas, on retrouve
les oprateurs de synthse qui produisent lapproximation dune onde plane damplitude S()
pour des sources de reproduction de type monople
Q(y, ) = r
corr
S()j
_
jk
2
cos
e
jkr
o
_
r
(ref)
o
/(r
(ref)
o
+r
o
) (A.154)
ou diple
Q(y, ) r
corr
S()j
_
1
2jk
e
jkr
o
_
r
(ref)
o
/(r
(ref)
o
+r
o
). (A.155)
Toujours dans la mesure o la source virtuelle est loin des sources de reproduction (pour de
10
On note ce sujet que la mthode dapproximation par la formule de la phase stationnaire poserait des pro-
blmes particuliers pour la reproduction dune onde plane dnie a priori.
342
grand r
o
). Par contre, avec de grandes distances de source virtuelle, le terme e
jkr
o
peut introduire
dimportants retards temporels. Pour en rduire limportance, il est possible de modier les deux
prcdentes quations comme suit pour des sources de reproduction de type monople
Q(y, ) = r
corr
S()j
_
jk
2
cos
e
j(kr
o
min(kr
o
))
o
_
r
(ref)
o
/(r
(ref)
o
+r
o
) (A.156)
ou diple
Q(y, ) = r
corr
S()j
_
1
2jk
e
j(kr
o
min(kr
o
))
o
_
r
(ref)
o
/(r
(ref)
o
+r
o
). (A.157)
o min(kr
o
) correspond la phase minimale (lire aussi la distance minimale) entre la source
virtuelle et toutes les sources relles de reproduction de telle sorte que la source de reproduction
la plus proche de la source virtuelle hrite dune phase nulle. Ainsi, la position de cette source
correspond lorigine de londe plane (du moins son approximation) et le point x
(ref)
corr
, au point
de lamplitude de rfrence. On note aussi quune telle correction du retard temporel est im-
plante (mais optionnelle) de faon similaire pour les oprateurs de synthse dnis aux lignes
(4) et (5) du tableau A.1 la page 338.
Les gures A.19 (p. 344) et A.20 (p. 344) prsentent des exemples dapplication des deux
quations prcdentes. Ce qui dmontre leur validit. On note que pour ces simulations, contrai-
rement aux cas traits dans le corps de la thse, les effets de diffraction nont pas t rduits
laide de lapplication dune fentre pondrant les sources de reproduction situes aux extrmi-
ts de lantenne puisque lobjectif tait dillustrer la validit des oprateurs de synthse dondes
planes prsents aux quations (A.19 (p. 344)) et (A.20 (p. 344)).
A.6 Lambisonie partir des quations gnrales de la WFS
Il est possible dexprimer un lien thorique entre les quations gnratrices de la WFS (la
formulation intgrale de Kirchhoff-Helmholtz) et lambisonie. Ce qui complte donc le triangle
des relations entre AWFS, ambisonie et WFS alors que, dans le corps de cette thse, au chapitre
7, un lien fut trac entre AWFS et WFS puis entre AWFS et ambisonie.
On procde partir de lquation (A.108) qui peut exprimer la reproduction dun champ
acoustique p
(im)
(x) dans un volume V
p
(rep)
(x) =
_
S
_
p
(im)
(y)
jkr 1
r
2
e
jkr
4
cos j
o
v
(im)
n
(y)
e
jkr
4r
_
dS x V (A.158)
343
Figure A.19 Simulation de la reproduction par
WFS en champ libre avec lutilisation de
monoples (distribus sur une ligne) comme
sources de reproduction dondes planes.
Figure A.20 Simulation de la reproduction par
WFS en champ libre avec lutilisation de
diples (distribus sur une ligne quelconque)
comme sources de reproduction dondes
planes.
o p
(im)
(y) est la pression acoustique reproduire value la surface de V et v
(im)
n
(y) est la
vitesse particulaire normale reproduire value sur la surface S. La nomenclature est donne
la gure A.9 (p. 328) o r = [xy[ et nest pas une coordonne cylindrique mais langle de r
avec la normale n la surface S. Cette quation, lorigine des oprateurs de la WFS, implique
deux types de sources de reproduction : des monoples et des diples. Cest la formulation la
plus gnrale qui soit de la WFS et elle approche ainsi la description holophonique du problme
[Jessel, 1973].
Puisque lambisonie est dcrite dans un systme de coordonnes cylindriques, on transforme
S en surface cylindrique et V en volume cylindrique dont laxe volue selon x
3
(un axe perpen-
diculaire au plan horizontal prsent la gure A.9 (p. 328))
p
(rep)
(x) =
_
2
0
_

_
p
(im)
(y)
jkr 1
r
2
e
jkr
4
cos j
o
v
(im)
n
(y)
e
jkr
4r
_
Rdx
3
d
y
x V
(A.159)
o R est le rayon du cylindre, r est la distance de la source de reproduction en y jusquau
point dobservation en x et
y
est la position angulaire de y selon le systme de coordonnes
cylindriques utilis dans cette section. Il est en de mme pour le point x qui sera dcrit par une
position angulaire
x
. La gure A.21 (p. 345) prsente les quelques changements de notation
344
Figure A.21 Notation modie pour lobtention de la solution ambisonique partir de la
formulation de Kirchhoff-Helmholtz lorigine de la WFS.
ncessaires la prsente dmonstration. On applique lapproximation de la phase stationnaire
lintgration selon laxe x
3
_

_
p
(im)
(y)
jkr 1
r
2
e
jkr
4
cos j
o
v
(im)
n
(y)
e
jkr
4r
_
dx
3

_
2
jk
_
p
(im)
(y)
jkr 1
r
cos j
o
v
(im)
n
(y)
_
e
jkr
4
x
3
=0
(A.160)
o la phase est stationnaire pour x
3
= 0 si on assume que le point dobservation x est dans le
plan x
3
= 0. Dans ce cas, lquation (A.159) devient
p
(rep)
(x) =
_
2
jk
R
_
2
0
_
p
(im)
(y)
jkr 1
r
cos j
o
v
(im)
n
(y)
_
e
jkr
4
x
3
=0
d
y
x V
(A.161)
Pour rejoindre les quations de lambisonie, on suppose maintenant que le champ acoustique
reproduire est une onde plane avec une direction de propagation de dans le plan horizontal
(x
3
= 0) quil est possible dcrire sous la forme dune srie de Fourier-Bessel
p
(im)
(y) = e
j
k y
= J
o
(kR) + 2
n=1
j
n
J
n
(kR) cos(n(
y
)) (A.162)
o R ne reprsente plus une distance radiale quelconque, comme la section A.4, mais bien le
rayon du cylindre. Cest la premire hypothse de lambisonie. Lquation (A.162) donne donc
lexpression de la pression reproduire sur un point de la surface S localis en (R,
y
, 0).
345
La seconde hypothse de lambisonie est tout aussi simple : les sources de reproduction sont
postes linni. On fait donc tendre R vers linni et donc r puisque on peut crire
r = [x y[ =
_
R
2
+[x[
2
2R[x[ cos(
x
y
). Dans ce cas, on note les expressions des
limites qui suivent
lim
R
jkr 1
r
= jk (A.163a)
lim
R
cos = 1 (A.163b)
lim
R
e
jkr
/
r =
e
jkR
R
e
jk|x| cos(xy)
(A.163c)
lim
R
J
n
(kR) =
_
2
kR
cos
_
kR (n +
1
2
)
2
_
(A.163d)
Pour obtenir la limite de lquation (A.163b), on remarque simplement que 0 avec R 0
puisque dans ce cas r et R (tel que montr la gure A.9 (p. 328)) se confondent. En ce qui
concerne lquation (A.163c), elle rsulte du fait que puisque la source de reproduction poste
en y une distance R produit un front donde plan avec une dcroissance spatiale de 1/
r,
le dphasage total caus par la propagation est seulement selon laxe de R (dphasage de kR
plus celui attribuable la projection de x sur laxe de R : k[x[ cos(
x

y
)) alors que la
dcroissance spatiale est estime 1/
R puisque [x[ cos(

x

y
) est ngligeable devant R
avec R .
Lquation (A.161) est lgrement simplie avec lintroduction de quelques cas limites
exposs plus tt (les quations (A.163a) (A.163c) pour dbuter)
p
(rep)
(x) =
1
4
2R
jk
_
2
0
_
jkp
(im)
(y)
p
(im)
(y)
n
_
e
jkR
e
jk|x| cos(xy)
x
3
=0
d
y
x V
(A.164)
Avec la valeur limite des fonctions de Bessel prsente lquation (A.163d) il est possible de
prouver que [Nicol et Emerit, 1999]
_
jkp
(im)
(y)
p
(im)
(y)
n
_
=
_
2jk
R
e
jkR
_
1 + 2
n=0
cos(n(
y
))
_
(A.165)
de telle sorte que lquation (A.164) devienne
p
(rep)
(x) =
1
2
_
2
0
_
1 + 2
n=0
cos(n(
y
))
_
e
jk|x| cos(xy)
d
y
x V (A.166)
o lintgration est value pour x
3
= 0. Pour parachever le lien vers les fonctions de panora-
misation ambisoniques, lintgration est remplace par une somme alors que lon suppose quil
346
y a L sources postes sur un cercle de rayon R inni
p
(rep)
(x) =
1
L
L
l=1
_
1 + 2
n=0
cos(n(
y
l
))
_
e
jk|x| cos(xy
l
)
x V (A.167)
o
y
l
est la position angulaire de la source l. Dans cette quation, le terme e
jk|x| cos(xy
l
)
, en
accord avec la gure A.21 (p. 345), reprsente le champ produit par la source en
y
l
autour de
lorigine du systme cylindrique.
Avec cette dernire quation, on trouve donc le lien de lholophonie vers lambisonie (dordre
inni) alors que les fonctions ambisoniques (amplitudes

A des sources de reproduction [voir
lquation (A.90)]) sont aussi obtenues partir de la formulation holophonique de la reproduc-
tion de champs acoustiques
A
l
=
1
L
_
1 + 2
n=0
cos(n(
y
l
))
_
=
1
L
_
1 + 2
n=0
cos(n(
y
l
))
_
x V (A.168)
Cette nouvelle quation est parfaitement comparable lquation (A.90) lexception que, dans
la prsente section, 1) lamplitude de londe plane reproduire tait unitaire, 2) lordre de lam-
bisonie tait inni et 3) la position angulaire de la source l tait reprsente par
y
l
. Ce qui
complte la dmonstration comme quoi lambisonie dordre ni est un cas particulier de lho-
lophonie (hypothses dondes planes, de sources de reproduction linni et srie de Fourier-
Bessel tronque).
A.7 Les oprateurs de synthse de la WFS dans le domaine temporel
Pour laborer un systme de WFS, les oprateurs de synthse dcrits dans le domaine des
frquences au tableau A.1 doivent tre formuls dans le domaine temporel de telle sorte quune
ralisation pratique, sous la forme de ltres rponse nie produits par une architecture trans-
verse, puisse tre mise en place. Pour tablir les rponses limpulsion des oprateurs de syn-
thse, il serait possible de refaire le dveloppement des sections prcdentes en prenant la for-
mulation intgrale de Kirchhoff-Helmholtz dans le domaine temporel. Ce dveloppement serait
plutt long et ardu. Pour cette raison, les oprateurs de synthse dans le domaine temporel sont
dabord trouvs partir de leur dnition dans le domaine frquentiel pour un systme num-
rique (rsolution temporelle et spectrale nie) puis ramens dans le domaine temporel laide
de la transforme de Fourier rapide inverse.
347
Cette section dannexe prsente quelques oprateurs de synthse typiques dans le domaine
temporel. Tel que prsentes pour ces cas typiques, certaines particularits sont propres ces
oprateurs et diverses approximations peuvent tre introduites pour la ralisation pratique de la
WFS.
A.7.1 Passage du domaine frquentiel au domaine temporel pour un systme incluant un
retard temporel fractionnaire
Avant dtudier la nature mme des oprateurs de synthse dans le domaine temporel, il
faut tablir quelques remarques au sujet de la prsence dune composante de phase pente
constante pour une rponse en frquences qui doit tre ramene dans le domaine temporel.
En fait, les oprateurs de synthse de la WFS comportent toujours de tels retards, ce sont des
retards numriques fractionnaires qui doivent tre raliss pour une largeur de bande limite par
la frquence de Nyquist [Laakso et al., 1996]. Cest ce qui motive cette courte tude du sujet.
La gure A.22 (p. 349) prsente des rponses limpulsion obtenues par transformes de
Fourier rapides inverses lorsque les fonctions de rponse en frquences ne comportent quune
pente de dphasage constante, cest--dire un dlai de groupe constant pour toutes les fr-
quences. Le gain, unitaire, est aussi constant pour toutes les frquences. Des rponses limpul-
sion sont prsentes pour diffrents retards temporels qui passent progressivement dun multiple
entier de la priode dchantillonnage au suivant. Comme on peut le voir, lorsque le retard tem-
porel nest pas un multiple entier de la priode dchantillonnage lorsquil est fractionnaire ,
limpulsion est principalement distribue sur les deux chantillons les plus proches et leurs voi-
sins. Si la rponse en frquences comporte en plus un gain variable en fonction de la frquence,
ltalement devient encore plus important.
On formalise les prcdentes remarques comme suit. Soit une fonction de transfert H(z) qui
reprsente un retard D exprim en nombre (entier ou non) dchantillons
H(z) = z
D
(A.169)
o lon assume lexistence de cette transforme en z mme si D nest pas ncessairement un
entier. La fonction de rponse en frquences de H(z) est obtenue en remplaant z par re
j
avec
r = 1 (cest--dire en valuant H(z) le long du cercle unitaire dans le plan complexe des z)
H(e
j
) = e
jD
[H(e
j
)[ = 1 et arg[H(e
j
)] = D (A.170)
348
Figure A.22 Rponses limpulsion par transformes de Fourier rapide inverse pour
diffrents retards temporels. Le gain est unitaire et indpendant de la frquence.
de telle sorte que la rponse limpulsion correspondante puisse tre trouve par transforme
de Fourier inverse pour des instants discrets (Inverse Discrete-Time Fourier Transform ou
IDTFT)
11
[Deller, 1994; Laakso et al., 1996]
h(n) =
1
2
_

H(e
j
)e
jn
d =
1
2
_

e
j(nD)
d n (A.171)
La rponse limpulsion h(n) est donc
h(n) =
sin((n D))
(n D)
= sinc(n D) (A.172)
La rponse limpulsion h(n) correspondant H(z) est donc une fonction sinc (soit une im-
pulsion largeur de bande limite par la frquence de Nyquist). Selon la valeur de D, les lobes
de la fonction sinc seront plus ou moins visibles sur la grille temporelle dchantillonnage (mar-
que par des traits pointills sur la gure A.23 (p. 351)). Cest ainsi que pour un D entier, tous
les lobes secondaires tombent lextrieur de la grille dchantillonnage. Seul le lobe principal
tombe pile sur la valeur de retard D. h(n), par lquation A.172, explique ainsi parfaitement
les phnomnes observs plus tt. La gure A.23 (p. 351) prsente des rsultats illustratifs du
phnomne pour diffrents retards fractionnaires. Lorsque le gain en fonction de la frquence
nest pas unitaire, les mmes principes sappliquent.
En se concentrant davantage sur le cas simple du retard fractionnaire sans coloration frquen-
tielle, on remarque que lquation (A.172) laisse entrevoir deux points importants. Dabord, tout
ltre FIR dordre ni sera toujours une approximation tronque de h(n) et value pour des n
11
Cest la transforme inverse dune transforme de Fourier classique applique une squence discrte.
349
entiers seulement. De plus, lorsque D nest pas entier, h(n) illustre la nature de la pondration
temporelle, remarque plus haut la gure A.23 (p. 351), applique ltalement discret de la
rponse limpulsion du retard fractionnaire.
Dans la littrature, lapproche qui consiste trouver la rponse limpulsion discrte dun
ltre comportant un retard fractionnaire par transforme inverse de la rponse en frquences est
qualie dapproche idale [Laakso et al., 1996]. Cette approche idale, en tronquant la fonction
sinc, correspond une minimisation de lcart quadratique de la rponse frquentielle entre la
solution idale innie et une solution tronque. Ainsi, lapproche par IFFT utilise plus tt pour
la transformation des oprateurs de la WFS trouve donc une signication. Dans la littrature,
cette approche est identie comme conception de FIR directe par moindres-carrs intgrs
[Laakso et al., 1996]. Plusieurs autres mthodes de conception de ltres retards fractionnaires
existent, elles sont souvent sollicites lorsque la valeur du retard doit changer rapidement ou
suivre un processus de retard adaptatif : mthodes de fentres temporelles, mthodes de lissage
des FRF, mthodes gnrales et mthodes par interpolation de Lagrange.
Dans le cadre de cette thse, il serait possible de se contenter dune approche idale (ou
directe par moindres-carrs intgrs) sans fentrage puisque le gain et la phase des opra-
teurs de la WFS sont plutt lisses dans le domaine des frquences (la seule variation de gain en
fonction de la frquence tant le +3 dB/octave) [Laakso et al., 1996]. Par contre, des modules
dapplications de fentrage temporel (Hanning, Kaiser et Tukey) sont intgrs dans la dnition
temporelle des oprateurs de synthse. On remarque que ces fentres sont de largeur variable
et toujours centres au maximum dnergie constituant les ltres sans fentrage. En procdant
de la sorte, on rduit en fait limportance du repliement temporel. On note aussi que, pour une
FRF dont les gains sont lisses, les fuites temporelles de la rponse temporelle svanouissent
plus rapidement et rduisent donc lerreur attribuable la troncature et au repliement temporel.
Dans ce cas, plus lordre du ltre FIR est lev, meilleure est lapproximation ; et plus le centre
de gravit de la RI approche le centre du ltre, plus faible est lerreur dapproximation du retard
fractionnaire. Pour les mmes raisons, les autres RI utilises dans lAWFS (tout comme le vec-
teur de dnition du champ reproduire) sont dnies de la mme faon et comportent aussi
ces options de fentrage.
On remarque par contre quune telle approche de troncature introduit des erreurs dans la
rponse en frquence, notamment aux environs de la frquence de Nyquist. Ces erreurs restent
par contre moins importantes que celles issues de lensemble des autres approches puisque lap-
proche idale par IDTFT minimise lcart quadratique des FRF complexes idales et rsultantes
350
0
0.5
1
128
0
0.5
1
128.25
0
0.5
1
128.5
0
0.5
1
128.66
0
0.5
1
128.9
115 120 125 130 135 140
0
0.5
1
chantillons
A
m
p
.
129
Figure A.23 Rponses limpulsion pour diffrents retards temporels (128, 128.25, 125.5,
128.66, 128.9 et 129 chantillons.). : h(n) n (selon lquation (A.172)). : h(n) pour n
entier (par IFFT).
[Laakso et al., 1996].
A.7.2 Les oprateurs de synthse en pratique pour lAWFS
En pratique, la simple conversion des oprateurs de synthse, dnis dans le domaine fr-
quentiel par Q(y, ), vers le domaine temporel peut introduire certains problmes. Le premier
est directement reli ce qui fut expos la sous-section A.7.1. Les trois points suivants sont
des ajustements pratiques des oprateurs de synthse.
retards temporels multiples dun nombre entier dchantillons. Pour viter des problmes
qui seraient produits par lexistence dun retard temporel ne correspondant pas un mul-
tiple entier dchantillons, les oprateurs de synthse des quations (4) et (5) du tableau
A.1 deviendraient respectivement
Q(y, ) = S()j
_
jk
2
cos
e
j2f arrondi[r
o
/(cTe)]Te
o
_
r
(ref)
o
/(r
(ref)
o
+r
o
) et (A.173)
Q(y, ) = S()j
_
1
2jk
e
j2f arrondi[r
o
/(cTe)]Te
o
_
r
(ref)
o
/(r
(ref)
o
+r
o
) (A.174)
351
o arrondi[] reprsente un arrondissement vers lentier le plus prs et T
e
est la priode
dchantillonage en secondes. Une approche similaire fut utilise par Verheijen [Verhei-
jen, 1998].
MD (Modelling Delay en contrle inverse adaptatif). Tel quutilis dans la dnition du
champ reproduire par AWFS (voir chapitre 7), un MD de chantillons peut tre intro-
duit comme il se fait couramment en contrle inverse adaptatif. Dans ce cas les quations
(4) et (5) du tableau A.1 deviendraient respectivement
Q(y, ) = S()j
_
jk
2
cos
e
jkr
o
+jTe
o
_
r
(ref)
o
/(r
(ref)
o
+r
o
) et (A.175)
Q(y, ) = S()j
_
1
2jk
e
jkr
o
+jTe
o
_
r
(ref)
o
/(r
(ref)
o
+r
o
) (A.176)
Prsence optionnelle des dphasages issus de lapproximation de la phase stationnaire. La
prsence de

j dans les premiers termes des oprateurs de la WFS introduit un dpha-
sage dun huitime de priode pour toutes les frquences. Il est possible dannuler cet effet
pour obtenir des oprateurs de synthse temporels moins tendus dans le temps. Dans ce
cas, il suft de remplacer les quations (4) et (5) du tableau A.1 par
Q(y, ) = jS()
_
k
2
cos
e
jkr
o
_
r
(ref)
o
/(r
(ref)
o
+r
o
) et (A.177)
Q(y, ) = jS()
_
1
2k
e
jkr
o
_
r
(ref)
o
/(r
(ref)
o
+r
o
) (A.178)
respectivement.
On note que lensemble de ces modications, lesquelles modications furent abordes s-
parment, peuvent tre combines au besoin. An dallger ce document, le dveloppement des
combinaisons possibles incluses dans le code dvaluation des oprateurs de la synthse de type
WFS nest pas prsent. La gure A.24 (p. 353) prsente par contre quelques oprateurs de
synthse de la WFS typiques avec chacune des diffrentes options numres plus tt
12
. Cette
dernire approche (cas (d)) correspond celle privilgie par Verheijen [Verheijen, 1998]. En
complment, la gure A.25 (p. 353) prsente les FRF correspondant aux quatre RI prsentes
en A.24 (p. 353).
12
Le cas tudi correspond celui des exprimentations introduites au chapitre 4 dans le cas de la position de
la source virtuelle (a) (voir gure 4.25 (p. 65)). Les oprateurs prsents la gure A.24 (p. 353) furent calculs,
avec une frquence dchantillonnage de 2 kHz, pour la septime source de reproduction, sur la ligne du haut, en
partant de la gauche (voir gure 4.25 (p. 65)).
352
0 10 20 30 40 50 60
0.2
0.1
0
0.1
0.2
0 10 20 30 40 50 60
0.2
0.1
0
0.1
0.2
0 10 20 30 40 50 60
0.2
0.1
0
0.1
0.2
0 10 20 30 40 50 60
0.2
0.1
0
0.1
0.2
Aucune compensation de dlai
dlai temporel continu,
avec j
3/2

Aucune compensation de dlai,
avec j
dlai temp. en chantillon entier,
avec j
avec j
3/2

chantillons
A
m
p
.

A
m
p
.

A
m
p
.

A
m
p
.

(a)
(b)
(c)
(d)
Dlai temporel correspondant
la distance entre source
virtuelle et relle
Figure A.24 RI dun oprateur de synthse
typique selon quatre approches possibles.
200 400 600 800 1000
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0 200 400 600 800 1000
3.14
1.57
0
1.57
Frquence [Hz]
Option (a)
Option (b)
Option (c)
Option (d)
A
m
p
.

.

P
h
a
s
e

[
r
a
d
]
Figure A.25 FRF dun oprateur de synthse
typique selon quatre approches possibles.
Par contre, il est important de noter lampleur des diffrences introduites par ces modica-
tions manuelles des oprateurs sur le champ reproduit. Cet aspect est illustr la gure A.26 (p.
354) sur laquelle on peut voir les RI values au capteur numro 4 dans un mme conguration
que celle utilise pour les exprimentations commentes au chapitre 4. Ainsi, tout ajustement
manuel des oprateurs de la WFS augmente lcart entre une RI produite par la source virtuelle
en champ libre et celle produite par la WFS aussi en champ libre.
Suivant lensemble de ces modications optionnelles
13
, les oprateurs temporels sont obte-
nus par IFFT de ces oprateurs modis. On favorise le cas le plus simple, le cas (a) la gure
A.25 (p. 353), cest--dire sans modication des oprateurs de la WFS.
13
Ces modications peuvent tre mises en fonction ou non dans les codes responsables de la construction num-
rique des oprateurs de la WFS pour lAWFS.
353
0.01 0.02 0.03 0.04 0.05 0.06
0.2
0.1
0
0.1
0.2
0.01 0.02 0.03 0.04 0.05 0.06
0.2
0.1
0
0.1
0.2
0.01 0.02 0.03 0.04 0.05 0.06
0.2
0.1
0
0.1
0.2
0.01 0.02 0.03 0.04 0.05 0.06
0.2
0.1
0
0.1
0.2
RI virtuelle
RI de la WFS
Dlai de propagation
Aucune compensation de dlai
avec j
3/2

avec j
avec j
avec j
3/2

Temps [s]
A
m
p
.

A
m
p
.

A
m
p
.

A
m
p
.

(a)
(b)
(c)
(d)
Figure A.26 RI reproduites par la WFS selon les quatre approches possibles de la gure A.24
(p. 353).
A.8 Dcomposition en valeurs singulires : aspects thoriques, considrations
numriques et algorithmes
Cette section prsente une revue des points saillants de la SVD dans le but de dnir lalgo-
rithme de SVD utilis dans le cadre de cette thse. La revue se base principalement sur les livres
de Stewart [Stewart, 2001] et Hansen [Hansen, 1998].
On considre une matrice Z C
ML
avec M L (pour le problme M L, il suft
deffectuer la transposition Hermitienne de tous les dveloppements qui suivent) de telle sorte
que la dcomposition (factorisation) en valeurs singulires (SVD) donne
U
H
ZV =
_

0
_
(A.179)
avec = diag(
1
, ...,
M
) et
1

2
...
M
. La SVD de Z est lie la dcomposition
en valeurs propres des matrices Z
H
Z et ZZ
H
[Stewart, 2001]. Par contre, mme si la SVD est
354
unique (les valeurs singulires sont uniques) on doit comprendre que seuls les span [Lancaster
et Tismenetsky, 1985] des vecteurs singuliers de droite et de gauche sont uniques (par contre,
si la base vectorielle de gauche est dtermine, la base de droite en dcoule et vice versa :
ils sont non-uniques mais dpendants) [Stewart, 2001]. Les vecteurs singuliers de droite et de
gauche ne doivent produire que des bases orthogonales pour ces espaces (span) uniques, les
vecteurs singuliers ne sont pas, en eux-mmes, uniques. Cette particularit a initialement pos
certains problmes dans le cadre de cette thse. La suite du dveloppement sinscrit donc dans
le contexte de la rsolution de ce problme.
A.8.1 Proprits numriques de la SVD
Si on reprsente une matrice

Z par laddition de la matrice idale thorique Z une ma-
trice derreurs numriques E de telle sorte que

Z = Z + E on dcouvre plusieurs proprits
de propagation des erreurs numriques dans les algorithmes de la SVD. Typiquement, la ma-
trice derreur E est une matrice alatoire de lordre de la prcision de la machine numrique.
Comprendre la propagation des erreurs dans la SVD est dimportance dans la mesure o cette
propagation caractrise les limites dapplications des algorithmes de la SVD (voir la section
suivante).
La proprit la plus simple est la suivante. Elle exprime les erreurs sur les valeurs singulires
produites par lexistence dune matrice derreurs E [Stewart, 2001].
[
i
i
[ [[E[[
2
avec i = 1, 2, ..., M (A.180)
Avec une approche plus complexe, on peut trouver lexpression de lerreur sur les vecteurs sin-
guliers. On isole dabord une des valeurs singulires non-nulles en la baptisant
1
(on laisse
tomber le classement en ordre dcroissant des modes singuliers an de gnraliser la dmons-
tration). Cest ainsi que U et V sont maintenant crites comme suit grce leur reprsentation
en blocs,
U = [u
1
U
1
U
2
] V = [v
1
V
2
] (A.181)
o u
1
et u
1
reprsentent les vecteurs singuliers associs la valeur singulire
1
.
Dans ce cas, on peut factoriser la matrice comme suit
[u
1
U
1
U
2
]
H
Z[v
1
V
2
] =
_
1
0
T
0
2
0 0
_
_
(A.182)
355
avec
2
= diag(
2
, ...,
M
). Si on pose une matrice qui comporte une erreur numrique

Z =
Z +E, on note lapparition derreurs dans la matrice de droite dans lquation prcdente
[u
1
U
2
U
3
]
H
Z[v
1
V
2
] =
_
1
+
1

T
2
3

2
+
4
5

6
_
_
(A.183)
o les et les reprsentent les sous-matrices derreurs dont les dnitions peuvent tre trou-
ves partir de la dernire quation [Stewart, 2001]. Une fois ces composantes exprimes, la
relation de couplage entre les vecteurs singuliers de droite et de gauche permet daboutir la
reprsentation de lerreur sur les valeurs singulires et les vecteurs singuliers, erreur cause par
la prsence de E dans Z.
Les rsultats suivants caractrisent leffet de E sur la reprsentation numrique de Z par

Z.
Ils sont issus de [Stewart, 2001] et ngligent les termes derreur dordre deux.

1
=
1
+u
H
1
Ev
1
+O([[E[[
2
2
) = u
H
1
Zv
1
+O([[E[[
2
2
) (A.184a)
u
1
= u
1
+U
2
(
2
1
I
2
2
)
1
(
1
U
H
2
Ev
1
2
V
2
E
H
u
1
) +
1
1
U
H
3
Ev
1
+O([[E[[
2
2
) (A.184b)
v
1
= v
1
+V
2
(
2
1
I
2
2
)
1
(
1
V
2
E
H
u
1
2
V
H
2
Ev
1
) +O([[E[[
2
2
) (A.184c)
Lensemble des prcdentes remarques concernent leffet de la simple reprsentation num-
rique dune matrice sur ses valeurs et vecteurs singuliers. Le rsultat le plus remarquable reste
issu de lquation (A.180) qui dmontre que tant que la plus petite valeur singulire est dun
ordre suprieur la norme deux de lerreur de prcision, les valeurs singulires sont bien repr-
sentes. Il en est de mme avec les quations (A.184), o les erreurs sont contrles par E mais
potentiellement amplies par la division par de petites valeurs singulires (soit par (
2
1
I
2
2
)
ou par
1
seule). Ainsi, de faon gnrale, on note que tant que la plus petite valeur singulire
reste dun ordre plus lev que lerreur numrique E les erreurs sur la reprsentation de Z par
ses valeurs et vecteurs singuliers restent minimes.
A.8.2 Algorithmes de la SVD
Dans le cadre de cette thse, deux outils de dcomposition en valeurs singulires sont utili-
ss : la fonction de SVD incluse dans Matlab et lalgorithme du produit crois. La fonction
356
SVD de Matlabse base sur LAPACK (Linear-Algebra PACKage), un outil numrique bien
connu [Golub et van Loan, 1996]. En supplment, les fonctions de dcouplage et de blanchi-
ment utilises dans cette thse (voir le chapitre 8) incluent un algorithme de SVD par produit
crois. Cet algorithme est brivement dcrit la sous-section suivante.
Algorithme du produit crois
Lalgorithme du produit crois [Stewart, 2001] prsente une solution de rechange simple en
comparaison avec les ralisations LAPACK qui favorisent certaines approches selon la nature
de la matrice dcomposer. Cet algorithme du produit crois comporte quatre tapes princi-
pales prsentes dans la liste qui suit (lexposant
+
reprsente la pseudo-inversion dune matrice
rectangulaire de rang r).
1. Calcul du produit crois : A = Z
H
Z (ou A = ZZ
H
).
2. Rsolution du problme aux valeurs propres : A = VV
H
(ou A = UU
H
).
3. Rcupration des valeurs singulires correspondantes : =
1/2
, et classement en ordre
dcroissant des valeurs singulires et des vecteurs singuliers V (ou U).
4. Dnition des vecteurs singuliers manquants Uou (V) : U = ZV
+
(ou V =
_
+
U
H
Z
H
).
Dans le cadre de cette thse, lintrt de lalgorithme du produit crois vient de la syst-
matisation de la SVD en attribuant toujours la priorit aux vecteurs des matrices V (ou U). Ce
qui nest pas le cas avec lalgorithme SVD de Matlabqui produit parfois des rsultats en fr-
quence dont la cohrence ncessaire pour la production de ltres temporels nest pas sufsante
(voir le chapitre 8).
La dcomposition SVD par lalgorithme du produit crois a par contre le dsavantage din-
troduire des erreurs de reprsentation numrique des valeurs et des vecteurs singuliers plus
importantes. Cette augmentation de lerreur vient du passage de la matrice dcomposer Z vers
la matrice du produit crois A.
Ainsi, si la matrice

Z admet une erreur numrique E (
Z = Z + E) pour laquelle [[E[[

2
=
1
(E) [[Z[[
2
=
1
(Z) o [[ [[
2
reprsente la norme deux dune matrice, est une
constante et est la prcision de la machine numrique. Dans ce cas, on trouve lerreur relative
357
sur la valeur singulire i de Z (
i
(Z)) :
[
i
i
[
i
ou
[
i
i
[
i

i
(A.185)
Cette dernire quation introduit la dnition du nombre de conditionnement
i
=
1
/
i
. Ainsi,
selon cette dernire quation, si
i

1
la valeur singulire
i
de Zpourra tre convenablement
reprsente dans un espace numrique par
i
dans la mesure o le facteur
i
attnue lerreur
relative sous un seuil plus faible que . Par contre, dans le cas du produit crois (A = Z
H
Z)
les erreurs numriques sur les valeurs propres
i
(les carrs des valeurs singulires) suivent la
mme structure derreur relative que les valeurs singulires
[
i
[
i
ou
[
i
[
i

2
i
(A.186)
de telle sorte que la condition qui garantit que lerreur de la machine (de lordre de ) nest
pas amplie est plus restrictive :
i

1/2
. Il est donc clair que lalgorithme du produit
crois, par lutilisation de la matrice A, ne peut supporter des problmes avec des nombres de
conditionnements
i
aussi levs que dans la reprsentation classique de la SVD.
Dans le cadre de cette thse, les deux reprsentations de Z(par Z telle quelle, ou par A) pour
la SVD sapplique bien puisque les matrices sont petites et les nombres de conditionnement
observs en pratique respectent les critres sur
i
mentionns plus tt.
A.8.3 Relation thorique entre la dcomposition en valeurs singulires (SVD) et lexpansion
en valeurs singulires (SVE)
Au chapitre 7, il fut observ que la SVD applique la matrice dimpdance de transfert
Z produisait des modes de rayonnement proches des harmoniques cylindriques (dcomposition
de Fourier-Bessel en coordonnes cylindriques) pour les congurations tudies. Ce rsultat,
lgant et illustratif des mcanismes impliqus dans lAWFS, est issu dune des proprits de
lexpansion en valeurs singulires (SVE pour Singular value expansion) de fonctions conti-
nues.
En acoustique, on considre le problme linaire et continu de rayonnement suivant, avec
un noyau G(x[y),
_
V
G(x[y)q(y)dy = p(x) (A.187)
358
pour un volume V . Si le noyau est intgrable au carr
14
, on peut appliquer lexpansion en valeurs
singulires (SVE) du noyau [Hansen, 1998]
G(x[y) =
i=1
i
u
i
(x)v
i
(y) (A.188)
o
i
sont les valeurs singulires du noyau continu et u
i
, v
i
sont les fonctions singulires corres-
pondantes.
On note que les fonctions singulires sont orthonormales [Hansen, 1998]
_
V
u
i
(x)u
j
(x)dx =
ij
et
_
V
v
i
(y)v
j
(y)dy =
ij
(A.189)
et que les deux couples dune valeur et dune fonction singulires dcoulent de deux problmes
aux valeurs propres
_
2
i
, u
i
_
_
V
G(x[z)G(y[z)dz (A.190a)
_
2
i
, v
i
_
_
V
G(z[x)G(z[y)dz (A.190b)
de telle sorte que les fonctions singulires sont uniques et orthonormales (entre elles) pour un
noyau continu donn. Cette gnralit de la SVE qui exige des fonctions orthonormales uniques
pour un noyau donn fait donc, typiquement, apparatre les solutions orthogonales du noyau :
cest--dire de lquation diffrentielle lorigine de la dnition de la fonction de Green G(x[y)
pour lacoustique. Dans ce cas de la propagation acoustique pour une excitation harmonique, on
retrouve typiquement, selon la gomtrie, des solution orthogonales telles des ondes planes, des
harmoniques cylindriques ou des harmoniques sphriques [Williams, 1999]. Cest cette pro-
prit, voque plus haut, qui se transpose dans la SVD et qui confre certains caractres
lAWFS. Fait historique intressant, Gerzon, le pre de lambisonie, approche le problme
de la reproduction sonore spatiale en 1977 en se basant sur la notion de noyau (comme pour
lquation (A.187)) sans toutefois faire usage de la SVE (qui mne la SVD) alors que la SVE
est une des proprits fondamentales des quations intgrales avec noyau de la forme de lqua-
tion (A.187) [Hansen, 1998]. Lusage de la SVD en reproduction spatiale du son reste, mme
ce jour, assez peu commun et, telle quexploite dans cette thse, forme une des originalits de
la prsente recherche.
Il est possible de reprsenter la SVE par une SVD si le problme continu est transform en
reprsentation discrte au niveau des sources (q(y)) et du champ rayonn (p(x)) [Hansen, 1998].
Cest le lien entre la SVE et la SVD. Les proprits notes pour la SVE se transposent vers la
SVD lors de cette discrtisation.
14
Cest--dire, si la norme ||G(x|y)||
2
=
_
V
_
V
G(x|y)
2
dxdy est nie.
359
A.9 Traitement du signal pour lAWFS
Cette section prsente quelques complments au sujet du traitement de signal adaptatif pour
lAWFS. Ces complments ont t utiliss pour le dveloppement de lalgorithme ou pour en
comprendre certains aspects sans toutefois quil ne fasse lobjet de sections dans le corps de la
thse.
A.9.1 AWFS pour des tons purs
Pour lAWFS en temps rel pour des tons purs, on peut crire lalgorithme adaptatif des
modes de rayonnement avec une approche diffrente. On cherche dnir lalgorithme et
mieux faire valoir certaines proprits de lalgorithme en lien avec la modication du PC-LMS
(Principal-Component LMS), du FXLMS a plusieurs canaux et de lalgorithme de Newton
[Elliott, 2001]. On pose les erreurs de reproduction complexes
e =

d Zu (A.191)
o tous les vecteurs et matrices sont complexes. e est le vecteur des erreurs,

d le vecteur des
amplitudes complexes reproduire, et u le vecteur des amplitudes complexes des commandes.
La fonction cot de lAWFS est ainsi crite
J
AWFS
= e
H
e +(u u
WFS
)
H
(u u
WFS
) (A.192)
Cette fonction est toujours une fonction quadratique de la commande. On trouve la commande
optimale (on suppose que M < L et que est un rel positif de telle sorte que la matrice
Hessienne soit dnie positive)
u
(opt)
= [Z
H
Z]
1
[Z
H
d +u
WFS
] (A.193)
Avec la dnition du gradient complexe correspondant la fonction cot J
AWFS
[Elliott, 2001],
on peut crire lalgorithme multicanal dAWFS bas sur le gradient complexe
u(n + 1) = (1 )u(n) +Z
H
e(n) +u
WFS
(A.194)
On peut aussi crire lalgorithme de Newton pour lAWFS multicanal pour la reproduction
adaptative de tons purs [Elliott, 2001]. Lalgorithme de Newton se base sur la prmultiplication
du gradient complexe par linverse de la matrice Hessienne A
u(n + 1) = u(n) A
1
g(n) (A.195)
360
avec
g(n) = 2
_
Z
H
e(n) u(n) +u
WFS
(A.196)
et
A = [Z
H
Z +I] (A.197)
de telle sorte que lquation (A.195) devienne
u(n + 1) = (1 [Z
H
Z +I]
1
)u(n) +[Z
H
Z +I]
1
u
WFS
+[Z
H
Z +I]
1
Z
H
e(n)
(A.198)
Cest lalgorithme de Newton modi pour lAWFS. Dans le cas particulier o il ny a pas de
pnalisation dun cart par rapport la solution WFS ( = 0), la dernire quation se simplie
vers une formulation plus classique de lalgorithme de Newton [Elliott, 2001]
u(n + 1) = u(n) +[Z
H
Z]Z
H
e(n) (A.199)
qui, avec la dnition de la commande optimale (quation (A.193)) et de lerreur (quation
(A.191)) possde la proprit de convergence connue suivante
u(n + 1) = u(n) +u
(opt)
u(n) = (1 )u(n) +u
(opt)
(A.200)
A.9.2 AWFS base sur le contrle indpendant des modes de rayonnement et les algorithmes
FXLMS et de Newton modis
Lalgorithme dAWFS fond sur le contrle indpendant des modes de rayonnement pour
des tons purs se base sur la dcomposition SVD de la matrice Z
Z = UV
H
(A.201)
et lexpression des vecteurs transforms

u(n) = V
H
u(n),

e(n) = U
H
e(n) et

d = U
H
d de
telle sorte que le problme soit dcoupl

e(n) =

d +
u(n). Dans ce cas, on peut crire lalgo-

rithme PC-LMS [Elliott, 2001] pour la reproduction de champs comme une suite de contrleurs
indpendants, pour le contrleur i
u
i
(n + 1) = u
i
(n) +
i
e
i
(n) (A.202)
Cette dernire quation correspond exactement au PC-LMS classique. Si on introduit une pna-
lisation par rapport une solution a priori (soit la base de lAWFS), on trouve, en remplacement
de cette dernire quation,
u
i
(n + 1) = (1
i
i
) u
i
(n) +
i
e
i
(n) +
i
i
u
WFS
i
(A.203)
361
Parmi toutes les valeurs possibles pour les coefcients de convergence
i
et les paramtres
de pnalisation
i
du mode de rayonnement i, on trouve deux cas extrmes qui correspondent
exactement lalgorithme multicanal FXLMS modi (avec solution a priori) et lalgorithme
multicanal de Newton, respectivement.
On pose dabord le premier cas comme suit
i
=
i
et
i
= /
i
o est un coefcient
de convergence global, la pnalisation globale et
i
la valeur singulire du mode i. Dans ce
cas prcis,
i
i
= et on trouve pour tous les modes ( partir de lquation (A.203))
u(n + 1) = (1 )
u(n) +
T
e(n) +
u
WFS
(A.204)
qui, en considrant les dnitions des commandes et des erreurs transformes, donne nalement
u(n + 1) = (1 )u(n) +Z
H
e(n) +u
WFS
(A.205)
Cette dernire quation correspond exactement lquation (A.194). Cest ainsi quen utilisant
des coefcients de convergence proportionnels aux valeurs singulires des modes de rayonne-
ment avec des paramtres de rgularisation inversement proportionnels ces mmes valeurs
singulires, lalgorithme dAWFS bas sur le contrle indpendant des modes de rayonnement
donne exactement le FXLMS multicanal modi (avec lintroduction dune solution a priori).
Dans ce cas extrme, quant au choix des coefcients de convergence et des paramtres de rgu-
larisation, on retrouve les dfauts typiques du FXLMS multicanal [Elliott, 2001].
On pose le second cas comme suit, partir de lquation (A.203), on impose
i
= = 0 et
i
= /
i
(on utilise [
T
]
1
T
)
u(n + 1) =

u(n) +[
T
]
1
e(n) (A.206)
qui devient (avec la dnition des commandes et des erreurs transformes)
u(n + 1) = u(n) +[Z
H
Z]
1
Z
H
e(n) (A.207)
car V[
T
]
1
T
U
H
= [Z
H
Z]
1
Z
H
. La dernire quation, consquence du choix des coef-
cients de convergence inversement proportionnels aux valeurs singulires et de labsence de r-
gularisation, donne exactement un algorithme de Newton tel que prsent lquation (A.200).
Le tableau A.2 rsume les proprits des deux cas dcrits plus haut.
Lutilisation dun coefcient de convergence unique (et donc dun paramtre de rgularisa-
tion unique) pour tous les modes de rayonnement (
i
= et
i
= ), comme pour le PC-LMS,
362
TRANSFORMATIONS DU PC-LMS POUR LAWFS
i

i
Proprits quivalence
i
/
i
Les modes i avec des valeurs singulires importantes reoivent
un coefcient de convergence lev et sont peu pnaliss. Les
modes avec des valeurs singulires faibles reoivent un faible
coefcient de convergence et sont fortement pnaliss. Les
modes rapides sont donc favoriss (en terme de convergence)
et les modes lents sont dfavoriss, on retrouve lalgorithme
FXLMS modi pour lAWFS.
Algorithme mul-
ticanal leaky
FXLMS
/
i
0 Les modes avec une valeur singulire faible (les modes lents)
sont favoriss : ils bncient dun important coefcient de
convergence. Les modes avec une valeur singulire importante
(les modes rapides) sont dfavoriss : ils bncient dun co-
efcient de convergence plus faible. Tous les modes sont sur
le mme pied dgalit, aucun mode nest pnalis : on obtient
lalgorithme de Newton.
Algorithme mul-
ticanal de New-
ton
Tableau A.2 Variation de lalgorithme de PC-LMS pour lAWFS selon les coefcients de
convergence et les paramtres de pnalisation.
vite les problmes de lalgorithme FXLMS et de lalgorithme de Newton [Elliott, 2001]. Cest
ainsi que lAWFS base sur le contrle indpendant des modes de rayonnement apparat comme
un compromis intressant entre FXLMS modi brut et Newton modi brut.
Pour les exprimentations en AWFS en temps rel (reproduction de tons purs), lalgorithme
nest pas implant avec un schma comme celui de lquation (A.203) (avec des gains com-
plexes), mais plutt avec des ralisations dans le domaine temporel avec des ltres FIR de
contrle, de synthse et danalyse deux coefcients. On note aussi, nalement, que mme si
cette analyse de lalgorithme dAWFS de contrle indpendant des modes est facile dvelop-
per dans un contexte de contrle de ton pur, la version dveloppe au chapitre 8 naurait pu tre
aussi facilement mise en relation avec le FXLMS ou lalgorithme de Newton en fonction des
coefcients de convergence, des paramtres de rgularisation et des valeurs singulires. Cette
brve section dannexe visait donc cette mise en relation.
363
ANNEXE B
COMPLMENTS DE SIMULATIONS
Cette annexe regroupe des informations complmentaires aux simulations introduites dans
le corps de la thse. La premire section est ddie la prsentation des recommandations
de lAES au sujet des salles dcoute pour systme multipiste. La deuxime section offre des
simulations dAWFS qui illustrent limportance et leffet des modes de rayonnement dordre
suprieur sur la qualit de la reproduction physique.
B.1 Recommandations de lAES quant aux salles dcoute pour systmes plusieurs
voies.
Les simulations introduites au chapitre 5 sont ralises pour un espace ferm de reproduc-
tion. Lespace en question est dni en accord avec les recommandations de lAES proposes
au sujet des salles dcoute pour systme plusieurs canaux [Rumsey, 2001]. Les consignes
touchent diffrents aspects des salles de reproduction : surface de plancher, gomtrie, volume,
hauteur des sources, temps de rverbration et rponse en frquence. Pour lensemble des simu-
lations prsentes au chapitre 5, la salle thorique utilise prsente les caractristiques num-
res au tableau B.1.
Les consignes quant la gomtrie de la salle sont illustres par la charte de la gure B.1
(p. 366) sur laquelle on peut voir la taille de la salle. La charte est calcule pour une hauteur
de plafond prescrite (puisquil faut xer une des trois dimensions pour effectuer les calculs).
Sur la gure B.1 (p. 366), les traits continus et gras reprsentent les dimensions maximales
prescrites (L
x1
3L
x3
et L
x2
3L
x3
), les traits pointills reprsentent dautres contraintes
(L
x1
L
x2
40 pour la surface du plancher, L
x1
1.1L
x2
et L
x1
4.5L
x2
4L
x3
) et les
zones grises prsentent les zones o les dimensions forment des ratios entiers ( 5%). On note
364
Tableau B.1 Caractristiques de la salle utilise pour les simulations
Proprits Valeurs numriques
L
x1
(longueur selon laxe x
1
) 7.5 m
L
x2
2
) 6.4 m
L
x3
3
) 2.8956 m
V (volume) 138.99m
3
S
plancher
(surface de plancher) 48 m
2
x
3(sources)
(hauteur des sources) 1.2 m
T
60
(temps de rverbration) 0.279 s
que seules ces zones signicatives (pour des grandes salles) sont incluses sur le graphique. La
densit des zones grises devient trop importante pour de faibles dimensions. Pour les contraintes
dingalit, des zones de traits hachures illustrent le ct inacceptable des contraintes de type
ou . Tel quillustr sur la charte (qui se trouve habituellement sous la forme de tableaux
1
),
la salle utilise pour les simulations respecte les contraintes gomtriques maintenant adoptes
par lAES (Audio Engineering Society). La taille de la salle est indique par un . Cette charte
graphique peut tre trs utile pour optimiser (du moins visuellement et selon les besoins) les
dimensions de la salle au stade de la conception dun studio par exemple. Un autre exemple de
charte, pour une salle de 7 m6 m par 4 m de hauteur, est prsent la gure B.2 (p. 366).
B.2 Importance des modes de rayonnement dordre suprieur sur la taille de la zone de
contrle effective de lAWFS.
Dans le corps de la thse, notamment au sein du chapitre qui prsente les rsultats exp-
rimentaux dAWFS (chapitre 9) et de celui qui prsente le traitement du signal pour lAWFS
(chapitre 8), il fut propos que les modes de rayonnement, issus de la dcomposition en valeurs
singulires, dordre suprieur taient dune importance notable pour assurer une taille plus vaste
de la zone de contrle par AWFS.
Cette section prsente, par le biais de simulations thoriques, la validit de cette hypothse.
1
la connaissance de lauteur de cette thse, il nexiste pas de telle charte graphique dans la littrature spcia-
lise qui facilite la comprhension des contraintes et le choix des dimensions.
365
Figure B.1 Charte graphique des contraintes
imposes sur la gomtrie dune salle dcoute
pour systme plusieurs canaux [Rumsey,
2001].
Figure B.2 Charte graphique des contraintes
imposes sur la gomtrie dune salle dcoute
pour systme plusieurs canaux [Rumsey,
2001]. Un autre exemple dmontrant lutilit
de la charte.
B.2.1 Reproduction de champs harmoniques
Les premires gures qui suivent prsentent leffet de laugmentation du nombre de modes
de rayonnement impliqu dans la solution AWFS (trouve directement partir de lquation
(A.59) ou (7.19)) pour la conguration de sources et de microphones tudie exprimentalement
(antenne de sources de reproduction circulaire et antenne de microphones centre et compacte).
Dans tous les cas, on sintresse la taille de la zone de contrle en fonction du nombre de
modes impliqu dans la minimisation de lerreur de reproduction. Pour ce faire, on utilise syst-
matiquement une pnalisation nulle (
i
= 0) et q
WFS
= 0 dans les quations cites an de bien
illustrer la proprit dintrt pour cette section.
Deux types de lieu de reproduction sont considrs ( limage des lieux utiliss pour les
exprimentations) : un espace inni (pour valider les fondements de lhypothse) et un espace
semi-inni correspondant au lieu quelconque tudi au chapitre 9.
La gure B.3 (p. 367) prsente lerreur quadratique rsiduelle normalise (elle est dnie
par E
LS
= [p
(rep)
(x) p
(im)
(x)[
2
/[p
(im)
(x)[
2
) en champ libre 220 Hz alors quun seul mode
de rayonnement est inclus dans la solution. Comme on peut le voir, la zone de lespace o E
LS
366
Figure B.3 Erreur rsiduelle moyenne pour
lAWFS en champ libre alors quun seul mode
de rayonnement est inclus dans la solution.
lAWFS en champ libre alors que les deux
premiers modes de rayonnement sont inclus
dans la solution.
est faible et relativement petite. Les gures B.4 (p. 367) B.6 (p. 368) illustrent llargissement
de cette zone o lerreur de reproduction (E
LS
) est rduite alors que le nombre de modes de
rayonnement inclus dans la solution est de plus en plus important. Ces gures, avec les exp-
rimentations en AWFS, dmontrent donc lintrt de lAWFS et notamment de lAWFS base
sur le contrle indpendant des modes de rayonnement : la possibilit de rduire la pnalisation
des modes dordre suprieur (ce qui nest pas le cas avec lAWFS base sur la modication de
lalgorithme FXLMS) et, donc, dtendre la zone de contrle dans lespace.
Les mmes remarques sappliquent pour lautre situation acoustique : un espace semi-inni
dlimit par deux plans rigides (ce qui correspond approximativement lespace quelconque
tudi exprimentalement : prsence dun mur vertical et dun plancher). Le plan vertical est
situ en x
1
= 0 et le plancher est un plan parallle x
1
x
2
mais situ 1.22 m sous les sources de
reproduction. Les gures B.7 (p. 369) B.10 (p. 370) supportent cette extension des remarques
poses plus tt.
367
lAWFS en champ libre alors que les trois
dans la solution.
lAWFS en champ libre alors que les quatre
dans la solution.
En plus hautes frquences, la taille de la rgion pour laquelle E
LS
est plus faible est rduite,
en accord avec les connaissances acquises en contrle actif du bruit, mais lobservation du fait
que les modes dordre suprieur sont dune importance capitale pour llargissement de la zone
efcace de reproduction reste valable. Ce qui est montr aux gures B.11 (p. 371) B.14 (p.
372).
Lensemble des complments de simulations pos dans cette sous-section supporte donc
maintes observations exprimentales. Limportance des modes de rayonnement dordre sup-
rieur est telle quelle dicte, en dehors des positions des microphones de lerreur utiliss pour le
contrle, lallure des courbes de niveau de lerreur de reproduction observe pour lAWFS base
sur le contrle indpendant des modes de rayonnement ou sur la modication du FXLMS.
368
lAWFS en prsence de deux plans rigides
alors quun seul mode de rayonnement est
inclus dans la solution.
alors que les deux premiers modes de
rayonnement sont inclus dans la solution.
B.2.2 Reproduction dimpulsions
Cette sous-section complte et supporte les afrmations poses au chapitre 8 sur le traite-
ment du signal large bande pour lAWFS.
Le cas thorique considr est celui qui comporte trois parois rigides au chapitre 8. On
sintresse la comparaison de la taille effective de reproduction pour lAWFS base sur le
FXLMS modi ou sur le contrle indpendant des modes de rayonnement. La dure de la
simulation est limite 4 secondes et les coefcients de convergence utiliss sont les mme que
ceux utiliss au chapitre 8. Tous les paramtres de pnalisation sont nuls. Aussi, pour bien
illustrer la diffrence de taille de la rgion de reproduction pour les deux algorithmes, on pose
la solution WFS suivante : w
WFS
=
0.
Les gures B.15 et B.16 prsentent les champs reproduits. Il est clair que lAWFS base
369
alors que les trois premiers modes de
alors que les quatre premiers modes de
sur le contrle indpendant des modes rayonnement donne une zone de reproduction plus large.
Cette diffrence remarquable, lavantage de lAWFS base sur le contrle indpendant des
modes de rayonnement, tient de la plus rapide convergence des modes dordre suprieur pour
lAWFS base sur les modes de rayonnement. Dans ce cas, ces modes contribuent llargisse-
ment de la zone effective de reproduction. Tel que suggr la sous-section prcdente.
Les courbes dapprentissage pour ces deux cas sont prsentes la gure B.17.
370
lAWFS 400 Hz en champ libre alors quun
seul mode de rayonnement est inclus dans la
solution.
lAWFS 400 Hz en champ libre alors que les
deux premiers modes de rayonnement sont
371
trois premiers modes de rayonnement sont
quatre premiers modes de rayonnement sont
372
Figure B.15 Champ acoustique reproduit par
AWFS base sur le FXLMS.
Figure B.16 Champ acoustique reproduit par
AWFS base sur le contrle indpendant des
modes de rayonnement.
0.5 1 1.5 2 2.5 3 3.5 4
10
4
10
3
10
2
10
1
10
0
E
L
S
(
n
)
Temps [s]
FXLMS, w
WFS
=0
Contrle des modes de radiation, w
WFS
=0
Figure B.17 Courbes dapprentissage pour les champs reproduits prsents aux gures B.15
(p. 373) et B.16 (p. 373).
373
ANNEXE C
COMPLMENTS DEXPRIMENTATIONS
Lensemble de cette annexe regroupe les informations complmentaires aux diffrentes ex-
primentations qui, an dallger le corps du texte de la thse, sont ici rpertories. Elles in-
cluent, par exemple, des informations sur les montages, lquipement et les mthodes expri-
mentales privilgies.
C.1 Exprimentations prliminaires avec un systme de WFS conventionnel : mesures
de champs reproduits
Cette section complte la partie exprimentale du chapitre du mme nom, soit le chapitre
4 dbutant la page 42. Ces exprimentations furent essentiellement consacres la mesure
exprimentale de champs acoustiques reproduits par WFS dans une situation relle.
La section C.1.1 prsente la salle, la section C.1.2 le systme de WFS, la section C.1.3 le
montage exprimental et la section C.1.4 offre quelques preuves du bon fonctionnement de la
dmarche danalyse. La dernire section (C.2) prsente les rsultats didentication des micro-
phones et les corrections des rponses.
C.1.1 Informations complmentaires sur la salle de reproduction
Le lieu de reproduction est illustr schmatiquement la gure C.1 (p. 375). Cet espace de
recherche appartient au MARLAB (Multi channel Audio Reasearch LABoratory lUniversit
McGill, au sous-sol du Redpath Hall).
374
Figure C.1 Gomtrie du lieu o les mesures
objectives de la WFS ont pris place.
Figure C.2 Les haut-parleurs deux voies
utiliss pour la WFS.
Les murs de la salle sont faits de panneaux de pltre dun demi-pouce dpaisseur sur un
fond de briques. De lourds rideaux acoustiques noirs (souvent utiliss dans les studios semi-
profesionnels) recouvrent les murs. Un plafond ottant recouvre environ 30 cm de matriaux
laineux compresss utiliss pour labsorption sonore et thermique. Le lourd plancher de bton
(correspondant la fondation de tout limmeuble) est couvert dun tapis commercial. La taille
de la salle est environ 5.2 m6.05 m2 m (2 m est la distance entre le plancher et le plafond
ottant) tel que montr la gure C.1 (p. 375). Le temps de rverbration 20 dB 1 kHz est
mesur environ T
20
= 0.11 s (source : facult de musique de lUniversit McGill). Les exp-
rimentations furent donc conduites dans une salle de dimension moyenne reprsentative dune
situation relle. On note que derrire les rideaux absorbants disposs devant les murs de briques,
il y aussi des fentres qui donnent sur une rue moyennement achalande de Montral. Ce qui
produit donc des conditions de bruits de fond non-idales, notamment en basses frquences.
ce sujet, on note que tous les enregistrements de concerts raliss au Redpath Hall sont ltrs
de telle sorte que le contenu sous 100 Hz soit srieusement attnu pour justement rduire lim-
portance des bruits de passage des camions et autres vhicules. Nous procdons de mme pour
lensemble des donnes.
375
C.1.2 Informations complmentaires sur le systme de WFS
Chaque panneau du systme (voir les gures 4.23 (p. 64) et C.2 (p. 375)) comporte 8 haut-
parleurs deux voies, une entre numrique optique ADAT ( 8 canaux), des convertisseurs
DAC et 8 amplicateurs de puissance. Le systme de WFS en charge du rendu, du calcul des
oprateurs de synthse et du ltrage en temps rel, inclut quatre ordinateurs PC fonctionnant
sur Linux. Les ordinateurs sont prsents la gure C.3 (p. 377) (extrait du mode demploi de
la WFS par Fraunhofer). Un des ordinateurs est utilis comme interface graphique, un autre est
utilis pour la lecture des chiers audionumriques qui alimentent les sources virtuelles et les
deux derniers sont en charge des oprateurs de synthse de la WFS pour une partie du rseau de
haut-parleurs. Pour les exprimentations, les logiciels dvelopps par Fraunhofer sont utiliss.
Ceux-ci sont cineplay et wfssynth. Cineplay fonctionne sur PC2 (le second ordinateur)
et produit les ots audionumriques transmis aux PC en charge du rendu alors que wfssynth
(pour le rendu) roule sur PC3 et PC4. Tout est contrl la ligne de commande sur PC1 qui
communique avec les autres ordinateurs. Pour les exprimentations, lensemble des chiers de
donnes (description gomtrique de la position des sources virtuelles dans le temps et chiers
audionumriques) est produit selon un processus automatis dans Matlab. Le reste des opra-
tions
1
est gr par PC1 sur lequel des scripts Linux ont t rdigs, pour ces exprimentations,
puis lancs.
En plus des 88 haut-parleurs, le systme de WFS comporte deux caissons dextrmes graves
aliments par un seul et unique signal driv des sources formant la scne virtuelle
2
. Pour les
expriences avec ce systme, ces caissons amplis ne sont videmment pas en fonction pour
lvaluation du champ reproduit par WFS. Par contre, le canal balanc (sur XLRnormal, et selon
la tradition audio) pour les caissons est utilis comme signal de rfrence pour lvaluation des
fonctions de rponse en frquences et des rponses impulsionnelles. Avant de procder de la
sorte, des essais sont raliss pour valuer la validit de cette possibilit. Suivant lobservation
des signaux, dont lamplitude tait constante, balayant 0 Hz 20 kHz, il fut clair que la sortie
pour les caissons ntait pas ltre par le traitement de signal de la WFS (au niveau de PC3 et
1
Copies des chiers de PC1 vers PC2, PC3 et PC4 ; conguration des cartes de sons [nombre de canaux,
communication, etc.] ; lancement de rendu en boucle ; rptition des squences de rendu et essais prliminaires
avec de courts balayages en frquence sur chacun des haut-parleurs.
2
Il est plus que probable que ce signal soit simplement obtenu par la superposition des alimentations monopho-
niques des sources virtuelles. Les retards temporels qui pourraient tre introduits viendraient peut-tre du temps de
calcul. Selon les informations obtenues par lquipe de Fraunhofer, le traitement pour la production de la ligne de
basses frquences tait des plus simples an de rduire la charge de calcul essentiellement ddie aux oprateurs
de synthse.
376
Figure C.3 Le systme informatique derrire la WFS. Des composantes audio commerciales
sont utilises (baies de brassage analogiques [patch bays] et ADAT, matrice ADAT, etc.)
PC4) puisque le voltage observ sur la ligne analogique fut constant lors du balayage. Dautres
dtails ce sujet sont explicits la section C.1.3.
Des photos supplmentaires du systme de WFS tudi sont prsentes aux gures C.2
(p. 375) C.7 (p. 379). Le manuel de WFS fournit aussi des informations dtailles sur les
composantes commerciales spciques utilises par le systme [Fraunhofer, Institut Integrierte
Schaltungen, 2003].
377
Figure C.4 Lantenne de micophones utilise pour les mesures de champs acoustiques.
Figure C.5 Un microphone de lantenne de
capteurs.
Figure C.6 Lantenne de micophones est
positionne par rapport au centre du rseau de
sources par le biais de marques au sol.
378
Figure C.7 Enregistreur DAT et oscilloscope
dans lentre isole de la pice (voir la gure
C.1 (p. 375)).
Figure C.8 Reprsentation schmatique de la
chane dacquisition utilise pour les mesures
de champs acoustiques reproduits par WFS.
C.1.3 Informations complmentaires au sujet du montage exprimental
La pression sonore fut mesure avec une antenne linaire de microphones illustre aux -
gures 4.23 (p. 64), 4.24 (p. 64), C.4 (p. 378) C.6 (p. 378) et C.8 (p. 379). Lantenne comportait
8 microphones TMS (modle 130M01 avec des pramplicateurs de la mme marque de modle
130P10). Pour les mesures de champs acoustiques reproduits, lantenne de capteurs est place
au centre du rseau de haut-parleurs et est perpendiculaire laxe avant-arrire comme le sug-
gre la gure 4.24 (p. 64). Des conditionneurs ICP (deux conditionneurs PCB 442B104 quatre
canaux chacun) sont utiliss pour assurer la connection entre les microphones et lenregistreur
DAT (SONY PC216A, voir la gure C.7 (p. 379)) sur lequel sont nalement stockes les don-
nes avant le post-traitement. Les microphones sont calibrs avant chaque sance de mesure. La
chane de mesure est rsume graphiquement la gure C.8 (p. 379). On note nalement que le
signal de rfrence est directement issu de PC3. En fait, lorsque les caissons de graves actifs sont
utiliss normalement, cest lentre des caissons que lutilisateur peut ajuster la frquence de
coupure pour dterminer la plage effective des caissons ; do une justication supplmentaire
de labsence de ltre lors de la production de la ligne de graves par wfssynth.
379
C.1.4 Informations et preuves supplmentaires au sujet de la rcupration et de la
manipulation des donnes exprimentales
Les mesures et lanalyse des donnes sont simples et suivent la procdure suivante.
Pour les mesures de champs reproduits, le systme de WFS est sollicit pour la reproduc-
tion dondes sphriques alimentes par des chiers audionumriques normaliss. Les signaux
utiliss sont des bruits blancs de quatre minutes une frquence dchantillonnage de 48 kHz
3
.
Puisque le systme de WFS utilise des haut-parleurs spars par 17.5 cm (ce qui donne environ
945.7 Hz comme frquence de repliement spatial si lon assume une vitesse du son de 331 m/s
[Verheijen, 1998]), ce signal de rfrence, reproduire, est limit 1 kHz (ce qui correspond
la frquence de coupure -3 dB dun ltre passe-bas de type Butterworth dordre 12, oprant
aussi 48 kHz, utilis pour prparer les signaux reproduire). Cette limitation en frquence
sexplique simplement par le fait que ltude des performances concerne la plage dopration
effective de la WFS et non pas le systme comme entit de reproduction audio complte telle
quutilise en situation typique.
Tous les signaux issus des microphones et de la ligne de rfrence (la sortie de ligne balance
pour les caissons de graves) sont numriss, lors de la reproduction en tant que telle, une fr-
quence dchantillonnage de 6 kHz avec une bande passante de 0 2.5 kHz avant dtre stocks
sur des bandes DAT en post-traitement
4
. Suivant les ajustements consquents aux calibrations
des microphones, tous les signaux sont ltrs par un ltre passe-haut dni dans le domaine
des frquences comme une fentre rectangulaire dont la frquence de coupure est 100 Hz. Ce
ltrage idal est introduit pour annuler limportance du bruit de passage des camions sur cette
plage de frquences, dautant plus que cette plage est normalement cest--dire en situation
de reproduction audio produite par les caissons de graves alors hors fonction pour les me-
sures. On note aussi que tous les enregistrements de concerts raliss dans le mme Redpath
3
48 kHz correspond la frquence dchantillonnage utilise par cineplay et wfssynth en situation nor-
male.
4
Il peut paratre trange que le signal de rfrence, connu et construit dans le domaine numrique, soit numris
par le biais de la sortie des caissons de graves lors de la reproduction. Savoir reconnatre que ce choix est la solution
la plus simple pour un problme technique relativement complexe devrait claircir tout doute ce sujet. En effet,
pour conserver un retard temporel xe dexprience en exprience ou, du moins, uniquement fonction de la
distance de la source virtuelle les signaux reproduits et le signal de rfrence doivent se trouver simultanment
sur les bandes DAT. Puisque toutes les sorties des ordinateurs chargs du rendu (soit PC3 et PC4) ne produisent que
des signaux optiques ADAT qui sont envoys aux panneaux ferms des haut-parleurs, la sortie pour les caissons de
graves tait la seule possibilit analogique simple an denvoyer une rfrence lenregistreur DAT.
380
Hall sont ltrs par les tudiants gradus en enregistrement du son sur une plage semblable et
pour la mme raison. Le ltre en question est conu dans le domaine des frquences de telle
sorte que la fentre soit rellement rectangulaire (nulle sous 100 Hz et unitaire relle partir de
100 Hz). Le ltre idal est par la suite appliqu dans le domaine temporel avec compensation de
la circularit par lintroduction dune circulation des coefcients.
partir des donnes ainsi traites a priori, les diffrentes rponses impulsionnelles sont
identies dans le domaine temporel laide du ltrage adaptatif (de type LMS gradient sto-
chastique). Cest donc une approche didentication base sur lerreur de prdiction parfois
connue sous le nom didentication de systme adaptative [Stearns et David, 1988]. Une fois
que la rponse temporelle des ltres adaptatifs converge, elle est transpose dans le domaine
frquentielle o 1) la correction de la rponse des microphones est appliques (si ncessaire)
5
et
2) le rsultat est ltr par un ltre passe-bande (100 Hz 1 kHz) dans le domaine des frquences
de la mme faon que les donnes brutes avaient t ltres pour en soustraire les composantes
sous 100 Hz. La fentre dintrt est donc habituellement limite de 100 Hz 1 kHz (sauf dans
les cas indiqus dans le corps du document). Les rponses impulsionnelles sont obtenues par la
suite en transposant les FRF ainsi ltres dans le domaine temporel laide de la transforme
de Fourier rapide inverse.
Cette approche qui passe du temporel vers le frquentiel puis retourne vers le temporel fut
choisie essentiellement parce que lidentication adaptative dans le domaine temporel semblait
la plus robuste et la plus able lorsquelle fut applique des cas ctifs didentication.
C.2 Identication des rponses en frquences de huit microphones en situation
semi-anchoque
Pour potentiellement corriger les rponses obtenues par les microphones lors de la mesure de
champs reproduits, les rponses des microphones sont identies en condition semi-anchoque.
La procdure est simple. Les microphones sont, tour tour, disposs devant une source de
bruit blanc (2.2 mtres devant un haut-parleur JBL actif deux voies aliment par un analyseur
5
Cette correction est ralise selon lidentication des rponses des microphones en condition semi-anchoque
(la section C.2 prsente le dtail de ces exprimentations ncessaires la bonne suite des prsentes) pour sassurer
que les phases des rponses en frquences des microphones sont les mmes par le biais de cette correction a
posteriori ralise dans le domaine frquentiel.
381
0 0.5 1 1.5 2 2.5 3 3.5
x 10
5
10
2
10
1
10
0
E
r
r
e
u
r

a
b
s
o
l
u
e
0 0.5 1 1.5 2 2.5 3 3.5
x 10
5
10
8
10
7
10
6
10
5
chantillon
c
a
r
t

a
b
s
o
l
u

m
o
y
e
n
(a)
(b)
Figure C.9 Convergence de lerreur rsiduelle de lidentication de rponses impulsionnelles
par ltrage adaptatif pour lidentication dun microphone. (a) : moyenne mobile de lerreur
rsiduelle instantane absolue. (b) : variation absolue moyenne des coefcients du ltre
adaptatif.
B&K 2311). Au sol, entre la source lectroacoustique et le microphone une mousse absorbante
de 10 cm dpaisseur est dpose pour rduire les effets de rexion. Pour chaque microphone
la mesure est divise en deux parties : une pour lidentication et une autre, plus courte, pour la
validation. Les mesures de calibration sont par la suite appliques aux donnes brutes. Un l-
trage passe-haut 100 Hz est alors appliqu (dans le domaine temporel) aux donnes. La rponse
impulsionnelle est par la suite identie laide du ltrage adaptatif dans le domaine temporel.
La validation des identications complte nalement la procdure.
titre dexemple, la convergence du ltre adaptatif est illustre la gure C.9 (p. 382) pour
le premier microphone.
Puisque toute dmarche didentication doit saccompagner dune validation des sorties pr-
dites par le systme nouvellement identi en comparaison avec les sorties mesures pour une
srie de points qui nont pas t sollicits pour lidentication, les validations des identications
pour les huit microphones sont prsentes aux gures C.10 (p. 383) et C.11 (p. 383). Les courbes
identies mesures prsentent les sorties mesures alors que les courbes intitules simula-
tions ont t produites par la convolution numrique des entres mesures par les RI identies.
Dans le cas de la premire gure, on peut voir que les sorties simules avec le systme identi
correspondent bien aux sorties mesures. La deuxime gure prsente la diffrence entre les
paires de courbes de la gure C.10 (p. 383). Cette correspondance valide donc lidentication.
382
0 100 200 300 400 500
2
0
2
#
1

[
P
a
]
0 100 200 300 400 500
2
0
2
#
2

[
P
a
]
0 100 200 300 400 500
2
0
2

#
3

[
P
a
]
0 100 200 300 400 500
2
0
2
#
4

[
P
a
]
0 100 200 300 400 500
2
0
2
#
5

[
P
a
]
0 100 200 300 400 500
2
0
2
#
6

[
P
a
]
0 100 200 300 400 500
2
0
2
#
7

[
P
a
]
0 100 200 300 400 500
2
0
2
chantillons

#
8

[
P
a
]
Simulations
Mesures
Figure C.10 Validation de lidentication des
microphones.
100 200 300 400 500
1
0
1
#
1

[
P
a
]
100 200 300 400 500
1
0
1
#
2

[
P
a
]
100 200 300 400 500
1
0
1
#
3

[
P
a
]
100 200 300 400 500
1
0
1
#
4

[
P
a
]
100 200 300 400 500
1
0
1
#
5

[
P
a
]
100 200 300 400 500
1
0
1
#
6

[
P
a
]
100 200 300 400 500
1
0
1
#
7

[
P
a
]
100 200 300 400 500
1
0
1
chantillons
#
8

[
P
a
]
Figure C.11 Erreurs de validation de la gure
C.10 (p. 383).
Les rponses en frquence des huit microphones sont prsentes la gure C.12 (p. 384).
Tel quil est possible de le voir sur la gure, les FRF des microphones sont trs semblables et
prsentent un dlai de groupe attribuable au temps de propagation de la source aux capteurs. En
basses frquences, les amplitudes sont plus importantes tant donne la rexion par le plancher
(qui nest pas totalement couvert de mousse absorbante). Les uctuations en basses frquences
sont aussi attribuables la source miroir sous le plancher qui introduit un ltrage en peigne.
On note aussi que la chambre nest plus anchoque sous 100 Hz. En plus hautes frquences,
ces uctuations sont moins importantes puisque 1) la mousse acoustique pose au sol (plus
383
0 500 1000 1500 2000 2500 3000
40
20
0
20
40
G
a
i
n

[
d
B

r
e
f

1
]
0 500 1000 1500 2000 2500 3000
100
80
60
40
20
0
Frquences [Hz]
P
h
a
s
e

[
r
a
d
]
0 500 1000 1500 2000 2500 3000
20
0
20
40
60
Frquence [Hz]
D
l
a
i

d
e

g
r
o
u
p
e

[
m
s
]

Figure C.12 Fonctions de rponse en frquence des huit microphones. En haut : gain des FRF.
En bas : phase et dlai de groupe des FRF.
prcisment la taille de la surface couverte en relation avec la longueur donde) devient plus
efcace et 2) la directivit de la source rduit probablement lamplitude des hautes frquences
diriges vers le plancher. Toujours sur la mme gure, on observe un dlai de groupe moyen
denviron 6.6 ms. Ce qui correspond environ 2.18 m avec une vitesse de propagation du son
de 331 m/s. La distance physique mesure entre la source et les capteurs tant denviron 2.2 m.
Les rponses impulsionnelles des huit microphones sont prsentes la gure C.13 (p. 385).
Comme on peut le voir, les rponses sont trs similaires.
Pour le traitement potentiel des donnes des mesures de la WFS, on dnit une FRF de
correction pour chaque microphone. En imposant la FRF du microphone #1 comme rfrence,
on trouve une FRF de correction pour un autre microphone m : H(f)
corr,m
= H
1
(f)/H
m
(f).
Cette fonction de correction pourrait tre applique, dans le domaine frquentiel, aux FRF me-
sures pour la reproduction de champs acoustiques par WFS. Les RI corriges sont simplement
produites par le retour dans le domaine temporel.
Les FRF corriges pour les mesures des microphones en chambre semi-anchoque sont
prsentes la gure C.15 (p. 386) (sur cette gure, les huit traits se confondent) et les RI
correspondantes la gure C.14 (p. 385). Comme on peut le voir, une fois corriges (quoique
les diffrences sont assez faibles sans correction), toutes les rponses correspondent celle
du premier microphone (le microphone de rfrence) puisque dans la dnition de H
corr,m
les
composantes partages (salle, retard temporel, rponse et directivit du haut-parleur) sannulent.
384
50 100 150 200 250
2
1
0
1
#
1

[
P
a
/
V
]
50 100 150 200 250
2
1
0
1
#
2

[
P
a
/
V
]
50 100 150 200 250
2
1
0
1

#
3

[
P
a
/
V
]
50 100 150 200 250
2
1
0
1
#
4

[
P
a
/
V
]
50 100 150 200 250
2
1
0
1
#
5

[
P
a
/
V
]
50 100 150 200 250
2
1
0
1
#
6

[
P
a
/
V
]
50 100 150 200 250
2
1
0
1
#
7

[
P
a
/
V
]
50 100 150 200 250
2
1
0
1
chantillons

#
8

[
P
a
/
V
]
Figure C.13 Rponses impulsionnelles des
huit microphones de mesure.
50 100 150 200 250
2
1
0
1
50 100 150 200 250
2
1
0
1
50 100 150 200 250
2
1
0
1
50 100 150 200 250
2
1
0
1
50 100 150 200 250
2
1
0
1
50 100 150 200 250
2
1
0
1
50 100 150 200 250
2
1
0
1
50 100 150 200 250
2
1
0
1
RI corriges
RI de rfrence
chantillons
#
1

[
P
a
/
V
]
#
2

[
P
a
/
V
]

#
3

[
P
a
/
V
]
#
4

[
P
a
/
V
]
#
5

[
P
a
/
V
]
#
6

[
P
a
/
V
]
#
7

[
P
a
/
V
]

#
8

[
P
a
/
V
]
Figure C.14 Rponses impulsionnelles
corriges des huit microphones de mesure. La
rfrence correspond au microphone #1.
385
0 500 1000 1500 2000 2500 3000
40
20
0
20
40
G
a
i
n

[
d
B

r
e
f

1
]
0 500 1000 1500 2000 2500 3000
100
80
60
40
20
0
Frquences [Hz]
P
h
a
s
e

[
r
a
d
]
0 500 1000 1500 2000 2500 3000
20
10
0
Frquence [Hz]
D
l
a
i

d
e

g
r
o
u
p
e

[
m
s
]

Figure C.15 Fonctions de rponse en frquence corriges des huit microphones. En haut : gain
des FRF corriges. En bas : phase et dlai de groupe des FRF corriges.
Les FRF de correction (H(f)
corr,m
) sont prsentes aux gures C.16 (p. 387) et C.17 (p.
387). Elles dmontrent que, malgr le fait que les FRF sans correction se ressemblent, des
diffrences existent entre les FRF identies pour chacun des microphones.
C.3 Construction dun systme de WFS approximatif
Cette section prsente des exprimentations en lien avec cette thse sans toutefois rpondre
lobjectif principal de la thse. Ces dveloppements et essais exprimentaux furent raliss
avec James Partaik, tienne Grenier et Christophe Viau dans les laboratoires du LANTISS (LA-
boratoire des Nouvelles Technologies de lImage, de la Scne et du Son) en novembre 2005
lUniversit Laval (Qubec, Qubec, Canada).
Lobjectif de cette collaboration tait alors simple : raliser un systme de WFS en deux ou
trois jours sur une base de programmation visuelle Pure-Data (logiciel libre) et Max/Msp,
deux logiciels disponibles dans la majeure partie des centres de recherche ou de cration m-
diatique et musicale. Lintention tait aussi dvaluer la possibilit dintroduire un bon nombre
dapproximations dans la dnition de la WFS et deffectuer de la reproduction en temps rel,
avec plusieurs sources virtuelles, sur un seul ordinateur Apple. Cette ralisation approxima-
tive de la WFS correspond la description populaire de la WFS publie par Gauthier et al.
[Gauthier et al., 2005b] et fait ainsi partie dun effort de vulgarisation des notions de spatialisa-
tion sonore et de reproduction de champs acoustiques.
386
0 1000 2000 3000
5
0
5
#
1

[
d
B

r
e
f

1
]
0 1000 2000 3000
5
0
5
#
2
0 1000 2000 3000
5
0
5
#
3
0 1000 2000 3000
5
0
5
#
4
0 1000 2000 3000
5
0
5
#
5
0 1000 2000 3000
5
0
5
#
6
0 1000 2000 3000
5
0
5
#
7
0 1000 2000 3000
5
0
5
Frquence [Hz]
#
8
Figure C.16 Gains [dBref1] des FRF de
correction des rponses des microphones.
200 400 600 800 1000
0.2
0.1
0
0.1
#
1

[
r
a
d
]
0 1000 2000 3000
0.2
0.1
0
0.1
#
2
0 1000 2000 3000
0.2
0.1
0
0.1
#
3
0 1000 2000 3000
0.2
0.1
0
0.1
#
4
0 1000 2000 3000
0.2
0.1
0
0.1
#
5
0 1000 2000 3000
0.2
0.1
0
0.1
#
6
0 1000 2000 3000
0.2
0.1
0
0.1
#
7
0 1000 2000 3000
0.2
0.1
0
0.1
Frquence [Hz]
#
8
Figure C.17 Phase [rad] des FRF de
correction des rponses des microphones.
C.3.1 Description du systme
Initialement, le systme mis en place (prsent la gure C.18 (p. 388)) comportait 24
sources de reproduction regroupes en un rseau linaire de haut-parleurs [Jouhaneau, 1997].
Rapidement, le nombre de sources passe 16 puisquil devient trop complexe de grer deux
cartes de son en combinant des sorties analogiques et ADAT pour un aussi bref projet. Les
16 haut-parleurs sont alors branchs sur deux cartes de son Motu 896HD 8 sorties analo-
giques balances, par carte. Les signaux audio sont amplis par des amplicateurs CTs 4200
387
Figure C.18 Photographie du systme de WFS approximatif. Mme si seulement 16 sources
sont utilises, limage en prsente 24.
de Crown avant dtre transmis aux cabinets lectroacoustiques de marque Renkus-Heinz
et de la srie TRX.
Les sources sont spares par 0.245 mtre et lantenne complte couvre environ 4 mtres. La
zone dcoute de la WFS, identie pour la prsentation publique, est donc, approximativement,
de 4 mtres par 4 mtres. Larrire des cabinets est 0.445 mtre du mur. La profondeur de la
salle, dont les murs sont couverts de rideaux acoustiques, fait environ 15 mtres.
La gure C.19 (p. 389) prsente deux vues rapproches de lantenne de sources de repro-
duction. Les photos prsentent 24 sources, mais seulement les 16 du centre sont utilises.
C.3.2 Rsum des observations
Mme si tous les objectifs dnis pour ce court projet ne furent pas entirement atteints (cer-
tains problmes techniques de synchronisation de cartes de son ont ralenti le dveloppement),
on peut numrer quelques points concluants :
haute frquence dchantillonnage (48 kHz dans notre cas), il est possible de simplier
lextrme les oprateurs de synthse de la WFS tel quexpliqu dans la rfrence [Gauthier
et al., 2005a] ;
il devient alors possible de faire tourner en temps rel plusieurs sries doprateurs de
la WFS (pour crer plusieurs sources virtuelles) sur un seul ordinateur (Apple) ; il est
388
Figure C.19 Dtails du rseau de sources du systme de WFS approximatif. Mme si
seulement 16 sources sont utilises, limage en prsente 24.
mme possible dajouter des modules de traitement du signal sans surcharger lordina-
teur ;
en terme de localisation sonore, les rsultats sont concluants : les sources virtuelles sont
bien perues o elles taient virtuellement positionnes ;
il est plus difcile de simplier les oprateurs de la WFS pour la cration dune source
virtuelle devant lantenne linaire de haut-parleurs (cette partie de programmation na pu
tre termine) ;
il est possible, en champ lointain ou pour des angles dincidence virtuelle qui corres-
pondent la ligne des sources de reproduction, dutiliser la WFS comme systme de pro-
jection sonore super directif pour diriger le lobe principal de rayonnement sur les murs du
lieu et ainsi crer des vnements auditifs lextrieur de lantenne de sources de repro-
duction (cest--dire placer des sons qui viennent de larrire ou des cts de la salle alors
quaucun haut-parleur ne se trouve sur ces surfaces) ;
les projets Pure-Data et MAX/MSP de WFS pourront tre ventuellement complts
et distribus.
389
Tableau C.1 Spcications techniques pour les moniteurs de studio DX4.
MONITEURS DE STUDIO DX4 DE M-AUDIO
Haut-parleur basse frquence 4 pouces, cne de papier recouvert
Haut-parleur haute frquence 1 pouce, cne de mylar avec OptImage
Sortie strophonique pour couteur 1/8 pouce
Puissance damplication par canal 18 Watts
Plage dynamique >95 dB
Frquence de coupure 2.8 kHz
Ratio signal-bruit >90 dB (pondration A)
Niveau de pression acoustique ( 1 m, sur laxe) 101.5 dB
Impdance dentre (balance) 20 k
Impdance dentre (non-balance) 10 k
Connecteurs dentre TRS, 1/4 pouce et RCS
Dimensions 8.5 5.75 6.25 pouces
Masse 12 livres
C.4 Description du systme exprimental dAWFS et des lieux utiliss pour les
exprimentations avec un systme dAWFS complet
Cette section est divise en quatre parties, toutes relies au dernier chapitre de cette thse :
description du systme dAWFS, description du lieu semi-anchoque, description de lespace
de laboratoire et description de la salle rverbrante.
C.4.1 Conception et construction du systme dAWFS
Le systme est construit pour une conguration circulaire de haut-parleurs telle quinitiale-
ment prsente au chapitre 6. Le systme est fait partir de 24 moniteurs amplis pour studio
de marque M-Audio et de modle DX4. La che technique du fabricant est prsente au
tableau C.1.
Les haut-parleurs sont disposs sur un cercle et chaque paire de haut-parleurs voisins est sup-
porte par un pied pour moniteur de studio Quik-Lok de modle ES-300. Les spcications
des supports sont prsentes au tableau C.2.
390
Tableau C.2 Spcications techniques pour les supports ES-300.
SUPPORTS POUR MONITEURS ES-300 DE QUIK-LOK
Dimensions de la tablette 9 9 pouces
Hauteurs possibles 83 cm, 91 cm, 99 cm, 107 cm, 115 cm
Base Triangulaire, 17.7 pouces (45 cm) (par ct)
quilibrage Pointes ajustables pour plancher ou appuis de caoutchouc
Charge maximale 100 livres
Masse 10.6 livres
Construction Acier et soudure, avec amnagement pour ls
Tableau C.3 Spcications techniques pour les microphones 130D10.
MICROPHONES 130D10 DE PCB
Diamtre 1/4 pouce
Rponse en frquence 1dB, 100 4000 Hz
Appariement en phase 3 degrs, 100 3000 Hz
Sensibilit 45 mv/Pa 250 Hz
Plage dynamique >122 dB
Voltage dalimentation 18 30 VDC
Construction Acier inoxydable
Pour lvaluation de lerreur de reproduction, des microphones PCB de modle 130D10,
des pramplicateurs PCB de modle 130P10 et un conditionneur de signal huit voies
PCB de modle 482A20 sont utiliss. Les spcications des microphones et des prampli-
cateurs sont prsentes aux tableaux C.3 C.4.
La gure C.20 (p. 392) prsente une vue en plonge schmatique de la conguration des
Tableau C.4 Spcications techniques pour les pramplicateurs 130P10.
PRAMPLIFICATEURS 130P10 DE PCB
Diamtre 1/2 pouce
Rponse en frquence 0.1 dB, 10 20000 Hz
Bruit lectrique <7 V, plat de 20 20000 Hz
Voltage dalimentation 18 30 VDC
Construction Acier inoxydable
391
Figure C.20 Vue en plonge dune reprsentation schmatique de lantenne circulaire de
haut-parleurs DX4 sur les supports usins et les pieds ES-300.
24 haut-parleurs utiliss pour les essais dAWFS. Des photographies gnrales et dtailles du
montage sont prsentes aux gures C.21 (p. 393) C.23 (p. 394)
Pour llaboration du systme dAWFS, on note deux contextes dopration diffrents qui
sollicitent diffrentes pices dquipement. Dans le premier contexte (contrle large bande),
ladaptation est simule hors-ligne. Pour cette situation, des cartes de son sont utilises pour ef-
fectuer lidentication du systme, le contrle (en rendu) puis la mesure de champs acoustiques
reproduits. Une 24IO de Motu est utilise et dcrite au tableau C.5. Pour le montage exp-
rimental, la carte est pilote par ASIO2 et Matlab, ladaptation est simule dans Simulink.
La conguration de lensemble du systme est schmatiquement prsente la gure C.24 (p.
395).
Dans le deuxime contexte, ladaptation est effectue en ligne (pour des tons purs) avec
une station dSpace. La disposition du systme exprimental est prsente la gure C.25 (p.
392
Figure C.21 Vues gnrales et dtailles du montage exprimental dAWFS en salle
semi-anchoque.
393
Figure C.22 Vue de larrire dun
haut-parleur.
Figure C.23 Vue rapproche des microphones
de lerreur pour le systme dAWFS.
Tableau C.5 Spcications techniques pour la carte de son 24IO.
CARTE DE SON 24IO DE MOTU
Entres 24, 24 bits, 96 kHz
Sorties 24, 24 bits, 96 kHz
Entres et sorties analogiques 8 8, balances et non-balances, TRS 1/4 pouce
Word-clock Entre et sortie pour synchronisation
Pilotes compatibles ASIO, WDM
395). Les ltres anti-repliements de Musilab (FPB25 8 entres et 8 sorties) sont des ltres
Butterworth analogiques dordre 8.
C.4.2 Caractrisation des haut-parleurs DX4
Dans la mesure o la WFS implique lutilisation de sources de reproduction qui, idalement,
devraient reprsenter des sources monopolaires, la caractrisation des haut-parleurs amplis
DX4 permet de juger a priori lcart des sources de reproduction relle par rapport au modle
394
Figure C.24 Conguration exprimentale du systme dAWFS large bande
Figure C.25 Conguration exprimentale du systme dAWFS pour des tons purs
395
de sources de reproduction utilis pour le dveloppement de la WFS.
Caractrisation du woofer
On cherche dabord les caractristiques du woofer seul, lextrieur des cabinets. Pour
valuer ces caractristiques, les courbes dimpdance lectrique en frquence sont utilises.
Pour le woofer pos sur une table, on trouve la courbe dimpdance prsente la gure C.26 (p.
397). Cette courbe exprimentale, et les suivantes, sont obtenues partir du gratuiciel Speaker
Workshop, dune carte de son M-Audio (Delta 44) et du Wallin Jig 2
6
.
partir de cette courbe, on trouve que la frquence de rsonance mcanique du woofer
est denviron 98 Hz. La rsistance nominale est denviron 4 (tel que not par le fabricant) et
linductance est denviron 0.10 mH [Jouhaneau, 2000].
Avec la technique de la masse ajoute [Jouhaneau, 2000], il est possible dvaluer la ri-
gidit mcanique (ce qui inclut la rigidit (1) de lanneau de centrage, (2) de la suspension
priphrique, (3) de la cavit entre lanneau de centrage et lentrefer et (4) de la cavit derrire
lentrefer) et la masse de lquipage mobile du woofer. On trouve ainsi une rigidit mcanique
de 2.034 kN/m et une masse mobile de 5.4 g.
Effet du cabinet et de lvent
Des nouvelles mesures dimpdance lectrique sont effectues alors que le woofer est dans
un des cabinets sans amplicateur
7
, ces mesures sont prsentes la gure C.27 (p. 397). La
frquence de coupure du circuit daiguillage de frquences est de 2.5 kHz tel quillustr sur cette
mme gure.
Clairement, la prsence de la cavit du cabinet et de lvent intervient comme un absorbeur
6
Le Wallin Jig est un petit circuit passif utilis pour la mesure de haut-parleurs et de cabinets avec une carte
de son conventionnelle.
7
Les haut-parleurs DX4 tant des moniteurs amplis venant par paire, un seul des deux haut-parleurs supporte
lamplicateur de puissance deux voies. Dans ce haut-parleur, le volume de la cavit derrire la membrane est plus
petit. Mme si toutes les mesures prsentes dans cette section ne viennent que dun cabinet sans amplicateur,
on note que les mesures pour un cabinet avec amplicateur sont trs similaires lexception des frquences de
rsonance mcanique qui sont lgrement plus leves tant donne la rigidit acoustique plus importante pour une
cavit plus petite.
396
20 100 1000 10000
2
4
6
8
10
12
14
16
18
20
Frq. [Hz]
I
m
p
d
a
n
c
e

[
]
Frq. de rsonance : 98.1445 Hz
Rsistance : 4
Figure C.26 Impdance lectrique du woofer
des DX4 pos sur une table.
20 100 1000 10000
2
4
6
8
10
12
14
16
18
20
Frq. [Hz]
I
m
p
d
a
n
c
e

[
]
128.9062 Hz
4
2
.
5

k
H
z
des DX4 pos sur une table (en gris) et
impdance lectrique du woofer, du tweeter et
du circuit daiguillage de frquences dans un
des cabinets sans amplicateur (en noir).
dynamique : on trouve donc quen basses frquences (sous la premire rsonance 60 Hz) le
systme se comporte comme un diple (dplacements mcaniques de la membrane et de lvent
en phase, mais dbits volumiques hors phase) alors quen plus hautes frquences ( partir de
la deuxime rsonance 129 Hz) le systme se comporte comme un monopole (dplacements
mcaniques de la membrane et de lvent hors phase, mais dbits volumiques en phase). Dans
cette mesure, les DX4, mme sils possdent un vent larrire, doivent agir plutt comme des
sources monopolaires que comme des sources de gradient sur la plage de frquences dintrt
pour lAWFS et la WFS.
Dans tous les cas, lamortissement de lvent (par lintroduction dun cylindre de mousse
absorbante) est ais et efcace, comme on peut le voir la gure C.28 (p. 398), de telle sorte
quil soit possible de contrler, au besoin, la contribution de lvent lors des exprimentations.
Plus de dtails sur la contribution de lvent la puissance acoustique totale des DX4 sont
donns la sous-section suivante.
397
50 100 150 200 250 300
5
10
15
20
25
30
Frq. [Hz]
I
m
p
d
a
n
c
e

[
]
Woofer seul
Woofer et tweeter dans le cabinet
Amortissement de lvent
Demiamortissement de lvent
vent ferm
des DX4 avec amortissement de lvent.
100 200 300 400 500 600
0
5
10

G
a
i
n

(
q
e
/
q
m
)
100 200 300 400 500 600
5
0
5
Frq. [Hz]
P
h
a
s
e

(
q
e
/
q
m
)
=0
=0.0005
=0.001
Figure C.29 Fonctions de rponse en
frquences thoriques entre le dbit volumique
de la membrane (q
m
) et le dbit volumique de
lvent (q
e
).
Contribution thorique de lvent
Connaissant la masse et la rigidit de lquipage mobile du woofer ainsi que les deux fr-
quences de rsonance mcanique du woofer coupl au cabinet (environ 60 Hz et 129 Hz pour
le cabinet sans amplicateur et environ 60 Hz et 140 Hz pour le cabinet avec amplicateur), on
trouve la rigidit et la masse quivalente du rsonateur de Helmholtz fait de la cavit du cabi-
net et de la masse dair dans lvent. Dans le cas du cabinet sans amplicateur on trouve une
rigidit de cavit de 922.85 N/m et une masse dair dans lvent de 3.8 g pour une frquence de
rsonance du rsonateur cavit/vent 78.88 Hz. Dans le cas du cabinet avec amplicateur, on
trouve une rigidit de 1340.2 N/m et une masse de 4.6 g pour une frquence de rsonance du
rsonateur cavit/vent 86.05 Hz.
La fonction de transfert du dbit volumique de la membrane (q
m
) au dbit volumique de
lvent (q
e
) scrit comme suit (en modlisant le systme par un systme deux degrs de
libert) : q
e
/q
m
=
1
(1(/e)
2
)+j
o
e
est la pulsation naturelle du rsonateur de Helmholtz
et le facteur de perte [Jouhaneau, 2000]. On constate donc limportance de la frquence de
rsonance du rsonateur de Helmholtz derrire la membrane. Trois rponses en frquences de
ce type sont prsentes la gure C.29 (p. 398) pour des valeurs ctives du facteur de perte.
Clairement, cest sous la frquence de rsonance du rsonateur que les cabinets se comporteront
plutt comme des diples (les dbits volumiques de la membrane et de lvent sont dcals
398
100 200 300 400 500 600
120
125
130
135
140
145
150
155
160
165
170
Frq. [Hz]
N
i
v
e
a
u

d
e

p
u
i
s
s
a
n
c
e

[
d
B

r
e
f

1
0
1
2
]
=0
=0.0005
=0.001
Puissance de la membrane
Figure C.30 Niveaux de puissance acoustique de lvent et de la membrane pour une
membrane dbit volumique unitaire pour un cabinet DX4 sans amplicateur.
denviron radians). Ce comportement est moins dominant pour un amortissement de lvent
plus important, comme le suggre lvolution de la phase dans la bande de transition qui couvre
cette frquence de rsonance de la cavit du cabinet avec la masse dair dans lvent.
Au-del de limportance de la phase de la rponse du dbit volumique dans lvent versus le
dbit volumique caus par la membrane, on note que la puissance acoustique de lvent tombe
avec laugmentation de la frquence, ce qui attnue dautant plus la contribution potentielle de
lvent au-del de 78.88 Hz (cabinet sans amplicateur) ou 86.05 Hz (cabinet avec amplica-
teur). Si lvent et la membrane sont modliss comme des monoples encastrs, leur puissance
acoustique (W) respective est donne par E = 33k
2
q
2
o k est le nombre donde et q le dbit
volumique. La gure C.30 (p. 399) prsente les niveaux de puissance thoriques de lvent et de
la membrane pour un des cabinets sans amplicateur sur la base de la frquence de rsonance de
la cavit couple lvent. Selon cette gure, il est clair quau-del de 100 Hz environ la puis-
sance acoustique de lvent est de moins en moins signicative face la puissance acoustique
de la membrane.
En guise de conclusion au sujet des effets des vents des DX4, on note les observations
suivantes :
sous la frquence de rsonance du rsonateur de Helmholtz (78.88 Hz ou 86.05 Hz), les
DX4 peuvent agir plutt comme des diples (dphasage de radians entre le dbit vo-
lumique la membrane et le dbit volumique lvent), ce qui peut tre nfaste pour la
399
WFS seulement
8
;
au-del de la frquence de rsonance du rsonateur de Helmholtz (78.88 Hz ou 86.05 Hz),
les DX4 peuvent agir plutt comme des monoples (les dbits volumiques de la mem-
brane et de lvent sont en phase), ce qui est convenable pour la WFS telle quutilise
exprimentalement dans cette thse ;
au-del de la frquence de rsonance du rsonateur de Helmholtz (78.88 Hz ou 86.05 Hz),
la contribution en puissance acoustique des vents est srieusement rduite et les cabinets
ventils approchent plutt le comportement de cabinets clos ; dans tous les cas, lamortis-
sement de lvent (entre autre caus par les turbulences aux extrmits de lvent et par la
couche limite acoustique dans lvent), amenuise encore plus la contribution de lvent.
Directivit de la membrane
Le point considr concerne la directivit du rayonnement de la membrane pour la bande de
frquences dintrt pour la WFS et lAWFS.
Pour une membrane de 4 po de diamtre, on trouve une fonction de directivit en pression
[Jouhaneau, 2000] h() =
2J
1
(kasin())
kasin()
o J
1
est la fonction de Bessel du premier type du premier
ordre et a = 0.0506 m. Tant que cette fonction ne prsente pas de lobes, il est possible de
la modliser grossirement par un monople, comme cest le cas pour le dveloppement des
oprateurs de la WFS. On sait, en gnral, que tant que la longueur donde est plus importante
que la circonfrence de la membrane, le fonction de directivit en pression ne prsentera pas de
lobes et sera proche de 1 pour tout . Pour une membrane de 5.06 cm de rayon, la frquence
partir de laquelle des lobes devraient apparatre dans cette fonction de directivit est 1069 Hz,
soit bien au-del de la frquence de repliement spatial qui dlimite la plage dintrt pour la
WFS et lAWFS tudies dans cette thse. La fonction de directivit est trace pour quelques
frquences la gure C.31 (p. 401).
Selon cette gure, et comme propos plus tt, la fonction de directivit approche celle dun
monople sous 1000 Hz. Lhypothse qui stipule que les sources de reproduction sont modli-
ses par des monoples pour llaboration des oprateurs de la WFS est donc acceptable pour
les DX4.
8
Les oprateurs de la WFS ne sont, en effet, pas les mmes pour des sources de reproduction de type diple ou
des sources de reproduction de type monople.
400
30
60
90
270
300
330
0
200 Hz
500 Hz
1000 Hz
1500 Hz
2000 Hz
2500 Hz
[deg]
Figure C.31 Fonction de directivit en pression h() (entre 0 et 1) pour un piston de 4 po de
diamtre.
C.4.3 Caractrisation et description acoustiques des lieux utiliss pour les essais en AWFS
Pour dcrire les lieux o lAWFS fut teste exprimentalement, diffrents mtriques sont uti-
liss : descriptions textuelles, tailles gomtriques des lieux, courbes de dcroissance spatiales
[Jouhaneau, 1997] moyennes, rayons acoustiques
9
moyens, rponses en frquences ou temps de
rverbration approximatifs.
Pour un lieu donn, la courbe de dcroissance spatiale est une reprsentation du niveau
de pression mesur en fonction de la distance par rapport une source acoustique omnidirec-
tionnelle. En pratique, on utilise des mesures de niveaux sonores quivalents sans pondration
frquentielle L
eq
avec un sonomtre [Jouhaneau, 1997]
L
eq
= 10log
10
__
1
T
_
T
0
p
2
(t)dt
_
/p
2
o
]
_
(C.1)
o T est la dure de la mesure en secondes, p(t) la pression instantanne et p
o
la pression de
rfrence (20 Pa).
Cette courbe de dcroissance spatiale des niveaux sonores permet de visualiser le rayon
acoustique du lieu. Le rayon acoustique du lieu est dni comme la distance de la source
9
Comme synonymes, on trouve : rayon de rverbration, rayon critique ou distance de rverbration[Jouhaneau,
1997].
401
Figure C.32 Mesure de la dcroissance
spatiale en salle semi-anchoque
Figure C.33 Mesure de la dcroissance
spatiale en salle rverbrante
la rception pour laquelle il y a galit des niveaux de pression du champ direct et du champ
rverbr. Pour les essais dAWFS, le rayon acoustique est important puisquil permet de savoir
si les capteurs de lerreur sont, par rapport aux sources de reproduction, plutt dans le champ
direct ou dans le champ rverbr des sources de reproduction.
Pour tracer les courbes de dcroissance spatiale, on utilise une source omnidirectionelle
B&K OmniPower 4296 douze haut-parleurs, une source de bruit blanc (50 Hz 10 kHz)
B&K Sound Power Source 4205 et un sonomtre B&K Mediator 4296. On effectue des
moyennes pour chaque lieu en dplaant la source omnidirectionnelle. Les valeurs du rayon
acoustique sont donc approximatives et couvrent une large bande de frquences. Deux exemples
dinstallation de mesure de la courbe de dcroissance sont prsents aux gures C.32 (p. 402)
et C.33 (p. 402).
Pour valuer le rayon acoustique r
o
, les courbes de dcroissance spatiale moyennes sont
sollicites. Avec ces courbes, la distance partir de laquelle on note une distribution spatiale
402
homogne du niveau de pression est identie. Le niveau de pression mesur dans cette rgion
homogne L
pr
est estim en effectuant une moyenne des niveaux pour cette rgion. Le rayon
acoustique est par la suite retrouv dans la courbe de dcroissance mesure : on cherche le
niveau mesur qui donne 3 dB de plus que le niveau rverbr moyen (cest--dire que le niveau
du champ direct est gal celui du champ rverbr). La distance correspondante donne une
approximation moyenne du rayon de rverbration. Une autre mthode de dtermination du
rayon acoustique est aussi utilise [Jouhaneau, 1997] : (1) on trouve le niveau de puissance de
la source L
w
dB par les moindre-carrs avec L
w
= L
pd
+ 20log
10
(r) + 11 o L
pd
est le niveau
de pression du champ direct une distance r m de la source
10
; (2) on trouve, pour tout r, avec
L
w
, le niveau thorique du champ direct en fonction de r : L
pd
= L
w
20log
10
(r) 11 ; (3)
on trouve le niveau moyen du champ rverbr L
pr
dans la partie homogne de la courbe de
dcroissance moyenne et (4) on cherche le croisement des asymptotes thoriques des niveaux
de pression du champ direct et du champ rverbr avec L
pd
= L
pr
pour nalement trouver une
seconde estimation du rayon acoustique des lieux.
En chambre semi-anchoque
La salle semi-anchoque du GAUS est denviron 6.55 m par 6.25 m par 3.05 m pour un
volume de 125 m
3
. Les surfaces du lieu sont rigides mais recouvertes de prismes triangulaires
de mousse absorbante. La salle est, habituellement, qualie de rellement semi-anchoque
au-dessus de 100 Hz. La courbe de dcroissance spatiale moyenne, pour quatre trajectoires ho-
rizontales et choisies au hasard, est prsente la gure C.34 (p. 404) sur laquelle on peut aussi
voir la variance des mesures. Les courbes de la moyenne de dcroissance, plus ou moins la
variance de ces courbes, se confondent visuellement avec la courbe moyenne, ce qui dmontre
une bonne uniformit du caractre de la salle. On ne peut valuer le rayon acoustique du lieu
puisquil nexiste pas de rgion de distribution homogne du niveau de pression acoustique.
Cette courbe de dcroissance spatiale est superpose une courbe thorique pour une source
en champ libre. Pour le volume et la surface de la chambre anchoque, un rayon acoustique de
plus de trois mtres (distance maximale de mesure) donne un temps de rverbration de moins
0.1 s, pour un rayon acoustique de 4 m (qui mettrait au d la dimension de la salle), on trouve
un temps de rverbration de moins de 0.07 s. La courbe de dcroissance thorique (L
pd
) est ob-
tenue partir de la minimisation des erreurs quadratiques entre la courbe mesure et la courbe
thorique (L
pd
= L
w
20log(r) 11).
10
L
pd
est pris dans la courbe de dcroissance spatiale mesure pour de courtes distances r par rapport la source,
cest--dire pour des distances plus petites que le rayon acoustique trouv plus tt.
403
0.2 0.5 1 1.5 2 2.53
75
80
85
90
95
100
105
Distance [m]
N
i
v
e
a
u

d
e

p
r
e
s
s
i
o
n

(
L
e
q
)

[
d
B
]

L
eq
moyens (<L
eq
>)
<L
eq
> + var[L
eq
]
<L
eq
> var[L
eq
]
L
pd
thorique
Figure C.34 Courbe de dcroissance spatiale moyenne mesure et thorique dans la chambre
semi-anchoque pour quatre trajectoires diffrentes.
En complment, la moyenne des 96 (quatre fois 24) rponses limpulsion (des 24 sources
de reproduction aux 4 capteurs de lerreur du systme dAWFS) en nergie (valeurs quadratiques
des rponses exprimes en dB ref 1) est prsente la gure C.35 (p. 405). Suivant le passage du
front direct, les niveaux dnergie sont passablement rduits et ressemblent des composantes
basses frquences. Sur cette mme gure, le mme type de rponse moyenne pour lespace de
laboratoire est montr. Clairement, le passage du front direct et de la rexion du plancher sont
parfaitement superposes.
Des rponses en frquence typique (des sources de reproduction aux capteurs de lerreur et
un moniteur de lerreur) sont prsentes la gure C.36 (p. 405).
La gure C.21 (p. 393) prsente le systme dAWFS dans la salle semi-anchoque.
Dans un espace de laboratoire
Lespace choisi est la grande pice de laboratoire du GAUS. La salle en question fait environ
8.23 m par 14.02 m par 4.06 pour un volume approximatif de 468.5 m
3
. La courbe de dcrois-
sance spatiale moyenne est prsente la gure C.37 (p. 407) sur laquelle on peut aussi voir
404
0 0.05 0.1 0.15 0.2
60
50
40
30
20
10
0
10
Temps [s] R
p
o
n
s
e

i
m
p
u
l
s
i
o
n

[
d
B

r
e
f

1
]
Rponse en salle semianchoque
Rponse en laboratoire
Figure C.35 Rponse limpulsion moyenne en nergie [dB ref 1] en chambre
semi-anchoque et en laboratoire.
0 50 95 160 220 310 400440 500
60
50
40
30
20
10
0
10
Frq. [Hz]
G
a
i
n

[
d
B

r
f
.

1
]
Source #1, capteur #1
Figure C.36 Fonctions de rponse en frquence typiques pour la salle semi-anchoque.
405
la variance des mesures. Comparativement la salle semi-anchoque, la variance des mesures
selon la trajectoire est plus importante. On note aussi un niveau dnergie rverbr plus im-
portant quen salle semi-anchoque en champ lointain mais bien plus faible que celui de la
chambre rverbrante. Clairement, aucun palier de niveau quivalent nest atteint sur la distance
de mesures (un peu plus de trois mtres). On ne peut donc pas valuer le rayon acoustique, ce
qui est typique de salles industrielles ou mme de salles dcoute [Toole, 2006]. Par contre, en
supposant que le niveau de pression rverbre est moindre que le niveau de pression mesur
pour le dernier point de mesure, on trouve que le rayon acoustique est de plus de 1.4 m selon la
premire mthode dcrite plus haut. Les capteurs de lerreur tant environ 1 m des sources de
reproduction, le champ aux capteurs de lerreur devrait tre domin par le champ direct.
Le temps de rverbration est estim moins de 0.85 s avec r
o
1.4 m et moins de 0.25 s
avec r
o
3 m. Ce qui correspond trs approximativement avec limpression du lieu. Ces valeurs
restent des approximations grossires.
Selon Toole [Toole, 2006], le rayon acoustique nest pas un paramtre valable pour dcrire
une salle dcoute qui ne prsente pas de champ diffus important. En de telles salles, une courbe
de dcroissance spatiale sachve typiquement avec une pente de -3 dB/dd (dd : distance dou-
ble). Selon la courbe de dcroissance de la gure C.37 (p. 407), le lieu test approche cette
tendance aprs 1.5 m (de 1.5 m 3 m on perd presque 3 dB). Dans cette mesure, on remarque
que cet espace de laboratoire, rejoint, dune certaine manire, une caractristique importante des
salles dcoute.
Des rponses en frquence typiques (des sources de reproduction aux capteurs de lerreur)
sont prsentes la gure C.38 (p. 407). Comme on peut le voir, la tendance gnrale observe
en salle semi-anchoque est toujours prsente mais agrmente de crevasses plus complexes is-
sues de motifs dinterfrence plus complexes, causes par un nombre plus marqu de rexions,
mais moins marques que celles observes dans les FRF de la chambre rverbrante.
La gure C.39 (p. 408) montre les huit rponses limpulsion au niveau des huit moniteurs
alors que seule la source de reproduction #3 est active. Comme on peut le voir aprs le passage
du front direct, diffrentes rexions discrtes passent au niveau de lantenne des moniteurs.
Ce trac illustre donc la rponse spatiale limpulsion du lieu dexprimentation et montre,
justement, lexistence de rexions franches qui devront tre contrles par lAWFS.
En complment, la moyenne des 96 (quatre fois 24) rponses limpulsion en nergie (va-
406
0.2 0.5 1 1.5 2 2.53
75
80
85
90
95
100
105
Distance [m]
N
i
v
e
a
u

d
e

p
r
e
s
s
i
o
n

(
L
e
q
)

[
d
B
]
Rayon de rverbration (+3dB) : >1.4 m
(en supposant L
p
r
= dernier <L
eq
>)
Salle rverbrante
Salle semianchoque
<L
eq
>
<L
eq
> + var[L
eq
]
<L
eq
> var[L
eq
]
L
p
r
L
pd
thorique
Figure C.37 Courbe de dcroissance spatiale moyenne mesure et thorique dans lespace de
laboratoire pour quatre trajectoires diffrentes.
50 133160 220 310 400 440 500
60
50
40
30
20
10
0
10
Frq. [Hz]
G
a
i
n

[
d
B

r
f
.

1
]
Source #13, capteur #5 (anch.)
Source #1, capteur #1 (anch.)
Figure C.38 Fonctions de rponse en frquences typiques pour le laboratoire.
407
Figure C.39 Rponses limpulsion au niveau de lantenne de moniteurs dans le laboratoire.
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4
60
50
40
30
20
10
0
10
Temps [s]
R
p
o
n
s
e

i
m
p
u
l
s
i
o
n

[
d
B

r
e
f

1
]
Rponse
Rgression linaire
Point #1
Point #2
T
60
: 0.87 s
Figure C.40 Rponse limpulsion moyenne en nergie [dB ref 1] en laboratoire.
leurs quadratiques des rponses exprimes en dB ref 1) est prsente la gure C.40 (p. 408).
Selon une rgression linaire, montre sur la gure, value entre le point #1 et le point #2,
on trouve un temps de rverbration (T
60
) de 0.87 s environ. On note ainsi quun tel temps de
rverbration (pour la plage de frquence dintrt, soit de 0 Hz 600 Hz) est dj fort long pour
un espace dcoute. On sloigne donc, dune certain faon, dune situation idale dcoute.
La gure C.41 (p. 409) prsente le systme dAWFS dans ce lieu.
En salle rverbrante
La salle en question fait environ 7.5 m par 6.2 m par 3.05 m pour un volume denviron
142 m
3
. Ce volume de salle est jug acceptable pour la production de champs diffus (cest-
-dire dun volume plus important que 50 m
3
). La courbe de dcroissance spatiale moyenne est
408
Figure C.41 Vues gnrales et dtailles du montage exprimental dAWFS au laboratoire du
GAUS.
409
0.2 0.5 1 1.5 2 2.53
85
90
95
100
105
110
115
Distance [m]
N
i
v
e
a
u

d
e

p
r
e
s
s
i
o
n

(
L
e
q
)

[
d
B
]
(par asymptotes) : ~0.66m

Rayon de rverbration (+3dB) : ~0.46m
(par asymptotes, semianc.) : ~0.51m
<L
eq
>
<L
eq
> + var[L
eq
]
<L
eq
> var[L
eq
]
L
p
r
L
pd
thorique
L
pd
thorique
(semianc.)
Figure C.42 Courbe de dcroissance spatiale moyenne mesure dans la chambre rverbrante
pour quatre trajectoires diffrentes.
prsente la gure C.42 (p. 410) sur laquelle on peut aussi voir la variance des mesures. On
note que la faible variance des niveaux de pression dans la rgion de distribution homogne
de la pression valide lexistence dun champ diffus (selon la dnition stricte dun champ dif-
fus). Le rayon acoustique est denviron 0.46 m selon la premire mthode (3 dB au-dessus du
niveau de champ diffus) dcrite plus haut et denviron 0.66 m selon la deuxime mthode (par
asymptotes thoriques). On obtient une bien meilleure correspondance entre les deux mthodes
si, au lieu dutiliser la courbe de dcroissance thorique directe qui approche la pente mesure
pour de petites distances, on utilise la courbe L
pd
obtenue pour la salle semi-anchoque. Dans
ce cas, la mthode des asymptotes donne environ 0.51 m comme rayon acoustique. Le rayon
acoustique doit tre compris entre 0.45 m et 0.51 m. Pour le systme dAWFS, les capteurs de
lerreur seront donc bien englobs dans le champ diffus.
Pour un rayon acoustique de 0.45 m et une salle de 142 m
3
(et de surface de 176.57 m
2
),
on trouve une constante de salle (R = 50r
2
o
[Jouhaneau, 1997]) de 10.125 et un temps de
rverbration (modle de Eyring [Jouhaneau, 1997]) de 2.31 s. Pour un rayon de rverbration
de 0.51 m, on trouve une constante de salle 13.01 et un temps de rverbration de 1.81 s. Dans
cette mesure, la valeur de 0.45 m comme rayon de rverbration approximatif semble plus en
accord avec les valeurs de temps de rverbration mesures dans la chambre rverbrante.
410
50 104 160 220 310 400 500
50
40
30
20
10
0
10
20
Frq. [Hz]
Source #13, capteur 5
G
a
i
n

[
d
B

r
f
.

1
]

Figure C.43 Fonctions de rponse en frquences typiques pour la chambre rverbrante.
Des rponses en frquence typiques (des sources de reproduction un capteur de lerreur et
un moniteur de lerreur) sont prsentes la gure C.43 (p. 411). Ces FRFs furent identies en
prsence de morceaux de mousse absorbante dans la chambre. On note clairement des rponses
rsonantes en basses frquences et des interfrences principalement destructives en hautes fr-
quences. Pour cette salle on estime la frquence Schroeder environ 127 Hz, mais elle pourrait
tre plus faible.
La gure C.44 (p. 412) prsente le systme dAWFS dans la salle rverbrante.
Aprs quelques expriences en AWFS en salle rverbrante, on constate le caractre trs
instable du systme acoustique (variation dans le temps, forte sensibilit aux dplacements des
oprateurs dans la pice). Suivant cette observation, quatre panneaux de mousse absorbante
sont placs dans la salle pour introduire un peu plus damortissement
11
. Les photographies du
systme prsentent aussi la position de ces panneaux. On estime que leur surface totale couvre
moins dune des 6 surfaces de la chambre. Les FRF prsentes plutt sont mesures avec ces
panneaux de mousse. Les courbes de dcroissance spatiale sont par contre mesures en labsence
11
Lutilisation de ces panneaux est sollicite pour rduire la contribution amortissante, relativement lamortis-
sement total, de la prsence doprateurs dans la pice.
411
Figure C.44 Vues gnrales et dtailles du montage exprimental dAWFS en salle
rverbrante.
412
de tels panneaux.
Comparaison des salles
Suivant les descriptions prcdentes des salles utilises pour la ralisation des exprimenta-
tions de lAWFS, on note les distinctions suivantes qui devraient laisser entrevoir des caract-
ristiques diverses du systme dAWFS.
En chambre semi-anchoque, lensemble des capteurs baigne dans un champ direct ( lex-
ception de la rexion cause par le plancher rigide) de telle sorte quil soit possible de visualiser
des rsultats proches de ceux thoriques reports au chapitre 7. Cette comparaison est effectue
grce aux rsultats exprimentaux prsents au chapitre 9.
Pour ce qui est du laboratoire, on remarque une certaine balance entre champ direct et champ
des rexions. tant donn quil ne semble pas tre possible datteindre les qualits propres dun
champ diffus, ni celles dun champ de modes de rsonance acoustique, sur la zone couverte par
le systme dAWFS (2 m de diamtre), on sattend observer leffet de rections discrtes
(prsence de surfaces planes rigides et, donc, cration dinterfrences destructives et construc-
tives sans rsonance) sur les performances de lAWFS. Cette observation est effectue grce aux
rsultats exprimentaux prsents au chapitre 9.
La chambre rverbrante reprsente un lieu plus extrme : les capteurs de lerreur, par rap-
port aux sources de reproduction, baignent dans un champ diffus et on remarque la forte pr-
sence de modes de rsonance en basses frquences. Dans cette situation, on pourra donc valuer
la possibilit dgaliser, grce lAWFS, la rponse de la WFS et de synthtiser, plus localement
quen salle semi-anchoque, un champ propagatif dans un espace caractris par une propaga-
tion principalement diffuse. Ce qui est bien observ au chapitre 9 pour des exprimentations
dAWFS avec tons purs.
C.5 Compensation en phase des microphones de lerreur pour lAWFS harmonique
Lors des exprimentations harmoniques de lAWFS, les cinq microphones furent calibrs
en amplitude et en phase. Cette section prsente des exemples de calibration en phase et v-
rie leffet de cette calibration (absente ou prsente) sur la qualit de lAWFS et des mesures
413
correspondantes.
C.5.1 Filtres de compensation de phase
Pour trouver les ltres de compensation de phase, on place les cinq microphones tour tour
dans un tube de Kundt (avec terminaison anchoque) et on mesure leurs fonctions de rponse en
frquence (par identication adaptative) pour une excitation blanche (frquence dchantillon-
nage 1000 Hz et frquence de coupure des ltres anti-repliement et des ltres de reconstruc-
tion 440 Hz). En choisissant le premier microphone comme rfrence, on trouve les ltres de
compensation de phase
12
prsents la gure C.45 (p. 415). Pour sassurer de la validit de
ces ltres, on refait plusieurs fois lexprience, diffrents moments, aprs montage et dmon-
tage des microphones, et on retrouve sensiblement les mmes courbes. Les diffrences entre les
sances dessai sont de lordre des plus petites variations de phase en fonction de la frquence.
Cette vrication valide les ltres de compensation de phase.
Cette gure reprsente donc les diffrences de phase entre chacun des microphones. Le fabri-
cant afrme que ces microphones et ces pramplicateurs offrent une correspondance de phase
de 3 deg entre 100 Hz et 3 kHz. Comme cette gure le suggre, cette spcication semble
valable. On note nalement quune fois les diffrences de phase converties en erreurs de posi-
tion quivalente, il est possible dapprcier le fait que ces diffrences sont de lordre de lerreur
de positionnement des composantes du systme exprimental et donc potentiellement peu in-
uentes.
C.6 Rsultats supplmentaires dAWFS harmonique
Cette section prsente quelques rsultats exprimentaux qui nont pas t illustrs dans le
corps de la thse mais qui ajoutent un certain apport aux conclusions de cette recherche ou, plus
simplement, valident les algorithmes.
12
On remarque que de ces ltres, seules les phases sont conserves. Cest--dire que les ltres de compensation
de phase ont tous des gains unitaires de telle sorte que la calibration en amplitude des microphones puisse tre faite
normalement, tout juste avant chacune des expriences.
414
50 100 200 300 400 440 500
10
1
10
0
10
1
G
a
i
n
50 100 200 300 400 440 500
5
4
3
2
1
0
1
2
3
4
5
P
h
a
s
e

[
d
e
g
]
100 200 300 400 500
5
4
3
2
1
0
1
2
3
4
5
Frq. [Hz]
D
i
s
t
a
n
c
e
q
u
i
v
a
l
e
n
t
e

[
c
m
]
Mic. #1 (rf.)
Mic. #2
Mic. #3
Mic. #4
Mic. #5
Figure C.45 Filtres de compensation de phase pour lAWFS harmonique. De haut en bas :
gain en fonction de la frquence, phase [deg] en fonction de la frquence et distance
quivalente la diffrence de phase.
C.6.1 Effet de la position de la source virtuelle en salle semi-anchoque
En chambre semi-anchoque, plusieurs essais de reproduction furent effectus pour diff-
rentes positions de source virtuelle. On cherche voir leffet de la position angulaire ou de la
distance de la source virtuelle au niveau de lantenne des moniteurs de lerreur et donc, plus
prcisment, sur lallure de la zone de contrle.
La gure C.46 (p. 416) rappelle les rsultats dAWFS par le biais du critre E
LS
normalis
chacun des moniteurs pour une source virtuelle en x
o
= [0, 4, 0] m 220 Hz
13
. Lantenne des
moniteurs est donc perpendiculaire la direction de propagation. On peut comparer les rsultats
13
Ces rsultats sont prsents sous une autre forme au chapitre 9.
415
0.5 0 0.5
10
3
10
2
10
1
10
0
x
1
[m]
E
L
S

(
m
o
n
i
t
e
u
r
s
)
WFS
AWFS par FXLMS
AWFS par SVD
Figure C.46 E
LS
normalis pour chaque
moniteur et diffrents algorithmes dAWFS
harmonique (220 Hz) avec une source virtuelle
en x
o
= [0, 4, 0] m.
0.5 0 0.5
10
3
10
2
10
1
10
0
x
1
[m]
E
L
S

(
m
o
n
i
t
e
u
r
s
)
WFS
AWFS par FXLMS
AWFS par SVD
Figure C.47 E
LS
en x
o
= [4, 0, 0] m.
dAWFS selon lautre axe (direction de propagation selon lantenne de moniteurs) avec la gure
C.47 (p. 416) alors que x
o
= [4, 0, 0] m. On constate, avec ces deux gures, quil y a bien
rduction de lerreur de reproduction pour les deux positions de sources virtuelles. La zone de
contrle est donc relativement vaste, mais toujours assurment plus importante, et de meilleure
qualit (cest--dire un E
LS
plus faible), que celle de la WFS.
Toujours en ce qui concerne la position angulaire, la gure C.48 (p. 417) prsente les perfor-
mances de la WFS et des algorithmes dAWFS pour une source virtuelle proche de lantenne de
sources de reproduction mais qui produit, cette fois, une direction de propagation de 37.5 deg
par rapport laxe de lantenne linaire de moniteurs. Comme il est possible de le voir, la repro-
duction par AWFS produit encore une zone de contrle, pour laquelle lerreur de reproduction
est attnue, bien plus grande que celle de la WFS. Lalgorithme bas sur la SVD performe,
selon ces critres, mieux que lalgorithme bas sur la modication du FLXMS.
Un rsultat remarquable, et qui supporte exprimentalement lide comme quoi les modes
de rayonnement dordre suprieur jouent un rle notable dans la taille de la zone de reproduction
efcace (garantie par un E
LS
faible), est prsent la gure C.49 (p. 417) qui illustre un exemple
en plus haute frquence (400 Hz) pour x
o
= [0, 4, 0]. Dans ce cas, lalgorithme dAWFS bas
sur le contrle indpendant des modes de rayonnement permet, contrairement lalgorithme
FXLMS modi, lajustement des modes dordres suprieurs. Avec cette gure, il est clair que
la zone efcace de reproduction est plus large grce la minimisation pnalise des erreurs
416
0.5 0 0.5
10
3
10
2
10
1
10
0
x
1
[m]
E
L
S

(
m
o
n
i
t
e
u
r
s
)
WFS
AWFS par FXLMS
AWFS par SVD
Figure C.48 E
LS
en x
o
= [1.19, 0.91, 0] m.
0.5 0 0.5
10
3
10
2
10
1
10
0
x
1
[m]
E
L
S

(
m
o
n
i
t
e
u
r
s
)
WFS
AWFS par FXLMS
AWFS par SVD
Figure C.49 E
LS
en x
o
= [0, 4, 0] m.
de reproduction au niveau des modes dordre deux, trois et quatre qui impliquent des drives
spatiales dordres plus levs. On observe les mmes tendances sur lensemble des quatre gures
prsentes en cette section.
En bref, mme si la forme de la zone de contrle effective change avec la position de la
source virtuelle, cette variation conserve les mmes tendances globales pour toutes les positions
de source virtuelle testes, lAWFS performe mieux que la WFS en situation semi-anchoque
exprimentale. Cest une des premires validations exprimentales du concept dAWFS.
Pour les rsultats prsents, les coefcients de convergence et les coefcients de pnalisation
furent les mmes que ceux prsents au chapitre 9 pour la chambre semi-anchoque.
C.6.2 Champs acoustiques reproduits
En guise de dmonstration de la validit de la ralisation de lAWFS harmonique sur une
station dSPACE
TM
, cette sous-section prsente des exemples de champs harmoniques repro-
duits aux moniteurs dans la chambre semi-anchoque.
Les gures C.50 (p. 418) C.52 (p. 420) montrent les champs de pression acoustique re-
417
5000 5010 5020 5030 5040
0.5
0
0.5
#
1
5000 5010 5020 5030 5040
0.5
0
0.5
#
2
5000 5010 5020 5030 5040
0.5
0
0.5
#
3
5000 5010 5020 5030 5040
0.5
0
0.5
#
4
5000 5010 5020 5030 5040
0.5
0
0.5
#
5
5000 5010 5020 5030 5040
0.5
0
0.5
#
6
5000 5010 5020 5030 5040
0.5
0
0.5
#
7
5000 5010 5020 5030 5040
0.5
0
0.5
#
8
Samples (n)
p
(im)
(n)
p
(rep)
(n)
e(n)
Figure C.50 Pressions acoustiques [Pa]
reproduites, pressions acoustiques reproduire
et erreurs de reproduction aux huit moniteurs
de lerreur pour un champ harmonique
220 Hz et une source virtuelle en
x
o
= [4, 0, 0] laide de la WFS.
5000 5010 5020 5030 5040
0.5
0
0.5
#
1
5000 5010 5020 5030 5040
0.5
0
0.5
#
2
5000 5010 5020 5030 5040
0.5
0
0.5
#
3
5000 5010 5020 5030 5040
0.5
0
0.5
#
4
5000 5010 5020 5030 5040
0.5
0
0.5
#
5
5000 5010 5020 5030 5040
0.5
0
0.5
#
6
5000 5010 5020 5030 5040
0.5
0
0.5
#
7
5000 5010 5020 5030 5040
0.5
0
0.5
#
8
chantillons (n)
p
(im)
(n)
p
(rep)
(n)
e(n)
Figure C.51 Pressions acoustiques [Pa]
reproduites, pressions acoustiques reproduire
et erreurs de reproduction aux huit moniteurs
de lerreur pour un champ harmonique
220 Hz et une source virtuelle en
x
o
= [4, 0, 0] laide de lAWFS par FXLMS
modi.
produits, les champs de pression reproduire et les champs de lerreur de reproduction pour
la reproduction dune source virtuelle harmonique 220 Hz en x
o
= [4, 0, 0]. On note que la
solution WFS, comme on pouvait sy attendre, donne des rsultats acceptables en salle semi-
anchoque. Comme on peut le voir la gure C.50 (p. 418), lamplitude et la phase du champ
reproduit sont acceptables. Ce qui, du coup valide, la ralisation dSPACE
TM
de la WFS,
notamment au niveau de la phase qui, initialement, posait problme.
418
Lorsque les algorithmes damlioration de la reproduction de champs acoustiques de type
AWFS sont enclenchs, le champ reproduit approche bien mieux le champ reproduire comme
on peut le voir aux gures C.51 (p. 418) et C.52 (p. 420). Pour les deux algorithmes dAWFS, le
champ reproduit au niveau des capteurs de lerreur (moniteurs un et quatre) se confond avec le
champ reproduire. Au niveau des autres moniteurs, la rduction du champ de lerreur est aussi
remarquable. On note que pour les moniteurs les plus loigns, lamlioration du champ repro-
duit est moindre. Ce qui est normal puisquen sloignant des capteurs de lerreur pour lesquels
on minimise lerreur de reproduction, on approche aussi les sources de reproduction (moins de
39 cm) et on passe rapidement dans leurs champs proches. De faon plus spcique, dans le cas
de lalgorithme bas sur le FXLMS, lerreur damplitude est rduite mais une certaine erreur de
phase demeure pour le moniteur le plus loign. Dans le cas de lalgorithme bas sur la SVD,
lerreur de phase est rduite mais il reste une certaine erreur damplitude. En comparaison avec
la WFS, les rsultats dAWFS restent nanmoins meilleurs pour ces moniteurs loigns.
Ces exemples de champs acoustiques harmoniques reproduits dmontrent la bonne marche
de la ralisation de lAWFS harmonique sur dSPACE
TM
.
419
5000 5010 5020 5030 5040
0.5
0
0.5
#
1
5000 5010 5020 5030 5040
0.5
0
0.5
#
2
5000 5010 5020 5030 5040
0.5
0
0.5
#
3
5000 5010 5020 5030 5040
0.5
0
0.5
#
4
5000 5010 5020 5030 5040
0.5
0
0.5
#
5
5000 5010 5020 5030 5040
0.5
0
0.5
#
6
5000 5010 5020 5030 5040
0.5
0
0.5
#
7
5000 5010 5020 5030 5040
0.5
0
0.5
#
8
chantillons (n)
p
(im)
(n)
p
(rep)
(n)
e(n)
Figure C.52 Pressions acoustiques [Pa] reproduites, pressions acoustiques reproduire et
erreurs de reproduction aux huit moniteurs de lerreur pour un champ harmonique 220 Hz et
une source virtuelle en x
o
= [4, 0, 0] laide de lAWFS base sur le contrle indpendant
des modes de rayonnement.
420

2007 PHD Thesis: Adaptive Wave Field Synthesis

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

2007 PHD Thesis: Adaptive Wave Field Synthesis

Загружено:

Авторское право:

Доступные форматы

Facult de Gnie

Dpartement de Gnie Mcanique

(z) in the time domain for the source modes #1 to

(z) in the time domain for the pressure modes #1 to #4 in

(z) in the time domain for the source modes #1 to

(G(x[y)p(y) p(y)G(x[y)) ndS

becomes a continuous monopole source and the pressure on S

may not correspond to

where p(y) is the target wave eld on S

. Another interpretation of Eq. (5.23) is that any

with reproduction sources outside V

will entirely dene sound

which consequently cannot be replaced by a line array without

0) sont prsents aux gures 6.6 (p. 118) 6.9

0). Right, corresponding source

(z) is created from the

2 cos() sin() . . . cos(n) sin(n) . . .

x(z)) is the target wave eld

vanishes. Since Eq. (8.18)

(z) and the analysis lter

1. Using the SVD, the plant matrix can be expressed as

i is a block vector dened by

(z) (the second syn-

was used for the second synthesis lters. In a similar manner, (e

different from Eq. (8.46)

represents the mathematical expectation of

W are assumed time-invariant (

after convergence so that an explicit expression for

does not exist.

Figure 8.14 Left : Spectrum of the singular

(z) (see Eq. (8.31))

(z) which create the source modes at the reproduction sources

(z) for the rst four source modes are

(z) in the time

C B.D., WILLIAMSON R.C., KENNEDY R.A. (2000) Equalization in an acoustic reveberant

2 cos() sin() . . . cos(n) sin(n) . . .

(x[y) n) se dveloppe comme suit

(x[y) cos (A.105)

, le vecteur miroir de r par rapport S

, que lintrgrale de Rayleigh II

dcrit toute position de source virtuelle pose lintrieur de V

cos cos (A.127)

) et par observation de la gure A.11 (p. 332), il est

Q(y, )jk cos

Q(y, )jk cos

R puisque [x[ cos(

Z = Z + E) pour laquelle [[E[[

u(n). Dans ce cas, on peut crire lalgo-

Вам также может понравиться