Вы находитесь на странице: 1из 16

Interfaces audionumriques AES/EBU

par Yves GRENIER


Ingnieur de lcole Centrale, docteur en sciences physiques
Professeur lcole nationale suprieure des tlcommunications (ENST), Paris
Dpartement traitement du signal et des images

1. Interface audionumrique AES3 .......................................................... TE 5 420 - 2


1.1 Terminologie ................................................................................................ 3
1.2 Spcifications logiques ............................................................................... 3
1.3 Reprsentation lectrique ........................................................................... 4
1.4 Donnes auxiliaires ..................................................................................... 4
1.5 Informations portes par le Channel Status Data..................................... 5
1.6 Implantation du statut ................................................................................. 7
2. Standard AES42 ....................................................................................... 8
2.1 Objectifs........................................................................................................ 8
2.2 Alimentation fantme numrique.............................................................. 8
2.3 Commandes ................................................................................................. 8
2.4 Rapport et identification.............................................................................. 10
2.5 volutions..................................................................................................... 10
3. Spcifications lectriques ..................................................................... 11
3.1 Tensions, impdances et connectique ....................................................... 11
3.2 galisation.................................................................................................... 12
4. Synchronisation et horloges ................................................................. 12
4.1 Gigue ............................................................................................................ 12
4.2 Horloges de rfrence ................................................................................. 12
4.3 Synchronisation dhorloge AES42.............................................................. 13
5. Insertion audio en vido ........................................................................ 13
5.1 Interface vido numrique BT.656.............................................................. 13
5.2 Insertion de paquets audio ......................................................................... 14
5.3 Contrle des trames audio et vido ........................................................... 15
5.4 Difficults pratiques : insertion multiple et dsynchronisation ............... 16
6. Conclusion et repres............................................................................. 16
Pour en savoir plus ........................................................................................... Doc. TE 5 420

es signaux audio sous forme numrique, quand ils ne sont pas compresss,
L sont transmis sous forme de flux binaire continu (par opposition une trans-
mission par paquets) entre deux quipements. Afin de faciliter linterconnexion
des quipements, plusieurs organismes de normalisation et de standardisation
ont prconis divers formats de transfert des flux numriques de donnes audio.
Parmi ces organismes de normalisation, on trouve les suivants : Audio Engi-
neering Society (AES), European Broadcasting Union (EBU ou Union euro-
penne de radio-tlvision : UER), International Telecommunication Union (ITU
ou Union internationale des tlcommunications : UIT), Society of Motion
Picture and Television Engineers (SMPTE), International Electrotechnical
Commission (IEC ou Commission lectrotechnique internationale : CEI).
ces organismes, il conviendrait dajouter des organismes nationaux (par
exemple ANSI, DIN). Certaines normes existent sous plusieurs versions
quasiment identiques lorsquelles ont t adoptes simultanment ou succes-
sivement par plusieurs de ces organismes.

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 420 1
INTERFACES AUDIONUMRIQUES AES/EBU _________________________________________________________________________________________________

En premier lieu, nous nous intressons ici au standard dit AES/EBU qui cor-
respond une interface audionumrique deux canaux. Cette interface est
monodirectionnelle ; elle dfinit une liaison entre un metteur et un rcepteur.
Nous prsentons dabord sa version symtrique (au sens lectrique) utilisant
une paire de conducteurs. Cette version correspond au standard AES3.
Une variante importante de ce standard porte le numro AES-3id ; elle
correspond au mme type de liaison, mais sur cble coaxial, et donc non sym-
trique. Cette variante concerne essentiellement le contexte de la tldiffusion.
Dans le mme contexte, le signal audio est naturellement vhicul conjoin-
tement au signal vido. Nous tudions les standards qui prcisent linsertion du
signal audio AES/EBU dans un flux vido numrique. La norme a t dite par
lUIT-R sous la rfrence BT.1305.
Un troisime type de liaison driv du modle AES/EBU a t rcemment
normalis par lAES sous la rfrence AES42 ; ce standard concerne le transport
dun signal audionumrique issu dun microphone. Par rapport au standard
AES3, le standard AES42 ajoute principalement la possibilit denvoyer depuis
le rcepteur AES/EBU vers lmetteur (cest--dire vers le microphone) une
alimentation lectrique sous forme dune tension continue fantme. Elle ajoute
galement la possibilit denvoyer depuis le rcepteur (qui peut par exemple
tre une table de mixage) des commandes destines modifier le compor-
tement du microphone (ou de toute autre source numrique).
Nous couvrons ainsi les techniques permettant de vhiculer le signal sonore
seul, et celles permettant dassocier le signal audionumrique la vido num-
rique. linverse, nous excluons les techniques de tlcommunications permet-
tant de vhiculer ces signaux sur des rseaux. De mme, nous ne traitons pas
les diffrents formats de fichiers audio utiliss dans le stockage sur support
informatique, ni dans des liaisons avec ordinateurs (par exemple USB, FireWire).
Ce document se veut une introduction aux diverses normes, un panorama donc,
mais pas un rsum de ces normes. Lingnieur ayant les implanter doit se
reporter aux textes originaux des normes (voir [Doc. TE 5 420]).

1. Interface audionumrique (pulse code modulation ), cest--dire une succession dchantillons


numriques non compresss, acquis une cadence dchantillon-
AES3 nage fixe, et reprsents sur un nombre fixe de bits. Dautres
variantes existent dans le standard.
Le standard AES3 est aussi connu sous le nom dAES/EBU car il
Au dbut des annes 1980, la numrisation est entre de manire
a t publi conjointement par lEBU sous le numro Tech. 3250.
exprimentale dans les studios denregistrement. Une interface
Par ailleurs, il a t normalis dans sa version de 1992 par lUIT
pour lchange de signaux audionumriques entre quipements a
sous le numro UIT-R BS.647-2.
merg. Sous le nom SDIF-2 (Sound Description Interchange
Format), cette interface propose par Sony est reprise par quelques Un des modes de transmission que prvoit ce standard est sou-
fabricants. Elle utilise trois cbles coaxiaux pour transmettre respec- vent dsign par SPDIF ou S/PDIF. Cet acronyme, qui signifie Sony/
tivement le canal gauche, le canal droit et une horloge de synchroni- Philips Digital Interchange Format, est celui que lon rencontre le
sation (word clock, donc un cycle dhorloge par mot transmis). Cette plus souvent, car il est suppos dsigner le standard de transmis-
interface reste insuffisante sur trois points : les utilisateurs souhai- sion audionumrique pour les quipements grand public . Mais
taient un cble unique pour cette transmission ; la porte est limite curieusement, il nexiste ma connaissance aucun document
quelques mtres, alors que les utilisateurs souhaitaient au moins dcrivant ce standard sous ce nom. Aujourdhui, quand un
une centaine de mtres ; et enfin, aucune donne numrique ou constructeur fait rfrence au format SPDIF, dans la notice techni-
description nest associe au signal. que dun quipement, il dsigne en fait la partie II du document
CEI 60958-3 (connu avant 1998 sous la rfrence CEI-958 1989-03).
En rponse ces limitations, lAES a prpar le standard AES3
On peut supposer que lappellation SPDIF provienne de documents
dont la premire version date de 1985 (le premier brouillon publi
techniques propres aux deux constructeurs qui ont labor cette
la t lanne prcdente). La version actuelle a t rvise en
interface au moment du lancement du disque compact, et que ces
1992, 1997 et dernirement en 2003. Entre 1997 et 1999, quatre
documents, dabord internes, ont ensuite t proposs comme
amendements ont t adopts. Selon le titre de ce standard, il
draft ou brouillon de travail aux organismes de normalisation
sagit dun format de transmission srie pour des donnes audio-
concerns.
numriques sur deux canaux, codes linairement. Le format a
donc pour objectif de permettre la connexion de deux quipements Nous prenons ici comme rfrence le standard AES/EBU,
audionumriques. Le flux audio est principalement un flux PCM cest--dire la version dveloppe conjointement par lAES et lEBU.

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 420 2 Techniques de lIngnieur
_________________________________________________________________________________________________ INTERFACES AUDIONUMRIQUES AES/EBU

1.1 Terminologie
0 3 4 27 28 31
Commenons par dfinir quelques termes, comme le fait le stan-
dard. Ils concernent la manire dont les chantillons de signal sont Prambule LSB MSB V U C P
regroups entre eux et celle dont les informations auxiliaires sont
repres. Le flux audio ne prsente aucune interruption, mais il a
t choisi de le dcouper en units dnommes blocs. Cette 0 3 4 7 8 27 28 31
segmentation permet de structurer les informations associes au
Prambule AUX LSB MSB V U C P
signal audio. Le signal audio est transmis par trames ; chacune
correspond un instant dchantillonnage, et comme le signal peut
tre strophonique, la trame peut correspondre deux chan-
tillons, chacun correspondant une sous-trame. Nous avons donc Figure 1 Donnes audio et auxiliaires dans une sous-trame
les dfinitions suivantes, en allant du dtail vers lensemble :
sous-trame (sub-frame) : cette structure fixe contient les infor-
mations audio et auxiliaires correspondant un chantillon dun
canal ;
trame (frame ) : cest lassociation de deux sous-trames, pour X Canal 1 Y Canal 2 Z Canal 1 Y Canal 2 X Canal 1 Y Canal 2
constituer un chantillon de signal stro et les informations auxi- Sous- Sous-
liaires qui lui sont associes ; trame trame
bloc (block ) : il sagit dun groupe de 192 trames successives. 1 2
Ce groupe structure les donnes auxiliaires, comme nous le ver-
rons plus loin (bit de statut, 1.4.3) ; Trame 191 Trame 0 Trame 1
prambule (preamble ) : pour distinguer le dbut de chaque
bloc, le standard introduit un prambule constitu de signaux Dbut de bloc
ayant une forme spcifique, utiliss pour la synchronisation. Ils
permettent aussi de distinguer les deux canaux au sein dune
Figure 2 Blocs, trames et sous-trames AES3
mme trame.
Si lon interprte lassociation de deux canaux comme la consti-
tution dun signal strophonique, on devrait considrer les chan-
moins de bits que ce dont il dispose dans la liaison AES3, il doit
tillons dune trame comme reprsentant le canal gauche et le canal
tre complt par des bits mis zro jusqu remplir les 20 ou
droit. Cependant, le standard est plus gnral que cela : rien
24 bits qui lui sont allous.
noblige les deux canaux constituer les voies droite et gauche
dun signal strophonique, aussi les deux canaux prsents dans ces 24 bits recueillant le signal audio et les ventuelles donnes
une trame seront-ils considrs comme provenant dun canal 1 et auxiliaires, sajoute dans la trame un prambule, qui quivaut en
dun canal 2. dure 4 bits ; nous verrons ( 1.3.2) que le codage du signal, qui
est effectivement transmis sous forme lectrique (ou lumineuse), ne
permet pas de considrer ce prambule comme un vritable paquet
1.2 Spcifications logiques de 4 bits. Il en occupe la place, mais joue un rle de synchronisation.
Le prambule est transmis avant les donnes audio de la sous-
Nous nous intressons dabord la manire dont sont organises trame.
les informations logiques. Nous verrons plus loin ( 1.3) la descrip- Aprs les donnes audio, se situent 4 bits, dnomms VUCP
tion de linterface au niveau physique. Nous construisons dabord ( 1.4) : V pour validit, U pour utilisateur, C pour channel status
la sous-trame, puis la trame, et nous organisons finalement les (qui dsigne donc un bit dtat du canal) et P pour parit.
blocs.
1.2.2 Trame
1.2.1 Sous-trame
Une trame, nous lavons vu ( 1.1), se compose de deux
Dans chaque sous-trame transite un chantillon de signal audio, sous-trames. Le rle du prambule est de distinguer le canal 1 du
correspondant un canal. Pour la reprsentation de chaque chan- canal 2. On parle de prambule X pour le canal 1 et de prambule
tillon, 24 bits sont rservs, mais ils peuvent aussi contenir des Y pour le canal 2. Une trame est donc simplement constitue de
donnes auxiliaires. Deux possibilits sont envisages par le 64 bits, par la concatnation de deux sous-trames (figure 2).
standard :
la donne audio est seule prsente et elle occupe les 24 bits
disponibles ;
1.2.3 Bloc
la donne audio est accompagne de donnes auxiliaires et Le bloc contient 192 trames, chacune comprenant deux
dans ce cas, elle ne peut disposer que de 20 bits, les 4 bits suppl- sous-trames. Le concept de bloc permet de regrouper 192 bits dtat
mentaires vhiculant les donnes auxiliaires. (channel status ) ou 192 bits utilisateurs. Ces bits forment donc
La sous-trame est constitue de 32 bits. Elle contient dabord un 24 octets. Pour connatre le point de dpart du bloc, un troisime
prambule de 4 bits successifs (figure 1) en dbut de sous-trame. type de prambule est dfini, le prambule Z, qui se substitue au
Ensuite viennent les 24 bits de donnes, et enfin 4 bits VUCP ( 1.4). prambule X du canal 1 pour le premier chantillon du bloc.
Lors de la configuration de la liaison, si le nombre des bits du Il y a donc dans le flot AES3 deux chelles de temps. Dune part,
signal est suprieur 20 (donc entre 21 et 24), il ne lui est pas pos- on voit alterner les chantillons audio de deux canaux (reprs par
sible de vhiculer des donnes auxiliaires. En revanche, si le nom- leur prambule X ou Y), la cadence dchantillonnage retenue.
bre de bits est infrieur ou gal 20, deux possibilits se Dautre part, une cadence 192 fois plus basse, le flux transporte
prsentent ; soit on incorpore des donnes auxiliaires, et 20 bits un paquet dinformation par canal. Ce paquet de 192 bits est trans-
restent disponibles pour le signal audio, soit on prolonge les don- mis bit par bit associ un chantillon audio. Le prambule Z
nes audio par des bits mis zro, concurrence de 24 bits. Dans permet de se synchroniser sur ce paquet, afin den extraire les
un cas comme dans lautre, si lchantillon audio a t cod sur informations.

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 420 3
INTERFACES AUDIONUMRIQUES AES/EBU _________________________________________________________________________________________________

1.3 Reprsentation lectrique


Horloge
On aura compris, la lecture de la description succincte qui vient
den tre faite que le flux de donnes AES se prsente comme une
suite de bits sans aucune interruption. Pour transmettre ce flux, il 1
faut videmment le reprsenter comme un signal lectrique, dont 0
Source
la transmission doit se faire sur un lien srie. Un tel lien suppose
un unique conducteur pour transmettre le signal : il nest pas 1
possible de transmettre sparment les donnes, leur horloge, et Canal
les signaux de synchronisation, ce qui supposerait trois 0
conducteurs, un par signal lectrique.
Comment contourner ce paradoxe ? Une solution astucieuse a t Figure 3 Exemple de codage biphase mark
adopte pour transmettre simultanment les symboles et les
signaux temporels (horloge et synchronisation), sur un seul
conducteur. Cette solution repose sur un codage de type biphase
mark. Horloge

1.3.1 Codage biphase mark Parit LSB

Dans ce codage, on convient pour transmettre des bits une Prambule X


cadence fixe de faire basculer le signal lectrique codant chaque
transition entre bits. Cela permet de rcuprer le signal dhorloge.
Pour transmettre le bit 1, on fait galement basculer le signal cod
au milieu de lintervalle de temps ddi ce bit. En revanche, pour Prambule Y
transmettre un bit 0, on garde le signal constant sur la dure de
transmission du bit.
La figure 3 illustre ce type de codage. On voit de haut en bas
lhorloge dont un cycle reprsente la dure de transmission dun Prambule Z
bit, le signal de donnes ou source quil faut transmettre, et enfin
le signal lectrique transmis sur le canal, qui regroupe les infor- Absence de transition
mations des deux signaux au-dessus. On remarque que ce type de
codage est indpendant de la polarit du signal : le signal audio-
numrique transmis suivant le standard AES3 nest pas perturb Figure 4 Les trois prambules AES3 violent deux fois
par un changement de polarit que peut provoquer par exemple la rgle biphase mark
une erreur de branchement. Mais ce codage ne permet pas encore
de savoir o se trouve la limite dun mot. On ne peut pas en
audio. Par exemple, le rcepteur doit savoir si le signal est mono-
extraire les trames ou sous-trames. Il faut pour y parvenir ajouter
phonique ou strophonique, sil est praccentu, sur combien de
une synchronisation, par le biais des prambules.
bits il est chantillonn. Dautres donnes, sans tre ncessaires
pour la reconstruction du signal, sont pourtant indispensables
1.3.2 Prambules lexploitation du flux de donnes. Par exemple, dans une rgie,
pouvoir extraire du signal une tiquette donnant son origine permet
Les bits de prambule portent linformation de synchronisation dviter des erreurs de branchement. Le standard dcrit linsertion
et permettent de connatre aussi bien les limites des chantillons de ces informations sous forme de blocs de 192 bits transmis
que les limites des blocs. Pour transmettre ces bits de prambule, raison dun bit par chantillon audio. Quatre bits diffrents, nots
le standard AES3 a choisi de violer la rgle associe au codage V, U, C et P, doivent tre transmis.
biphase mark, et qui veut que le signal subisse une transition
chaque dbut de cycle dhorloge (un bit tant transmis dans un Comment ces bits se situent-ils par rapport aux 4 bits auxiliaires
cycle dhorloge). qui peuvent tre transmis dans chaque sous-trame si le signal audio
est reprsent sur 20 bits au maximum ? Le standard ne dit rien sur
On le voit sur la figure 4, le signal ne subit pas de transition la ce point ( part un exemple situ en annexe, dinsertion dun signal
fin du premier cycle dhorloge du prambule. Il devient donc dinterphonie, donc de la parole, chantillonn sur 12 bits une
erron de parler de bit de prambule, comme nous lavons fait cadence un tiers de celle du signal audio). La signification de ces
jusquici. On peut seulement dire que le prambule dure quatre 4 bits auxiliaires peut tre librement fixe par lutilisateur. Dans un
cycles dhorloge, dure normalement consacre au transfert de contexte de diffusion tlvisuelle, le son tant reprsent sur
4 bits. Aprs la transmission du bit de parit de la sous-trame 20 bits, ces 4 bits auxiliaires sont encore disponibles. En revanche,
prcdente, le signal subit une transition pour indiquer le dbut du dans le contexte de la musique, on peut considrer ces bits auxi-
cycle dhorloge, mais il reste constant sur un cycle et demi, ce qui liaires comme appartenant au pass, car lenregistrement du signal
indique un prambule. Lvolution du signal permet de dtecter le audio sur 24 bits sest maintenant gnralis en milieu profession-
type du prambule. nel et se rpand rapidement dans le grand public avec des botiers
Aprs quatre cycles dhorloge, le prambule se termine par une externes dacquisition ou de restitution du son pour micro-ordina-
transition qui fixe le dbut du premier bit transmis dans le canal teurs, qui travaillent sur 24 bits 96 kHz.
suivant. La disparition de ces 4 bits auxiliaires ne sonne pas le glas de la
transmission de donnes numriques au gr de lutilisateur, car
parmi les 4 bits VUCP, lun deux, le bit U, est rserv lutilisateur.
1.4 Donnes auxiliaires
1.4.1 Bit V
La ncessit de transmettre des donnes numriques simulta-
nment au signal audionumrique simpose. Certaines donnes Ce bit est dit de validit. Si le bit de validit est zro, il indique
sont ncessaires au rcepteur pour reconstituer correctement le flux que lchantillon audio est valide, cest--dire quil peut tre converti

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 420 4 Techniques de lIngnieur
_________________________________________________________________________________________________ INTERFACES AUDIONUMRIQUES AES/EBU

en valeur analogique. Ce bit est mis 1 lorsque lchantillon audio Les six premiers octets (numrots 0 5) sont consacrs aux
est invalide. Le standard reste muet sur la manire dont le rcepteur informations relatives au signal lui-mme, tant dans son origine
doit traiter un flux audio dans lequel de temps autre se trouvent que dans la manire dont il est reprsent lintrieur du flux
des chantillons non valides. audio AES/EBU ( 1.5).
On trouve ensuite dans les octets 6 9, un code (ASCII ou ISO 446)
1.4.2 Bit U de quatre caractres qui permet lutilisateur de prciser lorigine de
ce signal. De la mme manire, les quatre octets suivants (numrots
Ce bit est laiss la disposition de lutilisateur pour quil y stocke 10 13) permettent de dfinir la destination de ce signal. Le standard
des informations quil a dfinies. nest pas plus prcis sur ce point et laisse toute latitude lutilisateur
Nota : par utilisateur, il faut en ralit comprendre lquipement metteur. pour choisir ces codes alphanumriques. Les octets 14 17 permettent
Toute libert lui est laisse pour cela. Mais il peut aussi choisir de reprsenter la numrotation des chantillons audio. Ils sont
dadhrer un des deux standards AES qui lui proposent une sp- complts par les quatre octets suivants qui permettent de sauve-
cification pour ce bit U. Le standard AES18 dcrit une mthode garder un code horaire. Lavant-dernier octet indique quels sont les
pour formater le flux form par la succession des bits de donnes octets valides dans la description prcdente ; le dernier octet constitue
U, en sinspirant du protocole HDLC (High-level Data Link Control). un code correcteur derreur.
Le standard AES42 dcrit une autre utilisation du bit U.
Dans le premier cas (AES18), il sagit dun complment facultatif 1.4.4 Bit P
au standard AES3, dans lequel le canal fourni par le bit U est utilis Ce bit est un bit de parit. Il est choisi de manire telle quil y ait
comme un canal srie, sans tenir compte des limites de bloc, car un nombre pair de 1 sur les bits 4 31, et par consquent galement
le standard AES18 dfinit un autre signal de synchronisation un nombre pair de 0 sur ces mmes bits. Rappelons que les bits
lintrieur du flux de bits transmettre. Le bit U fournit donc un de prambule constituent les bits 0 3. Leur structure particulire
canal de transmission par paquets, qui est totalement indpendant les exclut du contrle de parit.
du flux audio.
Dans le deuxime cas, on peut considrer le standard AES42
comme une extension du standard AES3, et linformation code 1.5 Informations portes
dans le bit U est fortement contrainte par le standard AES42. Elle
se prsente sous forme de blocs de 192 bits (ou 24 octets) synchro- par le Channel Status Data
niss avec le prambule Z. Nous reviendrons sur ces deux implan-
tations au paragraphe 1.5.6. Le standard AES3 dcrit de manire minutieuse la signification de
chaque bit dans les six premiers octets du bloc de statut. La lecture
attentive des nombreux tableaux qui composent cette description
1.4.3 Bit C simpose lingnieur charg dimplanter le standard AES3. Mais
cette lecture est aride et fastidieuse. Nous allons essayer ici den
Ce bit permet de constituer un bloc de 192 bits constituant le
donner une interprtation plus synthtique en discutant les types
channel status. Nous dsignons parfois ce bloc par bloc de
dinformations insrs dans le bloc de statut, leur origine et leur
statut , mais cette dnomination nest pas reconnue dans le stan-
reprsentation.
dard. Limportance du bloc de statut nous amne lui consacrer le
paragraphe 1.5. Signalons ici que ce bloc vhicule les informations
indispensables au rcepteur pour interprter correctement le flux 1.5.1 Mode professionnel ou consommateur
de donnes audio. Il permet de coder ces informations, comme le
fait par exemple le bloc den-tte dans un fichier audio. Alors que Le standard AES3 implante en ralit deux modes diffrents. Lun
dans le fichier, le bloc na pas besoin dtre rpt, dans un flux est le mode professionnel, cest lui qui est vritablement dsign
audio continu comme le flux AES/EBU, il est ncessaire de rpter sous le nom de norme AES/EBU. Lautre mode est le mode
sans cesse linformation, afin que le rcepteur puisse lextraire, consommateur, cest lui qui est dsign sous le nom de SPDIF pour
quel que soit linstant o il se branche sur le flux audio. faire rfrence au format introduit par Sony et Philips, et dont la des-
cription plus complte (en particulier au niveau lectrique) se trouve
lintrieur de chaque bloc, le bit de statut de chaque canal dans la norme CEI 60958-3. Un rcepteur au standard AES3 na pas
constitue un tableau de 192 bits, ou encore de 24 octets se rpar- tre compatible avec un metteur la norme CEI 60958-3, pas plus
tissant tel que dcrit dans le tableau 1. (0) quun rcepteur la norme CEI 60958-3 na lobligation dtre
compatible avec un metteur au standard AES3. Le bit qui permet
de choisir le mode de fonctionnement est donc important, car il per-
met au rcepteur de savoir sil doit ou non dcoder les informations
Tableau 1 Contenu des 24 octets du canal C du status bit.
(channel status)
Dans le bloc constitu par le status bit, cest le premier octet qui
Octets Usage porte les informations de format. Le tout premier bit (bit 0 de
loctet 0, qui est associ au prambule Z) dfinit le mode. Si ce bit
05 Informations sur le signal est positionn 1, il sagit du format professionnel (AES/EBU) ; en
revanche, si ce bit est positionn 0, tout le bloc est cod confor-
69 Nom du canal dorigine (4 caractres ASCII) mment au standard dit SPDIF.
10 13 Nom du canal de destination (4 caractres ASCII)
1.5.2 Type de donne et taille des mots
14 17 Numro dchantillon (32 bits, LSB en tte)
Le rcepteur du flux audio doit savoir comment interprter les bits
18 21 Code horaire (32 bits, LSB en tte) audio. Le flux peut tre un flux dchantillons PCM, linairement
22 Bits de validit des octets prcdents quantifis, ou bien cela peut constituer un flux compress multi-
canal (dans un codage MPEG, DTS, AC3...). Dans ce dernier cas, il
23 Code correcteur derreur (CRCC) faut indiquer quel type de compression sapplique. Le bit 1 de loctet
0 permet de savoir si le flux audio est de type PCM ou autre : dans
LSB : least significant bit. le cas PCM, le bit vaut 0, mais lorsque le bit est mis 1, le signal
CRCC : cyclic redundancy check code. peut avoir toute autre reprsentation (quantification non linaire ou

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 420 5
INTERFACES AUDIONUMRIQUES AES/EBU _________________________________________________________________________________________________

signal compress, par exemple). Le standard AES/EBU nen dit pas


plus, ce qui est conforme sa logique et son orientation vers le
contexte professionnel. En revanche la norme CEI 60958-3 prvoit

Amplitude (dB)
20
plus de dtails sur les signaux compresss.
J 17
15
Quant la taille des mots audio, on aurait pu sattendre ce que
le standard la code dans la reprsentation binaire la plus simple, ce 10
qui supposerait 5 bits, permettant de spcifier une taille de mots s
15
entre 1 et 32 bits. Mais ce nest pas le choix qui a t retenu. Au 5 5 0/
dbut des annes 1980, quand la premire version du standard a
t labore (sa publication en 1985 suppose que le travail de stan- 0
dardisation ait dbut vers 1982 ou 1983), les meilleurs conver-
5
tisseurs analogique-numrique se situaient entre 16 et 18 bits. Cest
20 50 100 200 500 1000 2000 5000 20 000
probablement ce contexte qui a amen prvoir 20 bits pour la don-
ne audio et 4 bits auxiliaires vous devenir ensuite des bits de f (Hz)
faible poids dans une reprsentation tendue 24 bits. Le choix
entre un champ de 20 bits ou un champ de 24 bits pour la donne
audio aurait pu conduire la rservation dun seul bit, mais le stan- Figure 5 Courbes de praccentuation
dard a t beaucoup plus gnreux, en allouant 3 bits (bits 0 2 de
loctet 2) ce choix, ltendant du coup au-del de lalternative, en
distinguant quatre cas : et des valeurs spcifiant une praccentuation de 50/15 s (code
un champ audio de 24 bits (code 001) ; 110) ou J17 (code 111), quatre valeurs sont rserves pour un usage
un champ audio de 20 bits avec 4 bits auxiliaires coordonns futur. La figure 5 montre les deux courbes de praccentuation pr-
(code 010) ; dfinies.
un champ audio de 20 bits seul, les 4 bits auxiliaires inutiliss Une autre difficult que rencontrent les ingnieurs du son dans
sont mis zro (code 000) ; les studios ou les rgies est lalignement des signaux. Lors du
un champ audio dans un format diffrent, que lutilisateur mixage ou de la concatnation de plusieurs programmes, ling-
spcifie et dcode (code 011). nieur du son ajuste les niveaux en fonction dun niveau de rf-
Les quatre autres choix laisss disponibles par lallocation de rence, le 0 dB. Il est indispensable que tous les signaux adoptent
3 bits sont rservs pour un hypothtique usage futur. une rfrence commune. Malheureusement, plusieurs rfrences
existent, et il faut indiquer celle qui est utilise. Il est surprenant de
Et si le signal nest reprsent que par 16 bits, quen est-il ? Le
constater que cest assez tardivement, dans lamendement 4 de
standard prvoit ce cas dans une logique complmentaire du choix
1999, que le standard AES3 prcise comment noter la rfrence qui
prcdent : les 16 bits sont vus comme 20 bits dont 4 ne sont pas
a servi dans chaque signal. Deux rfrences peuvent tre codes
utiliss. De mme, 22 bits seraient vus comme 24 dont 2 sont inem-
dans les bits 6 et 7 de loctet 2 du bloc de statut : lalignement sur
ploys. On utilise 3 bits (bits 3 5 de loctet 2) pour reprsenter ces
le niveau SMPTE RP155 (qui situe le niveau de rfrence 20 dB
diffrents cas. Par exemple, la valeur 001 indique quun bit de poids
en dessous de lamplitude maximale reprsentable sur chaque mot
faible est inemploy, et donc une longueur de mot qui est soit 19,
chantillonn) ou le niveau EBU R68 (avec une rfrence qui est
soit 23 bits suivant le choix prcdent. Cette logique est a priori
18,06 dB en dessous de lamplitude maximale).
assez simple, mais comme le standard AES3 prvoit toujours une
valeur par dfaut, la valeur 000 ne signifie pas quaucun bit de poids
faible nest inemploy (ce qui correspond un chantillon sur 20 ou 1.5.4 Frquence dchantillonnage
24 bits), mais plutt que lmetteur a choisi de ne pas spcifier
combien de bits sont employs. cause de cette particularit, pour Si les signaux sont transmis en temps rel par linterface, on peut
indiquer que tous les bits sont employs, il faut spcifier ici le code imaginer quil soit inutile de prciser la frquence dchantillon-
binaire 101. Les autres codes binaires (110 et 111) ne doivent pas tre nage, puisque celle-ci se dduit aisment de lhorloge insre dans
utiliss, car le standard les rserve pour un usage futur. Comme un le flux binaire. Mais il a paru plus simple dinclure cette information
constructeur allemand de consoles de mixage (StageTec) a dj dans le bloc de statut, ce qui permet au rcepteur dafficher cette
dpos un brevet et mis sur le march des convertisseurs sur frquence, sans avoir la mesurer.
28 bits, et que par ailleurs les logiciels de mixage prvoient dj des Le standard navait pas prvu dans sa version initiale les vo-
chantillons sur 32 bits, on peut sattendre des rvisions dchi- lutions de cette frquence dchantillonnage avec les progrs des
rantes et polmiques du standard AES/EBU dans quelques annes. convertisseurs analogique-numrique et numrique-analogique.
Linformation de frquence est donc code dune manire complexe,
1.5.3 Praccentuation et alignement par ajouts successifs au fil des mises jour du standard. lorigine,
trois frquences dchantillonnage ont t prvues : 32 kHz,
Mme en transmettant un signal PCM, il peut tre ncessaire de 44,1 KHz et 48 kHz. En ajoutant la valeur par dfaut (qui autorise le
corriger ce signal au niveau du rcepteur. Le standard AES/EBU rcepteur fixer la frquence de son choix), on obtient quatre
prvoit donc que le signal puisse tre praccentu. Deux types de valeurs codes sur les deux bits 6 et 7 de loctet 0.
praccentuation sont prvus par le standard :
Mais la frquence de 96 kHz est depuis apparue dans les studios
une praccentuation de 50/15 s, dans laquelle on applique denregistrement o la frquence de 48 kHz tait juge insuffisante
au signal un filtre ayant un ple avec une constante de temps de pour fournir la qualit de son recherche. Lamendement 3 de 1999
50 s et un zro avec une constante de temps de 15 s ; a donc introduit la possibilit de transmettre sur une liaison AES3
une praccentuation conforme la recommandation J17 de un canal unique la frquence double en utilisant les deux canaux
lUIT-T. initiaux. Ainsi, une liaison AES3 fonctionnant avec une cadence de
Le choix du type de praccentuation sinsre dans le bloc de sta- trames de 48 kHz peut aussi bien transmettre un signal stro-
tut (bits 2 4 de loctet 0) en respectant la logique de la valeur par phonique 48 kHz quun signal monophonique 96 kHz. Pour tre
dfaut (000) qui signifie que lmetteur ne prcise pas le type de plus prcis, dailleurs, il faut aussi indiquer si ce canal frquence
praccentuation, le rcepteur est alors libre de choisir la dsaccen- double est un canal monophonique, ou bien le canal gauche ou
tuation quil applique. Lmetteur indique avec une valeur (100) encore le canal droit dun couple strophonique. Les bits 0 3 de
quil na appliqu aucune praccentuation, obligeant le rcepteur loctet 1 dans le bloc de statut jouent alors un rle un peu hybride.
ne pas appliquer de dsaccentuation. En plus de ces deux valeurs Initialement prvus pour prciser le type de canal (soit monopho-

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 420 6 Techniques de lIngnieur
_________________________________________________________________________________________________ INTERFACES AUDIONUMRIQUES AES/EBU

nique, soit strophonique, soit encore deux canaux sans relation 1.5.6 Nature des donnes utilisateur
entre eux), ces bits se voient ainsi dots dun rle dindicateur de
frquence dchantillonnage double. On peut dire qu ce moment- Le standard AES3 prvoit que le bit U de chaque sous-trame
l, le standard entrine un usage dj bien rpandu dans les studios puisse vhiculer une information spcifique au libre choix de luti-
et chez les fabricants. lisateur (ou plutt lquipement metteur). Comme lutilisateur peut
choisir dadhrer certains standards pour exploiter le canal
Mais cela sest avr insatisfaisant. Si une cadence dchantillon- constitu par la succession de ces bits U, il est souhaitable quil
nage plus leve devenait dusage courant, il fallait que linterface puisse indiquer son choix. Les possibilits retenues sont :
AES3 change elle aussi de cadence, pour conserver son caractre
strophonique. Dans le mme amendement, lAES a donc anticip le canal U est exploit par blocs de 192 bits synchrones du
sur les cadences suivantes en prvoyant une cadence qui puisse bloc de statut et donc initialiss par le prambule Z (cest ce type
tre double, quadruple, mais aussi divise par 2. Ainsi par rapport de codage qui est retenu dans le standard AES42, 2) ;
au 48 kHz, cela ajoute 24 kHz, 96 kHz et 192 kHz. O loger cette infor- le canal U forme un flot continu, ayant son propre dispositif
mation dans le bloc de statut ? Cest loctet 4 qui a t choisi pour de synchronisation, conformment au standard AES18 ;
cela, dans les bits 3 6. La cadence de 32 kHz tant tombe en le canal U est cod conformment au format de donnes
dsutude, les frquences codes dans ces bits sont 24, 96, 192, utilisateur dfini par le standard CEI 60958-3, cest--dire au format
22,05, 88,2 et 176,4 kHz. Le standard prcise dailleurs que ce choix dit SPDIF ;
nest pas incompatible avec le fait de passer un canal mono- le canal U est cod suivant un format spcifique lutilisateur.
phonique cadence double (est-ce pour prvoir une ventuelle
extension 384 kHz ?).
Ajoutons un mot sur le bit 7 de ce mme octet 4, dont lemploi 1.6 Implantation du statut
peut paratre anecdotique, mais est bien reprsentatif de la comple-
xit des situations que doit prendre en compte un standard. La tl- On a vu que chaque paquet de bits lintrieur du bloc de statut
vision NTSC utilise une cadence de trames vido qui nest pas de a une valeur par dfaut. Ce choix dlibr au niveau du standard
30 Hz, mais plus prcisment de 30/1,001 Hz. Pour quun signal rend parfois le dcodage des informations un peu complexe. En
audio puisse sinsrer dans un flux vido numrique de type NTSC, contrepartie, avoir fait ce choix laisse une grande latitude au
il faut effectuer de savantes dcoupes dans les blocs audio et fabricant qui implante le standard AES3 dans un produit. Il peut en
vido ( 5.3). Cette dcoupe se simplifie videmment si lon modifie effet choisir de sen tenir uniquement aux valeurs par dfaut, ou au
lgrement la cadence dchantillonnage audio, dans ce mme rap- contraire donner une description complte du bloc de statut. Trois
port de 1/1,001, et cest pourquoi le standard AES3 a prvu, dans niveaux dimplantation sont prvus par le standard AES3 :
lamendement 4 de 1999, un bit pour signaler cette situation. implantation minimum : seul le premier bit (octet 0, bit 0) est
mis 1, ce qui indique le mode professionnel. Tous les autres bits
1.5.5 Monophonie, strophonie, multicanal doivent tre positionns leur valeur par dfaut ;
implantation standard : le premier bit (octet 0, bit 0) est mis
lorigine, le standard AES3 avait prvu que les deux canaux de 1 (mode professionnel). Lutilisateur (cest--dire en fait lquipe-
la liaison puissent servir transmettre un canal strophonique, ment qui fournit le flux audionumrique sa sortie) encode
mais aussi un canal monophonique, ou deux canaux dits primaire obligatoirement les octets 0, 1, 2 et 23 (CRCC) ;
et secondaire (cela peut correspondre par exemple aux signaux M implantation tendue (enhanced ) : les octets dfinis au
et S dun couple strophonique M+S). Il a fallu tendre cette niveau prcdent (implantation standard) le sont aussi ce
situation la transmission dans les deux canaux dun unique signal niveau ; de plus, les autres octets sont laisss au choix de lutilisa-
mais cadence double. Et comme le son multicanal (surround, 5.1, teur.
voire plus) se dveloppe, lun des amendements de 1999 a tenu Le document dinformation AES-2id discute dans le dtail la
compte de ces nouveaux dveloppements. Les bits 0 3 de loctet manire dont les quipements traitent les informations situes
1 tant saturs, il fallait loger ailleurs les informations de multicanal. dans le status bit. Il prvoit en particulier plusieurs classes dqui-
Cest loctet 3 du bloc de statut que revient le rle de prciser pement (A, B1, B2, B3, C1 et C2), ce qui permet de savoir comment
quel canal est transmis. On ne peut pas dire que le standard soit par- lquipement manipule les diffrents flux audio et de donnes :
ticulirement simple. Il prvoit en effet deux manires de spcifier le A : lquipement transmet sans aucun dcodage les flux
numro du canal. Si le bit 7 est mis zro, la numrotation est audio et de donnes ;
directe. Les 7 autres bits de loctet permettent de numroter B1 : lquipement dcode les donnes audio, mais pas les don-
128 canaux diffrents (entre 1 et 128, ce qui veut dire que lon ajoute nes du channel status quil ne transmet pas (ce type dquipement
1 la valeur lue dans les 7 bits, qui, sinon, serait entre 0 et 127). Si, en nest pas recommand car il perd entre autres les informations rela-
revanche, le bit 7 est mis 1, on se place dans un mode de numrota- tives la praccentuation) ;
tion indirect o les 7 autres bits sont dcoups en deux groupes : un B2 : cet quipement dcode le channel status, le traite si
groupe de 3 bits dfinit le mode de numrotation et un groupe de ncessaire mais ne le transmet pas ;
4 bits dfinit un numro de canal parmi 32. Quand cet amendement a B3 : cet quipement dcode le channel status, le traite si
t adopt en 1999, le standard prcisait que la signification de ces ncessaire et le transmet ;
modes de numrotation tait en cours dlaboration. Mais en 2003, C1 : il sagit dun quipement uniquement rcepteur, sans sortie
le standard a t confirm, ce qui signifie dans les procdures de numrique (par exemple, un convertisseur numrique
lAES, entre autres, que les amendements prcdents sont dfinitive- analogique) ; lquipement ne dcode que le flux audio ;
ment inclus dans le standard ; or la phrase disant que ces modes
C2 : comme un quipement de classe C1, un quipement de
sont en cours dlaboration est reste inchange. En ltat, ce mode
classe C2 est uniquement rcepteur ; en revanche, il dcode et
de numrotation des canaux nest donc pas encore exploitable.
traite aussi bien le flux audio que le flux de donnes.
Pour compliquer encore le tableau, le standard a dcid de tolrer
Ce mme document dinformation AES-2id propose un tableau
une pratique de certains constructeurs dont les quipements ne
que chaque constructeur devrait joindre lquipement quil vend,
lisent le numro du canal que dans lun des deux blocs de statut
mais il est regrettable que pratiquement aucun ne le fasse. Ce
(rappelons que dans le flux AES, chaque canal vhicule son propre
tableau indique prcisment les emplois des bits C, V et U, que
bit C et a donc un bloc de statut propre). Dans ce cas, il faut mettre
lquipement soit metteur ou rcepteur.
dans les deux canaux du flux AES3, le mme numro de canal, et
implicitement ce numro est celui du premier canal du flux AES, Exemple : pour un quipement de type B3, le tableau indique si
lautre canal ayant le numro immdiatement suprieur. lquipement modifie les bits quil transmet.

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 420 7
INTERFACES AUDIONUMRIQUES AES/EBU _________________________________________________________________________________________________

2. Standard AES42 condensateur sont aliments depuis une console de mixage ou


depuis un enregistreur par une tension fantme de 48 V, qui est
transmise comme une tension de mode commun sur les broches
2 et 3 du connecteur XLR (voir la recommandation EBU R50), la
En 2001, lAES a publi un nouveau standard, sous le numro broche 1 tant relie au blindage.
AES42. Il est intitul Interface numrique pour microphones et a
pour base le standard AES3, quil complte dans le sens remontant. Lors de llaboration du standard AES42, il a suffi de fournir un
Il permet en effet lquipement qui reoit le flux AES3 provenant quivalent de cette alimentation fantme pour un microphone
du microphone numrique, de renvoyer au microphone des numrique. Applique de la mme manire, il sagit maintenant
commandes ainsi quune alimentation. Bien que ce standard fasse dune tension de 10 V, dsigne par le sigle DPP (Digital Phantom
rfrence un microphone comme source du flux AES3, il peut Power). La manire la plus simple dappliquer cette tension, lorsque
aussi sappliquer dautres quipements qui fournissent une source la liaison AES3 passe par un transformateur, consiste appliquer
AES3 mais doivent dune part tre aliments depuis lautre extr- la tension au point milieu de lenroulement faisant face au micro-
mit du cble et dautre part recevoir par ce biais des commandes phone. La figure 6 montre comment cette tension peut tre envoye
(par exemple, pour modifier leur configuration). au microphone.
Il y a une diffrence importante entre lalimentation fantme ana-
logique et lalimentation DPP. Alors quun microphone analogique
2.1 Objectifs rclame une tension leve pour polariser le microphone, et une
intensit faible pour alimenter un pramplificateur, la DPP doit ali-
Lemploi typique de ce standard est celui dun microphone menter des circuits intgrs (convertisseur analogique-numrique,
numrique reli une console de mixage. Le microphone joue le interface AES3, ventuellement processeur de traitement du
rle de source AES3 et la console joue le rle du rcepteur AES3. signal). Par consquent, la tension dalimentation est plus basse,
Cette compatibilit avec le standard AES3 a t trs contraignante mais lalimentation doit fournir un courant relativement important
dans la conception du standard. au microphone numrique. Selon le standard, ce courant a une
intensit maximale de 250 mA, sous une tension de 10 V.
Les objectifs de ce standard sont multiples :
Ces valeurs pourraient voluer dans le futur. Do viennent-elles ?
permettre au rcepteur AES3 dalimenter lmetteur AES3 ; Au moment o le standard a t prpar, un seul constructeur,
permettre au rcepteur AES3 de fournir des commandes Beyerdynamic, avait mis sur le march un microphone interface
lmetteur AES3 ; numrique. Son avance technologique lui a bien entendu permis de
permettre lmetteur AES3 denvoyer un rapport sur son faire adopter ses choix au sein du standard. Lalimentation DPP en
tat ou sa configuration ; est un exemple. Si lon se met la place des fabricants de console,
permettre lmetteur AES3 de synchroniser son horloge sur on peut tre effray par la valeur de lintensit requise, car au niveau
celle du rcepteur. dune console, il faut multiplier cette intensit par le nombre de
Nous allons tudier ces quatre fonctions sparment et nous tranches (ou voies) de la console. Pour une console de 64 voies, il
verrons quelles volutions sont souhaitables pour ce standard faut fournir 16 A !
( 2.5).

2.3 Commandes
2.2 Alimentation fantme numrique
Par rapport au standard AES3, le standard AES42 ajoute une
Rsoudre le problme de la tension dalimentation ntait pas trs caractristique importante : la console ou lenregistreur envoie des
difficile, car une solution existe dj dans le domaine analogique, commandes au microphone, commandes que celui-ci dcode et
avec lavantage dun consensus trs large parmi les constructeurs excute. Il faut donc dfinir dans le standard la reprsentation
autour de cette solution : aujourdhui, les microphones analogiques logique de ces commandes et leur mode de transmission lectrique.

metteur Rcepteur
XLR XLR
110
TXP RXP
110
TXN RXN

Microphone Console

Tension DPP DPP Tension


Rgulateur Codeur

Commande Commande
Dcodeur

a mission b rception

Figure 6 Envoi de la DPP depuis le rcepteur AES42

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 420 8 Techniques de lIngnieur
_________________________________________________________________________________________________ INTERFACES AUDIONUMRIQUES AES/EBU

80 512 T 512T 512T


Amplitude (dB)

70

60

64T 64T 64T


50
56T 8T 8T 56T 8T 56T

40
0 1 1 0
30

20

10
Figure 8 Modulation de la DPP
0 pour transmettre les bits de commande

103 104 105 106 107 108


f (Hz)
Ce schma de transmission permet un dcodage trs simple des
commandes au niveau du microphone. Quelques portes logiques
Figure 7 Densit spectrale de puissance du signal suffisent. En revanche, le dbit utile est faible.
sur un lien AES3 48 kHz
2.3.2 Commandes venant de la console

2.3.1 Paramtres lectriques de la transmission Sur le plan logique, la conception des commandes na pas
soulev beaucoup de difficults. Deux types de commande sont pr-
Pour concevoir la manire dont les commandes parviennent au vus par le standard. Les commandes simples, au nombre de 3, sont
microphone, il aurait t possible de considrer le cble comme un transmises sur deux octets, le premier tant un octet dadresses et
canal de communication. Le signal AES3 occupant une bande le second un octet de donnes. Les commandes tendues, au
au-del de 100 kHz (figure 7), la bande infrieure aurait pu tre uti- nombre de 32, sont transmises sur trois octets. La distinction entre
lise pour le lien montant, ce qui aurait permis de passer un dbit commandes simples et commandes tendues vise amliorer le
dinformation relativement lev. dbit, car les commandes simples sont supposes tre expdies
trs souvent et bnficient dun codage plus compact.
Une autre solution aurait consist envoyer un second signal
AES3 en sens inverse du premier. La sparation des deux signaux Les trois commandes simples permettent de fixer respective-
se serait faite par un circuit adapt, reposant sur un transformateur ment :
trois enroulements, comme cela se faisait en tlphonie analo- la prattnuation qui peut prendre quatre valeurs, la directi-
gique dans ce que lon appelait le passage 2 fils-4 fils . vit indique par 4 bits, ce qui laisse le choix entre 15 directivits
(dont omnidirectionnel, cardiode, hypercardiode et en figure de
Aucune de ces deux solutions na t retenue. Malgr leurs per- huit) et enfin un filtre coupe-bas qui prend trois valeurs au choix du
formances plus leves, cest une solution plus rudimentaire qui a constructeur ;
t retenue. Cela est sans doute en accord avec la culture de lAES
le gain du microphone (sur 6 bits), un limiteur et un signal
dont les standards ont tendance privilgier des solutions simples
mute pour rendre le microphone muet ;
et robustes quitte tre moins performantes. Ici, la solution retenue
est celle que Beyerdynamic avait dj introduite dans son micro- la synchronisation du microphone.
phone MD100. La commande de synchronisation joue un rle particulier. Elle a
vocation tre expdie aussi souvent que possible. Le mot de
La squence des bits de commande est transfre vers le micro-
donnes qui lui est associ permet de coder, sur 8 bits ou sur
phone par le biais dune modulation positive de 2 V de la tension
13 bits en utilisant 5 bits du premier octet, une tension applique
DPP. Paralllement, lalimentation est suppose fournir jusqu
un oscillateur command en tension (VCO : voltage controlled
300 mA quand la tension DPP est module (passant de 10 V 12 V).
oscillator ). Nous dcrivons plus loin ( 4.3) la manire dont seffec-
La figure 8 montre la modulation utilise pour transmettre les infor-
tue le pilotage de lhorloge du microphone.
mations vers le microphone. Les bits sont cods par une modulation
de largeur dimpulsion. La dure attribue un bit est de 64 /fs , soit La norme AES42 prvoit en plus des trois commandes simples,
64 priodes dchantillonnage du signal audio. Cela donne un dbit un jeu de trente et une commandes tendues. Pour le moment,
thorique de 750 bits/s si la frquence dchantillonnage est de seules les commandes numrotes de 4 7 sont dfinies ainsi que
48 kHz. Un bit 1 est cod par une impulsion qui reste DPP les commandes 33 et 34. Une rvision de ce standard, paratre
pendant 8 priodes dchantillonnage puis passe DPP + 2 V courant 2005, devrait dfinir en plus les commandes 29 32. Les
pendant 56 priodes dchantillonnage. Un bit 0 est cod par une commandes actuellement dfinies concernent :
impulsion qui reste DPP pendant 56 priodes dchantillonnage le numro de la page que le microphone transmet par le bit
puis passe DPP + 2 V pendant 8 priodes dchantillonnage. U, la remise zro du microphone, le calibrage du convertisseur,
Les bits sont transmis par paquets de 16 ou 24, chaque paquet le test du microphone et un tmoin lumineux sur le corps du
tant dcod comme une commande. Le dbit binaire rel est de microphone ;
lordre de 500 bits/s car un intervalle de garde au moins gal la la frquence dchantillonnage des convertisseurs du micro-
dure dun octet, soit 512 priodes dchantillonnage, est requis phone et un dithering lors de la conversion vers un nombre rduit
avant la transmission du mot de commande suivant. de bits ;

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 420 9
INTERFACES AUDIONUMRIQUES AES/EBU _________________________________________________________________________________________________

le type de strophonie (X/Y avec canaux gauche et droite, ou cela sajouteront peut-tre, dans une future rvision, les fr-
M/S, avec le canal somme puis le canal diffrence), la balance dun quences dchantillonnage possibles et la valeur actuelle du gain du
microphone strophonique ; compresseur.
diverses courbes dgalisation du microphone ; Les autres pages contiennent des informations moins essentielles,
une commande qui ouvre une squence spcifique chaque mais permettant de simplifier lemploi des consoles de mixage
constructeur ; lorsquelles affichent ces informations :
une commande qui ferme cette squence spcifique. identification du fabricant ;
Les deux dernires commandes montrent la fois la volont identification du modle de microphone ;
douverture de ce standard, mais aussi le souvenir des rvisions de identification du numro de srie ;
la norme AES3, parfois induites par des contraintes imposes par numro de version du matriel ;
des fabricants, ou des pratiques adoptes par les utilisateurs. numro de version du logiciel.
Il est dailleurs intressant de se pencher sur les commandes ces informations, il est utile dajouter une estimation du retard
proposes pour la prochaine rvision. Pour la plupart, elles induit par le microphone. En effet, la conversion analogique-num-
concernent le rglage dun compresseur. Aujourdhui, aucun micro- rique se fait systmatiquement par convertisseur / , qui comporte
phone nincorpore de compresseur, mais la possibilit dinclure un filtre numrique antirepliement, et donc un certain retard. De
avec le microphone et son convertisseur analogique-numrique un plus, le microphone numrique incorpore divers filtrages, et ceux-ci
processeur de traitement du signal est clairement ouverte par le ajoutent galement un retard. Une console de mixage doit faire
standard AES42 (en particulier au niveau de lalimentation travailler ensemble des microphones de marques et modles
lectrique). Un compresseur peut tre facilement implant sur ce diffrents, et chacun produit un signal ayant un certain retard. La
DSP (digital signal processor ). Le standard tente donc danticiper console doit en tenir compte pour compenser ces retards. En ana-
cette demande. Mais quand on voit la varit des effets numriques logique, cela navait pratiquement pas dincidence, pas plus quavec
disponibles dans les logiciels de montage audio, on se dit que rien les consoles numriques actuelles, dont les entres restent analo-
nempche de programmer la plupart dentre eux sur un DSP. Quel giques et sont donc toutes soumises au mme type de conver-
est le degr dadaptation du standard AES42 face cette explosion tisseur analogique-numrique : les signaux ne sont pas dcals les
annonce ? uns par rapport aux autres. Avec des sources numriques, il est
indispensable que chacune annonce le retard avec lequel elle dli-
vre les signaux. Sans cette information, le travail de lingnieur du
2.4 Rapport et identification son devient un immense casse-tte. Le standard AES42, sil incor-
pore cette information, ne peut le faire avant sa rvision en 2005.
Nota : on peut stonner que certains octets de la page 0 soient consacrs un micro-
Aprs lalimentation et lenvoi de commande du rcepteur vers phone sans fil, alors que la norme AES42 concerne la transmission par cble. Il sagit ici
lmetteur, le troisime ajout du standard AES42 par rapport au simplement de prendre en compte le rcepteur dun microphone HF, qui serait vu par la
standard AES3 est la fourniture dun rapport sur ltat de fonction- console comme un microphone numrique.
nement de lmetteur. Contrairement un metteur AES3 qui fonc-
tionne sur un mme mode durant toute une session, un metteur
AES42 change souvent de rglages. Le standard demande donc que 2.5 volutions
lmetteur fournisse un rapport rgulirement au rcepteur. La
compatibilit avec le standard AES3 ne laisse pratiquement pas
La norme AES42 a t dite en 2001 et pourtant, peu de micro-
dautre choix que dutiliser le bit U (user bit ). Nous avons vu plus
phones respectant ce standard sont disponibles en 2005. Quelques
haut que lon peut utiliser ce bit comme un canal continu
points de la norme posent encore problme et nont reu un
48 000 chantillons par seconde, ou bien comme une succession de
accord ni de la part des fabricants, ni de celle des utilisateurs. On
paquets de 192 bits, dont le premier concide avec le prambule Z.
peut donc sattendre des volutions de cette norme.
Le standard AES42 a choisi cette dernire possibilit. Nous dis-
posons donc dun bloc dinformation de 24 octets, appel page . Une premire volution concerne les connecteurs. La norme pro-
Lors de llaboration du standard, il est apparu quune page ntait pose (mais nimpose pas) lemploi dun connecteur nomm XLD
pas suffisante pour rapporter toutes les informations souhaites. pour remplacer le connecteur XLR dans la transmission de signaux
Quatre pages diffrentes ont donc t prvues, mais la quatrime numriques. Ce connecteur diffre du connecteur XLR par un ergot
est pour le moment rserve (tous les bits 0). La page 0 contient amovible qui le rend incompatible avec le connecteur XLR quand
des informations varies et doit tre envoye le plus souvent pos- il est prsent, mais compatible quand il est absent. Lobjectif est de
sible. Les autres pages doivent tre envoyes au moins une fois par ne pas permettre dappliquer une tension fantme numrique (DPP)
seconde, ou la demande de la console (qui utilise pour cela la sur un quipement analogique quil pourrait dtruire du fait du
commande tendue numro 4). courant quil est capable de fournir (250 mA). En plus de cet ergot,
le connecteur XLD a aussi un anneau cannel et ray (zbr) afin
Certaines informations tant juges critiques et ne pouvant souf- de permettre au technicien manipulant cette prise de la lire en
frir de retard dans la transmission du microphone vers la console, lumire faible, ou de la reconnatre en sentant ses cannelures sous
elles ont t regroupes dans loctet 0 de la page 0, et sont aussi ses doigts.
recopies dans le mme octet 0 des autres pages. Ce sont :
Une autre volution possible est similaire celle qui a fait
lactivit du limiteur ;
complter la norme AES3 par le document dinformation AES-3id ;
la prsence dun crtage au niveau du convertisseur analo- ce document introduit la transmission sur un cble coaxial, avec un
gique-numrique ; connecteur de type BNC. Les prestataires techniques et les chanes
ltat muet du microphone. de tlvision souhaitaient cette compatibilit avec le type de cble
Les informations qui sont vhicules sont pour la premire page : quelles utilisent pour la vido. Aprs la parution de la norme
AES42, la mme demande a ressurgi.
ltat des rglages du microphone (attnuation, directivit,
filtre coupe-bas, boutons) ;
la liste des fonctions que le microphone sait rgler sur On peut donc sattendre voir apparatre une version de la
commande du rcepteur ; norme AES42 qui permette de vhiculer le flux AES3 descendant
ltat de la liaison radio et de la batterie dans le cas dun et le flux de commande AES42 remontant, ainsi que la tension
microphone sans fil. DPP, sur un cble coaxial, par le biais de connecteurs BNC.

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 420 10 Techniques de lIngnieur
_________________________________________________________________________________________________ INTERFACES AUDIONUMRIQUES AES/EBU

3. Spcifications lectriques Tableau 2 Comparaison des modes AudioPro,


VidoPro et Conso
Nous tudions ici les couches physiques de la liaison de type AES/
EBU, cest--dire les caractristiques lectriques de lmetteur, du Application AudioPro VidoPro Conso
cble et du rcepteur. Jusqualors, nous avons vu que les diverses
interfaces audio (AES3, SPDIF, CEI 60958, AES42) utilisent finalement Standard AES3 AES-3id CEI 60958-3
le mme protocole logique, avec les mmes blocs, trames et sous- (SPDIF)
trames, la mme modulation biphase mark et les mmes canaux C Symtrique Oui Non Non
(channel status ) dans les deux modes, professionnel et consomma-
teur. En revanche, au niveau lectrique, les spcifications divergent. Connecteur XLR BNC RCA
Trois situations se prsentent. La premire correspond au standard Impdance 110 75 75
AES3, dans une liaison de type professionnel, principalement dans le
contexte purement audio. La seconde est la variante consommateur Tension 27V 0,8 1,2 V 0,4 0,6 V
de ce standard, ce qui correspond une liaison SPDIF ou CEI 60958-3.
La troisime variante est, comme la premire, destine une liaison
en mode professionnel, mais intresse surtout les utilisateurs dans le connecteur trois broches XLR, aussi ce connecteur a t repris, pour
domaine de la tlvision ; elle repose sur la recommandation AES- le moment, dans les standards AES3 comme AES42. Cela na pas vrai-
3id. Convenons dans ce qui suit de dsigner les trois situations res- ment de quoi rjouir les utilisateurs, car le technicien doit chaque
pectivement par AudioPro, Conso et VidoPro (tableau 2). fois tre attentif ne pas insrer un signal analogique sur une entre
numrique, ou linverse. Un connecteur spcifique pour les prises
numriques aurait t prfrable.
3.1 Tensions, impdances et connectique La figure 9 donne un exemple demploi des connecteurs XLR
pour une connexion de type AES3 en mode professionnel. Notons
La tension lectrique du signal numrique varie de 2 7 V dans les rsistances de 110 chargeant lmetteur et le rcepteur. Les
le standard AES3, mais elle est plus basse dans les autres situa- transformateurs sont de rapport 1:1. Il y a galement la possibilit
tions, de lordre du volt en VidoPro et de la moiti dans le disoler le transformateur de lmetteur avec deux condensateurs,
contexte Conso. Ces rapports sont conformes ceux que lon lun plac dans la branche amont du transformateur, lautre situ
observe en moyenne pour les signaux analogiques dans ces dans la branche aval. Ces condensateurs protgent le transfor-
domaines dapplication. mateur dune tension continue qui lui serait applique, tout en
(0)

Les impdances et les types de cbles varient tout autant. Dans amliorant la rjection de mode commun.
le contexte AudioPro, le signal transite par une paire torsade, de La figure 10 donne un exemple de connexion de type AES3 en
manire symtrique (si un conducteur transmet un signal +s, mode consommateur, ou plus prcisment de type SPDIF. On a sup-
lautre transmet le signal s). Dans les deux autres contextes, le pos que lmetteur avait des caractristiques lectriques identi-
signal est transmis de manire asymtrique entre un conducteur ques lexemple de la figure 9. Les deux rsistances en sortie de
la tension nulle et le conducteur vhiculant le signal. Limpdance lmetteur ont pour rle de diviser la tension pour la ramener aux
est de 110 dans la transmission symtrique, mais de 75 dans valeurs souhaitables, mais elles adaptent aussi ltage de sortie
la transmission asymtrique. limpdance du cble. Comme dans lexemple de la figure 9, on
La connectique, qui est la partie la plus visible du standard, montre peut souligner la possibilit disoler le transformateur avec deux
la plus grande dispersion. Le monde AudioPro est habitu au condensateurs.

metteur Rcepteur
XLR XLR
110
TXP RXP
110
TXN RXN

a mission b rception

Figure 9 Connexion de type professionnel

metteur Rcepteur
374
RCA RCA 0,01 F
TXP RXP
90 75
TXN RXN
0,01 F

a mission b rception

Figure 10 Liaison en mode SPDIF avec metteur au standard AES3

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 420 11
INTERFACES AUDIONUMRIQUES AES/EBU _________________________________________________________________________________________________

La synchronisation sur une horloge de rfrence peut se faire de


trois manires. Le schma le plus simple consiste, pour chaque
14
Amplitude (dB)

quipement recevant un flux AES/EBU, utiliser lhorloge inhrente


ce flux comme horloge de synchronisation. Dans ce schma, les
12 difficults viennent des variations de lhorloge (gigue) ainsi que des
dcalages successifs qui sintroduisent quand de tels quipements
sont mis en cascade. Une seconde technique consiste fabriquer
10
une horloge de rfrence pour les signaux audio, envoye tous
les quipements du studio. Ceux-ci se synchronisent donc sur cette
8 horloge unique. Cette technique rclame une horloge trs prcise,
que dcrit le standard AES11. La troisime manire consiste uti-
liser un asservissement de lhorloge de lmetteur, une horloge de
6
rfrence audio ; cest la technique quutilise le standard AES42
pour synchroniser tous les microphones connects une mme
4 console de mixage.

2
4.1 Gigue
0
La gigue (jitter ) se dfinit comme les variations des instants de
0,01 0,02 0,05 0,1 0,2 0,5 1 2 5 10
passage du signal par zro, par rapport lhorloge idale. Deux
f (MHz) types de gigue peuvent tre considrs : le premier est intrinsque,
il est observ quand lmetteur fonctionne de manire autonome ;
le second type sobserve quand lquipement metteur reoit une
Figure 11 Fonction de transfert dun galiseur pour 1 000 m rfrence de temps sur laquelle il doit se synchroniser. On mesure
de cble 5C2V en sortie, dans cette dernire situation, la transmission de la gigue
issue de la rfrence de temps.
La gigue intrinsque doit avoir une amplitude au plus gale
3.2 galisation 0,025 UI, o UI dsigne le unit interval, cest--dire lunit de temps
la plus petite dans le signal, le temps le plus bref entre deux tran-
Les situations AudioPro et Conso ne rclament pas dgalisation, sitions dans le signal cod en biphase mark, qui est donc un 128e
les longueurs de cbles tant limites, ou du moins restant de la priode dchantillonnage.
compatibles avec les spcifications du standard. En revanche, dans
la situation VidoPro, les utilisateurs veulent pouvoir utiliser de Exemple : 48 kHz, cette unit de temps est de 162 ns et la gigue
grandes longueurs de cbles, au-del de 100 m, limite fixe par ne doit pas dpasser 4 ns.
lAES3. Une galisation du signal peut alors tre ncessaire au
La gigue transmise se mesure par lamplitude de la fonction de
niveau du rcepteur ; elle reste interdite par le standard au niveau
transfert de la gigue entre la rfrence de temps et le signal AES/
du rcepteur. Lattnuation dun cble est domine par un terme en
EBU en sortie de lquipement. Cela suppose une analyse en fr-
a f , o le facteur a vaut 0,0085 dB/m pour un cble de type 5C2V
quence du signal de gigue, considr comme un signal chan-
(pour dautres cbles, ce facteur volue entre 0,008 et 0,013). Lga-
tillonn. En dessous de 500 Hz, le standard ne spcifie rien. Puis la
liseur idal a une fonction de transfert conforme :
fonction de transfert doit rester infrieure un gabarit qui dcrot
dabord de 0 dB pour 500 Hz 6 dB pour 1 000 Hz. Au-del de

[ 1 + cos ( fT ) ] fT
E ( f ) = a f + 20 ln -----------------------------------------------------
2 sin ( fT )  (1) 1 000 Hz, le gabarit reste gal 6 dB. On peut considrer quun
quipement AES qui reoit une horloge doit la transmettre avec
La figure 11 montre la fonction de transfert obtenue avec cette deux fois moins damplitude de gigue que lhorloge reue.
formule, pour un cble de 1 000 m de longueur.

4.2 Horloges de rfrence


4. Synchronisation Dans le cas o lon fabrique un signal de rfrence audio, le stan-
et horloges dard AES11 prcise que cest un signal AES3 particulier, qui respecte
donc les caractristiques lectriques de ce type de signal. On peut
utiliser aussi bien un signal contenant un programme audio ou un
La numrisation des signaux a entran lapparition dun problme signal simplifi avec prambule seul.
trs important dans le transfert de signaux entre quipements : la
Deux classes dhorloge de rfrence sont considres. Une
synchronisation des horloges de chaque quipement. Le standard
horloge de grade 1 a une tolrance (exprime en fraction de la fr-
AES3 rsout trs lgamment ce problme entre un quipement
metteur et un quipement rcepteur : lmetteur insre son horloge quence) de 10 6 (ou 1 ppm), alors quune horloge de grade 2 a
dans le flux mis et permet au rcepteur de se synchroniser sur elle. une tolrance de 10 5 (soit 10 ppm). Un quipement pouvant se
Mais cela ne suffit pas lorsque plusieurs quipements doivent tra- synchroniser sur une horloge de grade 1 doit tre capable de se ver-
vailler en parallle ou lorsque lhorloge du rcepteur est impose, rouiller sur une horloge dont la frquence se situe dans un intervalle
par exemple en fonction dune horloge vido. de 2 ppm autour de la valeur nominale, alors quun quipement
La synchronisation suppose deux choses. Tout dabord, les fr- recevant une horloge de grade 2 doit se verrouiller sur une horloge se
quences dchantillonnage doivent tre identiques, garantissant le situant dans un intervalle de 50 ppm autour de la valeur nominale.
mme nombre dchantillons chaque seconde. Ensuite, les trames La synchronisation, sur le plan temporel, fixe une limite maxi-
audio doivent survenir au mme instant, aux tolrances prs. Les male lcart entre le dbut de la trame de la rfrence et le dbut
ingnieurs du son portent une trs grande attention la qualit des de la trame AES3 en sortie de lquipement, au niveau du
signaux dhorloge, car la qualit du signal analogique restitu en connecteur. Cette limite est exprime en fraction de la dure de la
dpend. trame AES3. Elle est de 5 % (pour un signal audio 48 kHz, cela

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 420 12 Techniques de lIngnieur
_________________________________________________________________________________________________ INTERFACES AUDIONUMRIQUES AES/EBU

Cble
110

A/D metteur

Horloge
VCO

Filtre D/A Dcodeur


Figure 12 Contrle de lhorloge locale de
lmetteur AES42

donne 1 s). Un rcepteur doit pouvoir se synchroniser sur le diffrence de structure entre les deux flux. Si tous deux apparais-
signal si lcart entre la rfrence et le signal reu reste infrieur sent comme des successions de bits cadence fixe, issus de
25 % de la dure de la trame AES3. lchantillonnage cadence fixe dun signal analogique, la structure
Dans le cas o le signal de rfrence audionumrique est temporelle sous-jacente est trs diffrente. Le signal vido est
construit partir dune horloge vido, un cart supplmentaire de constitu de lignes, spares par des intervalles de retour de ligne.
5 % de la trame est tolr entre la transition du signal vido Aprs numrisation, cette structure est respecte, et le flux num-
(correspondant au dbut de la ligne 1 de chaque image) et le dbut rique alterne entre le paquet doctets correspondant une ligne
du prambule Z du signal de rfrence audionumrique. Les tol- vido et un paquet doctets vides, correspondant aux retours de
rances, on le voit, sont assez troites. ligne. Cest dans ces paquets vides que sinsre le signal audio.
Une deuxime difficult vient des relations entre les trames
vido et les chantillons audio. Le rapport entre nombre de lignes
4.3 Synchronisation dhorloge AES42 vido par seconde et nombre dchantillons audio par seconde
nest pas un nombre entier. On ninsre donc pas toujours le mme
Nous en venons maintenant la trs importante question de la nombre dchantillons audio par ligne vido.
synchronisation des microphones numriques. Le standard AES42 Une troisime difficult vient de la prsence de donnes auxiliaires
propose un mode de fonctionnement sans synchronisation dans le signal audio, quil faut aussi insrer dans le signal vido. Et
(mode 1), dans lequel le microphone utilise sa propre horloge, ind- linsertion elle-mme engendre de nouvelles donnes de contrle
pendamment de celle de la console ou de lenregistreur ; la console dont le rcepteur a besoin pour savoir interprter et extraire les infor-
doit donc comporter un convertisseur de frquence dchantil- mations audio du flux vido.
lonnage (SRC : sample rate converter ). Les rticences de beaucoup
dutilisateurs face aux convertisseurs SRC ont amen lintroduction Nous montrons ci-aprs comment sont gres ces trois difficults
dun second mode de fonctionnement. Ce mode 2 incorpore un dis- dans un flux vido numrique 4:2:2 (norme UIT-R BT.656). Il nous
positif de synchronisation de lhorloge du microphone sur lhorloge faut dabord dcrire rapidement la structure du flux vido dans cette
de la console. Pour cela, le microphone numrique est pilot par un norme. Puis, nous voyons comment les donnes audio et auxiliaires
oscillateur contrl en tension (VCO) dont la tension est module sont insres dans le flux vido suivant la norme UIT-R BT.1305.
en fonction du mot de commande quenvoie la console (figure 12) : Dans un troisime temps, nous tudions les donnes qui contrlent
cette insertion. Nous concluons cette partie par une rflexion sur les
le dcodeur du microphone dtecte la commande de correction problmes que pose la synchronisation des divers flux audio avec
de synchronisation ; le flux vido, en particulier dans le cas des insertions multiples.
il transmet la valeur de la correction un convertisseur num-
rique-analogique ;
ce convertisseur en dduit une tension analogique qui pilote 5.1 Interface vido numrique BT.656
un VCO ;
la frquence de lhorloge que fournit ce VCO dpend de la Dcri vons tout dabord le flux numrique vido dans lequel
tension analogique en entre ; sinsrent les informations audio. Dans la norme BT.656-3, o les
le convertisseur ainsi que lmetteur AES3 se synchronisent signaux vido numriques sont de type 4:2:2 (quatre informations
sur cette horloge. de luminance pour deux informations dans chacun des deux canaux
Cela sous-entend que la console dtecte les carts de synchro- de chrominance), les informations vido sont transmises ligne par
nisation par un comparateur de phase : lensemble de lmetteur et ligne, chaque ligne reprsentant 864 chantillons de luminance (858
du rcepteur AES42 fonctionne en boucle ferme. Il constitue une dans le cas dun programme 525 lignes) et autant de chrominance,
boucle verrouillage de phase qui est stabilise par un compen- soit 432 chantillons pour CB , et autant pour C R . Les chantillons
sateur PID (proportionnel, intgral, diffrentiel) bien connu des sont regroups par paquets de 4, sous la forme {CB , Y, CR , Y} ; les
automaticiens. Les paramtres de ce compensateur sont fixs par trois premiers lments de chaque paquet concident dans limage,
le standard AES42. et le quatrime est isol.
Chaque chantillon est reprsent par un mot de 10 bits. Les
1 024 valeurs possibles ne sont pas toutes utilisables. En effet, la
norme prvoit que les quatre valeurs les plus faibles et les quatre
5. Insertion audio en vido les plus leves soient rserves pour des mots didentification des
donnes (ces valeurs se caractrisent par le fait que les 8 bits de
Lorsque lon souhaite insrer un flux audionumrique dans un poids fort sont tous 0 ou tous 1). Ne restent donc que
flux vido numrique, la premire difficult qui se prsente est la 1 016 valeurs possibles pour les chantillons.

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 420 13
INTERFACES AUDIONUMRIQUES AES/EBU _________________________________________________________________________________________________

Squence de rfrence temporelle SAV ou EAV 3FF 000 000 XYZ

C,Y,C,Y... EAV ADP, EDP, ADP, EDP... EAD SAV C,Y...

000 3FF 3FF 054


Lignes 8 et 320, ACP optionnel

C,Y,C,Y... EAV ACP ADP, EDP, ADP, EDP... EAD SAV C,Y...
Figure 13 Insertion des diffrents paquets
ancillaires dans une ligne vido

Lintervalle entre lignes vido successives est remplac par des audio (ADP) constituent un paquet de donnes tendues (extended
donnes de suppression numrique. Le dbut et la fin de la ligne data packet : EDP). Ce paquet doit suivre immdiatement lADP
vido sont marqus par deux groupes de quatre mots de donnes auquel il est associ. Cette dernire contrainte simplifie la recons-
(SAV start of active video au dbut, EAV end of active video truction des donnes au niveau du rcepteur.
la fin) ; en notation hexadcimale, ces deux blocs sont crits sous Linsertion de laudio dans le flux vido repose sur le choix de
la forme {3FF 000 000 XYZ} o les bits variables XYZ permettent de multiples options. Les paramtres choisis doivent tre transmis au
reprer le dbut ou la fin de trame et le dbut ou la fin de ligne rcepteur pour lui permettre le dcodage du flux reu. Cela se fait
active. Entre lEAV qui termine une ligne et le SAV qui commence par le biais dun paquet de commande audio (audio control packet :
la ligne suivante se trouve un bloc de 280 mots qui peut contenir ACP). Il sagit dun paquet ancillaire optionnel, qui ne peut tre
des donnes appeles ancillaires : ce sont soit des donnes audio, prsent que dans deux lignes vido (no 8 et no 320).
soit des donnes auxiliaires.
La figure 13 montre de quelle manire les diffrents types de
lintrieur du bloc de 280 mots peuvent se situer plusieurs paquets ancillaires sont insrs dans la ligne vido entre le groupe
paquets de donnes ancillaires. On les identifie par les quatre pre- de quatre mots qui clt la ligne vido active (EAV) et celui qui
miers mots : les paquets ancillaires commencent tous par un bloc ouvre la prochaine ligne vido active (SAV).
du type {000 3FF 3FF XYZ}, o le quatrime mot permet de reprer
le type des donnes. Les donnes ancillaires doivent commencer immdiatement
aprs le groupe EAV. On retrouve les trois types de donnes
ancillaires :
les paquets de donnes audio, reprsents dans cette
5.2 Insertion de paquets audio figure 13 par les lettres ADP ;
les paquets de donnes auxiliaires ou paquets de donnes
Rappelons que le flot AES/EBU transporte trois types de donnes : tendues, nots EDP, chaque paquet EDP suivant immdiatement
des donnes audio sur 20 bits ; le paquet ADP auquel il est associ ;
des donnes auxiliaires sur 4 bits (qui peuvent tre les 4 bits les paquets de commande audio, nots ACP. Un tel paquet ne
de poids faible dun chantillon audio sur 24 bits) ; peut figurer quune fois dans la trame vido, aux lignes 8/320 ; il
des donnes non audio dans les bits V, U et C ; est optionnel, mais sil est prsent, il doit prcder tous les autres
un bit de parit P ; paquets ancillaires et suivre directement lEAV.
un bit Z reprant le dbut des blocs dans le channel status C. On remarque aussi un quatrime type de paquet ancillaire, not
Privilgier linterprtation des 4 bits comme donnes auxiliaires EAD (end of ancillary data ), qui se limite au seul groupe de quatre
est typique du contexte broadcast o 20 bits sont considrs comme mots den-tte. Ce paquet signifie quil ny a plus de donnes ancil-
suffisants pour coder le signal audio. La norme UIT-R BT.1305 est laires dans le reste de la ligne vido en cours.
oriente par ce contexte : elle loge sparment les donnes auxi- Comment le rcepteur dtecte-t-il les limites des paquets ? Cest
liaires, quand bien mme elles sont les bits de poids faible des grce aux huit valeurs possibles des mots de contrle. Tout paquet
donnes audio. ancillaire commence par le groupe de 4 mots {000 3FF 3FF DID}, o
Dans la terminologie UIT-R BT.1305, une donne audio ( audio le mot DID slectionne le type de paquet (ADP, EDP, ACP ou EAD).
data ) est un paquet de bits correspondant un chantillon : le signal Ce mot sert aussi slectionner le groupe audio auquel appar-
est reprsent par 20 bits auxquels sajoutent les 3 bits dtat VUC. tiennent les donnes ancillaires. Par consquent, lintrieur des
Une donne audio est donc un mot de 23 bits. diffrents paquets ancillaires, seules sont permises les 1 016 valeurs
restantes, comme pour les chantillons vido. Cela signifie que la
La norme prvoit que lon puisse insrer jusqu 16 canaux reprsentation des donnes auxiliaires est trs contrainte ; disons-
audio dans un flux vido. Ces canaux sont regroups en quatre le, elle est plutt complique !
groupes audio (audio group ), chaque groupe contenant donc une
ou deux paires de canaux. Les groupes audio insrs dans la vido Voyons comment sinsre un chantillon audio. Dun ct, nous
sont numrots 1 4. avons cet chantillon sur 20 bits, plus les bits U, C, P, soit une
donne audio de 23 bits au total. De lautre ct, nous avons une
On a vu que le flux audio AES transmis sans discontinuit doit succession de mots de 10 bits, dont certaines valeurs sont interdi-
tre dcoup pour sinsrer dans les intervalles entre les lignes tes. Pour viter les valeurs interdites, la norme se contente de dci-
vido. Un bloc de donnes ancillaires contient souvent plusieurs der que le bit de poids le plus fort soit toujours choisi comme
chantillons audio successifs qui doivent appartenir aux canaux loppos du bit qui le suit immdiatement. Cest simple et robuste,
audio se situant dans un mme groupe audio. Ils constituent un mais peu efficace, car il ne reste plus que 512 valeurs possibles,
paquet de donnes audio (audio data packet : ADP). reprsentes sur les 9 bits restants. On voit quil faut trois mots
La mme logique de dcoupe en paquets sapplique aux autres successifs (soit 27 bits) pour recevoir une donne audio (23 bits),
donnes vhicules par le flux AES/EBU. Les donnes auxiliaires les quatre bits restants servent pour un bit de parit et deux bits
associes aux donnes audio faisant partie dun paquet de donnes codant le numro du canal audio dans son groupe mais aussi le bit

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 420 14 Techniques de lIngnieur
_________________________________________________________________________________________________ INTERFACES AUDIONUMRIQUES AES/EBU

0 3 4 7 8 27 31
Prambule AUX V U C P

20 + 3 bits de donnes

Checksum
AES 1, L AES 1, R AES 2, L
DBN
DID
DH

Canal 1 Canal 2 Canal 3


DC

X, X + 1, X + 2 X, X + 1, X + 2 X, X + 1, X + 2

Data Count : nombre de donnes


Data Block Number : numro du bloc de donnes
Data Identification : type de donnes
Data Header : en-tte 000 3FF 3FF Figure 14 Insertion des donnes audio
dans un paquet ancillaire ADP

0 3 4 7 8 27 31
Prambule AUX V U C P

4 bits de donnes
AUX AUX

Checksum
DBN
DID
DH

DC

Figure 15 Insertion des bits auxiliaires


dans un paquet de donnes tendues

Z. On rappelle que le numro du groupe est cod dans len-tte


ADP. La figure 14 montre linsertion des donnes audio extraites Tableau 3 Nombre dchantillons audio par trame vido
dune sous-trame AES/EBU.
La figure 14 montre aussi les autres mots prsents dans le Cadence Film PAL/SECAM 525 Mono NTSC
paquet ancillaire ADP. On trouve par ordre darrive : audio
(kHz) 24 im/s 25 im/s 30 im/s 30/1,001 im/s
les trois mots ouvrant un paquet ancillaire et valant
{000 3FF 3FF}, nots DH ;
32 4000/3 1280 3200/3 16016/15
le quatrime mot ouvrant le paquet ancillaire, not DID, qui
dfinit le type de paquet et le groupe audio ; 48 2000 1920 1600 8008/5
un mot dfinissant le numro du bloc de donnes (DBN) ;
un mot dfinissant le nombre de donnes prsentes dans ce 44,1 3675/2 1764 1470 147147/100
paquet (DC) ;
les chantillons audio raison de trois mots par chantillon ;
un mot de contrle de parit. respecter exactement ces rapports. On dit alors que lon se trouve
La figure 15 montre la construction dun paquet EDP. On dans le cas isochrone, par opposition au cas asynchrone.
retrouve les mmes lments que dans le paquet ADP. La seule dif- Le cas particulier du NTSC amne modifier dans un rapport
frence vient ensuite des mots contenant les bits auxiliaires : les 1/1,001 la frquence dchantillonnage audio, de manire se
paquets de quatre bits auxiliaires sont runis raison de deux par ramener aux rapports un peu plus simples figurant dans la colonne
mot du paquet EDP. 525 Mono. Si lon se trouve dans un cas isochrone o un nombre
(0)

entier dchantillons audio correspond plus dune trame vido,


on introduit le numro de trame audio (audio frame number ),
5.3 Contrle des trames audio et vido nombre (commenant 1) de la trame vido dans la squence
audio de trames. Quand la vido est 25 trames par seconde, une
Suivant les cadences de trames vido et la frquence dchan- trame vido contient toujours un nombre entier de donnes audio.
tillonnage audio, le nombre dchantillons audio par trames varie ; Quand la vido est une cadence de 29,97 trames par seconde, il
il peut mme ne pas tre entier. Le tableau 3 donne lquivalence faut plusieurs trames vido pour avoir un nombre entier dchan-
entre nombre de trames audio et nombre dimages pour le cinma tillons audio. Par exemple, si laudio est 48 kHz, il faut cinq tra-
et la tlvision. Lorsque la rfrence audionumrique est fabrique mes vido pour obtenir 8 008 chantillons audio ; le numro de
partir dune horloge vido, le signal de rfrence audio doit trame audio va alors de 1 5.

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 420 15
INTERFACES AUDIONUMRIQUES AES/EBU _________________________________________________________________________________________________

4:2:2 4:2:2
Insertion Dsinsertion
1 1
AES AES
2 2
3 3
AES AES
4 4
5 5
AES AES
6 6
7 7
AES AES
8 8
Figure 16 Insertion de quatre paires AES par
une cascade de quatre quipements

4:2:2 Traitement 4:2:2


4:2:2 vido numrique 4:2:2
insr insr
Dsinsertion Insertion
AES

AES

Signaux Signaux
synchrones asynchrones Figure 17 Perte de synchronisme audio-vido
du fait du traitement

Comme linsertion accepte galement des frquences dchan- chaque quipement nest capable dinsrer quune seule paire AES.
tillonnage ne faisant pas partie de la liste propose par le standard Le recours quatre quipements permet de raliser linsertion
AES/EBU, il faut aussi prciser cette frquence. Dans ce cas asyn- recherche, grce une mise en cascade des quipements. Le pro-
chrone, il est indispensable de transmettre le numro de trame blme qui surgit alors est le dcalage entre le flux audio entrant et
audio, pour permettre au rcepteur de rattraper le synchronisme celui qui a dj t insr. Si lon procde ensuite lextraction
entre les flux audio et vido. Ces donnes figurent dans le paquet comme il est montr sur la figure 16, les retards lextraction sont
de commande audio (ACP). Ce paquet est facultatif dans le cas iso- accrus. Pour quune telle cascade dinsertions fonctionne, il faut que
chrone 48 kHz. Il est obligatoire dans tous les autres cas. Chaque chacun travaille au moins au niveau I, cest--dire gre le retard.
groupe audio possde son propre paquet ACP. Le contenu du La figure 17 illustre un autre exemple de perte de synchronisme
paquet ACP fait apparatre dans lordre : entre audio et vido. Cest un schma trs classique, dans lequel
le numro de trame audio pour les voies 1-2 et 3-4 du on veut appliquer un traitement sur la vido. Si lquipement ne
groupe ; sait pas traiter laudio, il faut lextraire avant le traitement vido, et
la frquence dchantillonnage de chaque paire de canaux et rinsrer le signal audio aprs. Si les signaux sont synchrones la
leur ventuel asynchronisme ; sortie de lextracteur, ils ne le sont plus lors de la rinsertion. La
les canaux actifs dans le groupe ; solution consiste appliquer un retard sur le signal audio pour
le retard du traitement audio par rapport la vido, exprim compenser le retard pris par la vido.
en priodes dchantillonnage audio.
La structure de ce paquet ACP repose sur les mmes principes
utiliss dans la construction des paquets ADP et EDP : un en-tte
de quatre mots, les trois premiers qui permettent de dtecter une
commande, le quatrime mot dsignant le type de paquet et le
6. Conclusion et repres
numro de groupe, puis une suite de mots dont les valeurs sont
codes sur 9 bits, avec toujours un bit de poids fort oppos au bit
suivant pour viter les huit codes rservs aux commandes. Les La transmission de signaux audio entre quipements de studio
deux premiers de ces mots reprent le numro du bloc et la taille repose, on la vu, sur des normes nombreuses et enchevtres .
du paquet. Le paquet se termine par un contrle de parit. Le signal AES/EBU est un signal numrique deux canaux rgi par
les normes AES3, EBU Tech. 3250, ANSI S4.40, quivalentes entre
elles et la norme CEI 60958-3 (mode consommateur). La synchroni-
sation de plusieurs de ces signaux est dfinie dans les normes
5.4 Difficults pratiques : insertion AES11, EBU R83, ANSI S4.44. Un autre aspect de la synchronisation
multiple et dsynchronisation entre lquipement metteur et lquipement rcepteur est trait
dans la norme AES42 qui comporte aussi deux autres aspects : lali-
Pour conclure cette description de linsertion dun flux audio AES mentation via le cble et la remonte dinformation de rglage.
dans un flux vido numrique 4:2:2, nous nous penchons sur un Linsertion de flux audio AES dans un signal vido numrique est
problme pratique, celui du synchronisme entre les canaux AES traite dans les normes UIT-R BT.1305 et SMPTE 272M.
qui nest pas prserv par les insertions multiples. Dautres normes existent mais nont pas t traites ici, par
Le premier exemple est illustr par la figure 16. On y voit quatre exemple, la norme MADI (AES10) qui permet de regrouper jusqu
quipements dinsertion dun flux AES dans un flux vido, mais 56 canaux audionumriques en parallle.

Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 420 16 Techniques de lIngnieur

Вам также может понравиться