Академический Документы
Профессиональный Документы
Культура Документы
Centre Interuniversitaire de Recherche sur les Réseaux d'Entreprise, la Logistique et le Transport (CIRRELT)
Faculté des Sciences de l’Administration, Université Laval
G1V 0A6, Québec - Québec - Canada
Salma.Naccache@cirrelt.ulaval.ca, Benoit.Montreuil@cirrelt.ulaval.ca, Olivier.Labarthe@cirrelt.ulaval.ca,
Edith.Brotherton@cirrelt.ulaval.ca, Sehl.Mellouli@cirrelt.ulaval.ca
RESUME : Les jeux de simulation d’entreprise sont des outils d’apprentissage de la prise de décision tant en milieu
académique qu’en milieu professionnel. Le développement des versions électroniques de ces jeux fait appel aux
concepts issus de l’intelligence artificielle pour présenter des outils qui assistent intelligemment l’apprentissage de la
prise de décision. En particulier, le développement des comportements d’agents décisionnels pour les jeux de chaînes
d’approvisionnement est une issue de recherche en voie d’expansion. Dans cet article, nous présentons les
architectures des agents que nous avons développé pour le XBeerGame. Nous effectuons des simulations avec les
architectures implémentées afin d’en étudier la performance, en comparaison avec les performances obtenues par des
joueurs humains. Nous analysons la performance des agents selon différents coûts d’opération et en fonction de
plusieurs paramètres de simulation. Les résultats ainsi présentés permettent de mettre en lumière les points
d’amélioration à mettre en œuvre dans la définition des comportements d’agents décisionnels.
MOTS-CLES : Jeux d’affaires électroniques, Beer Game, XBeerGame, Plate-forme de simulations immersives et
participatives, Agents décisionnels, Comparaisons de performance joueurs humains et agents.
1
MOSIM’10 - 10 au 12 mai 2010 - Hammamet - Tunisie
2
MOSIM’10 - 10 au 12 mai 2010 - Hammamet - Tunisie
l’intelligence artificielle, notamment les agents Agent Competition - Supply Chain Management présente
décisionnels. une autre version à base d’agents décisionnels, (Collins
et al,. 2007). Il s’agit d’une compétition où chaque
2.2 Jeux de simulation orientés agents candidat crée un agent décisionnel et le fait concourir
dans un environnement prédéfini par la plateforme du
Les jeux de la bière utilisés à but de recherche jeu. La plateforme consiste en des mécanismes de
s’intéressent à l’analyse et la modélisation du marché, des politiques de coûts et une banque.
comportement des preneurs de décision. En particulier,
2.3 XBeerGame
les jeux orientés agents utilisent des modules logiciels
programmés afin de reproduire un comportement donné,
Le XBeerGame est la version étendue du jeu de la bière
pour interagir de manière autonome et proactive en
développée à l’Université Laval, Québec, Canada
réponse aux stimuli de l’environnement.
(Montreuil et al., 2009). Le jeu est implémenté sur la
Le jeu proposé dans (Nienhaus et al., 2006) peut être plate-forme BusinessWebGame développée par la même
joué par des humains et des agents simultanément. Le équipe, et qui permet à plusieurs joueurs de s’y
comportement des agents est géré par un algorithme qui connecter et y concourir simultanément, grâce à son
consiste à ce que chaque agent passe à son fournisseur architecture distribuée Il permet au maître de jeu de
les commandes reçues de ses clients. Les auteurs spécifier les informations à afficher aux apprenants, en
montrent que lorsque le jeu est joué uniquement par les fonction de leur niveau d’expertise et des objectifs
agents décisionnels, ces derniers réussissent à avoir de d’apprentissage. L’information est représentée dans des
meilleures performances que les humains dans des tableaux de bord, dont le cockpit principal qui est illustré
simulations aux paramètres identiques. Dans le cas de à la Figure 1. Celui-ci se compose de données
simulations mixtes (joueurs humains et agents), les opérationnelles, d’indicateurs de performance et d’outils
auteurs relèvent deux types de comportements extrêmes de prise de décision. Il résume les niveaux de stock des
des joueurs preneurs de décision, à savoir la stratégie de produits gérés et les niveaux des différents coûts
refuge (Safe harbour) et la stratégie de panique (Panic). affectés, etc. Les données sont surlignées de couleurs,
Dans (Kawagoe and Wada, 2005) une version du jeu utilisées comme indicateurs de la position opérationnelle
utilisant des agents logiciels est proposée. Le et financière de l’entreprise gérée par le joueur. Les
comportement des agents consiste à mettre à jour autres onglets / cockpits / panneaux contiennent divers
l’inventaire en fonction des quantités commandées de la graphiques indiquant notamment l’évolution des
part des clients et les quantités de marchandise reçues du différents revenus et coûts d’opération, ainsi que
fournisseur. Les agents livrent aux clients leurs l’historique des demandes.
commandes dans la mesure de leur inventaire. Les agents
Le XBeerGame implémente aussi une architecture
subissent des coûts d’arrérage si l’inventaire calculé
d’agents décisionnels. Par exemple, un joueur peut
n’est pas suffisant pour satisfaire toutes les commandes à
choisir d’activer un agent d’approvisionnement et de
la date promise. Grâce à ce jeu à base d’agents, les
paramétrer la politique de commande à appliquer pour
auteurs ont pu donner un contre exemple de l’effet coup
un produit donné. Dans ce cas, l’agent est un simple
de fouet. En particulier, en présence de longs délais de
exécutant de la politique dont les paramètres sont
livraison ainsi qu’un nombre élevé d’entreprises dans la
spécifiés par l’apprenant.
chaîne. Le système multi-agents DragonChain est
composé d’agents dont le comportement est implémenté
par un algorithme génétique, (Kimbrough, Wu and
Zhong, 2002).L’algorithme génère une population de
règles parmi lesquelles l’agent en choisit une selon un
score (fitness value) et l’applique jusqu’à la fin de la
ronde. Les auteurs ont comparé les résultats des agents
avec ceux d’étudiants de Bachelor et de MBA. Ils ont
montré que les agents sont capables de retrouver les
meilleures stratégies pour commander. Notons que dans
le cadre du DragonGame, peu d’hypothèses sur les
informations utilisées dans la simulation sont émises. Le
jeu du bois Québécois, (Moyaux et al., 2003), est une
adaptation numérique à base d’agents du jeu de plateau
Wood Supply Game (Fjeld, 2001). Chaque agent simule
le comportement d’une entreprise en décidant des
quantités à commander et du moment de leur commande.
Les auteurs présentent une architecture pour ces agents,
un aspect omis par les autres travaux. Les auteurs Figure 1: Cockpit XBeerGame (Montreuil et al., 2009)
montrent l’impact de l’architecture sur la réduction de
l’effet de coup de fouet en agissant sur une des quatre L’architecture permet d’expérimenter la performance de
causes présentées par Lee et al. (1997). Le jeu Trading l’adoption de ces différentes politiques, ceci en présence
3
MOSIM’10 - 10 au 12 mai 2010 - Hammamet - Tunisie
d’un patron de demande et de paramètres de revenus et fournisseur. Cette politique a été implémentée dans
de coûts spécifiés dans le patron de jeu par l’architecture des agents présentés dans (Nienhaus et al.,
l’administrateur. La limite des agents réside dans leur 2006). Les auteurs affirment que cette stratégie
dépendance face aux valeurs décidées par l’apprenant d’approvisionnement donne une meilleure solution que
ou le maître de jeu. A cet effet, une mise à jour de cette la stratégie basée sur le calcul de la moyenne mobile et
architecture est ici proposée afin de faire évoluer les l’écart type des demandes. Cependant, les hypothèses
agents du XBeerGame, allant de simples modules sous lesquelles ce comportement a été testé ne sont pas
d’automatisation des actions du joueur vers des outils présentées par les auteurs. Dans le présent article,
d’aide à la décision. l’impact de ce comportement dans différentes
configurations du jeu est testé, et ce en utilisant
3 AGENTS DU XBEERGAME différents scénarios de demande, ainsi que divers délais
d’acheminement de flux matériels d’un fournisseur à son
Cette section est consacrée à la proposition relative à client. Le diagramme d’états-transitions correspondant
l’évolution de l’architecture des agents décisionnels au est illustré dans la Figure 2.
sein de la plate-forme de simulation XBeerGame. Le
principe repose sur l’ajout d’un niveau de décision aux
comportements des agents d’approvisionnement. La
combinaison entre l’agent de décision et l’agent
d’approvisionnement d’un nœud donné de la chaîne,
constitue l’architecture de notre agent. Le comportement
de ce dernier s’établit comme suit :
L’agent de décision calcule les paramètres de la
politique d’approvisionnement à adopter (selon
son niveau de comportement).
Les paramètres sont communiqués à l’agent
d’approvisionnement.
Figure 2: Diagramme d’états-transitions N0
L’agent d’approvisionnement met à jour les
paramètres de la politique qu’il applique.
3.2 Niveau un
Un niveau de comportement correspond au niveau
d’expertise à affecter à l’agent d’approvisionnement. Le niveau un (N1) correspond au comportement d’un
L’implémentation intègre deux niveaux de joueur qui intègre l’information passée sur un court
comportement. Chaque niveau diffère par l’intégration horizon de temps. Il s’agit d’un agent disposant d’une
d’une information supplémentaire. La version actuelle de mémoire à court terme, qui intègre l’information sur les
l’agent implémente un niveau à la fois, la transition entre dernières commandes reçues en calculant la moyenne
les différents niveaux sera traitée dans de futurs travaux. mobile des demandes sur les n dernières périodes, ainsi
L’implémentation de différents niveaux de que l’écart type. Ces deux paramètres sont communiqués
comportement au sein de la plateforme correspond à la à l’agent d’approvisionnement qui implémente une
représentation de différents niveaux d’apprentissage. Ces politique de stock s, S. Le diagramme d’états-transitions
niveaux sont efficaces dans certains contextes et peu ou correspondant à N0 est illustré dans la Figure 3.
pas efficaces dans d’autres, et ce afin de sensibiliser les Afin de tester la performance des deux niveaux de
apprenants à l’importance de l’adaptabilité aux différents comportement, contrairement aux travaux précédemment
contextes informationnels des entreprises. Il ne s’agit pas évoqués dans notre revue de la littérature, la recherche
ici de donner les meilleurs comportements et de ici rapportée ne focalise pas sur l’analyse des profits
marginaliser les moins performants, mais plutôt réalisés par les agents, mais plutôt sur l’analyse des coûts
présenter des outils qui intègrent de manière progressive qu’engendrent leurs décisions et sur l’impact de
différents types d’informations pour en appréhender performance de la chaîne.
l’impact sur la prise de décision et la performance de
l’individu ou de la chaîne. 4 SIMULATIONS ET RESULTATS
4
MOSIM’10 - 10 au 12 mai 2010 - Hammamet - Tunisie
l’Université Laval. A cet effet, les agents ont disposé des premier jour du tournoi, chaque joueur gérait le détaillant
mêmes paramètres que les différentes simulations jouées de la chaîne, alors que les trois autres rôles étaient tenus
par les étudiants. par des agents logiciels. Chacun de ces agents
implémente une politique de stock s, S.
Usine Distributeur Grossiste Détaillant
5
MOSIM’10 - 10 au 12 mai 2010 - Hammamet - Tunisie
Dans les rondes suivantes, les équipes étaient constituées communication entre les joueurs n’était permise. Pour
uniquement de joueurs humains. chacune des parties individuelles correspondantes aux
Ronde Objectfis Visibilité Historique Clavardage Délais (Jours)
rondes 1.1, 1.2, 1.3, 1.4, la performance des agents est
du rôle demande comparée en les positionnant par rapport à la meilleure
1.1 max. profit non par défaut
indiv. valeur, la pire valeur et la valeur moyenne de coûts des
1.2 max. profit non tr. de Gr. à Det. : 10 joueurs humains, et ce pour chaque type de coût. Pour ce
indiv.
faire, pour chaque comportement d’agent i ∊ {N0,N1} et
1.3 max. profit non pdt Calore: 10
indiv. pour chaque ronde t, le rapport est calculé avec
1.4 max. profit
indiv.
non X pdt Igloo: 14
∊ {meilleure performance, pire performance,
2.1 max. profit non pdt Igloo: 16 performance moyenne} de la manière suivante :
indiv. pdt Calore: 8
2.2 max. profit non X pdt Igloo: 3
indiv. pdt Calore: 7
2.3 max. profit non X pdt Igloo: 7
indiv. pdt Calore: 3
2.4 max. profit non pdt Igloo: 4
indiv. pdt Calore: 8
3.1 max. profit oui X par défaut
indiv.
3.2 max. profit oui X X tr. de Usn. à Dist. : 21
indiv.
4.1 max. profit oui X X tr. de Usn. à Dist. : 14 avec le montant obtenu par i pour le coût k ∊
chaîne
4.3 max. profit oui X X tr. de Usn. à Dist. : 14 {Arrérages, Transport, Stockage, Achat} à la ronde t,
chaîne tr. de Dist. à Gr. : 7 le montant obtenu par l’humain ou l’équipe humaine
Légende
j. Les proportions pour la journée 1 sont
rapportées dans le Tableau 3.
max. : maximiser Usn. : usine
indiv. : individuel Dist. : distributeur Dans les tableaux de performance, nous avons coloré
tr. : transport Gr. :grossiste
pdt. :production Det. : détaillant chaque triplet de proportions selon la qualité de la
Tableau 2: Paramétrages des rondes du tournoi performance de l’agent. Nous avons utilisé le bleu clair
pour une excellente performance ( tend
Tel que décrit au Tableau 2, de ronde en ronde, des outils vers zéro), le vert pour une bonne performance
de communication entre les joueurs étaient rajoutés et les ( ), le jaune pour une faible
contextes collaboratifs étaient altérés. Par exemple à la
performance ( 0 mais
ronde 3.1, les joueurs ont accès à une interface de
tendent vers zéro) et le
clavardage pour communiquer avec leurs nœuds
adjacents dans la chaîne. À partir de 4.1, les joueurs rouge pour une mauvais performance ( , ).
visent à optimiser le profit total de la chaîne, et non plus t =1.1 t =1.2 t =1.3 t =1.4
leur profit individuel, sous-entendant le passage vers une k p usine i =N0 i =N1 i =N0 i =N1 i =N0 i =N1 i=N0 i=N1
chaîne intégrée. meilleure 0,39 0,99 0,85 0,44 1,19 3,27 4,47 5,53
Arrérages pire 0,09 0,22 0,16 0,08 0,32 0,87 4,12 5,09
moyenne 0,19 0,48 0,39 0,20 0,50 1,37 4,21 5,20
4.2 Analyse des résultats meilleure 0,01 0,01 2,50 3,26 1,04 1,06 0,85 0,86
Transport pire 0,00 0,00 1,05 1,38 0,97 0,99 0,83 0,84
La recherche ici rapportée a simulé les rondes du tournoi moyenne 0,01 0,01 1,29 1,68 1,00 1,02 0,83 0,84
explicitées en section 4.1 en remplaçant les joueurs meilleure 0,30 0,23 0,24 0,47 1,57 0,38 0,61 0,30
Stockage pire 0,07 0,05 0,07 0,15 0,23 0,06 0,30 0,15
humains par des agents avec le comportement N0 dans 0,16 0,12 0,15 0,29 0,59 0,14 0,39 0,19
moyenne
un premier temps, ensuite avec le comportement N1 tel meilleure 1,05 1,05 1,71 2,18 0,77 0,76 0,57 0,56
que décrits en section 3. Dans les travaux présentés à la Achat pire 0,99 0,99 0,80 1,01 0,76 0,74 0,57 0,56
sous-section 2.2, les auteurs ont comparé les moyenne 1,01 1,01 0,92 1,18 0,77 0,75 0,57 0,56
6
MOSIM’10 - 10 au 12 mai 2010 - Hammamet - Tunisie
capacité maximale. À la ronde 1.4 les agents N0 ont Pendant les rondes de la journée 3 (3.1 et 3.2) les joueurs
réussi à avoir de meilleures performances que les joueurs pouvaient établir une stratégie de manière individuelle
humains sur les coûts de transport, de stockage et avant le début de la simulation.
d’achat, alors que les coûts d’arrérages sont quatre fois t =2.1 t =2.2 t =2.3 t =2.4
plus élevés. Ces derniers peuvent être expliqués par le k p individus i =N0 i =N1 i =N0 i =N1 i =N0 i =N1 i =N0 i =N1
grand délai de livraison de la première catégorie de meilleure 0,65 1,55 0,03 3,93 0,07 0,75 1,09 5,39
produit de l’usine vers le distributeur qui est de 14 jours, Arrérages pire 0,06 0,14 0.0005 0,07 0,01 0,05 0,01 0,07
alors que dans les rondes 1.1, 1.2 et 1.3 le délai était de 4 moyenne 0,17 0,41 0.0015 0,20 0,02 0,19 0,06 0,31
meilleure 1,54 1,56 2,44 2,13 1,55 1,52 2,24 2,47
jours. N1 a donné moins de coûts de stockage que les
Transport pire 0,08 0,08 0,12 0,11 0,17 0,16 0,22 0,24
joueurs humains et que N0, au niveau des rondes 1.1, 1.3 moyenne 0,25 0,26 0,44 0,38 0,35 0,34 0,45 0,49
et 1.4. La Figure 7 présente un histogramme comparatif meilleure 0,55 0,12 2,77 0,43 0,58 0,30 0,54 0,48
entre les meilleurs, les pires profits et les profits moyens Stockage pire 0,01 0,002 0,03 0,004 0,01 0,01 0,06 0,05
des joueurs humains et des agents, et ce à travers les moyenne 0,06 0,01 0,17 0,03 0,07 0,04 0,16 0,14
meilleure 0,87 0,84 0,95 0,60 0,57 0,57 1,49 1,54
rondes de la journée 1. Achat 0,18 0,18 0,17 0,11 0,14 0,14 0,32 0,33
pire
moyenne 0,30 0,29 0,27 0,17 0,22 0,21 0,53 0,55
Notons que pendant les journées 2, 3 et 4 du tournoi joué
par les joueurs humains, les équipes ont été constituées Tableau 4: journée 2
de joueurs humains seulement. Les simulations des
rondes de ces journées ont été opérées par une équipe 5 000 000,00
d’agents de comportement niveau zéro, ensuite une
équipe d’agents de comportement niveau un et nous en 0,00
2.1 2.2 2.3 2.4 Meilleur profit humain
avons recueilli les performances dans les différentes
Pire profit humain
rondes de ces trois journées. -5 000 000,00
Profit moyen humain
Profit agent zero
1 000 000,00 -10 000 000,00
Profit agent un
0,00
1.1 1.2 1.3 1.4 Meilleur profit -15 000 000,00
-1 000 000,00
humain
-2 000 000,00
Pire profit humain
-3 000 000,00 -20 000 000,00
Profit moyen
-4 000 000,00
humain Figure 8: Profits/pertes réalisés journée 2
-5 000 000,00 Profit agent zero
-6 000 000,00 De plus, les joueurs ont eu accès à une interface de
Profit agent un
-7 000 000,00 clavardage qui leur permettait de communiquer
-8 000 000,00
librement avec leurs nœuds adjacents dans la chaîne
-9 000 000,00
d’approvisionnement. Pendant ces rondes les joueurs
Figure 7: Profits/pertes de journée 1 avaient une visibilité complète sur la constitution de la
chaîne. Le but à travers les rondes de la journée 3 était
Le but à travers les rondes de la journée 2 (2.1, 2.2, 2.3 d’améliorer les performances individuelles des joueurs à
et 2.4) était aussi de développer les performances travers la collaboration avec les nœuds adjacents.
individuelles des joueurs. Dans le Tableau 4, nous Dans le Tableau 5, nous rapportons les de la
rapportons les respectivement pour N0 et N1 pour journée 3. Nous constatons que pour N0, l’agent a eu de
les rondes de la journée 2. L’indice j dans meilleurs coûts de stockage que les joueurs humains et
correspond aux individus ayant joué les rondes des ce pour les deux rondes de la journée 3, par contre pour
journées 1, 2 et 3. Pour la journée 4, les j correspondent les coûts d’arrérage, de transport et d’achat, N0 a obtenu
aux indices des individus de chaque rôle, ainsi qu’aux des coûts d’achat qui sont meilleurs que les coûts d’achat
indices des équipes d’humains. moyens des joueurs humains, mais qui sont moins bons
que leurs meilleurs coûts. Par contre, l’agent N1 a réalisé
A travers le Tableau 4 nous constatons que le
de meilleurs coûts de stockage et de transport que l’agent
comportement N0 donne de meilleurs coûts d’arrérages,
N0 et ce pour les deux rondes 3.1 et 3.2. Aussi N1 a eu
de stockage et d’achat que les acteurs humains, par
de meilleurs coûts d’arrérages et d’achat pour la ronde
contre les coûts de transport obtenus par cet agents se
3.1. Le positionnement des profits de chacun des agents
trouvent meilleurs que la moyenne obtenue des coûts de
pour les rondes 3.1 et 3.2 sont illustrés par le graphique
transport obtenus par les humains. Nous émettons les
de la Figure 9.
mêmes observations pour N1. Lors de la journée 2, N0
a obtenu de meilleurs coûts d’arrérages que N1, N1 a
obtenu de meilleurs coûts de stockage que N0, et les 4.2.2 Résultats des parties en équipes
deux agents ont eu des coûts de transport et de stockage,
qui sont en moyenne similaires.La figure 8 présente une Les rondes des journées 1, 2 et 3 visaient à renforcer
comparaison entre les différents profits de la journée 2 l’apprentissage individuel des joueurs. Les rondes de la
obtenus par les agents humains et artificiels. journée 4 ont eu pour but d’apprendre aux joueurs à
collaborer ensemble pour mener à bien leurs opérations.
7
MOSIM’10 - 10 au 12 mai 2010 - Hammamet - Tunisie
200 000,00
-6 000 000,00
100 000,00
-8 000 000,00 0,00 Meilleur profit humain
-100 000,00 4.1 4.3
Figure 9: Profits/pertes journée 3 Pire profit humain
-200 000,00 Profit moyen humain
Pendant les rondes de la journée 4 (4.1 et 4.3), en plus de -300 000,00
Profit agent zero
la possibilité de communiquer, les joueurs avaient accès -400 000,00
Profit agent un
à l’information historique sur les distributions des -500 000,00
-600 000,00
demandes des deux produits et pouvaient établir une
-700 000,00
stratégie en groupe avant le début de la simulation.
Notons que pendant les rondes 4.1 et 4.3, les joueurs Figure 10: Profits/pertes usines journée 4
sont autorisés à communiquer directement ainsi que de
t =4.1 t =4.3
communiquer par vidéo conférence avec des joueurs k p dis tr. i =N0 i =N1 i =N0 i =N1
distants situés à Québec. meilleure 78,85 229,29 100,05 22,68
Arrérages pire 6,77 19,69 8,69 1,97
Dans un second temps, nous nous sommes intéressés à moyenne 18,33 53,31 15,99 3,62
analyser l’impact des comportements d’agents sur la meilleure 1,94 1,19 2,50 0,35
performance globale des équipes pour chaque journée de Trans port pire 1,76 1,08 1,13 0,16
moyenne 1,84 1,13 1,40 0,20
jeu. A cet effet, nous comparons les coûts obtenus par les meilleure 0,18 0,12 2,01 1,54
agents par rôle et par équipe. Dans les Tableaux 6 à 9, Stockage pire 0,05 0,03 0,27 0,21
nous rapportons les de la journée 4, et ce par rôle moyenne 0,09 0,06 0,41 0,31
meilleure 1,01 0,84 5,00 1,06
joué. Le tableau 10 présente ces proportions par équipes.
Achat pire 0,91 0,76 2,05 0,43
Notons que les usines ont des coûts d’arrérages nuls. moyenne 0,95 0,79 2,61 0,55
Chacune des figures 8 à 11 illustrent pour un rôle donné Tableau 7: distributeurs N0 et N1 journée 4
dans la chaîne une comparaison entre les profits ou
pertes obtenus par les agents et les humains au cours des Dans le présent travail de recherche nous avons étudié
rondes 4.1 et 4.3. La comparaison entre profits des les deux comportements d’agents dans différentes
équipes pour ces deux rondes et illustrée dans la Figure configurations en agissant sur plusieurs paramètres du
14. jeu. De plus, notre analyse de la performance des agents
a été plus granulaire dans le sens où nous l’avons
D’après ces résultats, les agents N1 ont eu de meilleures évaluée en termes de différents coûts, ce qui nous a
performances que les joueurs humains, ainsi que les permis de détecter quel est l’impact de chaque
agents N0, et ce en termes de coûts de stockage et comportement sur chaque coût dans différentes
d’achat, que ce soit pour les coûts par rôle, ou les coûts configurations de la simulation. Notons que les agents
par équipe pour les rondes 4.1 et 4.3. Ces agents ont ont eu de meilleures performances que les humains
aussi obtenu les meilleurs coûts de transport à la ronde pendant les 1ère, 2ème et 3ème journées de jeu, tandis que
4.3. Les agents N0 ont eu de meilleurs coûts de stockage pour la 4ème journée ils ont obtenus de mauvaises
que les joueurs humains, que ce soit par rôle ou par performances, notamment au niveau des coûts
équipe, et ce pour la ronde 4.1. Pour la ronde 4.3, ces d’arrérage. Ceci s’explique par le fait que les joueurs
coûts ont été meilleurs que la moyenne des coûts des humains ont pu tirer profit du contexte collaboratif de
joueurs humains, mais n’ont pas dépassé les meilleurs ces rondes et ont obtenu de bonnes performances au
coûts qu’ils ont réalisés et ce pour les agents N1 de rôles niveau de leur chaîne, chose non réalisable par les
8
MOSIM’10 - 10 au 12 mai 2010 - Hammamet - Tunisie
9
MOSIM’10 - 10 au 12 mai 2010 - Hammamet - Tunisie
Notre analyse plus granulaire de la performance, nous a Fjeld D. E., 2001. The Wood Supply Game as an
permis de nous rendre compte que les agents educational application for simulating dynamics in
décisionnels implémentés dans le XBeerGame doivent the forest sector. Supply Chain Management for
avoir des comportements qui agissent sur plusieurs Paper and Timber Industries, Växjö, Suède, p. 241-
paramètres pour en améliorer les performances. A cet 251.
effet, nous nous intéresserons dans nos futurs travaux à
Hofstede G. J., M. Kramer, S. Meijer and J. Wijdemans,
la conception de comportements qui prennent des
2003. A Chain Game for Distributed Trading and
décisions d’approvisionnement en tenant compte des
Negotiation. Production Planning & Control, 14, p.
différents critères de coûts. Cette évolution du
111-121.
comportement nécessiterait des architectures d’agents
plus complexes, incluant notamment un module Huang G.Q., S.K. Lau and K.L. Mak, 2003. The impacts
d’apprentissage. of sharing production information on supply chain
dynamics: a review of the literature. International
De plus, les comportements d’agents décisionnels du
Journal of Production Research, 41, 1483-1517.
XBeerGame ne doivent être génériques, mais doivent
s’adapter à leur contexte de prise de décision. A cet effet, Jacobs F. R., 2000. Playing the beer distribution game
ces agents artificiels doivent être en mesure d’identifier over the Internet. Production and Operations
le contexte sémantique des différentes informations qui Management, 9, p. 31-39.
sont diffusées dans l’environnement du jeu.
Kawagoe T. and S. Wada, 2005. A Counterexample for
En effet, des agents qui seront capables de déceler le the Bullwhip Effect. Proceedings of Gaming and
contexte des informations, pourront en détecter celles qui Multiagent Simulations IEEE/WIC/ACM
sont pertinentes et seront capables par la suite d’ajuster Inernational. Conference on Intelligent Agent
leur comportement en conséquent en choisissant une Technology, p. 124-127.
politique d’approvisionnement appropriée, ou en en
Kimbrough S. O., D.J. Wu and F. Zhong, 2002.
modifiant les paramètres.
Computers play the Beer Game: Can artificial agents
Le défi de mettre en place des agents décisionnels dotés manage supply chains? Decision Support Systems,
de capacités d’interprétations sémantiques, requiert la 33, p. 323-333.
construction d’ontologies du domaine de prise de
Lee L. H., V. Padmanabhan and S. Whang, 1997. The
décision et l’utilisation d’outils d’extraction
Bullwhip Effect in Supply Chains. Sloan
d’information, ainsi que des algorithmes de
Management Review, Spring 1997, p. 93-102.
classification. Nous pensons que la combinaison de ces
outils avec des modèles issus de la littérature relative à la Montreuil B., E. Brotherton, O. Labarthe et A. Morneau,
conception des chaînes logistiques permet de modéliser 2009. XBeerGame: simulations participatives pour le
un comportement d’agent réactif à l’environnement, dans pilotage et l'analyse de chaînes logistiques. Actes de
une tentative de reproduire un comportement de décideur du 8ème Congrès international de génie industriel,
humain dans le contexte de la gestion des opérations des Bagnères de Bigorre, France.
chaînes logistiques.
Moyaux T., B. Chaib-draa and S. D'Amours, 2003.
REMERCIEMENTS Agent-Based Simulation of the Amplification of
Demand variability in a Supply Chain. Proceedings
Nous tenons à remercier la Chaire de recherche du of the 4th workshop on Agent-Based Simulation,
Canada en Ingénierie d’Entreprise et le programme de Montpellier, France.
subventions à la découverte du Conseil de recherche en
Nienhaus J., A. Ziegenbein and P. Schoensleben, 2006.
Sciences et Génie pour leur support à cette recherche.
How human behaviour amplifies the bullwhip effect.
Nous remercions aussi le professeur Rémy Glardon et
son équipe à l‘ÉPFL pour leur collaboration dans A study based on the beer distribution game online.
l’acquisition des résultats du tournoi. Production Planning & Control, 17, p. 547-557.
Sterman J.D., 1989. Modeling managerial behavior:
misperceptions of feedback in a dynamic decision
making experiments. Management Science, 35, p.
REFERENCES
321-339.
Chen F. and R. Samroenraja, 2000. The stationary Beer Toyli J., S.O. Hansen and R. Smeds, 2006. Plan for
Game. Production and Operations Management, vol. profit and achieve profit: Lessons learnt from a
9, p.19-30. business management simulation. Production
Planning & Control, 17, p. 584-595.
Collins J., R. Arunachalam, N. Sadeh, J. Eriksson, N.
Finne and S. Janson, 2007. The Supply Chain
Management Game for the 2007 Trading Agent
Competition. Carnegie Mellon Technical Report,
CMU-ISRI-07-100.
10