Evaluation Et Optimisation Des Systemes

8e Conférence Internationale de MOdélisation et SIMulation - MOSIM’10 - 10 au 12 mai 2010 - Hammamet - Tunisie
« Evaluation et optimisation des systèmes innovants de production de biens et de services »
SIMULATIONS PARTICIPATIVES DU XBEERGAME:

COMPARAISONS DES PERFORMANCES
ENTRE JOUEURS HUMAINS ET AGENTS DECISIONNELS
S. NACCACHE, B. MONTREUIL, O. LABARTHE, E. BROTHERTON, S. MELLOULI
Centre Interuniversitaire de Recherche sur les Réseaux d'Entreprise, la Logistique et le Transport (CIRRELT)
Faculté des Sciences de l’Administration, Université Laval
G1V 0A6, Québec - Québec - Canada
Salma.Naccache@cirrelt.ulaval.ca, Benoit.Montreuil@cirrelt.ulaval.ca, Olivier.Labarthe@cirrelt.ulaval.ca,
Edith.Brotherton@cirrelt.ulaval.ca, Sehl.Mellouli@cirrelt.ulaval.ca
RESUME : Les jeux de simulation d’entreprise sont des outils d’apprentissage de la prise de décision tant en milieu
académique qu’en milieu professionnel. Le développement des versions électroniques de ces jeux fait appel aux
concepts issus de l’intelligence artificielle pour présenter des outils qui assistent intelligemment l’apprentissage de la
prise de décision. En particulier, le développement des comportements d’agents décisionnels pour les jeux de chaînes
d’approvisionnement est une issue de recherche en voie d’expansion. Dans cet article, nous présentons les
architectures des agents que nous avons développé pour le XBeerGame. Nous effectuons des simulations avec les
architectures implémentées afin d’en étudier la performance, en comparaison avec les performances obtenues par des
joueurs humains. Nous analysons la performance des agents selon différents coûts d’opération et en fonction de
plusieurs paramètres de simulation. Les résultats ainsi présentés permettent de mettre en lumière les points
d’amélioration à mettre en œuvre dans la définition des comportements d’agents décisionnels.
MOTS-CLES : Jeux d’affaires électroniques, Beer Game, XBeerGame, Plate-forme de simulations immersives et
participatives, Agents décisionnels, Comparaisons de performance joueurs humains et agents.
d’entreprise, mais aussi comme outils de simulation et

1 INTRODUCTION d’expérimentation. À travers la conduite de nombreuses
expériences, ils permettent d’évaluer différents
Les jeux sont utilisés depuis l’antiquité à des fins comportements face à certains contextes simulés
d’apprentissage ludique. Leur nature, leurs supports et d’entreprise, qui reflètent des cas particuliers de prise de
leurs objectifs évoluent sans cesse pour devenir des décision. Ainsi, les jeux de simulation d’entreprise
outils d’apprentissage de la prise de décision dans des s’inscrivent comme outils de recherche grâce à la
contextes variés, comme le démontre le nombre croissant simulation. Les paramètres de l’environnement de prise
de conférences internationales en relation avec ce sujet. de décision sont contrôlables par l’administrateur du jeu.
L’aspect caractéristique de ces jeux est l’abstraction de Dans ce contexte, la simulation favorise l’étude des
la réalité. Cette abstraction est faite à travers des comportements des apprenants selon différentes
artéfacts qui représentent des composantes faisant partie configurations de l’environnement. Les simulations
de situations réelles de prise de décision. Les jeux de permettent d’observer les phénomènes qui découlent de
simulation constituent un moyen pour former les ces comportements, lesquels reflètent ceux observables à
décisionnaires en environnement artificiel, afin d’avoir beaucoup plus grand effort dans des contextes réels. Par
conscience de l’impact de leurs décisions, sans pour exemple, dans le cadre des jeux de simulation des
autant subir des répercussions réelles. chaînes d’approvisionnement, notamment dans le jeu de
la bière, Sterman a pu observer le phénomène de l’effet
Les jeux de simulation d’affaires s’inscrivent comme des coup de fouet. Cet effet correspond à une amplification
outils d’apprentissage de la prise de décision, et ce dans de la variance de la demande au fur et à mesure que l’on
de multiples contextes de gestion d’entreprise. Il s’agit remonte dans la chaîne d’approvisionnement, (Sterman,
d’outils qui permettent aux apprenants de s’immerger 1989). La prise de conscience de l’existence de ce
dans différents contextes, les obligeant à prendre phénomène a permis de proposer des modèles de gestion
dynamiquement un ensemble de décisions afin d’approvisionnement qui tentent de le réduire.
d’optimiser leur performance. Le nombre et la
complexité des données fournies pendant le jeu La présente recherche focalise sur le jeu de la bière qui
influencent la structure et la présentation du jeu. En effet, est un jeu de simulation de chaînes d’approvisionnement,
ces jeux existent sous forme de jeux de plateau ainsi que ainsi que ses extensions.. La problématique repose sur la
sous forme de jeux électroniques. modélisation orientée agents des comportements de
preneurs de décision dans une chaîne logistique. Une
Les jeux de simulation d’entreprise ont un double rôle. architecture d’agents décisionnels est proposée afin
Ils sont utilisés pour l’apprentissage de la gestion
1
MOSIM’10 - 10 au 12 mai 2010 - Hammamet - Tunisie
d’implémenter différents comportements de prise de 2.1 Versions électroniques du jeu de la bière

décision. Les agents représentent les gestionnaires des
entités composant les chaînes d’approvisionnement. Le Stationary Beer Game est une variante du Beer
Lorsqu’ils adoptent un comportement et émettent une Game développée en Visual Basic, (Chen and
décision, celle-ci est considérée comme étant un des Samroengraja, 2000). Dans ce jeu, l’apprenant accède à
évènements discrets qui dirigent la dynamique de un historique de la demande. Selon les auteurs, cette
l’environnement de la simulation. De plus, les agents version électronique présente des avantages aussi bien
développés peuvent être activés par les joueurs. Ainsi, pour l’apprenant que pour les enseignants. Les
l’administrateur du jeu décide à quel niveau chaque apprenants ne sont plus encombrés par la gestion d’un
agent va aider ou remplacer un joueur. Ce niveau varie ensemble de jetons, le suivi de la situation de leur stock
de la suggestion d’une solution pour assister l’apprenant, et de leurs coûts. Les informations nécessaires au jeu
jusqu’à la prise de décision automatique sans son sont agencées dans des interfaces. Les instructeurs
intervention. Les agents sont donc utilisés dans ce peuvent se décharger du contrôle et du suivi des joueurs,
contexte comme outils d’aide à la décision décision ou ainsi qu’ajuster le déroulement du jeu en fonction de
comme comparatif de performance lorsqu’ils gèrent la leurs rétroactions. Le jeu devient un outil
chaine en mode autonome. d’expérimentation que les auteurs visent à utiliser
comme un laboratoire virtuel. Une version jouable en
La suite de l’article est structurée comme suit. La section
ligne au moyen d’un navigateur web est introduite par
2 décrit le jeu de la bière et présente certaines versions
Jacobs (2000). Cette version web permet d’avoir des
informatisées et extensions du jeu. Elle décrit notamment
équipes plus hétérogènes, avec des joueurs de différents
le XBeerGame qui sera utilisé pour implémenter et tester
l’architecture des agents. Dans la section 3, l’architecture pays qui interagissent via la même partie, ayant ainsi
d’agent développée est décrite ainsi que les deux une expérience plus variée et comprenant les
mécanismes de la gestion internationale. Un autre jeu qui
modèles décisionnels implémentés. Afin de tester la
tient en compte l’aspect d’apprentissage des relations
performance de ces comportements, la section 4 est
internationales est le SIMBU, (Toyli et al. 2006). Les
consacrée à la conception des tests et à l’analyse des
résultats associés. Enfin, la section 5 conclut cet article, joueurs gèrent les demandes de quatre produits de
en dressant une synthèse des contributions et en clientèles internationales provenant de trois pays. Les
joueurs doivent aussi considérer les composantes de
présentant une ouverture sur les avenues de recherche.
produits et les devises étrangères. Hofstede et al. (2003)
proposent un jeu décentralisé qui s’inspire du Beer
2 LE JEU DE LA BIERE (BEER GAME)
Game. Cependant, les chaînes d’approvisionnement
s’inscrivent dans le domaine de l’agro-alimentaire. Cette
Cette section est dédiée à la présentation des jeux de
variante du jeu conditionne la gestion de la qualité et
simulation de gestion de chaînes d’approvisionnement.
l’aspect périssable des marchandises. Les versions
Cette catégorie de jeux connaît un essor croissant pour
complètement informatisées des jeux d’entreprise ont
l’enseignement universitaire et dans le cadre de
redéfini les objectifs d’apprentissage. L’apprenant ne se
formation de personnel spécialisé dans la gestion des
limite plus à la gestion des flux matériels mais il se
opérations. Les jeux les plus populaires appartenant à
focalise aussi sur l’analyse de l’information et son
cette catégorie sont issus du jeu de la bière, connu sous
exploitation. Aussi ces versions du jeu, ont projeté
le nom initial de MIT Beer Distribution Game, ou
l’apprenant d’un milieu d’apprentissage, restreint aux
simplement Beer Game. Ce jeu repose sur le contrôle
membres d’une chaîne collaborative, vers un milieu
d’un des quatre rôles d’une chaîne d’approvisionnement
virtuel ouvert pour mettre en pratique les capacités de
linéaire simple, à savoir une usine, un grossiste, un
communication et de gestion des relations d’affaires dans
distributeur et un détaillant. Chaque rôle passe des
un milieu hétérogène. Les jeux informatisés sont
commandes et répond à la demande de ses clients en
devenus des outils d’expérimentation aux objectifs
fonction des produits en inventaire. Ce jeu a été
multiples. D’un côté ils permettent d’étudier le
développé par le System Dynamics Group au MIT Sloan
comportement des apprenants plus facilement, en ayant
School of Management sous la direction de Jay Forrester
des données compilées et affichées de manière
au début des années soixante. Les versions électroniques
interactive. Ce suivi combiné avec une facilité de
inspirées du Beer Game ont été essentiellement
paramétrage permet aux instructeurs d’agir sur le cours
exploitées pour rendre le jeu de plateau moins
des jeux. Plus encore, l’expérimentateur peut tester des
contraignant pour l’initialisation, plus ergonomique,
hypothèses en paramétrant les jeux avec des variables
facilitant ainsi l’apprentissage des étudiants. Dans ces
statiques (coûts fixes, délais de livraison, etc.) ainsi
versions évoluées l’accent est mis sur l’apprentissage de
qu’étudier l’impact du partage d’information (Huang et
transfert de flux matériels ainsi que sur l’exploitation des
al. 2003).
flux d’information, et ce grâce à différentes informations
affichées sur l’interface du jeu. Le développement des technologies de l’information,
l’amélioration des outils informatiques, couplés d’une
prolifération des différents outils qu’offre l’intelligence
artificielle, amène à faire un lien direct entre les jeux
d’entreprise intégrant la simulation et les paradigmes de
2
l’intelligence artificielle, notamment les agents Agent Competition - Supply Chain Management présente
décisionnels. une autre version à base d’agents décisionnels, (Collins
et al,. 2007). Il s’agit d’une compétition où chaque
2.2 Jeux de simulation orientés agents candidat crée un agent décisionnel et le fait concourir
dans un environnement prédéfini par la plateforme du
Les jeux de la bière utilisés à but de recherche jeu. La plateforme consiste en des mécanismes de
s’intéressent à l’analyse et la modélisation du marché, des politiques de coûts et une banque.
comportement des preneurs de décision. En particulier,
2.3 XBeerGame
les jeux orientés agents utilisent des modules logiciels
programmés afin de reproduire un comportement donné,
Le XBeerGame est la version étendue du jeu de la bière
pour interagir de manière autonome et proactive en
développée à l’Université Laval, Québec, Canada
réponse aux stimuli de l’environnement.
(Montreuil et al., 2009). Le jeu est implémenté sur la
Le jeu proposé dans (Nienhaus et al., 2006) peut être plate-forme BusinessWebGame développée par la même
joué par des humains et des agents simultanément. Le équipe, et qui permet à plusieurs joueurs de s’y
comportement des agents est géré par un algorithme qui connecter et y concourir simultanément, grâce à son
consiste à ce que chaque agent passe à son fournisseur architecture distribuée Il permet au maître de jeu de
les commandes reçues de ses clients. Les auteurs spécifier les informations à afficher aux apprenants, en
montrent que lorsque le jeu est joué uniquement par les fonction de leur niveau d’expertise et des objectifs
agents décisionnels, ces derniers réussissent à avoir de d’apprentissage. L’information est représentée dans des
meilleures performances que les humains dans des tableaux de bord, dont le cockpit principal qui est illustré
simulations aux paramètres identiques. Dans le cas de à la Figure 1. Celui-ci se compose de données
simulations mixtes (joueurs humains et agents), les opérationnelles, d’indicateurs de performance et d’outils
auteurs relèvent deux types de comportements extrêmes de prise de décision. Il résume les niveaux de stock des
des joueurs preneurs de décision, à savoir la stratégie de produits gérés et les niveaux des différents coûts
refuge (Safe harbour) et la stratégie de panique (Panic). affectés, etc. Les données sont surlignées de couleurs,
Dans (Kawagoe and Wada, 2005) une version du jeu utilisées comme indicateurs de la position opérationnelle
utilisant des agents logiciels est proposée. Le et financière de l’entreprise gérée par le joueur. Les
comportement des agents consiste à mettre à jour autres onglets / cockpits / panneaux contiennent divers
l’inventaire en fonction des quantités commandées de la graphiques indiquant notamment l’évolution des
part des clients et les quantités de marchandise reçues du différents revenus et coûts d’opération, ainsi que
fournisseur. Les agents livrent aux clients leurs l’historique des demandes.
commandes dans la mesure de leur inventaire. Les agents
Le XBeerGame implémente aussi une architecture
subissent des coûts d’arrérage si l’inventaire calculé
d’agents décisionnels. Par exemple, un joueur peut
n’est pas suffisant pour satisfaire toutes les commandes à
choisir d’activer un agent d’approvisionnement et de
la date promise. Grâce à ce jeu à base d’agents, les
paramétrer la politique de commande à appliquer pour
auteurs ont pu donner un contre exemple de l’effet coup
un produit donné. Dans ce cas, l’agent est un simple
de fouet. En particulier, en présence de longs délais de
exécutant de la politique dont les paramètres sont
livraison ainsi qu’un nombre élevé d’entreprises dans la
spécifiés par l’apprenant.
chaîne. Le système multi-agents DragonChain est
composé d’agents dont le comportement est implémenté
par un algorithme génétique, (Kimbrough, Wu and
Zhong, 2002).L’algorithme génère une population de
règles parmi lesquelles l’agent en choisit une selon un
score (fitness value) et l’applique jusqu’à la fin de la
ronde. Les auteurs ont comparé les résultats des agents
avec ceux d’étudiants de Bachelor et de MBA. Ils ont
montré que les agents sont capables de retrouver les
meilleures stratégies pour commander. Notons que dans
le cadre du DragonGame, peu d’hypothèses sur les
informations utilisées dans la simulation sont émises. Le
jeu du bois Québécois, (Moyaux et al., 2003), est une
adaptation numérique à base d’agents du jeu de plateau
Wood Supply Game (Fjeld, 2001). Chaque agent simule
le comportement d’une entreprise en décidant des
quantités à commander et du moment de leur commande.
Les auteurs présentent une architecture pour ces agents,
un aspect omis par les autres travaux. Les auteurs Figure 1: Cockpit XBeerGame (Montreuil et al., 2009)
montrent l’impact de l’architecture sur la réduction de
l’effet de coup de fouet en agissant sur une des quatre L’architecture permet d’expérimenter la performance de
causes présentées par Lee et al. (1997). Le jeu Trading l’adoption de ces différentes politiques, ceci en présence
3
d’un patron de demande et de paramètres de revenus et fournisseur. Cette politique a été implémentée dans
de coûts spécifiés dans le patron de jeu par l’architecture des agents présentés dans (Nienhaus et al.,
l’administrateur. La limite des agents réside dans leur 2006). Les auteurs affirment que cette stratégie
dépendance face aux valeurs décidées par l’apprenant d’approvisionnement donne une meilleure solution que
ou le maître de jeu. A cet effet, une mise à jour de cette la stratégie basée sur le calcul de la moyenne mobile et
architecture est ici proposée afin de faire évoluer les l’écart type des demandes. Cependant, les hypothèses
agents du XBeerGame, allant de simples modules sous lesquelles ce comportement a été testé ne sont pas
d’automatisation des actions du joueur vers des outils présentées par les auteurs. Dans le présent article,
d’aide à la décision. l’impact de ce comportement dans différentes
configurations du jeu est testé, et ce en utilisant
3 AGENTS DU XBEERGAME différents scénarios de demande, ainsi que divers délais
d’acheminement de flux matériels d’un fournisseur à son
Cette section est consacrée à la proposition relative à client. Le diagramme d’états-transitions correspondant
l’évolution de l’architecture des agents décisionnels au est illustré dans la Figure 2.
sein de la plate-forme de simulation XBeerGame. Le
principe repose sur l’ajout d’un niveau de décision aux
comportements des agents d’approvisionnement. La
combinaison entre l’agent de décision et l’agent
d’approvisionnement d’un nœud donné de la chaîne,
constitue l’architecture de notre agent. Le comportement
de ce dernier s’établit comme suit :
L’agent de décision calcule les paramètres de la
politique d’approvisionnement à adopter (selon
son niveau de comportement).
Les paramètres sont communiqués à l’agent
d’approvisionnement.
Figure 2: Diagramme d’états-transitions N0
L’agent d’approvisionnement met à jour les
paramètres de la politique qu’il applique.
3.2 Niveau un
Un niveau de comportement correspond au niveau
d’expertise à affecter à l’agent d’approvisionnement. Le niveau un (N1) correspond au comportement d’un
L’implémentation intègre deux niveaux de joueur qui intègre l’information passée sur un court
comportement. Chaque niveau diffère par l’intégration horizon de temps. Il s’agit d’un agent disposant d’une
d’une information supplémentaire. La version actuelle de mémoire à court terme, qui intègre l’information sur les
l’agent implémente un niveau à la fois, la transition entre dernières commandes reçues en calculant la moyenne
les différents niveaux sera traitée dans de futurs travaux. mobile des demandes sur les n dernières périodes, ainsi
L’implémentation de différents niveaux de que l’écart type. Ces deux paramètres sont communiqués
comportement au sein de la plateforme correspond à la à l’agent d’approvisionnement qui implémente une
représentation de différents niveaux d’apprentissage. Ces politique de stock s, S. Le diagramme d’états-transitions
niveaux sont efficaces dans certains contextes et peu ou correspondant à N0 est illustré dans la Figure 3.
pas efficaces dans d’autres, et ce afin de sensibiliser les Afin de tester la performance des deux niveaux de
apprenants à l’importance de l’adaptabilité aux différents comportement, contrairement aux travaux précédemment
contextes informationnels des entreprises. Il ne s’agit pas évoqués dans notre revue de la littérature, la recherche
ici de donner les meilleurs comportements et de ici rapportée ne focalise pas sur l’analyse des profits
marginaliser les moins performants, mais plutôt réalisés par les agents, mais plutôt sur l’analyse des coûts
présenter des outils qui intègrent de manière progressive qu’engendrent leurs décisions et sur l’impact de
différents types d’informations pour en appréhender performance de la chaîne.
l’impact sur la prise de décision et la performance de
l’individu ou de la chaîne. 4 SIMULATIONS ET RESULTATS
3.1 Niveau zéro Afin de pouvoir tester la performance des architectures

d’agents proposés, deux modules logiciels ont été
Le niveau zéro (N0) correspond au comportement d’un implémentés et testés par la conduite de simulations sur
joueur débutant qui a une connaissance très limitée de la plate-forme XBeerGame. La comparaison des
son contexte. Il s’agit d’un agent sans mémoire : la seule comportements des deux agents se fait par rapport à ceux
information qu’il intègre dans son modèle décisionnel d’étudiants du Masters en Global Supply Chain
est la demande reçue de ses clients. Aussitôt qu’une Management à l’Ecole Polytechnique Fédérale de
demande est réceptionnée, l’agent d’approvisionnement Lausanne dans un tournoi joué du 10 au 13 Février 2009,
commande la même quantité du même produit à son en collaboration avec des membres du CIRRELT de
4
l’Université Laval. A cet effet, les agents ont disposé des premier jour du tournoi, chaque joueur gérait le détaillant
mêmes paramètres que les différentes simulations jouées de la chaîne, alors que les trois autres rôles étaient tenus
par les étudiants. par des agents logiciels. Chacun de ces agents
implémente une politique de stock s, S.
Usine Distributeur Grossiste Détaillant
Inventaire 0.2$ / jour 0.4$ / jour 0.6$ / jour 0.8$ / jour

0.2$ / jour de 0.3$ / jour de 0.6$ / jour de 1$ / jour de
Arrérage
délai délai délai délai
Transport 360$ / camion 240$ / camion 120$ / camion 40$ / camion
Coûts fixes 50 000 $ / mois 37 500 $ / mois 18 750 $ / mois 6 250 $ / mois
Usine vers Distributeur Grossiste vers Détaillant vers
Délai de
Distributeur vers Grossiste Détaillant Marché
transport
4 jours 3 jours 2 jours 1 jour
Délai interne 4,5 jours - - -
Coût achat 2$ 4$ 6$ 8$
Coût fixe de
25 $ 25 $ 25 $ 25 $
commande
Coût fixe
d'annulation
5$ 5$ 5$ 5$
Figure 3: Diagramme d’états-transitions N1 d'une
commande
Coût variable
4.1 Paramétrage des simulations d'annulation
0,10 $ 0,10 $ 0,10 $ 0,10 $
d'une
commande
Le paramétrage des rondes du XBeerGame consiste à Marge 2$ 2$ 2$ 2$
fournir les coûts d’opérations (prix, coûts d’inventaire,
coûts d’arrérage, coûts de transport, coûts fixes), le Tableau 1: Paramètres de base, altérés en fonction des
patron de la demande de chacun des produits gérés au rondes
cours du jeu, le temps de production à l’usine, le délai de
livraison, les niveaux d’inventaire initiaux. Le Tableau 1
reprend les paramètres utilisés par défaut dans la ronde
1.1.
Les rondes utilisées pour simuler le comportement des
joueurs diffèrent par :
• Le patron de la demande ;
• Le temps de production en usine ;
• L’inventaire initial des deux produits ;
• La durée de la simulation ; Figure 4: Demande de la ronde 1.2
• La vitesse de la simulation.
De ronde en ronde, nous avons utilisé des patrons de
demande différents. Par exemple, nous avons utilisé à la
ronde 1.2 un patron de demande stable, à la ronde 1.3 un
patron de demande variable et à la ronde 2.2 un patron
de demande à effets saisonniers.
Les demandes des rondes 1.2, 1.3 et 2.2 sont

respectivement illustrées dans les Figures 4,5 et 6. Dans Figure 5: Demande de la ronde 1.3
chaque figure, la demande affichée pendant le jeu est
délimitée par un cadre bleu. Ces demandes ont été
obtenues à partir de distributions issues de simulations
de marché. Ces demandes ainsi générées ont été utilisées
pendant la simulation de la chaîne: pendant chaque
ronde, à chaque moment du temps simulé, la demande
correspondante était affichée aux joueurs. Ainsi, étant
donné que la demande n’est pas générée de manière
aléatoire pendant les rondes, et qu’elle n’est pas affectée
par les décisions des joueurs, nous n’avons eu besoin que Figure 6: Demande de la ronde 2.2
d’une seule réplication de chaque ronde pour analyser les
performances des deux niveaux de comportement Les stocks de sécurité pour ces politiques sont
d’agents que nous avons implémentés.Dans le Tableau 2 prédéterminés dans le patron du jeu, par le concepteur
nous rapportons les différences entre les configurations des rondes. Ces niveaux ont été spécifiés en fonction des
des différentes rondes du tournoi. Durant les rondes du patrons des demandes correspondantes à chaque ronde.
5
Dans les rondes suivantes, les équipes étaient constituées communication entre les joueurs n’était permise. Pour
uniquement de joueurs humains. chacune des parties individuelles correspondantes aux
Ronde Objectfis Visibilité Historique Clavardage Délais (Jours)
rondes 1.1, 1.2, 1.3, 1.4, la performance des agents est
du rôle demande comparée en les positionnant par rapport à la meilleure
1.1 max. profit non par défaut
indiv. valeur, la pire valeur et la valeur moyenne de coûts des
1.2 max. profit non tr. de Gr. à Det. : 10 joueurs humains, et ce pour chaque type de coût. Pour ce
indiv.
faire, pour chaque comportement d’agent i ∊ {N0,N1} et
1.3 max. profit non pdt Calore: 10
indiv. pour chaque ronde t, le rapport est calculé avec
1.4 max. profit
indiv.
non X pdt Igloo: 14
∊ {meilleure performance, pire performance,
2.1 max. profit non pdt Igloo: 16 performance moyenne} de la manière suivante :
indiv. pdt Calore: 8
2.2 max. profit non X pdt Igloo: 3
2.3 max. profit non X pdt Igloo: 7
2.4 max. profit non pdt Igloo: 4
3.1 max. profit oui X par défaut
indiv.
3.2 max. profit oui X X tr. de Usn. à Dist. : 21
indiv.
4.1 max. profit oui X X tr. de Usn. à Dist. : 14 avec le montant obtenu par i pour le coût k ∊
chaîne
4.3 max. profit oui X X tr. de Usn. à Dist. : 14 {Arrérages, Transport, Stockage, Achat} à la ronde t,
chaîne tr. de Dist. à Gr. : 7 le montant obtenu par l’humain ou l’équipe humaine
Légende
j. Les proportions pour la journée 1 sont
rapportées dans le Tableau 3.
max. : maximiser Usn. : usine
indiv. : individuel Dist. : distributeur Dans les tableaux de performance, nous avons coloré
tr. : transport Gr. :grossiste
pdt. :production Det. : détaillant chaque triplet de proportions selon la qualité de la
Tableau 2: Paramétrages des rondes du tournoi performance de l’agent. Nous avons utilisé le bleu clair
pour une excellente performance ( tend
Tel que décrit au Tableau 2, de ronde en ronde, des outils vers zéro), le vert pour une bonne performance
de communication entre les joueurs étaient rajoutés et les ( ), le jaune pour une faible
contextes collaboratifs étaient altérés. Par exemple à la
performance ( 0 mais
ronde 3.1, les joueurs ont accès à une interface de
tendent vers zéro) et le
clavardage pour communiquer avec leurs nœuds
adjacents dans la chaîne. À partir de 4.1, les joueurs rouge pour une mauvais performance ( , ).
visent à optimiser le profit total de la chaîne, et non plus t =1.1 t =1.2 t =1.3 t =1.4
leur profit individuel, sous-entendant le passage vers une k p usine i =N0 i =N1 i =N0 i =N1 i =N0 i =N1 i=N0 i=N1
chaîne intégrée. meilleure 0,39 0,99 0,85 0,44 1,19 3,27 4,47 5,53
Arrérages pire 0,09 0,22 0,16 0,08 0,32 0,87 4,12 5,09
moyenne 0,19 0,48 0,39 0,20 0,50 1,37 4,21 5,20
4.2 Analyse des résultats meilleure 0,01 0,01 2,50 3,26 1,04 1,06 0,85 0,86
Transport pire 0,00 0,00 1,05 1,38 0,97 0,99 0,83 0,84
La recherche ici rapportée a simulé les rondes du tournoi moyenne 0,01 0,01 1,29 1,68 1,00 1,02 0,83 0,84
explicitées en section 4.1 en remplaçant les joueurs meilleure 0,30 0,23 0,24 0,47 1,57 0,38 0,61 0,30
Stockage pire 0,07 0,05 0,07 0,15 0,23 0,06 0,30 0,15
humains par des agents avec le comportement N0 dans 0,16 0,12 0,15 0,29 0,59 0,14 0,39 0,19
moyenne
un premier temps, ensuite avec le comportement N1 tel meilleure 1,05 1,05 1,71 2,18 0,77 0,76 0,57 0,56
que décrits en section 3. Dans les travaux présentés à la Achat pire 0,99 0,99 0,80 1,01 0,76 0,74 0,57 0,56
sous-section 2.2, les auteurs ont comparé les moyenne 1,01 1,01 0,92 1,18 0,77 0,75 0,57 0,56
performances d’agents artificiels avec celles de joueurs Tableau 3: journée 1

humains. Cette comparaison repose sur les profits ou
D’après les résultats rapportés dans le Tableau 3, N0
pertes réalisés par les différents acteurs. Cette sous-
engage de faibles coûts d’arrérage dans les rondes 1.1,
section présente une analyse des différents coûts
1.2 et 1.3 ainsi que de faibles coûts de stockage aux
résultants du comportement des joueurs et des agents.
rondes 1.1, 1.2 et 1.4, et ce par rapport au comportement
Les coûts en question sont le coût d’arrérage, le coût de
des joueurs humains. Par contre, ce comportement
transport, le coût de stockage et les coûts d’achat (ou de
engage dans la majorité des cas des coûts de transport
production pour l’usine).
plus importants que ceux réalisés par les joueurs
humains, à l’exception de la ronde 1.1. Les coûts subis
4.2.1 Résultats des parties individuelles
pas les agents N0 sont en moyenne équivalents aux coûts
d’achat subis par les joueurs humains et ce aux rondes
Le but à travers les rondes de la journée 1 est de se
1.1 et 1.2. Ceci s’explique par le fait que ce
concentrer sur la performance individuelle. Pour ce faire,
comportement achemine la marchandise aussitôt que la
les rondes ont été conçues de manière à ce que les
commande d’un client peut être desservie, ce qui peut
joueurs n’aient aucune visibilité de la composition de la
engendrer des exploitations inefficaces de camions qui
chaîne, ni de leur rôle (détaillant). De plus, aucune
quittent l’entrepôt sans pour autant exploiter leur
6
capacité maximale. À la ronde 1.4 les agents N0 ont Pendant les rondes de la journée 3 (3.1 et 3.2) les joueurs
réussi à avoir de meilleures performances que les joueurs pouvaient établir une stratégie de manière individuelle
humains sur les coûts de transport, de stockage et avant le début de la simulation.
d’achat, alors que les coûts d’arrérages sont quatre fois t =2.1 t =2.2 t =2.3 t =2.4
plus élevés. Ces derniers peuvent être expliqués par le k p individus i =N0 i =N1 i =N0 i =N1 i =N0 i =N1 i =N0 i =N1
grand délai de livraison de la première catégorie de meilleure 0,65 1,55 0,03 3,93 0,07 0,75 1,09 5,39
produit de l’usine vers le distributeur qui est de 14 jours, Arrérages pire 0,06 0,14 0.0005 0,07 0,01 0,05 0,01 0,07
alors que dans les rondes 1.1, 1.2 et 1.3 le délai était de 4 moyenne 0,17 0,41 0.0015 0,20 0,02 0,19 0,06 0,31
meilleure 1,54 1,56 2,44 2,13 1,55 1,52 2,24 2,47
jours. N1 a donné moins de coûts de stockage que les
Transport pire 0,08 0,08 0,12 0,11 0,17 0,16 0,22 0,24
joueurs humains et que N0, au niveau des rondes 1.1, 1.3 moyenne 0,25 0,26 0,44 0,38 0,35 0,34 0,45 0,49
et 1.4. La Figure 7 présente un histogramme comparatif meilleure 0,55 0,12 2,77 0,43 0,58 0,30 0,54 0,48
entre les meilleurs, les pires profits et les profits moyens Stockage pire 0,01 0,002 0,03 0,004 0,01 0,01 0,06 0,05
des joueurs humains et des agents, et ce à travers les moyenne 0,06 0,01 0,17 0,03 0,07 0,04 0,16 0,14
meilleure 0,87 0,84 0,95 0,60 0,57 0,57 1,49 1,54
rondes de la journée 1. Achat 0,18 0,18 0,17 0,11 0,14 0,14 0,32 0,33
pire
moyenne 0,30 0,29 0,27 0,17 0,22 0,21 0,53 0,55
Notons que pendant les journées 2, 3 et 4 du tournoi joué
par les joueurs humains, les équipes ont été constituées Tableau 4: journée 2
de joueurs humains seulement. Les simulations des
rondes de ces journées ont été opérées par une équipe 5 000 000,00
d’agents de comportement niveau zéro, ensuite une
équipe d’agents de comportement niveau un et nous en 0,00
2.1 2.2 2.3 2.4 Meilleur profit humain
avons recueilli les performances dans les différentes
Pire profit humain
rondes de ces trois journées. -5 000 000,00
Profit moyen humain
Profit agent zero
1 000 000,00 -10 000 000,00
Profit agent un
0,00
1.1 1.2 1.3 1.4 Meilleur profit -15 000 000,00
-1 000 000,00
humain
-2 000 000,00
Pire profit humain
-3 000 000,00 -20 000 000,00
Profit moyen
-4 000 000,00
humain Figure 8: Profits/pertes réalisés journée 2
-5 000 000,00 Profit agent zero
-6 000 000,00 De plus, les joueurs ont eu accès à une interface de
Profit agent un
-7 000 000,00 clavardage qui leur permettait de communiquer
-8 000 000,00
librement avec leurs nœuds adjacents dans la chaîne
-9 000 000,00
d’approvisionnement. Pendant ces rondes les joueurs
Figure 7: Profits/pertes de journée 1 avaient une visibilité complète sur la constitution de la
chaîne. Le but à travers les rondes de la journée 3 était
Le but à travers les rondes de la journée 2 (2.1, 2.2, 2.3 d’améliorer les performances individuelles des joueurs à
et 2.4) était aussi de développer les performances travers la collaboration avec les nœuds adjacents.
individuelles des joueurs. Dans le Tableau 4, nous Dans le Tableau 5, nous rapportons les de la
rapportons les respectivement pour N0 et N1 pour journée 3. Nous constatons que pour N0, l’agent a eu de
les rondes de la journée 2. L’indice j dans meilleurs coûts de stockage que les joueurs humains et
correspond aux individus ayant joué les rondes des ce pour les deux rondes de la journée 3, par contre pour
journées 1, 2 et 3. Pour la journée 4, les j correspondent les coûts d’arrérage, de transport et d’achat, N0 a obtenu
aux indices des individus de chaque rôle, ainsi qu’aux des coûts d’achat qui sont meilleurs que les coûts d’achat
indices des équipes d’humains. moyens des joueurs humains, mais qui sont moins bons
que leurs meilleurs coûts. Par contre, l’agent N1 a réalisé
A travers le Tableau 4 nous constatons que le
de meilleurs coûts de stockage et de transport que l’agent
comportement N0 donne de meilleurs coûts d’arrérages,
N0 et ce pour les deux rondes 3.1 et 3.2. Aussi N1 a eu
de stockage et d’achat que les acteurs humains, par
de meilleurs coûts d’arrérages et d’achat pour la ronde
contre les coûts de transport obtenus par cet agents se
3.1. Le positionnement des profits de chacun des agents
trouvent meilleurs que la moyenne obtenue des coûts de
pour les rondes 3.1 et 3.2 sont illustrés par le graphique
transport obtenus par les humains. Nous émettons les
de la Figure 9.
mêmes observations pour N1. Lors de la journée 2, N0
a obtenu de meilleurs coûts d’arrérages que N1, N1 a
obtenu de meilleurs coûts de stockage que N0, et les 4.2.2 Résultats des parties en équipes
deux agents ont eu des coûts de transport et de stockage,
qui sont en moyenne similaires.La figure 8 présente une Les rondes des journées 1, 2 et 3 visaient à renforcer
comparaison entre les différents profits de la journée 2 l’apprentissage individuel des joueurs. Les rondes de la
obtenus par les agents humains et artificiels. journée 4 ont eu pour but d’apprendre aux joueurs à
collaborer ensemble pour mener à bien leurs opérations.
7
Performance 3.1 3.2 distributeur, grossiste et détaillant, ainsi que pour

joueur us ine N0 N1 N0 N1
meilleure 1,81 11,55 14,42 0,88 l’équipe de ces agents. Finalement notons que les agents
Arrérages pire 0,02 0,13 0,07 0,004 N1 ont eu de meilleures performances pour les quatre
moyenne 0,10 0,64 0,33 0,02
meilleure 2,02 1,93 2,48 0,17
coûts, que les agents N0 que ce soit par rôle ou par
Trans port pire 0,18 0,17 0,06 0,004 équipe.
moyenne 0,42 0,40 0,22 0,01
meilleure 0,50 0,34 0,09 0,01 t =4.1 t =4.3
Stockage pire 0,02 0,02 0,005 0,0007 k p usines i =N0 i =N1 i =N0 i =N1
moyenne 0,09 0,06 0,02 0,002 meilleure # # # #
meilleure 1,21 1,34 1,53 0,08 Arrérages pire # # # #
Achat pire 0,20 0,23 0,29 0,02
moyenne # # # #
moyenne 0,37 0,41 0,58 0,03
meilleure 2,25 1,40 5,46 0,95
Tableau 5: journée 3 Transport pire 1,99 1,24 2,18 0,38
moyenne 2,08 1,30 2,86 0,50
meilleure 0,98 0,25 0,67 0,46
4 000 000,00 Stockage pire 0,23 0,06 0,24 0,16
moyenne 0,47 0,12 0,36 0,24
2 000 000,00 Meilleur profit humain meilleure 1,13 0,98 5,78 0,98
Pire profit humain Achat pire 1,01 0,88 2,26 0,38
0,00
Profit moyen humain moyenne 1,06 0,92 2,91 0,49
3.1 3.2
-2 000 000,00
Profit agent zero Tableau 6: usines N0 et N1 journée 4
-4 000 000,00 Profit agent un
200 000,00
-6 000 000,00
100 000,00
-8 000 000,00 0,00 Meilleur profit humain
-100 000,00 4.1 4.3
Figure 9: Profits/pertes journée 3 Pire profit humain
-200 000,00 Profit moyen humain
Pendant les rondes de la journée 4 (4.1 et 4.3), en plus de -300 000,00
Profit agent zero
la possibilité de communiquer, les joueurs avaient accès -400 000,00
Profit agent un
à l’information historique sur les distributions des -500 000,00
-600 000,00
demandes des deux produits et pouvaient établir une
-700 000,00
stratégie en groupe avant le début de la simulation.
Notons que pendant les rondes 4.1 et 4.3, les joueurs Figure 10: Profits/pertes usines journée 4
sont autorisés à communiquer directement ainsi que de
t =4.1 t =4.3
communiquer par vidéo conférence avec des joueurs k p dis tr. i =N0 i =N1 i =N0 i =N1
distants situés à Québec. meilleure 78,85 229,29 100,05 22,68
Arrérages pire 6,77 19,69 8,69 1,97
Dans un second temps, nous nous sommes intéressés à moyenne 18,33 53,31 15,99 3,62
analyser l’impact des comportements d’agents sur la meilleure 1,94 1,19 2,50 0,35
performance globale des équipes pour chaque journée de Trans port pire 1,76 1,08 1,13 0,16
moyenne 1,84 1,13 1,40 0,20
jeu. A cet effet, nous comparons les coûts obtenus par les meilleure 0,18 0,12 2,01 1,54
agents par rôle et par équipe. Dans les Tableaux 6 à 9, Stockage pire 0,05 0,03 0,27 0,21
nous rapportons les de la journée 4, et ce par rôle moyenne 0,09 0,06 0,41 0,31
meilleure 1,01 0,84 5,00 1,06
joué. Le tableau 10 présente ces proportions par équipes.
Achat pire 0,91 0,76 2,05 0,43
Notons que les usines ont des coûts d’arrérages nuls. moyenne 0,95 0,79 2,61 0,55
Chacune des figures 8 à 11 illustrent pour un rôle donné Tableau 7: distributeurs N0 et N1 journée 4
dans la chaîne une comparaison entre les profits ou
pertes obtenus par les agents et les humains au cours des Dans le présent travail de recherche nous avons étudié
rondes 4.1 et 4.3. La comparaison entre profits des les deux comportements d’agents dans différentes
équipes pour ces deux rondes et illustrée dans la Figure configurations en agissant sur plusieurs paramètres du
14. jeu. De plus, notre analyse de la performance des agents
a été plus granulaire dans le sens où nous l’avons
D’après ces résultats, les agents N1 ont eu de meilleures évaluée en termes de différents coûts, ce qui nous a
performances que les joueurs humains, ainsi que les permis de détecter quel est l’impact de chaque
agents N0, et ce en termes de coûts de stockage et comportement sur chaque coût dans différentes
d’achat, que ce soit pour les coûts par rôle, ou les coûts configurations de la simulation. Notons que les agents
par équipe pour les rondes 4.1 et 4.3. Ces agents ont ont eu de meilleures performances que les humains
aussi obtenu les meilleurs coûts de transport à la ronde pendant les 1ère, 2ème et 3ème journées de jeu, tandis que
4.3. Les agents N0 ont eu de meilleurs coûts de stockage pour la 4ème journée ils ont obtenus de mauvaises
que les joueurs humains, que ce soit par rôle ou par performances, notamment au niveau des coûts
équipe, et ce pour la ronde 4.1. Pour la ronde 4.3, ces d’arrérage. Ceci s’explique par le fait que les joueurs
coûts ont été meilleurs que la moyenne des coûts des humains ont pu tirer profit du contexte collaboratif de
joueurs humains, mais n’ont pas dépassé les meilleurs ces rondes et ont obtenu de bonnes performances au
coûts qu’ils ont réalisés et ce pour les agents N1 de rôles niveau de leur chaîne, chose non réalisable par les
8
comportements d’agents actuellement développés, étant

donné qu’ils n’ont pas la capacité de déceler la 3 000 000,00
sémantique du contexte et n’implémentent aucun 2 000 000,00
mécanisme de collaboration. 1 000 000,00 Meilleur profit humain

Pire profit humain
0,00
Profit moyen humain
Meilleur profit 4.1 4.3
0,00 humain -1 000 000,00 Profit agent zero
4.1 4.3 -2 000 000,00
Profit agent un
-500 000,00 Pire profit humain
-3 000 000,00
-1 000 000,00 Profit moyen -4 000 000,00
humain
-1 500 000,00 Figure 13: Profits/pertes détaillants journée 4
Profit agent zero
t =4.1 t =4.3
-2 000 000,00
Profit agent un k p équipes i =N0 i =N1 i =N0 i =N1
-2 500 000,00
meilleure 60,75 193,20 297,23 62,38
Figure 11: Profits/pertes distributeurs réalisés lors de la Arrérages pire 7,90 25,13 17,42 3,66
journée 4 moyenne 11,36 36,13 42,32 8,88
meilleure 2,10 1,32 3,90 0,64
t =4.1 t =4.3 Trans port pire 1,90 1,19 1,68 0,28
moyenne 1,97 1,24 2,11 0,35
k p gros s is tes i =N0 i =N1 i =N0 i =N1
meilleure 0,40 0,13 1,02 0,56
meilleure 7,12 23,54 2,58 29,36 Stockage pire 0,12 0,04 0,28 0,16
Arrérages pire 4,90 16,20 0,35 3,94 moyenne 0,20 0,06 0,41 0,23
moyenne 5,83 19,29 0,61 6,95 meilleure 1,13 0,98 5,78 0,98
meilleure 1,90 1,19 2,37 0,40 Achat pire 1,01 0,88 2,26 0,38
Trans port 1,66 1,04 1,08 0,18 moyenne 1,06 0,92 2,91 0,49
pire
moyenne 1,80 1,13 1,27 0,21 Tableau 10: équipes N0 et N1 journée 4
meilleure 0,64 0,11 1,45 0,48
Stockage pire 0,17 0,03 0,28 0,09
moyenne 0,27 0,05 0,47 0,16 4 000 000,00
meilleure 0,98 0,85 5,09 0,78

2 000 000,00
Achat pire 0,93 0,80 2,11 0,32
0,95 0,82 2,61 0,40 0,00 Meilleur profit humain
moyenne
4.1 4.3 Pire profit humain
Tableau 8: grossistes N0 et N1 journée 4 -2 000 000,00
Profit moyen humain
500 000,00 Meilleur profit Profit agent un
-6 000 000,00
0,00 humain
-8 000 000,00
-500 000,00 4.1 4.3 Pire profit humain
-1 000 000,00 -10 000 000,00

Profit moyen humain
-1 500 000,00 Figure 14: Profits/pertes équipes journée 4
-2 500 000,00 5 CONCLUSIONS ET PERSECTIVES
-3 000 000,00 Profit agent un
-3 500 000,00 Au cours de cet article, nous avons étudié l’impact de

deux comportements d’agents décisionnels pour le jeu
Figure 12: Profits/pertes grossistes journée 4
du XBeerGame. Notre analyse s’est focalisée sur le test
t =4.1 t =4.3 de ces comportements dans différentes configurations du
jeu. De plus, nous nous sommes intéressés à étudier
k p détaillants i =N0 i =N1 i =N0 i =N1
l’impact de ces comportements sur les coûts infligés
meilleure 60,75 193,20 297,23 62,38
pendant le jeu.
Arrérages pire 7,90 25,13 55,87 11,73
Cette analyse diffère de celles effectuées dans la
moyenne 13,98 44,47 72,73 15,26
meilleure 1,65 1,34 1,84 0,29 littérature, qui se basent sur un seul indicateur de
Trans port pire 1,40 1,14 0,92 0,15 performance qui est le profit (ou les pertes). Nous
moyenne 1,50 1,22 1,13 0,18 sommes conscients que les comportements d’agents sont
0,54 0,16 1,15 0,22
Stockage
meilleure
pire 0,11 0,03 0,25 0,05
pour l’instant simplistes. Cependant, nous avons en
moyenne 0,21 0,06 0,39 0,07 premier lieu validé le fonctionnement de l’architecture
meilleure 0,98 0,85 5,13 0,74 des agents du XBeerGame. En second lieu, les résultats
Achat pire 0,93
0,95
0,81
0,82
2,23
2,73
0,32
0,40
obtenus nous permettent d’identifier les comportements
moyenne
à modifier. Ainsi, il apparait clairement que les coûts
Tableau 9 : détaillants N0 et N1 journée 4
d’arrérages peuvent être largement améliorés.
9
Notre analyse plus granulaire de la performance, nous a Fjeld D. E., 2001. The Wood Supply Game as an
permis de nous rendre compte que les agents educational application for simulating dynamics in
décisionnels implémentés dans le XBeerGame doivent the forest sector. Supply Chain Management for
avoir des comportements qui agissent sur plusieurs Paper and Timber Industries, Växjö, Suède, p. 241-
paramètres pour en améliorer les performances. A cet 251.
effet, nous nous intéresserons dans nos futurs travaux à
Hofstede G. J., M. Kramer, S. Meijer and J. Wijdemans,
la conception de comportements qui prennent des
2003. A Chain Game for Distributed Trading and
décisions d’approvisionnement en tenant compte des
Negotiation. Production Planning & Control, 14, p.
différents critères de coûts. Cette évolution du
111-121.
comportement nécessiterait des architectures d’agents
plus complexes, incluant notamment un module Huang G.Q., S.K. Lau and K.L. Mak, 2003. The impacts
d’apprentissage. of sharing production information on supply chain
dynamics: a review of the literature. International
De plus, les comportements d’agents décisionnels du
Journal of Production Research, 41, 1483-1517.
XBeerGame ne doivent être génériques, mais doivent
s’adapter à leur contexte de prise de décision. A cet effet, Jacobs F. R., 2000. Playing the beer distribution game
ces agents artificiels doivent être en mesure d’identifier over the Internet. Production and Operations
le contexte sémantique des différentes informations qui Management, 9, p. 31-39.
sont diffusées dans l’environnement du jeu.
Kawagoe T. and S. Wada, 2005. A Counterexample for
En effet, des agents qui seront capables de déceler le the Bullwhip Effect. Proceedings of Gaming and
contexte des informations, pourront en détecter celles qui Multiagent Simulations IEEE/WIC/ACM
sont pertinentes et seront capables par la suite d’ajuster Inernational. Conference on Intelligent Agent
leur comportement en conséquent en choisissant une Technology, p. 124-127.
politique d’approvisionnement appropriée, ou en en
Kimbrough S. O., D.J. Wu and F. Zhong, 2002.
modifiant les paramètres.
Computers play the Beer Game: Can artificial agents
Le défi de mettre en place des agents décisionnels dotés manage supply chains? Decision Support Systems,
de capacités d’interprétations sémantiques, requiert la 33, p. 323-333.
construction d’ontologies du domaine de prise de
Lee L. H., V. Padmanabhan and S. Whang, 1997. The
décision et l’utilisation d’outils d’extraction
Bullwhip Effect in Supply Chains. Sloan
d’information, ainsi que des algorithmes de
Management Review, Spring 1997, p. 93-102.
classification. Nous pensons que la combinaison de ces
outils avec des modèles issus de la littérature relative à la Montreuil B., E. Brotherton, O. Labarthe et A. Morneau,
conception des chaînes logistiques permet de modéliser 2009. XBeerGame: simulations participatives pour le
un comportement d’agent réactif à l’environnement, dans pilotage et l'analyse de chaînes logistiques. Actes de
une tentative de reproduire un comportement de décideur du 8ème Congrès international de génie industriel,
humain dans le contexte de la gestion des opérations des Bagnères de Bigorre, France.
chaînes logistiques.
Moyaux T., B. Chaib-draa and S. D'Amours, 2003.
REMERCIEMENTS Agent-Based Simulation of the Amplification of
Demand variability in a Supply Chain. Proceedings
Nous tenons à remercier la Chaire de recherche du of the 4th workshop on Agent-Based Simulation,
Canada en Ingénierie d’Entreprise et le programme de Montpellier, France.
subventions à la découverte du Conseil de recherche en
Nienhaus J., A. Ziegenbein and P. Schoensleben, 2006.
Sciences et Génie pour leur support à cette recherche.
How human behaviour amplifies the bullwhip effect.
Nous remercions aussi le professeur Rémy Glardon et
son équipe à l‘ÉPFL pour leur collaboration dans A study based on the beer distribution game online.
l’acquisition des résultats du tournoi. Production Planning & Control, 17, p. 547-557.
Sterman J.D., 1989. Modeling managerial behavior:
misperceptions of feedback in a dynamic decision
making experiments. Management Science, 35, p.
REFERENCES
321-339.
Chen F. and R. Samroenraja, 2000. The stationary Beer Toyli J., S.O. Hansen and R. Smeds, 2006. Plan for
Game. Production and Operations Management, vol. profit and achieve profit: Lessons learnt from a
9, p.19-30. business management simulation. Production
Planning & Control, 17, p. 584-595.
Collins J., R. Arunachalam, N. Sadeh, J. Eriksson, N.
Finne and S. Janson, 2007. The Supply Chain
Management Game for the 2007 Trading Agent
Competition. Carnegie Mellon Technical Report,
CMU-ISRI-07-100.
10

Evaluation Et Optimisation Des Systemes

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Evaluation Et Optimisation Des Systemes

Загружено:

Авторское право:

Доступные форматы

8e Conférence Internationale de MOdélisation et SIMulation - MOSIM’10 - 10 au 12 mai 2010 - Hammamet - Tunisie

« Evaluation et optimisation des systèmes innovants de production de biens et de services »

SIMULATIONS PARTICIPATIVES DU XBEERGAME:

S. NACCACHE, B. MONTREUIL, O. LABARTHE, E. BROTHERTON, S. MELLOULI

d’entreprise, mais aussi comme outils de simulation et

d’implémenter différents comportements de prise de 2.1 Versions électroniques du jeu de la bière

3.1 Niveau zéro Afin de pouvoir tester la performance des architectures

Inventaire 0.2$ / jour 0.4$ / jour 0.6$ / jour 0.8$ / jour

Les demandes des rondes 1.2, 1.3 et 2.2 sont

performances d’agents artificiels avec celles de joueurs Tableau 3: journée 1

Performance 3.1 3.2 distributeur, grossiste et détaillant, ainsi que pour

comportements d’agents actuellement développés, étant

sémantique du contexte et n’implémentent aucun 2 000 000,00

mécanisme de collaboration. 1 000 000,00 Meilleur profit humain

meilleure 0,98 0,85 5,09 0,78

-1 000 000,00 -10 000 000,00

-3 500 000,00 Au cours de cet article, nous avons étudié l’impact de

Вам также может понравиться