Вы находитесь на странице: 1из 5

LOG660 - Base de donnes de haute performance

Chapitre 18: Bases de donnes parallles et rparties


Exercices:
QUESTION 1 a) BD parallles: Les donnes peuvent tre distribues sur plusieurs disques d'un mme site, et l'excution des requtes peut tre paralllise sur les diffrentes units de traitement (CPU) du site. BD rparties: Les donnes sont distribues et/ou dupliques sur diffrents sites du rseau (ex: internet) qui possdent un certain degr dautonomie. Chaque site peut comporter une BD parallle. Avantages des BD rparties: Performance : En rapprochant les donnes des applications utilisant ces donnes (ex : stockant les comptes des clients montralais dans un site localis Montral), on peut rduire les cots de transfert sur le rseau et, ainsi, augmenter la performance des requtes sur ces donnes. Fiabilit : En dupliquant certaines donnes importantes sur plusieurs sites, on minimise limpact dune panne sur un site. De mme, en cas de panne, on peut rediriger le traitement dune requte vers un autre site disponible. Extensibilit : Si les besoins en espace de stockage et en puissance de traitement augmentent on peut facilement rajouter un nouveau nud (site), sans avoir remplacer le serveur (ex : approche Google).

b) Stratgie de semi-jointure : La stratgie par semi-jointure permet de rduire le cot d'une jointure en limitant la quantit de donnes transfres sur le rseau. Supposons que l'on veuille calculer T1 T2 o la table Ti est situe sur le site i. Au lieu de transfrer une table complte d'un site un autre, on envoie seulement les colonnes ncessaires la jointure (la cl). Par exemple, on envoie cl(T2) au site 1 et on fait la jointure avec T1: R = T1 cl(T2)

Ceci correspond faire la semi-jointure entre T1 et T2. Ensuite, on envoie le rsultat R au site 2 pour faire la jointure avec T2: T = R T2 = T1 T2 Les donnes transfres sont celles de cl(T2) et de R, et ont une taille potentiellement moins grande que celle de T1 ou de T2. c) Rpartition cyclique par bloc : Au lieu de disposer les blocs d'une table squentiellement sur un mme disque, la rpartition cyclique les dispose en alternance sur plusieurs disques. Par exemple, Disque 1 bloc 1 bloc 4 ... Disque 2 bloc 2 bloc 5 ... Disque 3 bloc 3 bloc 6 ...

Le but de cette stratgie est de permettre la lecture / criture de plusieurs blocs en parallle (un dans chaque disque). d) Fragmentation horizontale : Chaque fragment contient un sous-ensemble de lignes de la table. Par exemple, on dcoupe la table Client selon la provenance (ex : province, tat, etc.) dun client. Fragmentation verticale : Chaque fragment contient un sous-ensemble de colonnes de la table. En pratique, ce type de fragmentation est rarement employ. e) Avantages de la fragmentation : La fragmentation horizontale permet de rpartir les lignes d'une table sur les sites o le traitement de ces lignes est souvent fait, rduisant ainsi les temps de transfert sur le rseau. En cas de panne dun site, linformation stocke sur les autres sites reste disponible.

f) Avantages de la duplication : Rduit les cots de transfert en dupliquant sur les diffrentes linformation globale tous les sites. Par exemple, les codes et les frais associs aux transactions bancaires. Assure la disponibilit des donnes dupliques dans le cas o un ou plusieurs sites tombent en panne.

g)

Duplication synchrone : Une transaction modifiant des donnes de plusieurs sites nest confirme quau moment ou tous les sites ont confirms les changements. Duplication asynchrone : Les mises jour sont dabord faites sur la copie primaire des tables, et les autres copies sont mises jour en diffr. h) Vues matrialises : Permet de crer une copie locale dune table situe sur un autre site distant. En somme, elles permettent dimplmenter le concept de la duplication (synchrone ou asynchrone). i) Optimisation dans les BD rparties Cot de communication: Contrairement aux BD centralises, loptimisation de requtes utilisant des donnes sur plusieurs sites doit galement tenir compte du cot de transfert sur le rseau. Ressources multiples: Loptimiseur doit galement tenir compte de la localisation des donnes et des diverses ressources sa disposition. Par exemple, plusieurs sites peuvent contribuer en parallle rpondre la requte selon les donnes quils renferment.

j) RAID 1: Le niveau RAID 1 est bas sur la duplication des donnes sur des disques miroirs. Cette architecture est robuste aux pannes survenant sur un ou plusieurs disques. De plus, elle permet la lecture en parallle sur les diffrents disques (mais pas lcriture). Par contre, cette architecture est plutt gourmande en terme despace.

RAID 5: Contrairement au niveau RAID 1, le niveau RAID 5 ne duplique pas les donnes. En revanche, ce niveau emploi la rpartition cyclique par bloc ce qui permet de faire des lectures ET des critures en parallle. Par ailleurs, elle permet une certaine forme de fiabilit laide de bits de parit stocks sparment des donnes. k) Slection dans BD parallles: En supposant que la table sur laquelle opre la slection est fragmente, on peut effectuer en parallle une recherche sur chacun des fragments et ensuite combiner les rsultats de ces recherches. Par ailleurs, si la fragmentation est faite selon la cl de slection, on peut limiter la recherche aux fragments correspondants. l) Mmoire partage: Plusieurs processeurs (CPU) partagent la mme mmoire vive (RAM). Lavantage est que les processeurs peuvent communiquer efficacement travers la mmoire RAM. Cependant, la mmoire RAM constitue un goulot dtranglement qui limite le nombre de CPU possibles. Disques partags: Contrairement la prcdente, les CPU de cette architecture ont chacun leur propre RAM. Cela facilit lextension de larchitecture (ajout de nouveau CPU) mais complexifie un peu la communication entre les processeurs. En pratique, cette architecture est celle employe le plus souvent.

QUESTION 2 Puisque lapplication Web rside du ct de la succursale qubcoise, pour accder au catalogue franais, il faut crer un lien entre la BD qubcoise et la BD franaise : CREATE PUBLIC DATABASE LINK serveur-bd.microdur.france.com CONNECT TO nom_schema IDENTIFIED BY mot_de_passe; Par ailleurs, puisque les dlais doivent tre minimiss, on choisit de une approche de duplication qui cre une copie locale du catalogue franais dans la BD situ au Qubec. Cette approche peut tre implmente laide du vue matrialise : CREATE MATERIALIZED VIEW CatalogueFrance REFRESH FAST ON COMMIT AS SELECT * FROM Catalogue@serveur-bd.microdur.france.com

Le paramtre ON COMMIT est employ dans ce cas pour que les changements faits au catalogue franais soient immdiatement visibles lapplication. Le paramtre FAST assure une mise jour incrmentale rapide. Enfin, pour rendre transparent lapplication la localisation des items, on cre une vue regroupant tous les produits : CREATE VIEW CatalogueGlobal AS (SELECT * FROM Catalogue) -- le catalogue local UNION (SELECT * FROM CatalogueFrance) -- le catalogue francais

Вам также может понравиться