Вы находитесь на странице: 1из 10

Distribuirane baze podataka

Mentor:
Student:
Mr.Duan Markovi
Filip Stankovi
2A1/0322/10

Beograd, 2014

Sadraj
Sadraj....................................................................................................................... 1
DISTRIBUIRANE BAZE PODATAKA.........................................................................1
Nevidljivo upravljanje distribuiranim sistemom.............................................2
Pouzdanost i raspoloivost................................................................................3
Efikasnost i fleksibilnost..................................................................................... 4
Vei kapacitet i postupni rast............................................................................4
Lokalna autonomija podataka, upravljanja i kontrole...................................4
Problemi u distribuiranom sistemu..................................................................4
Organizacija podataka u distribuiranom sistemu...........................................5
Upravljanje katalogom........................................................................................ 6
Distribuirana obrada upita................................................................................. 7
Preneto auriranje............................................................................................... 7
Kontrola konkurentnog izvravanja i obrada uzajamnog blokiranja...........7
Literatura:............................................................................................................. 9

DISTRIBUIRANE BAZE PODATAKA


Distribuirana baza se moe definisati kao skup vie logiki meuzavisnih baza
podataka distribuiranih kroz raunarsku mreu. Sistem za upravljanje distribuiranim
bazama podataka je programski sistem koji omoguava efikasno upravljanje
distribuiranim bazama podataka kao i nevidjivost lokacije.
Neformalno govorei, distribuirana baza podataka je baza podataka koja se ne
nalazi u celosti na jednoj fizikoj lokaciji, ve je razdeljena na vie lokacija koje su
povezane komunikacionom mreom. Svaka lokacija (vor komunikacione mree)
poseduje sopstveni, autonomni sistem za upravljanje bazama podataka sa
sopstvenom
kontrolom, upravljaem transakcijama, oporavkom od pada i ostalim znaajnim
funkcijama.

Prednosti koje donosi distribuirani koncept su sledee:

Nevidljivo (eng. transparent) upravljanje distribuiranim sistemom


Pouzdanost i raspoloivost
Efikasnost i fleksibilnost
Vei kapacitet i postupni rast
Lokalna autonomija podataka, upravljanja i kontrole

Nevidljivo upravljanje distribuiranim sistemom


Nevidljivo (engl. transparent) upravljanje distribuiranim sistemom se odnosi na
razdvajanje semantike sistema od problema implementacije sistema. Drugim
reima,
sistem sakriva implementaciju od korisnika ime omoguava iroku podrku za
razvoj
raznih kompleksnih aplikacija nezavisno od interne organizacije sistema i podataka
u
njemu.
Postoji nekoliko tipova nevidljivosti u distribuiranom sistemu koje treba
obezbediti da bi se sistem mogao smatrati potpuno nevidljivim.
Nevidljivost podataka je osnovni oblik nevidljivosti distribuiranog sistema koji
treba obezbediti, a odnosi se na nezavisnost korisnikog programa od promena u
2

definiciji i organizaciji podataka unutar distribuiranog sistema. Ovo se odnosi na


promene na nivou logike strukture kao i na promene na nivou fizike strukture i
organizacije podataka.
U centralizovanom sistemu, jedini oblik nevidljivosti koji treba obezbediti odnosi
se na podatke, dok u distribuiranom sistemu postoji jo jedan aspekt na koji se
nevidljivost moe odnositi, a to je komunikaciona mrea. Postoje dva tipa
nevidljivosti
komunikacione mree: nevidljivost lokacije, koja se odnosi na to da korisnik i njegov
program ne treba da znaju na kojoj se lokaciji u sistemu nalaze podaci koji su im
potrebni
i nevidljivost imenovanja svakog objekta u bazi. Nevidljivost komunikacione mree
treba
da obezbedi da distribuirani sistem za korisnika izgleda isto kao centralizovani.
Ukoliko su podaci u distribuiranom sistemu ponovljeni onda je nevidljivost
ponavljanja podataka jo jedan od zahteva koji je potrebno ispuniti, a podrazumeva

sakrivanje injenice o postojanju kopija od korisnika kao i odravanje konzistentnosti


kopija od strane sistema bez potrebe da korisnik vodi rauna o tome.
Sa druge strane, ukoliko su podaci particionirani, strategija obrade upita nad
skupom podataka razdeljenim na vie lokacija u distribuiranom sistemu takoe
mora biti
skrivena od korisnika i njegovog programa.

Pouzdanost i raspoloivost
Distribuirani sistemi mogu da nastave svoje funkcionisanje i kada neki od
vorova distribuiranog sistema iz nekog razloga postane nedostupan ili kada otkae
neka
veza u komunikacionoj mrei, ime se poveava pouzdanost sistema kao i
raspoloivost

podataka. ak i kada je nemogue doi do nekih podataka u distribuiranom sistemu,


zbog
pada u delu komunikacione mree ili na odreenom voru u distribuiranom sistemu,
uz
odreene strategije mogue je preusmeriti korisniki zahtev na druge delove
distribuiranog sistema i uspeno doi do eljenih podataka.

Efikasnost i fleksibilnost
Efikasnost i fleksibilnost distribuiranog sistema zasniva se na dve injenice. Prvo,
zahvaljujui praticioniranju odnosno ponavljanju podataka u vorovima
distirbuiranog
sistema, podaci su fiziki blizu onome ko ih stvara i koristi tako da je znatno
smanjena
potreba za udaljenom komunkacijom. Drugo, poto svaka lokacija u distribuiranom
sistemu uglavnom obrauje jedan podskup podataka, smanjeno je optereenje CPUa kao
i ulazno/izlaznih ureaja.

Vei kapacitet i postupni rast


est razlog za uvoenje distribuiranog sistema je nemogunost jednog raunara
da primi i obrauje sve potrebne podatke. U sluaju potrebe za veim kapacitetima,
dodavanje vora distribuiranom sistemu znatno je jednostavnije nego zamena celog
centralizovanog sistema veim.

Lokalna autonomija podataka, upravljanja i kontrole


Okruenje u kome se distribuirani sistemi primenjuju obino je i samo logiki i
fiziki distribuirano. Distribuiranje baza podataka kao i sistema za upravljanje njima,
omoguava pojedinim grupama korisnika da lokalno kontroliu sopstvene podatke,
uz
4

mogunost pristupa podacima na drugim lokacijama kada je to potrebno.

Problemi u distribuiranom sistemu


Problemi sa kojima se susreu sistemi baza podataka dobijaju na sloenosti sa
uvoenjem distribuiranog okruenja i ujedno dovode do novih problema izazvanih
uglavnom jednim od sledea tri faktora.
Prvo, distribuirana baza podataka moe biti dizajnirana tako da se cela baza ili
neki njeni delovi nalaze na veem broju vorova komunikacione mree. Potencijalno
ponavljanje podataka dovodi do toga da sistem mora da odluuje o tome odakle e
pribaviti traene podatke kao i da vodi rauna o tome da se efekat promene nekog
podatka sprovede nad svim kopijama tog podatka u distribiranom sistemu.
Drugo, ukoliko jedan od vorova postane iz nekog razloga nedostupan ili se desi
pad u komunikacionoj mrei dok je u toku operacija auriranja podataka, sistem
mora da
osigura da e se auriranje izvriti i na podacima trenutno nedostupnim, im se
sistem
oporavi od pada.
I konano, s obzirom da je nemogue da svaki vor u distribuiranom sistemu
istovremeno dobije informaciju o transakcijama koje se izvravaju na drugim
vorovima,
sistem mora da obezbedi efikasnu sinhronizaciju transakcija, to predstvalja daleko
tei
zadatak nego u centralizovanom sistemu.
Jedan od problema distribuiranog sistema iskazan je C.A.P. teoremom (Brewers
CAP Theorem on distributed systems ):
U distribuiranom sistemu nije mogue istovremeno ispuniti sva tri zahteva:
1. Konzistentnost (engl. Consistency)
2. Dostupnost (engl. Availability)
3. Otpornost na otkaz (engl. Partition tolerance).

Organizacija podataka u distribuiranom sistemu


Podaci u distribuiranom sistemu mogu biti particionirani (eng. partitioned) ili
ponovljeni (eng. replicated), a mogu biti istovremeno i particionirani i ponovljeni.
U sluaju particioniranja podataka, baza je razdeljena na vie disjunktnih delova od
kojih je svaki na drugom voru komunikacione mree. Skup podataka sa logikog
nivoa
treba na neki nain podeliti, a zatim te delove fragmente raspodeliti po raznim
lokacijama. Logiki skup podataka u relacionom sistemu je relacija, a prirodni
fragment
relacije koji je opet relacija jeste neki njen podskup definisan uslovom projekcije i
restrikcije. Fragmentacija mora biti izvedena tako da se spajanjem fragmenata moe
dobiti polazna relacija. Najee primenjivana tehnika za ouvanje informacija pri
fragmentaciji podataka je uvoenje sistemskih identifikatora n-torki (nametnuti
kljuevi)
kao primarnih kljueva, koji se pamte uz svaki deo pojedine n-torke i omoguuju
njenu
rekonstrukciju.
U sluaju ponavljanja podataka, jedan logiki objekat moe imati vie fizikih
reprezentacija (vei broj kopija) na veem broju lokacija. Ukoliko je na svakom od
vorova fizika reprezentacija itave baze onda je to distribuirani sistem sa potpuno
ponovljenim podacima, a inae je distribuirani sistem sa delimino ponovljenim
podacima. Distribuirani sistem sa ponovljenim podacima e detaljnije biti razmatran
u
posebnom poglavlju.
Prilikom izbora naina organizacije podataka u distribuiranom sistemu, tei se
smanjenju trokova uvanja podataka, obrade transakcija kao i komunikacije meu
vorovima.

Upravljanje katalogom

Katalog je sistemska baza podataka koja sadri podatke o baznim relacijama,


pogledima, indeksima, korisnicima itd, a u sluaju distribuiranog sistema, i o nainu
i
lokacijama na koje su podaci razdeljeni i ponovljeni. Sam katalog u distribuiranom 8
sistemu moe biti centralizovan (samo na jednoj lokaciji), potpuno ponovljen (na
svim
lokacijama po jedna kopija kataloga), particioniran (na svakoj lokaciji je deo kataloga
koji se odnosi na objekte sa te lokacije) ili kombinovan (katalog je particioniran, ali
na
jednoj lokaciji postoji i centralna kopija kompletnog kataloga).
Svaki od navedenih pristupa ima svojih mana (zavisnost od centralne lokacije,
visoka cena prenoenja auriranja kataloga ili skup pristup udaljenoj lokaciji) pa pri
izboru naina organizacije treba uzeti u obzir karakteristike samog sistema npr.
vreme
odziva, veliinu kataloga, kapacitet lokacije, pouzdanost itd.

Distribuirana obrada upita


Distribuirana obrada upita podrazumeva distirbuiranu optimizaciju upita kao i
distribuirano izvravanje upita. Strategije optimizacije upita nad distribuiranom
bazom
podataka imaju za cilj da minimizuju cenu obrade i vreme za koje e korisnik dobiti
odgovor. U trokovima obrade najveu stavku ine trokovi mrene komunikacije
dok
trokovi komunikacije sa ulazno/izlaznim ureajima i korienja procesora mogu biti
i za
red veliine nii. Zbog toga je veoma znaajno, u zavisnosti od propusnosti mree i
vremena kanjenja, pravilno odabrati relacije i njihove fragmente koji e biti
prenoeni sa
jedne lokacije na drugu u cilju obrade upita to predstavlja globalnu optimizaciju.
Razlog

za prenoenje podataka moe biti to to su podaci na lokaciji razliitoj od one na


kojoj se
postavlja upit, ili to u upitu uestvuje vei broj relacija sa razliitih lokacija. Izbor
strategije za izvrenje operacija na jednoj lokaciji poznat je kao lokalna optimizacija.

Preneto auriranje
Ukoliko je distribuirana baza u celosti ili delimino ponovljena, potreba za
konzistentnou svih kopija podrazumeva da se auriranje jednog logikog objekta
mora
preneti na sve fizike kopije tog objekta. Postoji vie strategija koje se primenjuju u
zavisnosti od toga da li je prioritet konzistentnost podataka ili brzina izvrenja
transakcije
i o njima e biti vie rei u delu o strategijama prenetog auriranja u distribuiranom
sistemu sa ponovljenim podacima.

Kontrola konkurentnog izvravanja i obrada uzajamnog


blokiranja
Problem konkurentnog izvravanja jedan je od najire izuavanih problema u
oblasti distribuiranih sistema baza podataka, a podrazumeva sinhronizaciju pristupa
delovima distribuiranog sistema tako da integritet baze ostane ouvan. Pored
konzistentnosti baze u smislu u kom se koristi u centralizovanom sistemu, ovde
postoji
problem odravanja globalne konzistentnosti tj. odravanja svih delova i kopija baze
konzistentnim.
Dva glavna pristupa reavanju ovog problema su pesimistiki, gde se
sinhronizacija korisnikih zahteva vri pre nego to izvrenje pone, i optimistiki,
pri
emu se posle izvrenja ispituje da li je stanje baze konzistentno. Dve tehnike koje
se

koriste u kombinaciji sa oba prethodno navedena pristupa su zakljuavanje koje se


bazira
na uzajamnom iskljuivanju pristupa objektima u bazi i tehnika vremenskih oznaka
koja
podrazumeva ureeno izvravanje transakcija na svim lokacijama u sistemu.
Problem uzajamnog blokiranja (engl. deadlock) u distribuiranom sistemu reava
se metodama prevencije/spreavanja i otkrivanja/otklanjanja.

Literatura:
Wikipedia.org
elibrary.matf.bg.ac.rs
link-university.com
citforum.ru

Вам также может понравиться