Вы находитесь на странице: 1из 193

UNIVERZITET U BEOGRADU

FAKULTET ORGANIZACIONIH NAUKA

Miljan M. Vueti

PRIMENA FAZI LOGIKE U ANALIZI


FUNKCIONALNIH ZAVISNOSTI U
RELACIONIM BAZAMA PODATAKA

- Doktorska disertacija -

Beograd, 2013
Ova doktorska disertacija raena je na Fakultetu organizacionih nauka, smer elektronsko
poslovanje. Prilikom definsanja teme, sadraja, naslova i rezultata istraivanja doktorske
disertacije konsultovan je prof. dr Mirko Vujoevi.

Komisija za pregled, ocenu i odbranu doktorske disertacije:

Mentor:

1. dr Mirko Vujoevi, red. prof.,


Fakultet organizacionih nauka, Beograd

lanovi komisije:

2. dr Nenad Anii, vanr.prof.,


Fakultet organizacionih nauka, Beograd
3. dr Zoran Avramovi, vanr. prof.
Saobraajni fakultet, Beograd
4. dr Slaan Babarogi, docent,
Fakultet organizacionih nauka, Beograd
5. dr Dragan Radojevi,
Nauni savetnik Institut Mihajlo Pupin

Datum odbrane:____________________

Datum promocije:__________________

2
Primena fazi logike u analizi funkcionalnih zavisnosti u relacionim bazama
podataka

Rezime:
Predmet istraivanja u disertaciji su fazi funkcionalne zavisnosti u relacionim
bazama podataka, a cilj istraivanja je prouavanja dosadanjih rezultata u ovom polju, te
razvoj sopstvenog algoritma za identifikovanje zavisnosti izmeu atributa relacije koji je
zasnovan na primeni fazi implikacija iz fazi logike. Problem analize fazi funkcionalnih
zavisnoti nije nov. U ovoj oblasti postoji znaajan broj radova u poslednje dve decenije i
veliki broj autora se bavio ovom problematikom. Meutim, analizom dostupne literature
utvreno je da ne postoji algoritam koji bi omoguio identifikovanje zavisnosti izmeu
atributa relacione eme. Ovo ogranienje bilo je motiv za razvoj sopstvenog pristupa u
analizu funkcionalnih zavisnosti nad datim skupom atributa. Reavanje ovog, ne tako
novog problema, ne predstavlja samo teorijski znaaj i istraivaki izazov, ve ima i
praktini znaaj. U tom smislu, cilj istraivanja je implementacija logikog modela baze
podataka koju daje prethodna teorija i koja podrava oekivane rezultate istraivanja, ali i
veza sa drugim oblastima i poljima (geografski informacioni sistemi, rudarenje podataka,
ekstrakcija informacija, smanjenje redundancije, estimacija nepoznatih vrednosti
atributa...).
Polazna pretpostavka je bila da teorija fazi skupova i odreeni fragment fazi logike
predstavljaju pogodno reenje kada projektanti informacionih sistema ne mogu
jednoznano da odrede zavisnost izmeu podataka i atributa relacije. U oblasti vetake
inteligencije, fazi skupovi i fazi logika izuavaju se sa aspekta dizajniranja fazi ralacionih
baza podataka, u okviru inteligentnih sistema, jer teorija fazi skupova i fazi logika
predstavljaju moan alat za manilupisanje nepreciznim i neodreenim informacijama.
Otkrivanje potencijalnih zavisnosti izmeu atributa posmatrane fazi relacije ustvari
predstavlja pronalaenje skrivenih i korisnih znanja koja moemo da koristimo za
donoenje poslovnih i upravljakih odluka. U radu je predstavljena nova tehnika koja
identifikuje postojanje zavisnosti izmeu atributa na nivou podrelacije (parova n-torki)
primenom razliitih fazi implikacija, ija karakterizacija je opisana u ovoj disertaciji u
kontkestu primene u ovoj problematici. Fazi implikacije koje zadovoljavaju ustanovljene
kriterijume prihvatanja koristimo za procenu jaine zavisnosti u sluaju postojanja fazi

funkcionalne zavisnosti X Y.
Za potrebe demonstracije predloene metodologije i verifikaciju rezultata
istraivanja izvren je eksperiment nad realnim podacima u fazi modelu baze podataka na
bazi relacije bliskosti i fazi modelu na bazi mogunosti distribucije.
Da bismo identifikovali fazi funkcionalne zavisnosti u odgovarajuem fazi modelu
potrebno je:
1. Pripremiti podatke za analizu,
2. Pronai podrelacije (parove n-torki) na posmatranim atributima u kojima se
potencijalno kriju fazi funkcionalne zavisnosti,
3. Pridruiti fazi funkcionalnim zavisnostima odgovarajue fazi implikacije,
4. Interpretirati rezultate istraivanja da bismo dobili konaan skup fazi zavisnosti.

3
Tragajui za fazi funkcionalnim zavisnostima u fazi relacionim bazama podataka
primenom predloene metodologije, neophodno je sa praktine strane gledita uraditi i
analizu efikasnosti. Osnovni nedostatak koji se pojavljuje je ukupan broj transakcija
(moguih parova n-torki sa povezanim vrednostima) koje je neophodno izraunati, a to
moe biti jako skupo za velike baze podataka. Poveanjem broja n-torki, kao i broja
atributa relacione eme, broj transakcija raste eksponencijalno. U radu predlaemo i
pokazujemo da je mogue poveati efikasnost algoritma i smanjiti broj prolaza kroz petlju.
Takoe, elimo naglasiti da priroda posmatranog problema odreuje efikasnost algoritma.
Postoje baze podataka u kojima kompresija nije potrebna. Sa druge strane, kada govorimo
o bazama sa velikom koliinom podataka i zapisa koristimo razliite tehnike kompresije i
redukcije zapisa u bazi kao to su fazifikacija, klasterovanje, granulacija, predstavljanje
veeg broja slinih n-torki reprezentom itd.
Generalno, nae istraivanje pokazuje kako da dobijemo inteligentne informacije iz
fazi relacionih baza podataka. Da bismo doli do moguih relacija izmeu atributa fazi
relacije najpre je neophodno pripremiti podatke za analizu odnosno krierati tabelu sa
parovima n-torki i vrednostima usaglaenosti na svim atributima originalne relacije. U
drugom koraku pronalazimo podrelacije u kojima su zadovoljeni kriterijumi za postojanje
fazi funkcionalnih zavisnosti. U treem koraku fazi funkcionalnim zavisnostima
pridruujemo odgovarajue fazi implikacije. Konano, mi interpetiramo rezultate iz
prethodnih koraka kako bismo dobili finalni skup fazi funkcionalnih zavisnosti.
Najvaniji doprinos ove doktorske disertacije predstavlja karakterizacija teorije fazi
skupova i fazi implikacija u kontekstu izgradnje alata i algoritma koji omoguava
identifikaciju odnosa izmeu atributa u posmatranim relacionim emama. Treba
napomenuti da ovaj rad predstavlja empirijsku studiju i ''prof-of-concept'' i da nije razvijen
komercijalni softver. Nadalje, mi smo diskutovali neke praktine sluajeve u kojima ova
metodologija moe biti veoma korisna. Eksperimantalni rezultati verifikuju rezultate
istraivanja.
Budue istraivanje podrazumeva primenu predstavljene metodologije u razliitim
scenarijima, kao to su: procena nedostajuih vrednosti, text mining, ektrakcija zavisnosti
iz praktinih baza znanja itd.
Kljune rei: fazi relacija, fazi funkcionalna zavisnost, fazi implikacija, rudarenje
podataka.
Nauna oblast: tehnike nauke
Ua nauna oblast: informacione tehnologije i operaciona istraivanja
UDK: 519.8:004.652.4.

4
Analysis of Functional Dependencies in Relational Databases Using Fuzzy
Logic

Abstract:

The research presented in this dissertation is finding of fuzzy functional


dependencies in the fuzzy relational database models. The goal is reviewing and analyzing
of recent results in this field and developing our own algorithm for identification of
dependencies between attributes in the fuzzy relations based on fuzzy implication in fuzzy
logic. The problem of fuzzy functional dependency analzsing in fuzzy relational database
models is not recent. In this area there is a significant number of papers and authors dealt
with mentioned issue in the last two decades. However, literature analysis showed that
there is no algorithm that would enable the identification of attribute relationships in
relational schemas. This restriction was the motive for the development of our metodology
in the analysis of fuzzy functional dependencies over a given set of attributes. Solving this,
not so new problem, is not only research challenge having theoretical importance, but it
also has practical significance. Implementation of logical database models provided by the
previous theory and integration to other areas and fields (GIS, Rudarenje podataka,
Information Retrieval, reducing data redundansy,estimation of NULL values...) are crucial
aims in this paper.
The initial assumption was that the theory of fuzzy sets and particular fragment of
fuzzy logic are the perfect solution when database managers cant unambiguously
determine the relationships between data and attributes within the relation. In the field of
artificial intelligence, fuzzy sets and fuzzy logic are studied in terms of fuzzy relational
database design within the intelligent systems because fuzzy set theory and fuzzy logic are
powerful tools for manipulating and representing imprecise and uncertain information.
Finding potential dependencies between attributes in fuzzy relations is actually
rudarenje podataka technique related to hidden and useful knowledge used for decision
making. This dissertation presents a new technique for identification of existing
dependencies between pairs of tuples using different fuzzy implications which
characterization is described by author. Fuzzy implications meeting established
acceptance criteria are used for estimation of linguistic strength when fuzzy functional

dependency X Y is satisfied.
For demonstration of proposed methodology and research verification we performed
experiment on real data under two different models: fuzzy database model based on
proximity relation and fuzzy database model with possibility distribution.
Discovering potential dependencies between attributes of the observed fuzzy relation
actually represents a discovery of hidden and useful knowledge, i.e. a rudarenje podataka
technique. In order to identify fuzzy functional dependency within the corresponding fuzzy
model, following is necessary:
1. Preparing the data for the analysis (preprocessing, data summarization, data
warehousing etc.).
2. Finding subrelations (n-tuples) on the observed attributes with potentially hidden
fuzzy functional dependencies.
3. Associating fuzzy functional dependencies with corresponding fuzzy implications.

5
4. Interpreting search results for the purpose of getting the final set of fuzzy
dependencies.
From a practical point of view, in search of fuzzy functional dependencies within
fuzzy database models through application of the proposed methodology, it is necessary to
conduct efficiency analysis as well. Main shortcoming that may appear is the total number
of transactions (possible pairs of tuples with associated values) that needs to be computed,
which can be very expensive for large databases. Increase of the number of tuples, as well
as the number of attributes of relational scheme, exponentially increases the number of
tuples. However, in this PhD thesis we propose and show that increase of algorithm's
efficiency is possible, as well as decrease of the number of computed transactions.
However, we would like to note that the nature of the observed problem determines
efficiency of the algorithm. There are databases where compression is not neccesary, while
in other cases, when we are talking about huge databases, a variety of techniques are
proposed for the relation reduction such as data summarization based on fuzzification [],
cluster formation, granulation, presenting a number of similar tuples with one
representing tupe etc.
Generally, our research shows us how to extract intelligent information from fuzzy
relational databases. In order to identify possible relations between attributes of fuzzy
relation, we must firstly prepare the data for the analysis i.e. create a table with pairs of
tuples and conformance values on all attributes of original relation. Next step is to find
sub-relations where criteria for the existence of fuzzy dependencies were met. Third step is
to associate fuzzy functional dependencies with corresponding fuzzy implications. Finally,
we interpret the results of previous steps in order to get the final set of fuzzy functional
dependencies.
The most important contribution of this dissertation is characterization of the theory
of fuzzy sets and fuzzy implications in the context of developing tools and algorithms that
facilitate identification of relations between attributes in the observed relational schemes. It
should be pointed out that this paper represents an empirical study and a proof-of-
concept, without developed commercial software. Moreover, we discussed certain
practical cases where this methodology can be suitable. Our experiments suggest that
results provided by algorithm are acceptable.
As a future work we plan to employ this research in different scenariosand
applications involving this methodolog such as: estimating null values in relational
databases, text mining, extraction dependencies from practical knowledge databeses etc.
Keywords: fuzzy relation, fuzzy functional dependency, fuzzy implication, rudarenje
podataka.
Scientific field: technical science
Specialized scientific field: information technology and operational research
UDC: 519.8:004.652.4.

6
Sadraj

1. Uvod ................................................................................................................................. 9

2. Fazi skupovi i fazi logika .............................................................................................. 12


2.1. Uvod u fazi skupove ............................................................................................................. 12
2.2. Fundamentalni koncept fazi skupova .................................................................................... 18
2.3. Princip rezolucije i reprezentacije ......................................................................................... 19
2.4. Operacije nad fazi skupovima ............................................................................................... 21
2.5. t-norma i t-konorma .............................................................................................................. 23
2.6. Fazi relacije ........................................................................................................................... 25
2.7. Teorija aproksimativnog rezonovanja ................................................................................... 28
2.8. Semantika sistema aproksimativnog rezonovanja ................................................................ 30
2.9. Dedukcija u sistemu aproksimativnog rezonovanja .............................................................. 30
2.10. Kompoziciono pravilo ......................................................................................................... 31
2.11. Fazi implikacije ................................................................................................................... 32
2.12. Fazi metod zakljuivanja..................................................................................................... 34
2.13. Zadovoljivost u fazi logici .................................................................................................. 35
2.14. Rezolventa u fazi logici ....................................................................................................... 35
2.15. Zakljuak ............................................................................................................................. 38

3. Fazi relacione baze podataka ....................................................................................... 39


3.1. Relacioni model baza podataka............................................................................................. 39
3.1.1. Modeli, atributi, entiteti ..................................................................................... 39
3.1.2. Predstavljanje skupa entiteta skupom n-torki .................................................... 39
3.1.3. Relaciona algebra .............................................................................................. 40
3.1.4. Funkcionalne zavisnosti .................................................................................... 43
3.1.5. Vieznane zavisnosti ........................................................................................ 44
3.1.6. Osobine vieznanih zavisnosti ......................................................................... 46
3.2. Fazi relacioni model baza podataka ...................................................................................... 46
3.2.1. Nesavrene informacije i teorija fazi skupova ................................................... 48
3.2.2. Predstavljanje podataka u fazi modelu .............................................................. 49
3.2.3. Relacija bliskosti ............................................................................................... 51
3.2.4. Fazi upiti ............................................................................................................ 53
3.2.5. Redundancija podataka ...................................................................................... 60
3.2.6. Redundacija u fazi relacionim bazama podataka .............................................. 61
3.3. Fazi objektno-orijentisane baze podataka ............................................................................. 64
3.4. Fazi sistemi za upravljanje relacionim bazama podataka ..................................................... 65
3.5. Fazi funkcionalne zavisnosti ................................................................................................. 65
3.5.1. Pravila izvoenja za fazi funkcionalne zavisnosti ............................................. 67
3.5.2. Fazi funkcionalne zavisnosti i pravila izvoenja u modelu Raju i Majumdar-a 69
3.5.3. Fazi funkcionalne zavisnosti i pravila izvoenja u modelu Shenoi-Melton ...... 71
3.5.4. Fazi funkcionalne zavisnosti i pravila izvoenja u modelu Saxena i Tyagi-a ............... 71
3.5.5. Fazi funkcionalne zavisnosti i pravila izvoenja u modelu Dubois-Prade .................... 72
3.5.6. Fazi funkcionalne zavisnosti i pravila izvoenja u modelu Wei-Yi Liu ........................ 73
3.5.7. Fazi funkcionalne zavisnosti i pravila izvoenja u modelu Sozati i Yazici ................... 74
3.5.8. Primena saglasnosti (conformance) u analizi fazi funkcionalnih zavisnosti .................. 77
3.5.9. Analiza podataka i primena funkcionalnih zavisnosti u modelu Cubero -Medina ........ 79
3.5.10. Fazi aproksimativne zavisnosti .................................................................................... 81
3.5.11. Fazi vieznane zavisnosti ........................................................................................... 84
3.6. Zakljuak .............................................................................................................................. 85

7
4. Projektovanje relacionih baza podataka .................................................................... 86
4.1. Logiki model baza podataka .............................................................................................. 86
4.2. Logiko projektovanje postupkom normalizacije tabela..................................................... 89
4.2.1. Prva, druga i trea normalna forma ................................................................... 90
4.2.2. Ostale normlalne forme ..................................................................................... 93
4.3. Normalizacija u fazi relacionim modelima baza podataka ................................................. 93
4.4. Fizika organizacija podataka ............................................................................................. 97
4.4.1. Fizika reprezentacija relacije ......................................................................... 100
4.5. Zakljuak ........................................................................................................................... 102

5. Analiza fazi funkcionalnih zavisnosti u relacionim bazama podataka ................... 103


5.1. Uvodna razmatranja ............................................................................................................ 103
5.2. Model fazi relacione baze podataka .................................................................................... 104
5.3. Pretraga fazi funkcionalnih zavisnosti u FRDBMs............................................................. 108
5.4. Uloga fazi logike u ispitivanju fazi funkcionalnih zavisnosti ............................................. 110
5.5. Karakterizacija fazi implikacija u fazi modelima baza podataka........................................ 111
5.6. Izbor fazi implikacije u algoritmu za identifikovanje fazi funkcionalnih zavisnosti .......... 117
5.7. Model algoritma za pronalaenje fazi funkcionalnih zavisnosti ......................................... 118
5.8. Zakljuak ............................................................................................................................ 120

6. Algoritam za identifikovanje fazi funkcionalnih zavisnosti .................................... 121


6.1. Eksperiment nad realnim fazi relacijama ............................................................................ 121
6.2. Algoritam za pretragu fazi funkcionalnih zavisnosti u fazi modelu na bazi relacije
bliskosti ...................................................................................................................................... 121
6.3. Algoritam za pretragu fazi funkcionalnih zavisnosti u fazi modelu na bazi mogunosti
distribucije ................................................................................................................................. 145
6.4. Upotreba fazi priloga .......................................................................................................... 158
6.5. Poreenje primene razliitih fazi implikacija ..................................................................... 159
6.6. Praktina primena metodologije ......................................................................................... 160
6.7. Projektovanje fazi relacionih baza podataka ....................................................................... 162
6.7.1. Prva fazi normalna forma (F1NF) .............................................................................. 162
6.7.2. q-Druga fazi normalna forma (q-F2NF) ..................................................................... 163
6.7.3. q-Trea fazi normalna forma (q-F3NF) ...................................................................... 164
6.8. Efikasnost algoritma ........................................................................................................... 166
6.9. Zakljuak ............................................................................................................................ 169

7. Zakljuak...................................................................................................................... 170

8. Prilog - Programski kod za Algoritam napisan u C# .............................................. 173

9. Literatura .................................................................................................................... 180

10. Biografija .................................................................................................................... 186

8
1. Uvod
U ovoj doktorskoj disertaciji predstavljeni su rezultati istraivanja u identifikovanju
fazi funkcionalnih zavisnosti primenom metoda i alata iz fazi logike. Predmet istraivanja
bila je fazi relaciona baza podataka zbog svoje fleksibilnosti i efikasnosti u pogledu
pronalaenja zavisnosti izmeu skupa atributa relacione eme, te mogunosti primene
dobijenih rezultata u logikom dizajnu i modelovanju iste, definisanju novih tehnika
rudarenja podataka i drugih oblasti i polja gde predstavljena metodologija moe da nae
svoje mesto i znaajnu ulogu. Sama ideja nastala je prouavanjem klasinih relacionih
baza podataka i njihovih ogranienja kao to je nemogunost interpretacije razliitih tipova
neodreenosti i nepreciznosti koje se pojavljuju u realnim informacionim sistemima.
Integracija ovog ogranienja u klasine relacije dovela nas je do sistema baza podataka
koji lee u okviru koncepta vetake inteligencije. Sinteza dostupnih znanja iz Zadeove
teorije fazi skupova i fazi logike, a zatim i razvoj, implementacija i primena fazi relacionih
baza podataka bili su osnovni motivi za istraivanje i konkretizaciju rezultata rada u
doktorskoj disertaciji.
Savremene korporacije su sve vie zavisne od informacija koje se generiu iz baza u
kojima se skladite ogromne koliine podataka. Upravljanje i manipulacija ovim podacima
zahtevaju mehanizme koji omoguavaju pristup informacijama od znaaja koje su u veini
sluajeva neohodne za donoenje poslovnih odluka. Zbog toga je u disertaciji predstavljen
napredni algoritam za pronalaenje fazi funkcionalnih zavisnosti i primena dobijenog
skupa zavisnosti u konkretnim situacijama i primerima. Fazi pristup se kontinualno
prouava i neprekidno se javljaju nove mogunosti primene ovog koncepta u analizi
problema razliite prirode. Problem analize funkcionalnih zavisnoti u fazi relacionim
bazama podataka nije nov. U ovoj oblasti postoji znaajan broj radova i u poslednje dve
decenije veliki broj autora se bavio problemom analize fazi funkcionalnih zavisnosti.
Problem kod fazi relacionih baza znanja jeste injenica da procedura ispitivanja zavisnosti
i izvoenja logikih posledica iz datog skupa atributa u okviru date aksiomatizacije jeste
dosta sloena. Ne postoji algoritam koji bi odabirao odgovarajue aksiome i dostupna
znanja u datom koraku da bi se dolo do reenja i odgovarajuih fazi funkcionalnih
zavisnosti u bazi podataka, a takoe ne postoji globalna strategija koja bi davala valjane
rezultate. Naa pretpostavka je bila da fazi logika predstavlja pogodno reenje kada
projektanti informacionih sistema ne moe jednoznano da odredi zavisnost izmeu
podataka i atributa relacije.
Dakle, predmet istraivanja u ovoj doktorskoj disertaciji je fazi relaciona baza
podataka. Fazi relacioni model baza podataka je skup relacija ureenih n-torki. Ove n-torke
su uzete u formi (d1,d2,...,dn), gde je di domen vrednosti datog skupa Di, i di je ili neprezan
podskup od Di ili je elemant takav da pripada Di. Fazi relacione baze podataka na prirodan
nain proiruju funkciju klasinih baza znanja, to obezbeuje vii nivo adaptacije fazi
sistema, kao jedne od osnovnih osobina inteligentnih sistema (pored sistema planiranja,
uenja, predikcije, , robota, sistema za pretragu znanja). U samoj biti ovih modela podataka
je injenica da postoji veliki broj aktivnih istraivakih oblasti koje direktno ukljuuju ili
koriste ove baze znanja. Pitanje nepreciznosti podataka i njihove reprezentacije ja jako
zastupljena tema i vrlo vana u raznim oblastima. Naveemo samo neke od njih:
geografski informacioni sistemi (GIS) i reprezentacija prostornih podataka, sistemi za
traganje kroz podatke, pretraivanje fazi informacija...Razmatranje sa lingvistike take
gledita je veoma vaan aspekt koji se koristi u ovim sistemima. Zbog toga, po logici
stvari, fazi logika prua mogunost karakterizacije, generalizacije i analize podataka u

9
bazama podataka. Voeni tom injenicom, dolazimo do polazne hipoteze da fazi logika
moe da ima vanu ulogu i u ispitivanju fazi funkcionalnih zavisnosti u bazama podataka.
Navedni predmet istraivanja implicitno ukazuje i na ciljeve istraivanja doktorske
disertacije:
- Sistematska studija znanja iz oblasti fazi logike (teorija fazi skupova, fazi
implikacije, fazi metod zakljuivanja, princip rezolucije, generelizovani modus
ponens i modus tolens...)
- Prouavanje postojeih metoda koje se koriste u analizi funkcionalnih zavisnosti u
fazi relacionim bazama podataka.
- Istraivanje i razvoj nove metodologije za pronalaenje fazi funkcionalnih
zavisnosti koja je zasnovana na odreenom fragmentu fazi logike.
- Praktina primena algoritma za pronalaenje fazi funkcionalnih zavisnosti.
Reavanje ovog, ne tako novog problema, ne predstavlja samo teorijski znaaj i
istraivaki izazov, ve ima i praktini znaaj. Pa je stoga cilj istraivanja i
implementacija logikog modela fazi relacione baze podataka koju daje prethodna
teorija i koja podrava oekivane rezultate istraivanja, ali i veza sa drugim
oblastima i poljima (GIS, rudarenje podataka, ekstrakcija pravila, statistike baze
podataka, redundancija, biznis registri...).
- Analiza efikasnosti i nedostataka prezentovanog reenja.
- Identifikovanje otvorenih problema i buduih smernica istraivanja u ovoj oblasti.
Celukopna sistematizacija znanja je omoguila generisanje ideje i hipoteze
doktorske disertacije. U skladu sa definisanim predmetom i ciljom istraivanja definiemo
i hipoteze doktorske disertacije. Kao to smo napomenuli, opta hipoteza koju smo
razmatrali u radu je:
- Teorija fazi skupova i odreeni fragment fazi logike mogu da se primenjuju u
analizi funkcionalnih zavisnosti u relacionim bazama podataka.
Pored opte i polazne hipoteze doktorske disertacije, testirali smo i sledee posebne
hipoteze, kroz koje smo nastojali da potvrdimo ili opovrgnemo i optu hipotezu:
- Razvijena metodologija analize fazi funkcionalnih zavisnosti moe da se koristi za
logiko dizajniranje fazi relacionih baza podataka.
- Fazi implikacije su adekvatne za procenu jaine zavisnosti izmeu atributa fazi
relacione baze podataka.
- Teorija fazi skupova i odreeni fragment fazi logike pruaju poboljane mogunosti
u analizi funkcionalnih zavisnosti.
- Za otkrivanje fazi funkcionalnih zavisnosti mogu da se koriste razliite fazi
implikacije.
- Fazi funkcionalne zavisnosti poveavaju efikasnost statistikih baza podataka.
Od metoda istaivanja u doktorskoj disertaciji koristili smo teoriju fazi skupova i
odreene fazi implikacije. Da bi uspeno realizovali istraivanje, zamisao je bila da se
koristi i fazi metod zakljuivanja, metoda logikog objanjenja i naunog saznanja, metode
generalizacije i konkretizacije, kao i eksperiment nad realnim podacima. Naravno, klasine
metode prikupljanja i analize podataka su metode koje su koriene u izradi pristupog rada,
te smo i u toku izrade doktorske disertacije pribegavali ovim strunim izvorima znanja.

10
Sadraj doktorske disertacije prikazan je kroz sledea poglavlja:
- U drugom poglavlju prikazani su osnovni pojmovi i rezultati iz teorije fazi skupova
i fazi logike i naveden je znaaj i mogunosti primene ovih rezultata u relacionim
bazama podataka. U ovom poglavlju objanjeni su pojmovi fazi skupa, fazi
implikacija, principa rezolucije, fazi rezonovanja, fazi relacije, t-norm i t-konorm.
- U treem poglavlju definisan je osnovni koncept fazi relacionih baza podataka,
funkcionalnih zavisnosti, vieznanih zavisnosti kao i pregled ostvarenih i
najznaajnijih rezultata na polju analize funkcionalnih zavisnosti u fazi relacionim
bazama podataka.
- etrvto poglavlje se bavi ulogom i znaajom funkcionalnih zavisnosti u
projektovanju baza podataka kao osnovnog poligona za primenu dobijenih rezultata
istraivanja,
- Peto poglavlje predstavlja rezultat samostalnog istraivanja i razvoj sopstvenih
metoda u analizi fazi funkcionalnih zavisnoti. U ovom poglavlju analizirali smo
karakterizaciju razliitih fazi implikacija u kontekstu njihove primene u otkrivanju
fazi funkcionalnih zavisnosti i predstavili model algoritma.
- U estom poglavlju posmatrali smo rezultate primene algoritma nad realnim
podacima, prikazali rezultate eksperimenta i ukazali na praktinu primenu
predloene metodologije.
- U sedmom poglavlju smo se osvrnuli na zakljuna razmatranja, predstavili nauni
doprinos doktorske disertacije i identifikovali mogue oblasti primene koje mogu
da proizau iz istraivanja, a koje smo predvideli za budua istraivanja.
- U prilogu je prikazan kod napisan u programskoj jeziku C# koji smo koristili za
verifikaciju rezultata istraivanja.

11
2. Fazi skupovi i fazi logika
U ovom poglavlju uvedene su osnove teorije fazi skupova [3,4,19-22] i dat je prikaz
osnovnih koncepata kao i interpretacija fazi skupova, a naroito mogunost dokazivanja
semantikih operacija na fazi skupovima.
60-tih godina prolog veka Lotfi Zade uvodi novi koncept kombinujui crisp logiku i
Lukasiewic-eve skupove definisane pomou stepena pripadnosti. Jedna od glavnih
Zadeovih ideja kojom se vodio u svojim analizama jeste injenica da matematika moe da
se koristi za povezivanje jezika i ljudske inteligencije. Mnoge realne situacije se bolje
prikazuju reima nego matematikim formulacijama, a upravo fazi logika kroz svoje izraze
(fazi skupove) obezbeuje jednostavnije modeliranje stvarnosti. Stvarni svet se stalno
menja i prepun je iznenadnih i nepredvidivih situacija. Drugim reima, stvarni svet je fazi.
Upravo, fazi tehnika nam prua mogunost da uspeno upravljamo realnim situacijama.

2.1. Uvod u fazi skupove

U matematikoj teoriji osobine i koncepti mogu se opisati pomou specifinog


podskupa datog univerzalnog skupa. Na primer, ako uzmemo da je N skup prirodnih
brojeva, univerzalni skup, tada osobina da je broj jednocifren moe se izrazi koristei skup:
X={1, 2, 3, ..., 9} N
Ova reprezentacija koja je jednostavna u strukturi, ali nije esto primenljiva, moe se
takoe prikazati pomou predikata tj. jednocifreni broj (n) je istinit za prirodan broj n N
ako i samo ako decimalna reprezentacija od n sadri tano jednu cifru ili

X={n N: jednocifren broj (n) }

Trei nain predstavljanja jednocifrenog broja je pomou karakteristine funkcije,


koja ja za navedeni primer definisana kao:

X : N {0,1}

1, ako je jednocifre n broj (n)


(n)
x 0, u suprotnom

Vrednosti 0 i 1 karakteristine funkcije zovu se i stepenom pripadnosti.


U teoriji fazi skupova, karakteristina funkcija generalizovana je funkcijom
pripadnosti tako da svakom elementu iz univerzalnog skupa, umesto dvoelementnog skupa
{0,1}, pridruuje se vrednost iz jedninog intervala [0,1]. Skup koji je definisan na osnovu
takve funkcije pripadnosti naziva se fazi skup.
Sledea definicija formalno definie koncept fazi skupa.
Definicija 2.1. Neka je X domen. Fazi vrednosti na domenu X okarakterisane sa fazi
skupom A na X i funkcijom pripadnosti:
A : X [0,1]

12
Na ovaj nain svaki element xX ima stepen pripadnosti fazi skupu A, A(x)[0,1].
Dakle, fazi skup A kompletno je ureen sa skupom ureenih parova:
A = {(x,A(x)) | xX, A(x)[0,1]}
pri emu je A(x) stepen pripadnosti elementa x skupu A. Ukoliko je A(x) vee utoliko
ima vie istine u tvrdnji da element x pripada skupu A.
U klasinoj teoriji skupova postoje veoma precizne granice koje razdvajaju elemente
koji pripadaju odreenom skupu od elemenata van posmatranog skupa. Svaki obini skup
(u kontekstu fazi sistema nazvan crisp skup) moe se interpretirati preko date
karakteristine funkcije, kao specijalan sluaj fazi skupa. Veliki broj skupova sa kojima se
susreemo u realnosti nema precizno odredjene granice koje razdvajaju elemente u skupu
od elemenata izvan skupa. (npr. kratko vreme ekanja na semaforu).
Oznaimo sa X = {x1, x2, ..., xn} konaan skup elemenata xi, i = 1, 2, ..., n. Skup X
moe takodje da bude prikazan u obliku:
n
X = x1+x2+...+xn= x
i 1
i

pri emu znak + oznaava uniju elemenata.


Fazi skup A definisan na skupu X esto se prikazuje u obliku:

A (x 1 ) A (x 2 ) (x ) n (x )
A ... A n A i
x1 x2 xn i 1 xi

U sluaju kada X nije konaan skup, kontinulani fazi skup A definisan na domenu X
izraava se kao:
A (x)
A
X
x
Primer 2.1. X = {2, 5, 9, 18, 21, 25}. Elementi skupa oznaavaju broj vozila koja ekaju
u redu ispred semafora.
B mali broj vozila u redu
Fazi skup B moe, na primer, da bude prikazan kao:

0.95 0.55 0.20 0.10 0.05 0.01


B
2 5 9 18 21 25

13
Na sledeoj slici dat je tipian fazi skup sa funkcijom pripadnosti na jedninom intervalu:

A
F 1

x
Slika 1. Opadajua funkcija pripadnosti
Na sledeim slikama ilustrovane su dve vane klase funkcija pripadnosti: trougaona i
trapezoidna.

x
Slika 2. Trougaona forma funkcije pripadnosti

x
Slika 3. Trapezoidna forma funkcije pripadnosti

Trouglasta funkcija pripadnosti je najee koriena i najpraktinija funkcija, ali i


drugi oblici koji su prikazani na slikama se koriste. Fazi skup moemo da prikaemo i u
vidu kvadratne jednaine, u tom sluaju funkcija pripadnosti je neprekidna kriva, kao to je
prikazano na sledeim slikama. Mogua su tri oblika: S-funkcija, Z-funkcija i -funkcija
[69].

14
A

x
Slika 4. Z funkcija pripadnosti

x
Slika 5. S funkcija pripadnosti

x
Slika 6. - funkcija pripadnosti

Bilo koji fazi skup A moe se opisati pomou funkcije pripadnosti A(x), x X. Ali
praktino, ovo je mogue samo ako univerzalni skup (domen) X sadri konaan broj
elemenata. U suprotnom, ako je broj elemenata velik ili beskonaan, tada se stepen
pripadnosti A(x) najbolje odreuje uz pomo odgovarajuih parametara, gde ovi parametri
moraju biti usklaeni datom problemu.

15
Ako je X=R, tada u mnogim sluajevima lingvistiki izrazi kao Visok , Oko m i
priblino izmeu a i d, mogu biti tretirani kao elementi koji odgovaraju klasi fazi
skupova, tako da zadovoljavaju uslov x X : (x)=1. U ovom sluaju za fazi skup
kaemo da je normalan.
U aplikacijama, intrepretacija Visok je monotona neopadajua funkcija sa dva
paramerta, definisana kao:

0, ako je xa,

x a ako je a x b,
A (x) ,
x b
1, ako je x b

Za interpretaciju lingvistikog izraza Oko m moe se definisati trougaona funkcija kao:

mx
1 , ako je m-d x m+d,
A (x) d

0, x < m-d ili x>m+d

Analogno izraz priblino izmeu a i d moe se okarakterisati pomou trapezoidne


funkcije sa etiri parametra, definisana kao:

xa
, ako je a x b,
ba
1, ako je b x c,
A (x) xd
, ako je c x d,
cd

0, ako je x < a ili x>d

U prethodim primerima fazi skupovi (u oznaci A) su dati pomou funkcije


pripadnosti : X [0,1] . Ova reprezentacija odgovara razmatranju funkcije, ija slika
elemenata x, uzeta iz univerzalnog skupa X, uzima vrednost (x). S obzirom na
karakteristinu reprezentaciju funkcije pripadnosti , ovo nazivamo vertikalnom
reprezentacijom odgovarajueg fazi skupa. Horizontalna reprezentacija fazi skupa
definisana je pomou -preseka [26] .

16
Definicija 2.2. Neka je A fazi podskup od X i neka je [0,1]. Tada se skup
A ={x X A(x) }
naziva - presek skupa A.
Fazi skupovi su relevantni u mnogim problemima sa kojima se susreemo:
klasifikacija i analiza podataka u savremenim bazama, problemi odluivanja i
aproksimativno rezonovanje. Naravno, ove tipologije problema nisu jedine gde fazi
skupovi i funkcija pripadnosti imaju eksplicitnu primenu. Uopteno posmatrano, veina
drugih poslova adresirana na fazi skupove (na primer upiti u relacionim bazama podataka)
ukljuuje ovakvu vrstu istraivanja, pa se u praksi sve ee koristi termin fazi
informacioni inenjering.
Tri glavna znaenja za funkciju pripadnosti, koja se susreu u literaturi su: slinost,
preferencija i neizvesnost. [75] Svaka od navedenih semantika se nalazi u osnovi posebnih
klasa aplikacija. Funkcija pripadnosti fazi skupova ponekad predstavlja i funkciju
korisnosti koja predstavlja fleksibilno ogranienje u problemima donoenja odluka. U
narednim odeljcima definisana su referentna tumaenja primene funkcije pripadnosti:
Stepen slinosti: Pomou funkcije pripadnosti moe da se definie stepen bliskosti i
slinosti posmatranih elemenata. Ovo je, ujedno i najstarija semantika koju uvode Belman i
ostali. Ovaj prikaz je naroito znaajan u klaster analizi i regresionoj analizi, gde se
susreemo sa problemom predstavljanja podataka i odreivanja bliskosti izmeu
informacija.
Stepen preferencije: Fazi skup A predstavlja skup manje ili vie eljenih objekata ili
vrednosti varijable na osnovu koje se donose odluke. U tom sluaju, A(x) predstavlja
intenzitet prednosti u korist objekta x, odnosno preferenciju izbora objekta (vrednosti) x.
Fazi skup je tada kriterijum ili fleksibilno ogranienje. Ovaj pristup koji su izneli Belman i
Zade, predstavlja danas osnovu problema fazi optimizacije, fazi linearnog programiranja i
analize odluka. Aproksimativno rezonovanje na bazi varijabli i ogranienja koja mogu biti
fazi naroito je pogodno za primenu ovakovog pristupa.
Stepen neizvesnosti: Ovo tumaenje je predloio Zade u svojoj teoriji fazi skupova.
A(x) predstavlja stepen pripadnosti elementa x fazi skupu A. Funkcija pripadnosti rangira
vrednosti u smislu njihove verodostojnosti. Ovakav pristup se koristi u ekspertnim
sistemima.
Jedna od najvanijih osobina fazi logike jeste njena mogunost da izrazi stepen
neodreenosti u ovekovom razmiljanju i njegovu subjektivnost. Fazi logika se esto
pogreno poistoveuje sa verovatnoom. Osnovna razlika izmeu fazi logike i teorije
verovatnoe sastoji se u tome da fazi logika operie sa deterministikim nedoreenostima i
neodreenostima, dok se verovatnoa bavi verodostojnou stohastikih dogaaja i iza nje
sutinski stoji eksperiment. Fazi logika prosto ima za cilj prevazilaenje problema u
komunikaciji vezanim za razlike izmeu pravila koja nameu formalne teorije i naina
razmiljanja koji opisuju ponaanje ljudskog uma, dok se verovatnoa generalno bavi
fenomenom ponavljanja koji se simbolizuje sluajnou (sluajnim promenjivim i
sluajnim procesima). Drugim reima, fazi i sluajni su dva atributa koji se razlikuju u
svojoj prirodi, odnosno, oni opisuju drugaiji aspekt neodreenosti. Dakle, fazi logika
pokriva subjektivnost ljudskog miljenja, oseanja, jezika, dok verovatnoa pokriva
objektivnu statistiku u prirodnim naukama. Analogno, fazi modeli i modeli formirani na
bazi verovatnoe nose drugaiji vid informacija: fazi funkcija pripadnosti predstavlja

17
slinost objekata u kontekstu neprecizne definicije osobina, dok verovatnoa daje
informaciju o frekvenciji ponavljanja.
Sa matematike take gledita, fazi skup je preslikavanje skupa elemenata u opseg
koji ima strukturu reetke i obino linearni poredak. Takva osnovna ideja skupa sa
funkcijom pripadnosti ili ponderisanim elementima pokazala se veoma korisnom u analizi
znanja i predstavljanju informacija. Zaista, stepen pripadnosti, kao to smo i naveli moe
da se koristi u razliitim kontekstima: slinost, preferencija, neodreenost. U bazama
podataka, nepoznata vrednost atributa moe da se predstavi fazi skupom (manje ili vie
verodostojnim vrednostima). Kao generalizacija teorije skupova, fazi skupovi mogu da se
kombinuju sa operacijama i relacijama definisanim u teoriji skupova na osnovu principa
proirenja, a o tome e biti rei u narednim poglavljima.

2.2. Fundamentalni koncept fazi skupova

Ovde, kao prvo, uvodimo koncepte u teoriji fazi skupova koji ne postoje u klasinoj
teoriji skupova. Fazi skupovi su okarakterisani sa visinom i nosaom [4,19], pa emo
najpre dati sledee definicije.
Definicija 2.3. Visina fazi skupa A je najvei stepen pripadnosti elementa u A:
Visina(A)=supxX(A(x))
Definicija 2.4. Nosa fazi skupa je klasian skup elemenata x X takvih da je A(x)>0:
Supp (A) = {x | A(x)>0, xX}
Definicija 2.5. Fazi skup A univerzalnog skupa X zove se normalnim, ako postoji bar
jedan element x X takav da je A(x)=1. Fazi skup koji nije normalan zove se
subnormalnim. Svi klasini skupovi izuzev praznog skupa su normalni.
Definicija 2.6. Neka je A fazi skup od X. Jezgro od A, je podskup od X, koji sadri sve
elemente sa stepenom pripadnosti 1:
Jezgro(A) = {x | A(x)=1, x X }
Normalni fazi skup ima nenulto jezgro, dok subnormalni fazi skup ima nulto jezgro. Sada
emo dati proirene definicije na fazi skupovima :
Definicija 2.7. Neka su A i B dva fazi skupa definisana na univerzalnom skupu X.
Kaemo da je A podskup fazi skupa B, A B, ako je B(x) A(x), za svako x X.
Primer 2.2. Neka je A = {0.1/a, 0.6/b, 0.1/c } i B = {0.4/a, 0.8/b, 0.1/c}. Na osnovu
prethodne definicije sledi da je A B. Odavde vidimo da ova definicija proiruje ideju
klasinih skupova.
Neka je univerzalni skup X={a, b, c,d, e} i neka su data dva skupa A = {a,b} i B = {a,b,c}
na X. Oigledno je da je A B. U fazi skupovima imamo A = {1/a, 1/b, 0/c, 0/d, 0/e},
B = {1/a, 1/b, 1/c, 0/d, 0/e}, a s obzirom da je B(x) A(x), za svako x X sledi da je
A B.
Definicija 2.8. Neka su A i B dva fazi skupa definisana na skupu X. Kaemo da je fazi
skup A jednak fazi skupu B, A = B, ako je A B i B A, odnosno A = B ako i samo ako
je A(x) = B(x), za svako x X.
Definicija 2.9. Nulti fazi podskup od X je definisan kao fazi podskup od X takav da je
(x) = 0 za x X. Primetimo da za bilo koji podskup A od X je A. Dalje, poto X

18
moe da bude fazi skup za koje je X(x) = 1 za svako x X , tada je za bilo koje A,
A X.
Definicija 2.10. Neka je A fazi skup od X gde je X = {x1..., xn}. Tada se u fazi skupu A,
n
definie diskretna notacija kao x . Primetimo da je za klasine skupove diskretna
i 1
A i

notacija ekvivalentna kardinalitetu skupa.


Definicija 2.11. Neka je A fazi skup na univerzalnom skupu X. Radni domen od skupa A,
oznaen sa Rdom(A) je isto to i nosa skupa Supp(A).
Primer 2.3. Pretpostavimo da je mogui broj osvojenih bodova na nekom ispitu jedan od
elemenata skupa {10, 20, 30, 40, 50, 60, 70, 80, 90,100}. Ovo je, u svetlu prethodne prie,
univerzalni skup X. Posmatrajmo potom tri fazi skupa: A=Odlian uspeh, B=Osrednji
uspeh i C=Slab uspeh, ije su funkcije pripadnosti prikazane sledeom tabelom:

Broj poena Odlian uspeh (A) Osrednji uspeh (B) Slab uspeh (C)
10 0 0 1
20 0 0 1
30 0 0.1 0.9
40 0 0.5 0.7
50 0.1 0.8 0.5
60 0.3 1 0.3
70 0.5 0.8 0.1
80 0.8 0.5 0
90 1 0 0
100 1 0 0
Tabela 1. Funkcije pripadnosti fazi skupova A, B, C

Tada je:
Supp (A) = {50, 60, 70, 80, 90,100}
Supp (B) = {30, 40, 50, 60, 70, 80}
Supp (C) = {10, 20, 30, 40, 50, 60, 70}
Definicija 2.12. Fazi skup A ija se podrka sastoji od samo jednog elementa univerzalnog
skupa X i pri tome je A(x)=1, naziva se fazi singlton (fazi singleton).
Definicija 2.13. Element x X za koji vai A(x)=0.5 naziva se taka prolaska
(crossover point).

2.3. Princip rezolucije i reprezentacije

Na osnovu definisanih -preseka, mogue je uvesti jednu veoma vanu osobinu


teorije fazi skupova koja se naziva princip rezolucije (resolution principle) [57]. Ova
osobina otvara mogunost ekspanzije fazi skupa u niz njegovih -preseka.
Teorema 1. Neka je A fazi skup definisan na nekom univerzalnom skupu X. Tada se
funkcija pripadnosti ovog fazi skupa moe izraziti na osnovu -preseka u sledeem obliku:
A(x)=sup [ A(x)] x X, [0,1]
gde operator oznaava operator minimuma i pri tome A(x) oznaava funkciju
pripadnosti konvencionalnog skupa A

19
1, x A
A
0, x A
Dokaz: Neka oznaava operator maksimuma. Kako je A(x)=1 kada x A i
A(x)=0 kada x A , imamo:
sup[0,1] [ A(x)] = sup[0, A(x)] [ A(x)] sup[A(x),1] [ A(x)]
= sup[0, A(x)] [ 1] sup[A(x),1] [ 0]= sup[0, A(x)] = A(x)
Ovim je dokaz teoreme zavren.
Ova teorema direktno vodi ka reprezentaciji fazi skupova na osnovu principa
rezolucije. Neka je A fazi skup definisan na univerzalnom skupu X. Neka je, dalje, A
fazi skup ija je funkcija pripadnosti:
A(x)=[ A(x)], x X
To znai da je A takav fazi skup (vrlo slian konvencionalnom) koji svakom
elementu ija je funkcija pripadnosti skupu A vea ili jednaka pridruuje funkciju
pripadnosti jednaku , dok svim ostalim elementima pridruuje funkciju pripadnosti
jednaku 0. Tada se, koricenjem principa rezolucije, skup A moe predstaviti na sledei
nain:
1
A A ili A A
A 0

Teorema o dekompoziciji (A. Kofman): Svaki fazi skup A moe se razloiti na proizvod
obinih podskupova sa datim koeficijentima i .
Princip rezolucije oznaava da se fazi skup A moe dekomponovati na skup fazi
skupova A, [0,1]. Sa druge strane, fazi skup A moe biti predstavljen unijom
odgovarajuih A skupova, to se naziva teoremom reprezentacije. Drugim reima, fazi
skup se moe predstaviti u obliku odgovarajucih -preseka bez gubitka informacije o
funkciji pripadnosti.
Primer 2.4. Ako posmatramo fazi skup A definisan u prethodnom primeru, moemo pisati:

0.1 0.3 0.5 0.8 1 1


A
50 60 70 80 90 100

Koristei se principom rezolucije, skup A se moe napisati na sledei nain:

0.1 0.3 0.5 0.8 1 1 0.1 0.1 0.1 0.1 0.1 0.1 0.3
A
50 60 70 80 90 100 50 60 70 80 90 100 60
0.3 0.3 0.3 0.3 0.5 0.5 0.5 0.5 0.8 0.8 0.8 1 1

70 80 90 100 70 80 90 100 80 90 100 90 100
ili u domenu A skupova:

20
1 1 1 1 1 1 1 1 1 1 1
A 0.1 0.3
50 60 70 80 90 100 60 70 80 90 100
1 1 1 1 1 1 1 1 1
0.5 0.8 1
70 80 90 100 80 90 100 90 100
0.1A0.1 0.3 A0.3 0.5 A0.5 0.8 A0.8 1A1

Dakle, ovim primerom ilustrujemo princip rezolucije. Sledeim primerom e biti


ilustrovan princip reprezentacije. Ako su dati sledeci -preseci: A0.1={1,2,3,4,5},
A0.4={2,3,5}, A0.8={2,3}, A1={3}, tada na osnovu teoreme o reprezentaciji moemo
napisati:
1 1 1 1 1 1 1 1
A 0.1A0.1 0.4 A0.4 0.8 A0.8 1A1 0.1 0.4
1 2 3 4 5 2 3 5
1 1 1 0.1 0.8 1 0.1 0.4
0.8 1
2 3 3 1 2 3 4 5

2.4. Operacije nad fazi skupovima

U ovoj sekciji emo proiriti operacije iz teorije klasinih skupova na fazi skupove.
Pomou prethodnih notacija i definicija fazi skupova, u mogunosti smo da predstavimo
neke osnovne operacije koje se nad fazi skupovima (i izmeu njih) mogu izvoditi. Neka su
A i B fazi skupovi na univerzalnom skupu X.
Definicija 2.14. Za date fazi skupove A i B ije funkcije pripadnosti su A(x) i B(x),
funkcija pripadnosti unije fazi skupova A B, u oznaci A B(x), je definisana kao :
A B(x) = max [A(x), B(x)], x X
Definicija 2.15. Za date fazi skupove A i B ije funkcije pripadnosti su A(x) i B(x),
funkcija pripadnosti preseka fazi skupova A B, u oznaci A B(x), je definisana kao :
A B(x) = min [A(x), B(x)], x X
Za bilo koje a A i b B, oprecije max i min mogu biti odreene i algebarskim izrazom:

a b ab
max( a, b)
2
ab ab
min( a, b)
2
Primer 2.5. Za fazi skupove definsane u primeru 2.3. imamo:
1 1 1 1 0.9 0.7 0.5 0.2
A
10 20 30 40 50 60 70 80

0.1 0.3 0.5 0.5


A B
50 60 70 80
0.1 0.5 0.8 1 0.8 0.8 1 1
A B
30 40 50 60 70 80 90 100

21
Neka su A, B i C fazi skupovi i neka je xA, yB i zC. Tada iz
definicija unije i preseka sledi da vrede sledee osobine:
1. Komutativnost
A(x) B(y) = B(y) A(x)
A(x) B(y) = B(y) A(x)
2. Idempotenstnost
A(x) A(x) = A(x)
B(y) B(y) = B(y)
3. Asocijativnost
A(x) [ B(y) C(z) ] = [ A(x) B(y) ] C(z)
A(x) [ B(y) C(z) ] = [ A(x) B(y) ] C(z)
4. Distributivnost
A(x) [ B(y) C(z) ] = [ A(x) B(y) ] [ A(x) C(z) ]
A(x) [ B(y) C(z) ] = [ A(x) B(y) ] [ A(x) C(z) ]
5. Identitet
A(x) = A(x)
A(x) = A(x)
gde oznaava stepen pripadnosti praznom (nultom) skupu.
6. Apsorpcija
A(x) [ A(x) B(y) ] = A(x)
A(x) [ A(x) B(y) ] = A(x)
Sada proirimo definiciju operacije relativnoga komplementa i komplementa (ili
negacije) u fazi podskupovima.
Definicija 2.16. Neka su A i B dva fazi skupa na univerzalnom skupu X. Relativni
komplement od B sa respektom na A, E = A - B je definisan kao fazi skup E od X gde za
svako x X je:
E(x) = max [0, A(x)-B(x)]
Definicija 2.17. Neka s u A i B dva fazi skupa n a univerzalnom skupu X. Komplement
ili negacija od A, oznaena sa A, je definisana kao fazi skup A gde za svako x X
funkcija pripadnosti:
A(x) = 1- A(x)
Sada navodimo listu osobina koje ukljuuju komplement i relativni komplement
fazi skupova A i B od X:
1. Dupla negacija
[ A(x) ] = A(x), x X

22
2. De Morganovi zakoni
[A(x) B(y)] = A(x) B(y)
[A(x) B(y)] = A(x) B(y)
3. = X, X =
4. Ako je A(x) B(y) tada je A(x) > B(y)
5. A(x) - A(x) =
6. A(x) = A(x), - A(x) =
Ovde primeujemo da definicije za relativni komplement i komplement su ekvivalentne
definicijama za klasine skupove.
Druga znaajna osobina jeste da generalno ne vredi, odnosno da je A A X i
A A . Ovi zakoni koji vae sa svaki konvencionalni skup vie nisu istiniti i validni
u teoriji fazi skupova.
Sada uvedimo operacije nad fazi skupovim koje nisu koritene u klasinoj teoriji
skupova:
Definicija 2.18. Neka je A fazi skup od X i neka je proizvoljan nenegativan broj. Tada
se sa A oznaava fazi skup B od X takav da je:
B(x) = (A(x))
Lako je pokazati da ako je > 1 tada je i A fazi podskup od A. Isto tako ako je < 1
tada je A A. Ako je A klasian skup i > 0 tada je A = A. U sluaju da je > 1
gornju operaciju nazivamo koncentracijom, a u sluaju da je < 1 tada je zovemo
dilatacijom.

2.5. t-norma i t-konorma

Razmotrimo sada operacije preseka i unije nad fazi skupovima, koje se ubrajaju u
trougaone norme (t-norms) i trougaone konorme (t-conorms), respektivno. Poevi sa
operacijom preseka, mi pretpostavljamo da presek dva fazi skupa, koji elimo
definisati, moe biti izraunat taku po taku. [26,84]
Definicija 2.19. t-norma je dvoparametarska funkcije i predstavlja se u formi:
t: [0,1] x [0,1] [0,1]
tako da vai:

A Bt [A(x), B(y)]
pri emu funkcija t zadovoljava sledee uslove:
Ogranienost: t(A(x),1) = A(x),
Monotonost: A(x) < B(x) => t(A(x), C(x)) < t(B(x), C(x))
Komutativnost: t(A(x), B(x)) = t(B(x), A(x))
Asocijativnost: t(A(x),t(B(x), C(x))) =t(t(A(x), B(x)), C(x))

23
t-norme i t-konorme se esto koriste za definisanje drugih operacija. Tipine
neparametarske t-norme (jednostavnosti radi, koristiemo sledee notacije: A(x)=a i
B(x)=b ) koje su esto koritene u aplikacijama su:
tmin(a.b) = min{a,b},
tLukasiewic(a,b) = max{0, a + b -1},
tprod(a,b) = ab.
Dualni zapis t - norme jeste t - konorm, koja definie operaciju unije.
Definicija 2.20. t-konorma (takoe se zove i s-norma) je dvoparametarska funkcija i
predstavlja se u formi:
s: [0,1] x [0,1] [0,1]
tako da vai:

A B s[A(x), B(y)]
uz ispunjenost sledeih uslova:
Ogranienost: s(A(x),1) = 1,
Monotonost: A(x) < B(x) => s(A(x), C(x)) < s(B(x), C(x)),
Komutativnost: s(A(x), B(x)) = s(B(x), A(x)),
Asocijativnost: s(A(x),s(B(x), C(x))) =s(s(A(x), B(x)), C(x)),
Iz gornjih uslova, lako je videti da vredi s(1,1)= s(1,0) = s(0,1) = 1, s(0,0) = 0. Poznati
primeri t-konorma su sledei:
smax(a,b)= max{a,b},
sLukasiievic(a,b) = min{1,a + b},
sprod(a,b) = a + b-ab.
t-norme i t-konorme predstavljaju vrstu operacija agregacije nad fazi skupovima, tj.
ovo su operacije pomou kojih se kombinuje nekoliko fazi skupova da proizvedu jedan
fazi skup. Stoga ove operacije igraju vanu ulogu u smislu odluka koje se donose u fazi
okruenju.
Z a d e L. [20-22] uvodi sledee operatore:
( T ) (x) = max ((x), (x))
( T ) (x) = min((x), (x))
(x) = 1 - (x)
gde je operacija negacija definisana na sledei nain.
Definicija 2.21. Preslikavanje N: [0,1] [0,1] zovemo operatorom negacije ako je:
1. N(0) = 1, N(1) = 0
2. a < b implicira N(a) > N(b)
3. N(N(a)) = a
Koritenjem ove definicije, operator negacije za fazi skupove definie se kao:
(x) = N ( (x ))
Definicija negacije, (x) = 1 - (x), za fazi skupove je zasnovana na upotrebi operatora
negacije N(a) = 1 - a, koji oigledno zadovoljava gornje uslove.

24
Uvoenjem operatora negacije, u mogunosti smo da odredimo uoptene
De - M o r g a n o v e zakone, koji dovode u vezu t - normu i t - konormu. Pretpostavimo
da je t bilo koja proizvoljna t - norma. Tada se za operator s definisan pomou:
s(a,b) = 1 - t(a, b)
moe pokazati da je t - konorma. Za dati t operator, odgovarajui s operator definisan
prethodno, naziva se njegov dual.
Takoe, moe se dokazati da ako je s t - konorma, tada t(a,b) = 1 - s(a, b) je
t - norma. Vana implikacija ovoga jeste da, ako elimo definisati presek i uniju u fazi
skupovima, tako d a D e M o r g a n o v i zakoni budu zadovoljeni:
( ) = ( ) i
( ) = ( )
tada t i s operatori moraju biti dualni jedan drugome.
Veoma vane, sa matematikog stanovita, su Arhimedova t - norma i t - konorma
koje su definisane na sledei nain:
Definicija 2.22. Neka su t: [0,1]2 [0,1] i s: [0,1]2 [0,1] dve funkcije.
a) t se naziva Arhimedovom t - normom ako i samo ako je t neprekidna t-norma i vredi
t(a,a) < a , za svako a (0,1).
b) s se naziva Arhimedovom t -konormom ako i samo ako je s neprekidna t-konorma i
vredi t(a,a) > a, za svako a (0,1).
Arhimedova t - norma moe biti reprezentovana na sledei nain :
Teorema: Funkcija t : [0,1]2 [0,1] je Arhimedova t - norma ako i samo ako postoji
striktno opadajua neprekidna funkcija f: [0,1] [0,] sa f(1) = 0 i t(a,b) = f(-1)(f(a) +
f(b)), gde je f(-1) pseudo-inverzna funkcija od f, tj.

( 1) x [0,1] : f ( x) y, y [0, f (0)]


f ( y)
0, y [ f (0), ]
Ako je f(0) = , tada je t striktno rastua.

2.6. Fazi relacije

U ovom poglavlju proirujemo koncept relacije na fazi skup, uvoenjem koncepta


fazi relacije [19,55,84]. Pojam fazi relacije mogue je objasniti na slian nain kao to je
objanjen pojam fazi skupa. Izmedju dva klasina skupa postoji odreena relacija ukoliko
su njihovi elementi meuzavisni, povezani, odnosno uslovljeni jedan drugim. Prelaz od
pojma klasine relacije ka pojmu tzv. fazi relacije mogue je obezbediti uvoenjem
koncepta jaine relacije izmeu pojedinih elemenata.
Kaemo, da ako su X i Y dva obina skupa, tada je njihov Dekartov (Cartezian)
proizvod, skup X Y, koji sadri sve parove (x,y), gde je x X, y Y.
Definicija 2.23. Neka su A i B dva fazi podskupa od X i Y. Njihov Dekartov proizvod
A B je fazi relacija R na skupu X Y , zapisana kao R = A B , gde je:
R(x,y) = min[ A(x), B(x)]

25
ili uopteno, ako su A1, A2,..., A n , fazi podskupovi od X1, X 2 ,..., X n , respektivno, tada
njihov Dekartov proizvod A1 A2 ... An, je fazi podskup od X1 x X2 x...x X n zapisan
kao R = A1 A2 .. . A n , gde je:
R(x1,...xn) = min{Ai(xi) | x i Xi, i = 1,2,3,..n}.
Primer 2.6. Neka su A = {1/a, 0.6/b, 0.3/c} i B = {1/1, 0.5/2 , 0/3} dva fazi podskupa na
univerzalnim skupovima X = {a,b,c} i Y = {1,2,3}. Tada je njihov Dekartov proizvod:
A B = { 1/(a,1), 0.5/(a,2), 0/(a,3), 0.6/(b,1), 0.5/(b,2), 0/(b,3),0.3/(c,1), 0.3/(c,2), 0/(c,3)}
Nakon to smo definisali osnovnu fazi relaciju nad fazi skupovima, moemo da
prikaemo operacije nad fazi relacijama. Neka su R1 i R2 dve fazi relacije na X i Y sa
funkcijama pripadnosti R1 i R2 respektivno. Tada je:
1. Unija: R1 R2 je fazi relacija od X na Y sa funkcijom pripadnosti:
R1 R2 : X Y [0,1],
tako da za (x,y) X Y je:
R1 R2 (x,y) = max (R1(x,y),R2 (x,y) )
2. Presek: R1 R2 je fazi relacija od X u Y sa funkcijom pripadnosti:
R1 R2 : X Y [0,1],
tako da za (x,y) X Y je:
R1 R2 (x,y) = min(R1(x,y),R2 (x,y) )
3. Komplement: C R je je fazi relacija od X u Y sa funkcijom pripadnosti:
C0R : X Y [0,1]
tako da za (x,y) X Y je:
C0R1(x,y) = 1 - R1 (x,y).
4. Razlika: R1 - R2 je fazi relacija od X u Y sa funkcijom pripadnosti:
R1-R2: X Y [0,1],
tako da za (x,y) X Y je:
R1-R2 (x,y) = min (R1(x,y),1-R2 (x,y) )
5. Prirodno spajanje: Neka je R1 fazi relacija od X u Y sa R1(x,y):X Y [0,1] i
neka je R2 fazi relacija od Y u Z sa R2(y,z) :Y Z [0,1]. Tada je R1 * R2 fazi
relacija izmeu X, Y, Z sa R1*R2 (x,y,z): X Y Z [0,1], tako da za (x,y)
X Y Z je:
R1*R2 (x,y,z) = min (R1(x,y),R2(y,z))
6. Projekcija: Neka je R fazi relacija izmeu X1,..., Xn sa R: X1 . . . X n
[0,1]. Projekcija (ili marginalna fazi restrikcija) od R, zapisana kao Xi1...Xik (R), gde
je i1..., ik (1,...,k), definisana je kao fazi relacija izmeu Xi1,..., Xik sa funkcijom
pripadnosti Xi1...Xik(R) tako da za ( xi1,..., xik) Xi1 ... Xik:
Xi1...Xik(R) (xi1,..., xik ) = sup R (u1, ..., un), ui = xij, i=1,...,k.

26
7 . Cilindrino proirenje: Specijalan sluaj Dekartovog proizvoda zovemo
cilindrino proirenje. Neka je R fazi relacija izmeu X1,X2, ...Xk sa R: X1 . . .
X k [0,1]. Cilindrino proirenje od R u X1X2. . . X k X k + 1 X k + 2 . . . X n
oznaeno sa R je fazi relacija izmeu X1. . . X k X k + 1 X k + 2 . . . X n sa R :
X1 . . . X k X k + 1 X k + 2 . . . X n [0,1] tako da za (x1, x2, ...,
xk,xk+1,xk+2, ..., xn) X1. . . X k X k + 1 X k + 2 . . . X n :
R(x1, x2, ..., xk,xk+1,xk+2, ..., xn) = R (x1, x2, ..., xk).
Jo jedna vana operacija u fazi relacijama jeste kompozicija koja se definie na
sledei nain. Neka su X, Y i Z neprazni skupovi i neka je R1 fazi relacija iz X uY, i neka
je R2 fazi relaciji iz Y u Z. Max-min kompozicija fazi relacija R1 i R2, oznaena kao R1
R2, definie fazi relaciju iz X u Z tako da za (x,z) X Z vredi:
R1R2 (x,z) = sup min (R1(x,y), R2(y,z)) , y Y
U fazi relacijama vrede sledee osobine:
a) Asocijativnost: (R1 R2) R3= R1 (R2 R3),
b) Monotonost: R1 R2 R1 R2 R2 R3
c) Distributivnost: (R1 R2) R3 = ( R1 R 3 ) (R2 R3)
(R1 R2) R3 = ( R1 R 3 ) (R2 R3)
Definicija 2.24. Neka je R binarna fazi relacija na X (tj. iz X u X) sa R: X X [0,1].
R je relacija slinosti ako i samo ako je:
- refleksivna: xX, R (x,x) = 1,
- simetrina: (x1,x2) X X, R (x1,x2) = R (x2,x1),
- max-min tranzitivna (x1,x3) X X, R (x1,x3) supmin (R (x1,x2), R
(x2,x3)), x2X.
Fazi logika [56-59] je zasnovana na konceptu fazi skupova i simbolike logike.
Logiki operatori konjunkcije, disjunkcije i negacije definiu se na sledei nain:
a) x 1 x 2 = min (x 1, x 2)
b) x 1 x 2 = max (x 1, x 2)
c) x = 1 x
gde je xi (i=1,2, ...n) promenljiva sa znaenjem iz intervala [0,1].
Fazi formula definie funkcije iz [0,1]n u [0,1]. Definiimo sada fazi formulu pomou
sledeih pravila:
a) 0 i 1 su fazi formule,
b) Fazi promenljiva xi je fazi formula,
c) Ako je f fazi formula, tada je i f fazi formula,
d) Ako su f i g fazi formule tada su to i , f g ,
e) Drugih formula nema.
U fazi logici istinita vrednost formule moe biti bilo koja vrednost iz intervala [0,1].
Neka je T(S) zapis za istinitu vrednost formule S. Tada je na snazi: [58].
a) T(S) = T(A) ako je S=A i A je atomik formula,
b) T(S)=1-T(R) ako je S= R,
c) T(S) = min [T(S1), T(S2)] ako je S = S1 S2,
d) T(S) = max [T(S1), T(S2)] ako je S = S1 S2,

27
e) T(S) = inf [T(B(x)), x D] ako je S = B, D je domen od x,
f) T(S) = sup [T(B(x)), x D] ako je S = B, D je domen od x.

2.7. Teorija aproksimativnog rezonovanja

Ova teorija, zasnovana na fazi skupovima, omoguava rezonovanje sa neodreenim


informacijama. Originalna ideja donoenja odluka na osnovu nepreciznih, kvalitativnih
podataka kombinovanjem deskriptivnih lingvistikih pravila potie od Zadea. Proceduru
kombinovanja nepreciznih logikih pravila u jedinstvenu upravljaku strategiju Zade
(1973) naziva aproksimativnim ili fazi rezonovanjem. Fazi rezonovanje
(aproksimativno rezonovanje) predstavlja proceduru zakljuivanja, odnosno generisanje
zakljuka na osnovu premisa koje sadre lingvistike izraze.
Centralna osobina ove teorije je reprezentovanje propozicija kao naredbi koje su
pridruene fazi skupovima. Ulazne i izlazne promenljive u fazi sistemima su lingvistike
promenljive (Visoka zarada, Kratko vreme ekanja,....). Izlazni rezultat je dat u
kontinualnoj formi (svim moguim vrednostima izlazne promenljive pridruen je
odgovarajui stepen pripadnosti). Defazifikacija predstavlja izbor jedne vrednosti izlazne
promenljive.
U ovoj sekciji uveemo sintaksu i operacije u sistemu aproksimativnog rezonovanja
[86,87].
Primarni element u sistemu aproksimativnog rezonovanja je skup varijabli zvanih
atomskim (baznim) varijablama i pridrueni skupovi X1,...Xn, gde je Xk osnovni
(univerzalni) skup od Vk. Zajednika varijabla je bilo koji skup jedne ili vie razliitih
atomskih varijabli. Propozicija u ovome sistemu je naredba u formi:
V je M
gde je V zajednika varijabla i M je fazi podskup Dekartovog proizvoda osnovnog skupa
atomskih varijabli.
Naredba ili propozicija koja ukljuuje samo jednu varijablu zove se kanonina
naredba. Sledi definicija koncepta mogunosti propozicije:
Definicija 2.25. Za datu propoziciju V je A moemo definisati Mogunost[V je A] =
Max x [A(x)].
Propoziciju V je A zovemo normalnom ako je Mogunost[V je A] = 1 tj. postoji bar jedan
element x u osnovnom skupu A takav da je A(x)=1. Propozicija se zove kontradikcija ako
je Mogunost[V je A] = 0.
Definicija 2.26. Propozicija V je A naziva se tautologijom ako je A(x)=1 za svako x iz
domena V.
Rad sa propozicijama u sistemu aproksimativnog rezonovanja je zasnovano na dve
fundamentalne operacije. Prva operacija je konjunkcija, a druga operacija je biti sadran.
Definicija 2.27. Neka su VA i VB dve zajednike varijable na osnovnim skupovma X i Y
respektivno i neka su VA je M i VB je N dve propozicije. Tada je njihova konjunkcija, VA
je M i VB je N zapisana kao V A je M V B je N je propozicija V je P gde je V
zajednika varijabla koja sadri uniju atomskih varijabli koje ine VA i VB, i P je fazi
podskup domena V takav da za svako z iz domena V je P(z)= M(x) N(y)

28
U sluaju da je VA = VB tada je ova operacija redukovana u operaciju preseka tj.
VA je M i VA je N = VA je M N.
U sluaju kada VA i VB nemaju zajednikih varijabli ova operacija daje klasini Dekartov
proizvod:
VA je M VB je N = (VA ,VB) je M N.
Primedba za operaciju konjunkcije. Vredi sledee: Konjunkcija tautologije sa normalnom
propozicijom je normalna. Konjunkcija dve tautologije je tautologija. Konjunkcija
kontradikcije sa bilo kojom propozicijom je kontradikcija.
Sada emo definisati specijalni operator konjunkcije.
Definicija 2.28. Neka su VA i VB dve zajednike varijable takve da VB sadri sve varijable
iz VA . Cilindrino proirenje propozicije VA je M u VB je propozicija VB je M koja je
definisana sa VB je M = V A je M V1 je X1 ... Vq je Xq gde su V1,...,Vq atomske
varijable iz VB, a koje nisu V A , a Xi su osnovni skupovi ovih datih varijabli.
Cilindrino proirenje od VA je M u VB je M moe se izraziti pomou funkcija pripadnost
od M i M kao M (y) = M (x), gde je x element u VA koji se slae sa y za delove od VB
koji su u VA.
Sada uvodimo drugu osnovnu operaciju u sistemu aproksimativnog rezonovanja.
Definicija 2.29. Neka su V A je M i V B je N dve propozicije. Kaemo da V A je M je
sadrano u V B je N, tj. (V A je M) (VB je N) ako je M(z) N(z), gde su M i N
cilindrina proirenja od M i N na osnovnom skupu varijabli V, koja je unija atomskih
varijabli u VA i VB.
Primer 2.7. Neka je X1 = {x1, x2, x3,} i X2 = {y1, y2}. Razmotrimo V 1 je M, gde je
M = {0.7/X 1, 0.9/X2, 1.0/X3}, i V 2 je N gde je N = {0.3/y1, 0.5/y2,}. Tada je:
M = {0.7/(x1,y1), 0.7/(x1,y2), 0.9/( x2,y1), 0.9/(x2, y2), 1/(x3,y1), 1/(x1,y2)}
N = {0.3/(x1,y1), 0.5/(x1,y2), 0.3/(x2,y1), 0.5/(x2,y2), 0.3/(x3,y1), 0.5/(x3,y2)}
Kako je za svaki i, j:
M (xi,yi) N (xi,yi)
imamo da je V 2 je N V1 je M.
Sledea teorema uspostavlja relaciju izmeu prethodnih operacija:
Teorema 2. Pretpostavimo da su P1, P2 i P3 tri propozicije. Ako vredi:
P3 = P1 P2
tada je P3 P1 i P3 P2. Dokaz sledi neposredno iz definicije konjunkcije. Sada uvedimo
koncept ekvivalencije dve propozicije.
Definicija 2.30. Dve propozicije P1 i P2 su ekvivalentne ako je P1 P2 i P2 P1.
Teorema 3.Ako su VA i VB razdvojene varijable tada propozicije:
V A je M i V B je N
su ekvivalentne ako i samo ako postoji neko iz [0,1] takvo da je M (x)= za svako x iz
VA i N(y)= ,za svaki y iz VB.

29
2.8. Semantika sistema aproksimativnog rezonovanja

U ovom poglavlju uvedena je semantika u sistemu aproksimativnog rezonovanja.


Kada je V atomska varijabla data na univerzalnome skupu X, tada sledi da X je skup svih
moguih vrednosti koju varijabla V moe uzeti. Propozicija Vi je Aj oznaava da vrednost
varijable Vi lei u skupu Aj.
Primer 2.8. Neka su date dve varijable V1 (Grad osobe) i V2 (Godine osobe). Ako imamo
propoziciju:
(V 1 , V 2 ) = (Grad,Godine)= {i(v1,v2)/( v1,v2)}
(V 1 , V 2 ) = {1/(Bg,32), 1/(NS,29)}
Ova informacija pokazuje da osoba ili ivi u Beogradu i ima 32 godine ili ivi u Novom
Sadu i ima 29 godina. Preko ove semantike vidimo da operacija konjunkcije oznaava
skup moguih vrednosti na kojoj se obadve propozicije slau.
Z a d e L. uvodi posebna pravila koja nam dozvoljavaju reprezentovanje zajednikih
lingvistikih naredbi u izrazima propozicija. Sada dajemo neka od ovih pravila.
Negacija-propozicije. Naredba: ne V je A prevodi u V je B gde je B negacija od A
odnosno:
B(x) = 1 - A (x).
I-propozicija. Naredba: V A je A i V B je B definisana je preko operatora konjunkcije
kao:
V je A B
gde je V unija atomskih varijabli u VA i VB .
Ili-propozicija. Naredba: VA je A ili V B je B definisana je ne (V A je ne A i V B je ne
B). Moe se pokazati da
VA je A ili VB je B = V je A B
gde je V unija od VA i VB, A i B su cilindrina proirenja od A i B i je unija u
znaenju da:
F = A B
je definisano kao:
F(z)=max( A (z), B (z)) = A (z) B (z)
Operator implikacije. Ako V A je A tada V B je B prevodi se u propoziciju V je E gde
je V unija od VA i VB , i E je podskup osnovnog skupa V. Skup E se moe definisati na
vie razliitih naina.

2.9. Dedukcija u sistemu aproksimativnog rezonovanja

Dedukcija predstavlja fundamentalni mehanizam zakljuivanja koji se koristi u teoriji


aproksimativnog rezonovanja. Ovaj mehanizam zakljuivanja bie zasnovan na upotrebi
prethodno uvedenih operatora. Sada dajemo osnovna pravila zakljuivanja.

Pravilo 1. (P1) Od propozicije V je A moemo izvoditi propoziciju V B je B ako je VA je


A VB je B. Ovo pravilo reflektuje oiglednu injenicu: Ako vrednost date varijable lei u
nekom skupu tada ta vrednost mora leati i u veem skupu.

30
Pravilo 2 (P2). Od propozicija VA je A i VB je B moemo izvesti propoziciju:
(V A je A) (V B je B)
Proces dedukcije formira osnovni mehanizam u kome poevi sa skupom premisa i
izvoenja dobijamo nove rezultate.
Definicija 2.31. Dedukcija iz skupa premisa (P1,..., Pq) u sistemu aproksimativnog
rezonovanja je niz dobro definisanih formula B 1 , ..., Bn, gde je svaka Bk jedna od sledeeg:
1. Premisa (P1,..., Pq),
2. Tautologija,
3. Za neko i < k, B k je posledica od Bi, kao rezultat pravila 1 (P1),
4. Za neko i ,j < k, Bk je posledica od Bi i Bj, kao rezultat pravila 2 (PI2).
Teorema 3. (monotonost) . A k o j e ( P 1 , . . . , Pn) |-B tada je i ( P 1 , . . . , Pn+1) |-B. Dokaz
sledi neposredno iz definicije dedukcije.
Teorema 4. Jedine teoreme u sistemu aproksimativnog rezonovanja su tautologije.
Sledei rezultat prikazuje sve propozicije izvedive iz skupa propozicija.
Teorema 5. Propozicija B moe da se izvede iz skupa premisa (P1,..., Pn) |-B ako i samo
ako B sadri konjunkciju svih premisa odnosno:
(P1,..., Pn) B.
Primedba. Implikacija ove teoreme moe biti kao osnova za mehanizam rezonovanja u
teoriji aproksimativnog rezonovanja.

2.10. Kompoziciono pravilo

Osnovno pravilo izvoenja u klasinoj logici je modus ponens u kome ako je dati
iskaz A istinit i ako je istinito da A => B, tada je i iskaz B istinit. U mnogim obinim
rasuivanjima, pravilo modus ponensa, izraava se ne u tanoj ve u priblinoj formi. Tako
npr. ako znamo da je A istinito i da A* => B, gde je A* u nekom smislu priblino A, tada
iz A* => B moemo zakljuiti da je B priblino istinito. Sada dajemo formalizaciju
priblinih rasuivanja, na osnovu pojmova koji su uvedeni u prethodnom poglavlju. Za
razliku od klasine logike, ovde predstavljamo kompoziciono pravilo zakljuivanja, gde je
modus ponens samo specijalan sluaj ovoga izvoenja [88,89].
Pretpostavimo da je A fazi skup definisa na osi x, a F fazi relacija na Dekartovom
domenu X Y. Naimo cilindrino proirenje A sa osnovom A, a zatim njen presek sa
fazi relacijom F kao na donjoj slici. Tako dobivamo A F. Projektujmo zatim A F na
osu y . Na taj nain dobivamo fazi podskupa B, na y osi.

y
F

B A'F

A'

A x

Slika 7. Ilustracija kompozicionog pravila

31
Neka A, A, F i B oznaavaju funkcije pripadnosti skupova A, A, F i B
respektivno.Tada po definiciji cilindrino proirenje od A je:
A(x,y) = A (x)
Odavde je i :
A F = A(x,y) F(x,y)
Projektujmo skup A F na y osu i tada imamo (na osnovu definicije projekcije):
B (y) = A (x) F(x,y).
Iz ovoga prozilazi da se skup B moe definisati kao:
B=AF
gde definie max-min operaciju kompozicije, tj:
B (y) = max min (A(x), F(x,y))
x
Kompoziciono pravilo. Neka su U i V dva univerzalna skupa sa datim varijablama u i
v respektivno. Neka R(u) , R(u,v) i R(v) oznaavaju ogranienja na u, (u,v) i v i neka
predstavljaju fazi relacije na U, U V i V respektivno. Neka su A i F fazi podskupovi
skupova U i U V. Tada kompoziciono pravilo tvrdi, da reenje jednaine:
R(u) = A
R(u,v) = F
ima oblik:
R(v) =A F
gde je A F kompozicija od A i F.
Primer 2.9. Neka je U = V = {1,2,3,4} univerzalni skup. Neka je dat fazi skup
A = malen ={1/1, 0.6/2 , 0.2/3 } i neka je fazi relacija zadata sa:
F = priblino jednaki={ 1/(1,1), 1/(2,2), 1/(3,3), 1/(4,4), 0.5/(1,2), 0.5/(2,1), 0.5/(2,3),
0.5/(3,2), 0.5/(3,4), 0.5/(4,3)}
drugim reima, neka je A unarna fazi relacija na U, nazvana malen, F binarna fazi relacija
na U V, nazvana priblino jednaki. Gornja jednaina u tom sluaju ima oblik:
R(u) = malen
R(u,v) = priblino jednaki
i otuda:
R(v) = malen o priblino jednaki = R(u) R(u,v) = [1 0.6 0.5. 0.2]

2.11. Fazi implikacije

Neka su U i V univerzalni skupovi i neka su A, B i C fazi podskupovi od U, V i V.


Kao prvo definiimo smisao iskaza Ako x je A tada y je B inae y je C , a zatim definiimo
Ako x je A tada y je B kao specijalan sluaj iskaza Ako x je A tada y je B inae y je C.
Definicija 2.32. Iskaz Ako x je A tada y je B inae y je C je binarna fazi relacija na U V
definisana sa izrazom:
Ako x je A tada y je B inae y je C = A B A C

32
Odnosno, ako su A, B i C unarne fazi relacije na U, V i V tada Ako x je A tada y je B
inae C je binarna fazi relacija na U V, koja je unija Dekartovog proizvoda A i B i
Dekartovog proizvoda negacije A i C.
Poto iskaz Ako x je A tada y je B moemo posmatrati kao specijalan sluaj iskaza
Ako x je A tada y je B inae y je C, pri C = V tada taj iskaz moemo definisati kao:
Ako x je A tada y je B = A B A V
Z a d e L. uvodi pravila (max-min pravilo i aritmetiko pravilo) za prevoenje fazi
uslovne propozicije "Ako x je A tada y je B inae y je C" u fazi relaciju na U V.
Oznaimo fazi skupove A, B i C:

A A (u ) / u B B (v ) / v C C (v ) / v
U V V

tada imamo:
1. Max- Min pravilo
Rm= (A B) (A C)

Rm (
UxV
A (u ) B (v)) (1 A (u ) C (v)) /(u, v)

2. Aritmetiko pravilo
Ra= (A V U B) (A V U C )

Ra
UxV
1 (1 A (u ) B (v)) ( A (u ) C (v)) /(u, v)

gde , , , i oznaavaju Dekartov proizvod, uniju, presek, komplement i graninu


sumu za fazi skupove.
Primedba. Ako se C zameni sa V (univerzalnim skupom od C) koji je interpretiran kao
'nepoznat' tada fazi uslovna propozicija Ako x je A tada y je B inae y je C je
redukovana u propoziciju Ako x je A tada y je B inae y je nepoznato odnosno u Ako x
je A tada y je B " . Tada max - min pravilo Rm i aritmetiko pravilo Ra postaje , za C = V:
Rm= (A B) (A V)
Rm (
UxV
A (u ) B (v)) (1 A (u ) C (v)) /(u, v)

odnosno:
Ra= (A V U B)
Ra
UxV
1 (1 A (u ) B (v)) /(u, v)

U sluaju kada je C = prazan skup max - min pravilo je redukovano sa min pravilom Rc
koje je uveo Mamdani [86].
Rc= A B

Rc
UxV
( A (u ) B (v)) /(u, v)

33
Za propoziciju Ako x je A tada y je B inae y je C, takoe, se definie translatorno
pravilo Rb koje je zasnovano na implikaciji u binarnoj logici:
3. Fazi binarno pravilo Rb
Rb= (A V U B) (A V U C )
Rb (1
UxV
A (u ) B (v)) ( A (u ) C (v)) /(u, v)

U sluaju da je C=prazan skup imamo:


Rb= (A V) (U B)
Rb (1
UxV
A (u ) B (v)) /(u, v)

Mizumoto [88] uvodi sledee fazi implikacije:


1. Pravilo Rs:
Rs= A V s U B
Rs (
UxV
A (u ) s B (v)) /(u, v)

gde je:
1, A (u ) B (v)
A (u) s B (v) =
0, A (u ) B (v)

2. Pravilo Rg:
Rs= A V g U B
Rg
UxV
( A (u ) g B (v)) /(u, v)

gde je:
1, A (u ) B (v)
A (u) g B (v) =
B (v), A (u ) B (v)

2.12. Fazi metod zakljuivanja

Razmatrimo sledeu formu zakljuivanja:


Premisa 1: Ako x je A tada y je B
Premisa 2: x je A'
Zakljuak: y je B'
gde su x i y imena objekata, a A, A', B i B' su fazi koncepti odreeni sa fazi skupovima na
univerzalnim skupovim U, U, V i V respektivno. Ova forma zakljuivanja moe se
posmatrati kao generalizovani (fazi) modus ponens u odnosu na klasini modus ponens
kada je A'=A i B'=B. Validnost modus ponensa nam govori da zakljuak mora biti istinit
ukoliko su sve premise istinite.

34
Sada posmatrajmo sledeu formu zakljuivanja:
Premisa 1: Ako x je A tada y je B
Premisa 2: y je B'
Zakljuak: x je A'
Ovaj zakljuak moe biti uveden kao genereralizovan (fazi) modus tollens, u odnosu na
klasini modus tollens kada je B' = ne B i A' = ne A. U logici, modus tolens je formalni
naziv za validan indirektan dokaz ili dokaz kontrapozicijom.
Generalizovani modus ponens i modus tolens se lako primenjuju i u fazi situacijama.
Uoimo to na sledeem primeru:
Ako je ova jabuka vrlo crvena
I crvena jabuka je zrela jabuka
Onda je ova jabuka vrlo zrela.
U generalizovanom modus ponensu, konsekvenca B' u zakljuku moe biti dobivena
iz Premise 1 i Premise 2 koristei max-min () kompoziciju izmeu fazi skupa A' i fazi
relacija datih prethodno. Tako za metod Rm imamo:
Bm = A' Rm = A' [(A B) (A V)]
Funkcija pripadnosti fazi skupa Bm u univerzalnom skupu V je:
B u { A (u) Rm (u, v) }
m

ili:
B u { A (u) [( A (u) B (v)) (1 A (u) )] }
m

2.13. Zadovoljivost u fazi logici

Definicija 2.32. Za fazi formulu f S, gde je S skup fazi formula, kaemo da je


zadovoljiva ako postoji interpretacija I u kojoj je T(f) 0.5. U interpretaciji I kaemo da je
f protivrena ako je T(f) < 0.5. Za fazi formulu f kaemo da je nezadovoljiva ako je
protivrena u svim njenim interpretacijama.
Definicija 2.33. Fazi formulu f zovemo konjunktivnom normalnom formom ako je
f = C1 ... C P , p1, gde je Cj disjunkt. Fazi formulu f zovemo disjunktivnom
normalnom formom ako je f = C1 ... CP, p1, gde je Cj konjunkt
Definicija 2.34. Za formulu g kaemo da je logika konsekvenca date formule f ako i samo
ako je f g nezadovoljivo tj. T(f g) < 0.5.

2.14. Rezolventa u fazi logici

Definicija 2.35. Neka su D1: L1 D1' i D2: L2 D2' dva disjunkta, a L1 i L2, kontrarni
(suprotni) par literala tj. L2: L1 : neka D1 ' i D2' ne sadre ni jedan takav par. Tada
disjunkt D1' D2' zovemo rezolventom (Res) disjunkta D1 i D2 sa kljunom rei L1.
Primer 2.9. Neka su D1: P Q i D2: P dva disjunkta, i neka je 'i' njihova interpretacija.
Neka je ispunjeno i(P) = 0.3, i(Q) = 0.2. Tada je:
i(D1 D2) = min[max[i(P),i(Q)],i(P)] = min[max[0.7, 0,2],0.3] =min [0.7,0.3]=0.3

35
Q je rezolventa od D1 i D2, pa imamo da je tada i(Res(Q)) = 0.2. Vidimo da je u datom
primeru da je i(Q) < i(D1 D2).
Kriterijum koji osigurava da primena pravila rezolucije, u kontekstu fazi logike, kao
rezultat daje valjane logike posledice dat je sledeom teoremom.
Teorema 6. Neka su D1 i D2 dva disjunkta i neka je Res(D,D') njihova rezolventa s
literarom L kao kljunom rei. Tada vredi:
a) Ako je i(L L) i(Res(D1,D2) tada je i(D1 D2) i(Res(D1,D2)
b) Ako je i(L L) i(Res(D1,D2) tada je i(D1 D2) i(Res(D1,D2)
Dokaz : Neka su D1: L D1' i D2: L D2' dva disjunkta i pretpostavimo da ni u D1' niti
u D2' ne nastupa ni jedan kontrarni par literala. Sud (D1 D2) i rezolventa Res(D1,D2) tada
imaju prikaz:
D1 D2: (L1 D1') (L D2') : (L L) ( L D2') (L D1') (D1 ' D2')
Odnosno Res(D1,D2) = D1' D2'. Pretpostavimo da je i interpretacija za koju vredi 1 ) , to
jest:
i(L L) i(D1' D2') (1)
Naredne tri nejednakosti lako je proveriti koristei definiciju interpretacije fazi skupova i
svojstva operacija min i max.
i(L D2') i(D1' D2') (2)
i(L D1') i(D1' D2') (3)
i(D1' D2') i(D1' D2') (4)
Ilustracije radi proverimo samo prvu. Tada je:
i(L D2') = min {i(L), i(D2')} (*)
i(D1' D2') = max {i(D1'), i(D2')}
Ako je minimum desne strane u (*) jednak i(L), onda je i(L D2') = i(L) i(D2')
max{i(D1'), i(D2')}. Time je tvrdnja 2) ispunjena. Ako je taj minimum jednak i(D2'),
nejednakost 2) vredi tim prije.
Uzimanjem maksimuma levih i desnih strana nejednakosti (1) do (4) dobivamo
sledeu nejednakost:
max{i(L L), i( L D2'), i(L D1')} i(D1' D2') (**)
injenica da je leva strana u (**) upravo i(D1 D2), a desna rezolventa Res(D1, D2)
potvruje valjanost tvrdnje 1) datog teorema.
Ako je sada ispunjena pretpostavka iz take 2) teorema, tj.
i(Res(D1, D2)) i(L L), tada je tim prije na snazi nejednakost:
i(Res(D1, D2)) max{i(L L), i(L D2'), i(L D1'), i(D1' D2')}
odnosno:
i(Res(D1, D2)) i(D1 D2), a to je i trebalo dokazati.
Naredne dve teoreme su neposredna posledice date teoreme.

36
Teorema 7. Neka su D1 i D2 dva disjunkta i neka je Res(D1, D2) njihova rezolventa s
literarom L kao kljunom rei. Ako vredi i(Res(D1, D2)) 0.5 tada vredi i(D1 D2)
i(Res(D1, D2)) .
Dokaz : Oigledno je da za svaki literal L vredi i(L L) 0.5. Kako je iz uslova
teoreme je i(Res(D1, D2)) 0.5, tada i vredi da je i(L L) i(Res(D1, D2)) . Prema
taki 1) prethodne teoreme tada je i(D1 D2) i(Res(D1, D2)) .
Iz ovoge teoreme zakljuujemo da je svaka rezolventa dvaju disjunkta sa vrednou
interpretacije ne manjom od 0.5 smislena je logika posledica tih disjunkta.
Teorema 8. Neka su D1 i D2 dva disjunkta i neka je i(D1 D2) > 0.5. Tada je i(D1 D2)
< i(Res(D1, D2)).
Dokaz. Zbog
i(D1 D2) = max{i(L L) ,i( L D2'), i(L D1'). i(D1 ' D2')}
i injenice da je i(L L) 0.5 i pretpostavke teoreme, tada vredi bar jedna od narednih
nejednakosti:
a) i(L D2') > 0.5
b) i(L D1') > 0.5
c) i(D1' D2') > 0.5
Otuda je i(D1') > 0.5 ili je i(D2') > 0.5. Samim tim je i
i(D1' D2') = i(Res(D1, D2)) > 0.5.
U suprotnom da je i(Res(D1, D2)) i(D1 D2) tada bi bila ispunjena bar jedna od tri
naredne nejednakosti:
a) max{i(D1'),i(D2')}<min{i(L), i(D2')}
b) max{i(D1'),i(D2')} < min{i(L), i(D1')
c) max{i(D1'),i(D2')} < min{(D1'), i(D2')}
to je oigledno nemogue. Dakle vredi tvrdnja teoreme.
Gornja teorem pokazuje da je za smislenost rezolvente kao logike posledice dvaju
disjunkta dovoljno da istinita vrednost svake interpretacije njihove konjunkcije bude vea
od 0.5.
Definicija 2.36. Neka je D skup disjunkta. Indukcijom po n N definiemo n - ti
rezolventni skup Resn D na sledei nain:
D n0
Re s n D n -1
Res(Res (D)), u suprotnom.
Teorema 9. Neka je D = {D1,...,Dn} skup disjunkta i neka je D* Resn(D) .Ako je i(D)
0.5 za svaki disjunkt D iz D tada vredi:
i (D1 ... Dn) i(D*)
Dokaz. Ovo emo dokazati indukcijom po n. Neka je n = 1 , tada D* Res1(D) =
Res(D). Bez gubitka uoptenosti, pretpostavimo da je D* Res(D) - D. U tom sluaju
postoje disjunkti D1 i D2 takvi da je D : Res(D1, D2).

37
Po pretpostavci teoreme vredi i(D1 D2) >0.5. Sada na osnovu prethodne teoreme
vredi sledei niz nejednakosti:
0.5< i(D 1 ... D n ) < i(D1 D2) < i(Res (D1, D2)) = i(D*).
Sada pretpostavimo da je D* element skupa Resi(D) Resi-1(D). Tada postoje disjunkti Di'
i Di-1" iz skupa Res i-1(D), takvi da vredi:
D*: Res(Di-1' i Di-1").
Po pretpostavci indukcije vredi:
0.5< i(D 1 ... D n ) i(Di-1') i 0.5< i(D 1 ... D n ) i(Di-1")
Sada je:
0.5< i(D 1 ... D n ) min{i(Di-1' , i(Di-1")} ={ i(Di-1' i(Di-1") i(Res(Di-1', D i-1")) = i(D*).
Ova poslednja nejednakost je posledica prethodne teoreme.
Ova teorema tvrdi da je dovoljno da minimalna vrednost istinitosti disjunkta iz datog
skupa bude vea od 0.5 pa da svi rezolventni skupovi tog skupa sadre samo valjane
logike posledice.

2.15. Zakljuak

U ovom poglavlju navedeni su osnovni pojmovi kao i ve poznati rezultati iz teorije


fazi skupova. Kao prvo, uvedena je definicija fazi skupa, a zatim su date operacije s kojima
se operie nad fazi skupovima.
Zatim su uvedeni i razmatrani rezultati iz teorije fazi logike. Najpre, uvedena je
teorija aproksimativnog rezonovanja, zatim su definisani primarni elementi u sistemu
aproksimativnog rezonovanja i data su kompoziciona pravila zakljuivanja. Na kraju je
definisana rezolventa i dato je pravilo rezolucije u fazi logici. Sve navedene osobine su
analizirane radi razmatranja i analize fazi relacionih modela baza podataka.
Fazi logika i fazi sistemi se koriste za procenu i donoenje odluka u velikom broju
upravljakih sistema. U ovom radu rezultati fazi logike primenjeni su na konkretnom
primeru relacionih baza podataka. Primena teorije fazi skupova u bazama podataka prua
mogunost upravljanja i manipulisanja nepreciznim i nepotpunim informacijama.
Praktino, danas se fazi logika koristi u bezbroj aplikacija, a fazi relacioni modeli baza
podataka se primenjuju i ine osnovu sistema zasnovanih na znanju, sistema za pretragu
znanja itd. Takoe, fazi modeli baza podataka se koriste na viem, praktinom nivou, kao
to je proces donoenja odluka, ime se doprinosi optimizaciji poslovanja i prua znaajna
podrka poslovnim aktivnostima.
U protekloj deceniji, fazi sistemi su u velikoj meri postali zamena konvencionalnim
tehnologijama u velikom broju naunih aplikacija i informacionih sistema, naroito u
oblasti upravljanja sistemima i prepoznavanju oblika. Teorija fazi skupova se iroko
primenjeuje za proirenje razliitih modela baza podataka i primena ove teorije rezultirala
je brojnim doprinosima, uglavnom u relacionim modelima baza podataka. Da bi se
zadovoljile potrebe za modelovanjem nepreciznih i neodreenih informacija, u poslednjoj
deceniji mnoga istraivanja su koncentrisana na fazi relacione i fazi objektno-orjentisane
modele baza podataka.

38
3. Fazi relacione baze podataka
3.1. Relacioni model baza podataka

Sistem baza podataka [90-92] moe se posmatrati kao hijerarhijska apstrakcija. Svaki
od nivoa u datoj hijerarhiji predstavlja jednu vrstu modela, to znai da predstavlja skup
objekata (entiteta) i operacija nad tim objektima. Na nivou neposredno ispod modela
nalazi se reprezentacija modela predstavljena pomou strukture podataka, a operacija
modela predstavlja algoritme koji operiu nad tim strukturama.

3.1.1. Modeli, atributi, entiteti


Pod modelom se podrazumeva reprezentacija nekih objekata i odnosa meu njima.
Objekte modela i odnose izmeu njih zovemo entitetima.
Skup E koji se sastoji od entiteta istoga tipa okarakterisan je skupom atributa
A1,...,An ili krae E(A1,...,An) gde je A i : E Di funkcija iji se kodomen naziva domenom
atributa Ai. Za e iz E , Ai(e) iz Di se zove vrednost atributa Ai za entitet e.

3.1.2. Predstavljanje skupa entiteta skupom n-torki

Za dati tip entiteta E(A1,...,An) skup funkcija A 1 : ED 1 ,...,A n : ED n koje


predstavljaju atribute tog tipa entiteta, odreuje jednoznano funkciju:
(A1,...,An): E D1 ... Dn
gde je D1 ... Dn skup svih n-torki oblika (d1,...,dn), di Di za i =1,2,...,n , a D1 ... Dn
je Dekartov proizvod skupova D1,..., Dn.
Funkcija (A1,...,An) definisana je kao:
(A1,...,An)(e) = (A1(e),...,An(e))
pri emu zahtevamo da za dva entiteta e1 i e2 istoga tipa E vai:
(A1,...,An)(e1) (A1...,An)(e2)
odnosno da postoji neko j = 1,... ,n takvo da je Aj(e1) Aj(e2) ili drugim reima, entitete
istoga tipa razlikujemo po tome to imaju razliite vrednosti skupa atributa.
Skup entiteta tipa E(A1,...,An) predstavlja se tabelom ije kolone odgovaraju
atributima, a redovi pojedinim n - torkama. Ovakva tabela predstavlja relaciju koja se
definie na sledei nain:
Definicija 3.1. R je relacija na skupovima D1,..., Dn, R D1 ... Dn. Relaciona baza
podataka je skup relacija koje se mogu menjati tokom vremena. Opis strukture relacije
relacione baze se zadaje relacionom emom.
Primer relacione eme:
Fakultet(Sifra_Fakulteta, Naziv, Grad)
Student(Broj_Indexa, Ime_Prezime, Godina, Sifra_Fakulteta)
Projekat(Projekat, Naziv, Sredstva)
Ucesce(Broj_Indexa, Projekat, Funkcija)

39
Ova relaciona ema opisuje 4 tipa entiteta: Fakultet, Student, Projekat i Ucesce studenta u
projektima. Primer relacione baze za datu relacionu emu i za mogui vremenski trenutak.

Sifra_Fakulteta Naziv Grad


F1 Mainski Beograd
F2 Elektrotehniki Novi Sad
F3 Graevisnki Beograd
Tabela 2. Fakultet

Broj _Indexa Ime_Prezime Godina Sifra_Fakulteta


S1 Mihajlo Ivanovi 1. F1
S2 Milo Milutinovi 2. F2
S3 Petar Petrovi 3. F1
S4 Marko Markovi 1. F2
S5 Jelene Petrovi 4. F3
S6 Nikola Miloevi 4. F3
S7 Maja Martinovi 1. F1
Tabela 3. Student

Projekat Naziv Sredstva


P1 N1 1000
P2 N2 2000
P3 N3 3000
Tabela 4. Projekat

Broj_Indexa Projekat Funkcija


S1 P1 Izvrilac
S2 P3 Izvrilac
S2 P2 Rukovodilac
S3 P2 Izvrilac
S3 P3 Izvrilac
S4 P1 Izvrilac
S5 P3 Rukovodilac
S6 P1 Izvrilac
S6 P2 Izvrilac
S6 P3 Izvilac
S7 P1 Rukovodilac
Tabela 5. Uee

3.1.3. Relaciona algebra

Sastavni dio modela ini i jezik sa kojim se izraavaju upiti i zadaje auriranja baze
podataka koja odgovara tom modelu. Osnovu za relacione jezike predstavlja jedan
jedinstven formalni jezik koji se naziva relaciona algebra. Ona sadri niz operacija nad
relacijama. Osim poznatih operacija unije, preseka, razlike i Dekartovog proizvoda

40
relaciona algebra ukljuuje i neke specifine operacije koje se nazivaju projekcija,
restrikcija, spajanje i deljenje.
Projekcija. Neka je R(A1,...,An) relacija, a X podskup skupa atributa {A1,...,An}. Neka je
Y komplement od X na skupu atributa {A1,...,An), oznaan sa {A1,...,An}-X. Tada relaciju
R moemo permutovanjem njenih atributa predstaviti kao R(X,Y). Rezultat operacije
projekcije relacije R po atributima X je:
R[X] ={x: postoji y takvo da je (x,y) R(X,Y) }.
Primer projekcije. Nai projekciju za Student(Godina,Sifra_Fakulteta) iz prethodne
relacione eme Student(Broj_Indexa, Ime_Prezime, Godina, Sifra_Fakulteta).
Godina Sifra_Fakulteta
1. F1
2. F2
3. F1
1. F2
4. F3
Tabela 6. Projekcija
Restrikcija. Neka je R(A1,...,An) relacija na skupu atributa {A1,...,An}, a P relacija na
skupu D1 ... Dn, gde je Di domen atributa Ai (i = 1,...,n). Rezultat restrikcije relacije R po
uslovu P je:
R[P] = {x | x R i P(x)}.
Primer restrikcije. Izdvojiti sve studente 1. godine fakulteta iz relacione eme Student
(Broj _Indexa, Ime_Prezime, Godina, Sifra_Fakulteta).
Broj indexa Ime_Prezime Godina Sifra_Fakulteta
S1 Mihajlo Ivanovi 1. F1
S4 Marko Markovi 1. F2
S7 Maja Martinovi 1. F1
Tabela 7. Restrikcija

Spajanje. Neka su A(A1,...,An) i B(B1,...,Bm) relacije, a X (A1,...,An) i Y (B1,...,Bm)


skupovi jednakog broja atributa i sa jednakim korespodentnim domenima. Neka je Z
komplement od X n a skupu atributa {A1,...,An} u oznaci {A1,...,An} X i W
komplement od Y na skupu atributa {B1,...,Bm}, oznaano sa {B1,...,Bm} Y. Tada
pogodnim permutovanjem atributa relacije A i B moemo napisati kao A(Z,X) i B(Y,W).
Rezultat prirodnog spajanja relacije A i B po atributima X i Y definisan je kao:
A[X=Y]B = {(z,x,w) | (z,x) A, (y,w) B i x = y}
Tabelarna interpretacija operacije prirodnog spajanja je formiranje tabele iji se
redovi dobivaju dopisivanjem m-torke iz relacije B, n - torki iz relacije A kada god su
vrednosti atributa Y iz m-torke jednake vrednostima X atributa iz n-torke. Kod toga se jo
projekcijom po atributima iz X i Y eliminiu nepotrebna ponavljanja jednakih vrednosti
atributa spajanja.

41
Primer spajanja. Izvriti operaciju spajanja tabela Fakultet(Sifra_Fakulteta, Naziv, Grad) i
Student(Broj_Indexa, Ime_Prezime, Godina, Sifra_Fakultet), iji rezultat daje tabelu koja
daje pregled imena studenata i gradova u kojima se nalaze ti fakulteti.
Ime_Prezime Grad

Mihajlo Ivanovi Beograd

Milo Milutinovi Novi Sad


Petar Petrovi Beograd

Marko Markovi Novi Sad

Jelena Petrovi Beograd

Nikola Miloevi Beograd

Maja Martinovi Beograd


Tabela 8. Spajanje
Deljenje. Neka su A(X,Y) i B(Z) relacije gde su X, Y i Z skupovi atributa i gde Y i Z
predstavljaju isti broj atributa i neka su im domeni korespodentnih atributa jednaki.
Rezultat deljenja relacije A(X,Y) sa B(Z) u oznaci A[Y#Z]B definie se kao maksimalni
podskup projekcije A[X] takav da je njegov proizvod sa B(Z) sadran u A(X,Y).
Drugim reima vai:
A(X, Y) = A[Y#Z]B B(Z) (X,Y)
gde je A[Y#Z]B kolinik deljenja, a (X,Y) ostatak deljenja.
Primer deljenja:Projekat(Projekat, Naziv, Sredstva)
Uee(Broj_indexa, Projekat, Funkcija)
Uee[Projekat#Projekat]Projekat[Projekat] predstavlja rezultat deljenja relacije
Uee sa projekcijom relacije Projekat po atributu Projekat. Kolinik deljenja je tabela
studenata koji uestvuju na svim projektima u istoj funkciji i njihovih funkcija u okviru
tih projekata.
Broj_Indexa Funkcija
S6 Izvrilac
Tabela 9. Deljenje
Ostatak deljenja je tabela:
Broj_Indexa Projekat Funkcija
S1 P1 Izvrilac
S2 P3 Izvrilac
S2 P2 Rukovodilac
S3 P2 Izvrilac
S3 P3 Izvrilac
S4 P1 Izvrilac
S5 P3 Rukovodilac
S7 P1 Rukovodilac
Tabela 10. Ostatak deljenja

42
3.1.4. Funkcionalne zavisnosti

Posmatrajmo relaciju Studenti(lme, Adresa, Grad, Potanski_Broj, Telefon)


Pretpostavimo da su imena svih studenata razliita i da svaki od njih moe imati
samo jednu adresu i telefon.
Logike veze izmeu atributa relacije Studenti moe se opisati:
a) Svako ime odreuje jednoznano Adresu, Grad, Potanski_Broj i Telefon.
b) Adresa i Grad odreuju jedinstven Potanski_Broj
c) Svakom Potanskom_Broju pridruen je jednoznano Grad kojem taj broj pripada.
Ovako opisane logike veze izmeu atributa u prethodnoj relaciji nazivaju se
funkcionalnim zavisnostima. Ovaj se pojam definie na sledei nain:
Definicija 3.2. Neka je R(A1,..,An) relacija, a X i Y podskupovi skupa svih atributa
relacije R tj. X (A1,...,An) i Y (A1,...,An). Sa R[X,Y] oznaimo projekciju relacije R po
atributima iz X i Y. Kaemo da postoji funkcionalna zavisnost X Y ako i samo ako je za
svaki trenutak vremena R[X,Y] funkcija R[X] R[Y].
Navedena definicija oznaava da kad god su parovi (x,y) i (x,y') elementi relacije
R[XY] tada je y = y'. Ovo je upravo uslov koji razlikuje funkciju od relacije. Ako
funkcionalna zavisnost X Y ne postoji onda relacija R[X,Y] moe sadravati vie
elemenata koji imaju istu vrednost atributa iz X, a razliitu vrednost atributa iz Y. Drugo,
XY je vremenski nepromenljivo svojstvo. Skup n - torki koje opisuju R(A1,...,An) se
menja u vremenu, a to onda vai i za R[X,Y]. Definicija funkcionalne zavisnosti zahteva
da su te promene takve da u svakom trenutku vremena R[X,Y] predstavlja ne samo relaciju
nego funkciju R[X] R[Y],
Primer funkcionalnih zavisnosti. Za datu relaciju Studenti uz uvedene pretpostavke
slede funkcionalne zavisnosti: Ime Adresa, Ime Grad, Ime Potanski_Broj,
Ime Telefon, Adresa, Grad Potanski_Broj, Potanski_Broj Grad. Definicija
funkcionalne zavisnosti omoguava preciznu definiciju pojma kljua.
Neka je R(A1,...,An) relacija, a X podskup skupa atributa relacije R. X je klju relacije
R ako i samo ako vai:
a) X funkcionalno odreuje sve atribute relacije R tj. X Ai, za i = 1,.. .,n.
b) Nijedan pravi podskup od X nema tu osobinu tj. za X' X ne vai X' Aj, za neki
j = 1,...,n.
Na primer, atribut Ime je klju relacije Studenti, jer odreuje sve atribute te relacije.
Ako za X vai samo osobina a) on se naziva nadkljuem, to znai da sadri klju. Iz
skupa kljueva svake relacije bira se jedan koji preuzima ulogu jedinstvenog identifikatora
entiteta predstavljenih relacijom. Taj klju se zove primarnim kljuem. On ima ulogu da
zahteva da nijedan od njegovih atributa ne sme nikada poprimiti nedefinisanu (nepoznatu)
vrednost. [60]

43
Ponaanje funkcionalnih zavisnosti odreeno je skupom osnovnih pravila iz kojih se
izvode sve druge osobine ove vrste logikih veza.
a) Jedinstvenost. Ako su f: X Y i g : X Y funkcionalne zavisnosti tada je f g tj.
postoji samo jedna funkcionalna zavisnost sa datim domenom i kodomenom.
b) Projektivnost. Ako je X Y tada postoji funkcionalna zavisnost Y X tj. svaki
skup atributa funkcionalno odreuje svaki svoj podskup.(Trivijalna zavisnost)
c) Tranzitivnost. Ako su f: XY i g: Y Z funkcionalne zavisnosti tada postoji
funkcionalna zavisnost X Z.
d) Aditivnost. Ako su XY i XZ funkcionalne zavisnosti tada postoji i
funkcionalna zavisnost X YZ.
Na primer, za relacije Studenti vae na osnovu prethodnih osobina, sledee funkcionalne
zavisnosti:
Adresa, Grad Grad, Adresa, Grad Adresa (Projektivnost)
Iz funkcionalnih zavisnosti na osnovu osobine tranzitivnosti imamo:
Adresa, Grad Potanski_Broj i Potanski_Broj Grad dobivamo Adresa, Grad
Grad.
Iz funkcionalnih zavisnosti na osnovu osobine aditivnosti imamo:
Ime Adresa, Ime Telefon izvodimo Ime Adresa, Telefon
Iz osnovnih osobina funkcionalnih zavisnosti mogu se izvesti sledee osobine:
a) Distributivnost. Ako vai funkcionalna zavisnost X YZ tada vae i funkcionalne
zavisnosti X Y i X Z.
b) Pseudotranzitivnost. Ako vai funkcionaine zavisnosti X Y, YW Z tada vai i
funkcionalna zavisnost XW Z.
c) Proirenje. Ako vai funkcionalna zavisnost X Y, W Z tada vai i
funkcionalna zavisnost XW YZ.

3.1.5. Vieznane zavisnosti

Funkcionalne zavisnosti predstavljaju specijalan sluaj optije logike veze izmeu


atributa relacije, koja se naziva vieznana zavisnost. Vieznana zavisnost je potpuna
veza dva seta atributa u relaciji. Vieznana zavisnost meu atributima neke relacije R (X,
Y, Z) postoji onda kada skup vrednosti atributa Y zavisi od X, a ne zavisi od Z. Reima
iskazano: X vieznano odreuje Y, odnosno Y vieznano zavisi od X. Ovu vrstu
zavisnosti razmotrimo prvo na jednom primeru. Neka je data relacija Profesor (Ispit, Ime,
Sat, Uionica, Student, Ocena). U ovome primeru postoji samo jedan ispit sa dva studenta.
Ispit se moe odravati u nekoliko razliitih soba i u razliito vreme.

44
Ispit Ime Sat Uionica Student Ocena
Baze podataka M.V. 9:00 1 Marko M. 8
Baze podataka M.V. 10:00 2 Marko M. 8
Baze podataka M.V. 11:00 1 Marko M. 8
Baze podataka M.V. 9:00 1 Jelena J. 9
Baze podataka M.V. 10:00 2 Jelena J. 9
Baze podataka M.V. 11:00 1 Jelena J. 9
Tabela 11. Vieznane zavisnosti
Neka je R(X,Y,Z) relacija sa m + n + r atributa, gde su X = {X1,...,Xm},
Y = {Y1,...,Yn}, Z = {Z1...,Zr} meusobno disjunktni skupovi atributa, a m torku
(x1,...,xm) konkretnih vrednosti atributa X1,...,Xm, neke m + n + r - torke relacije R
oznaimo sa x. Analogno vai za y i z. Definiimo skup Yxz na sledei nain:
Yxz = {y | (x,y,z) R}
Dakle, skup Yxz dobije se tako to izvrimo operaciju restrikcije relacije R birajui
samo one m + n + r - torke ije su X komponente jednake x, a Z komponente jednake z, a
zatim izvrimo projekciju tako dobivene relacije na atribute Y.
Definicija 3.5. Kaemo da za relaciju R(X,Y,Z), gde su X, Y, Z meusobno
disjunktni skupovi atributa, vai vieznana zavisnost X Y ako i samo ako je Yxz =
Yxz' za svako x, z i z' za koje su Yxz i Yxz' neprazni skupovi.
Odavde vidimo da Yxz=Yxz' vai ako i samo ako vai da kad god su (x,y,z) i
(x,y,z') elementi relacije R, tada su to i (x,y',z) i (x,y,z'). Otuda imamo sledeu definiciju
potrebnog i dovoljnog uslova za postojanje vieznane zavisnosti koja je ekvivalentna
prethodnoj definiciji.
Definicija 3.4. Za relaciju R(X,Y,Z) vai vieznana zavisnost X Y ako i samo
ako je zadovoljen uslov: kad god su (x, y, z) i (x, y', z') elementi relacije R, tada su to i
(x, y,z) i (x, y, z').
Ove definicije vieznane zavisnosti mogu se modifikovati tako da se dobiju
odgovarajue definicije funkcionalne zavisnosti. Ako u definiciji 3.3 zahtevamo da Yxz,
osim toga to zavisi samo od x, sadri najvie jedan element, dobijamo uslov za postojanje
funkcionalne zavisnosti X Y. Analogno, ako u definiciji 3.4. zahtevamo da kad god su
(x,y,z) i (x,y',z') elementi relacije R, tada je y = y' . Dakle funkcionalne zavisnosti su samo
jedan specijalan sluaj vieznanih zavisnosti.
U gornjem primeru, na osnovu definicije, vredi vieznana zavisnost:
Ispit Sat i Uionica.
Pored toga vrede i sledee vieznane zavisnosti:
Ispit Sat i Ocena i Sat i Uionica Student i Ocena.
Takoe, postoji i trivijalna vieznane zavisnost:
Sat i Uionica Uionica.

45
Primetimo da ne vrede sledee vieznane zavisnost:
Ispit Sat,
Ispit Uionica.
Znaaj vieznanih zavisnosti je u tome to one daju potreban i dovoljan uslov da je
relacija rezultat prirodnog spajanja svojih projekcija.

3.1.6. Osobine vieznanih zavisnosti

Vieznane zavisnosti dosta su sloenije od funkcionalnih zavisnosti, pa je i skup


osnovnih i izvedenih pravila koji se odnosi na njih dosta sloeniji. Na primer, iz X Y i
Y Z ne vredi obavezno i X Z. Imamo sledee osobine za vieznane zavisnosti:
a ) Komplementno pravilo. Ako vredi X Y, tada vredi i X U - X - Y
b) Tranzitivnost. Ako vai X Y i Y Z tada vai i X (Z - Y).
c) Aditivnost. Ako vredi X Y i V W tada vredi i WX VY.

3.2. Fazi relacioni model baza podataka

U prethodnoj deceniji veliki broj autora [1,2,17,18,39,42] postavio je pitanje


uvoenja nepreciznosti i neodreenosti u relacionim bazama podataka, a to nas dovodi do
sistema baze podataka koji lee u okviru vetake inteligencije, jer nam se omoguava da
upravljamo informacijama koje su veoma sline prirodnom jeziku. Codd uvodi
organizaciju relacione baze podataka koja je zasnovana na teoriji skupova i relacionoj
teoriji. Zadeova teorija fazi skupova predstavlja generalizaciju opte teorije skupova, dok
je koncept fazi relacije generalizacija relacione teorije. Zbog toga Buckles i Petry predlau
fazi relacioni model baza podataka koji nudi mogunost skladitenja i upravljanja
nepreciznim i neodreenim informacijama.
Rasplinute, neprecizne informacije (fazi informacije) mogu biti ukljuene u sistem na
dva razliita nivoa: prvi nivo razmatra mogunost definisanja nepreciznih upita u
klasinim relacionim bazama podataka, a drugi se odnosi na problem dodavanja
nepreciznih informacija u bazu. U oba sluaja, teorija fazi skupova predstavlja moan alat
za upravljanje neodreenim i nepreciznim podacima. Razmatranje drugog pristupa nas
dovodi do Fazi Relacionih Modela Baza Podataka.
Grupa autora [5,29] uvodi model nazvan GEFRED (General Fuzzy Relational
Database). U ovom delu uvodimo osnovne elemente fazi proirenja relacionog modela
baza podataka.
Struktura GEFRED modela moe da se prikae na sledei nain:
RFG (DG1,C1) x x (DGn,Cn),
gde je DGi domen atributa, a Ci kompatibilnost atributa koja uzima vrednost iz intervala
[0,1]. U Fazi Relacionom Modelu kompatibilnost atributa se ne prikazuje, ali u svakoj
n-torci vrednost atributa povezana je sa odgovarajuom vrednou Ci.

46
Posmatrajmo sledei primer koji opisuje proirenje klasine relacione baze podataka
u GEFRED model:
Ime Adresa Godine Produktivnost Zarada
Marko Bulevar revolucije 31 Dobra Visoka
Aleksandar Medakovi Srednjih g. Zadovoljavajua 100 000
Nenad Karaburma Mlad Loa 90 .000
Saa Novi Beograd Star Odlina Niska
Vlada Cerak Mlad Dobra Srednja
Goran Rakovica Oko 28 Dobra 125 000
Milan arkovo Izmeu 30 i 35 Zadovoljavajua 105 000
Tabela 11. Fazi relacija GEFRED

11 Mlad Srednjih g. Star


1

25 40 55 80 Godine
Slika 8. Funkcija pripadnosti atributa Godine [5]

Niska Srednja Visoka


1

85 95 110 130 180 Zarada


Slika 9. Funkcija prpipadnosti atributa Zarada [5]
Atributi Ime i Adresa sadre crisp informacije, pri emu je primarni klju atribut Ime.
Sa druge strane, atributi Godine i Zarada sadre fazi informacije, a odgovarajue funkcije
pripadnosti za lingvistike promenljive iz tabele data su na slici 8 i 9. Atribut
Produktivnost sadri informacije iz diskretnog domena (4 tipa vrednosti), pa u tom sluaju
moramo da definiemo relaciju slinosti meu elementima ovog domena, a to je prikazano
u sledeoj tabeli:
S (di,dj) Loa Zadovoljavajua Dobra Odlina
Loa 1 0.8 0.5 0.1
Zadovoljavajua 0.8 1 0.7 0.5
Dobra 0.5 0.7 1 0.8
Odlina 0.1 0.5 0.8 1
Tabela 12. Relacija slinosti za atribut Produktivnost [5]

47
Ovaj teorijski model ukljuuje neophodne elemente za definisanje Fazi Relacionih
Modela Baza Podataka (FRDBM). U okviru ove baze, moemo da ispitamo zavisnost
izmeu pojedinih atributa (npr. Godine, Zarada i Produktivnost) i da primenjujui rezultate
fazi logike odredimo nepoznate vrednosti atributa, tj. da ih preciziramo. Ovaj model se
moe posmatrati kao proirenje klasine relacione baze podataka koji je sposoban za
predstavljanje i upravljanje nepreciznim i neodreenim informacijama. U ovom primeru,
moemo da sagledamo i usvojim prvobitne pristupe u analizi FRDBM:
- Predstavljanje fazi informacija u okviru baza podataka i
- Implementacija FRDBM korienjem mehanizama iz klasinih baza podataka (SQL
upiti).
Naredni korak u razvoju ovakvih modela baza podataka bio je fazi proirenje i
formulacija SQL jezika. Prvobitne ideje kretale su se u smeru realizacije softvera za
prevoenje fazi u klasine SQL upite.

3.2.1. Nesavrene informacije i teorija fazi skupova

Klasini modeli baza podataka esto pate od svoje nesposobnosti predstavljanja i


manipulisanja nepreciznim i neodreenim informacija koje se javljaju u stvarnom svetu
brojnih aplikacija. Od ranih 80-tih godina, Zadeova fazi logika se koristi za proirenje
razliitih modela podataka. Svrha uvoenja fazi logike u baze podataka jeste mogunost
predstavljanja i upravljana neodreenim i nepreciznim informacijama.
Nedoslednost, nepreciznost, neodreenost, neizvesnost i nejasnoa su osnovne vrste
nesavrenih informacija u sistemima baza podataka [75]:
1. Nedoslednost je vrsta semantikog konfikta, to znai isti aspekt stvarnog sveta je
predstavljen razliito u jednoj ili razliitim bazama podataka. Npr. Starost jedne
osobe je skladitena kao 34 i 37 godina istovremeno.
2. Intuitivno, nepeciznost i neodreenost su relevantni za sadraj vrednosti atributa, a
to znai da vrednost atributa mora da lei u datom opsegu (intervalu ili skupu)
vrednosti, ali mi ne znamo koja vrednost e se tano birati u datom trenutku. U
principu, nejasne informacije se predstavljaju lingvistikim varijablama. Na primer,
mlad ovek je skup vrednosti {18, 19, 20, 21, 22, 23} to znai da mlad ovek
moe imati 18, ali i 23 godine.
3. Neizvesnost se odnosi na stepen istine vrednosti atributa, a to znai da moemo da
procenimo verodostojnost pojednih vrednosti atributa. Na primer, moguost da je
Marko star 35 godina je 97%. Sluajne neizvesnosti koje se opisuju teorijom
verovatnoe se ne uzimaju u obzir ovde.
4. Nejasnoa dvosmislenost znai da nekim elementima modela podataka nedostaje
potpuna semantika to dovodi do nekoliko moguih tumaenja.
Generalno, nekoliko razliitih nesavrenosti moe da koegzistira u odnosu na isti
podatak u bazi. Na primer, starost osobe je podatak iz skupa vrednosti {18,19,20,21} i
njihove mogunosti (stepen pripadnosti) je 70%, 95%, 98% i 85% respektivno.
Nepreciznost, neizvenost i nejasnoa su tri glavne vrste nesavrenih informacija sa kojima
se susreemo u tradicionalnim bazama podataka. Mnogi od postojeih pristupa koji se bave
nepreciznou i neodreenou informacija se baziraju na teoriji fazi skupova i mogunosti
distribucije. Fazi skup {0.7/18, 0.85/19, 0.95/20, 0.98/21} za starost osobe sadri

48
neprecizne informacije (starost osobe moe biti 18, 19, 20 ili 21 godinu) i stepen
pripadnosti (0.7, 0.85, 0.95 i 0.98) istovremeno.

3.2.2. Predstavljanje podataka u fazi modelu

U klasinim relacionim bazama podataka [91] sve informacije moraju biti precizno
definisane, a u sluaju da osnovne vrednosti nisu precizno definisane, tada one ukljuuju
takozvanu NULL vrednost. C o d d razmatra NULL vrednost u znaenju kompletno
nepoznat tj. neke od vrednosti u domenu atributa mogu da poprime ovo znaenje.
U relacionom modelu baza podataka imamo sledea tri osnovna uslova:
a) Za elemente x, y iz domena atributa A, ako x i y nisu identini tada su oni u
potpunosti razliiti.
b) Za bilo koju n - torku t u tabeli, t=(t(A1),...,t(An)), t(Ai) moe predstavljati samo
jedan element na datom domenu.
c) Bilo koja n - torka predstavljena u tabeli u potpunosti pripada toj tabeli i to sa
stepenom pripadnosti 1.
Kao drugi nain razmatranja ovih nepreciznih informacija je ukljuivanje fazi
vrednosti na domenu atributa. Ove neprecizne informacije su odreene Zadeovom teorijom
fazi skupova i fazi logikom i one omoguavaju matematiki okvir za rad sa nepreciznim
informacijama u fazi relacionim bazama podataka.
Neka je data relaciji R(lme, Pol, Godine, Visina, Zdravlje, Boja_Kose) i neka u toj
relaciji u nekom trenutku vremena imamo sledee injenice:
T1: (Marko, M, {21,22,23}, 176, osrednje, crvena ili smea)
T2: (Milan, M, srednjih-godina, {0.7/180,1/183,0.8/186}, vrlo-dobro, {bela, siva})
T3: (Saa, M, 27,170, dobro, crna): , gde je pripadnost n-torke relaciji i [0,1].
U datom modelu uzmimo na domenu atributa lingvistike izraze (vrlo, srednjih), fazi
skupove (0.7/180, 1/183, 0.8/186), podskupove datoga domena (crvena, smea). Zatim,
primetimo da n - torke mogu pripadati datoj relaciji sa nekim parcijalnim stepenom
pripadnosti.
Za proirenje klasinog modela podataka u fazi model najpre definiimo modele za
predstavljanje podataka koji generie gore spomenute pretpostavke. U ovom poglavlju
daemo etiri okvira za predstavljanja podataka u fazi modelu [23,28,55,56], i to osnovni
fazi model na bazi slinosti, fazi model na bazi mogunosti, fazi model na bazi fazi relacije
i fazi model sa proirenom mogunosti.
U fazi modelu na bazi slinosti (Buckles i Petry) svaki domen skupa atributa u fazi
relacionim bazama podataka, kao prvo asociran je sa relacijom slinosti, umesto
identinom relacijom, i drugo domen vrednosti je definisan kao podskup osnovnog
baznoga skupa, umesto jednoga elementa domena kao u klasinim relacionim bazama
podataka. Tako imamo sledeu definiciju:
Definicija 3.5. Fazi relacija R je podskup skupa Dekartovog proizvoda
2 2D2 ... 2Dn gde je Di konaan domen i 2Di partitivni skup skupa Di. Bilo koji lan
D1

relacije naziva se jednostavno n - torkom.

49
Definicija 3.6. Fazi n torka ti je bilo koji lan od R i 2D1 2D2 ... 2Dn koja je
data u formi ti= (dil, di2,...dij,...din), gde je dijDj, j=1..n, dij.
Relacija slinosti sj na Dj je preslikavanje Dj Dj [0,1], tako da za x, y, z Dj
vai:
a) sj(x,x) = 1 (refleksivna)
b) sj(x,y) = sj(y,x) (simetrina)
c) sj(x,z) > max (min(sj(x,y), sj(y,z)) (max-min tranzitivna).
Za dati domen Dj, prag slinosti definisan je kao:

Prag (Dj) min min[ s( x, y )]
i
x , yd ij

Primer ovoga modela mogue je predstaviti n-torkom T1:


T1: (Marko, M, {21,22,23}, 176, osrednje, crvena ili smea)
Fazi model na bazi mogunosti distribucije (Prade i Testemale) proiruje teoriju klasinih
relacionih baza podataka dozvoljavajui upotrebu fazi vrednosti za atribute. Fundamentalni
koncept fazi informacija jeste da promenljiva (atribut) nije vezana za konkretnu vrednost.
U tom kontekstu se koristi termin mogunost distribucije, koja svaku moguu vrednost
promenljive povezuje sa vrednostima iz intervala [0,1]. Uopteno, mogunost distribucije
se identifikuje sa funkcijom stepena pripadnosti. . Zato kaemo da element x pripada fazi
skupu A (Visina osobe) sa stepenom pirpadnosti 0.9. Onda je mogunost distribucije
elementa xX na fazi skupa A, koji je definisan na domenu X, A(x)=0.9.
Definicija 3.7. Fazi relacija R je podskup domena (D1) ... (Dn), gde je:
(Di) = {Ai | Ai je mogua distribucija od Ai na Di}
Odgovarajua n - torka je data u formi ti= (A1, A2,....,An).
Nadalje, u ovom modelu uveden je jedan poseban element e za takozvane
neprimenljive situacije koje mogu poprimiti odgovarajue vrednosti atributa. U tu svrhu
definiemo sledeu funkciju:
Ai: D e [0,1]
Primer ovoga modela mogue je predstaviti n-torkom T2:
T2: (Milan, M, srednjih-godina, {0.7/180,1/183,0.8/186}, vrlo-dobro, {bela, siva}).
U fazi modelu na bazi fazi relacije (Baldwin), fazi relacija definisana je na sledei
nain:
Definicija 3.8. Fazi relacija R na D1 ... Dn odreena je sa funkcijom pripadnosti
R : D1 ... Dn [0,1], gde je Di, domen atributa Ai
Generalna forma binarne relacije R na D1 D2 predstavljena je kao:
R = { R (u1, v1) / (u1, v1),..., R (um, vn) / (um, vn)} u n - torci date sa
R = { u1, v1, R (u1, v1), ... , um, vn, R (um, vn)}
gde je uj D 1 , j = 1,2,...,m i vk D2, k = 1,2,...,n.

50
Ovaj model odreuje da je pripadnost neke n - torke datoj relaciji jeste fazi, dok
individualne vrednosti atributa ne moraju biti fazi, ili mogu biti lingvistike varijable, ali
tada se tretiraju kao atomske ili kao jedno - vrednosne varijable.
Primer ovoga modela mogue je predstaviti n-torkom T3 :
T3: (Sasa, M, 27, 170, dobro, crna):
Fazi model sa proirenom mogunou proiruje fazi model na bazi mogunosti
distribucije, ne samo dozvoljavajui moguu distribuciju vrednostima atributa, ve
dozvoljavajui i relaciju bliskosti koja je u vezi sa datim domenom. Ovo proirenje
generalizuje klasini relacioni model baza podataka. Naznaimo da je relacija slinosti
samo specijalni sluaj relacije bliskosti kod koje se zahteva da bude refleksivna i
simetrina.
Definicija 3.9. Relacija bliskosti ci na domenu Di je preslikavanje Di Di [0,1] tako da
za svako x,y Di je:
a) ci (x,x) = 1 (refleksivna)
b) ci (x,y) = ci (y,x) (simetrina)
Na taj nain gore spomenuti modeli postaju specijalni sluajevi fazi modela sa proirenom
mogunou.
Definicija 3.10. Fazi relacija R je podskup domena (D1) ... (Dn), gde je:
(Di) = {Ai | Ai je mogua distribucija od Ai na Di}
Odgovarajua n - torka je data u formi ti= (A1, A2,...., An).
Na taj nain pomou relacije bliskosti odreujemo bliskost elemenata odgovarajuih
atributa na datom domenu. Primer ovoga modela mogue je predstaviti n-torkom T2:
T2: (Milan, M, srednjih-godina, {0.7/180,1/183,0.8/186}, vrlo-dobro, {bela, siva}).

3.2.3. Relacija bliskosti

Relacija slinosti je jedna od najvanijih relacija koja se primenjuje u analizi domena


skalarnih fazi atributa. Fazi relacioni model baza podataka zasniva se, izmeu ostalog, na
relaciji slinosti skalarnih domena. Ove relacije su, kao to smo napomenuli refleksivne,
simetrine i max-min tranzitivne. Buckles i Petry u svojim radovima predlau uvoenje
fazi informacija u relacione strukture baza podataka. U ovim strukturama, kao i kod
klasine teorije relacionih baza, podaci se definiu kao ureene n-torke.
Meutim, fazi relaciona baza podataka R je podskup Dekartovog proizvoda:
R 2D1 2D2 2Dn ,
gde je Di domen atributa Ai, a ti n-torka koja pripada relaciji R.
Ovakva struktura nam daje mogunost da koristimo podskup vrednosti domena Di
kao komponente ureene n-torke da bismo na efikasniji nain mogli da upravljamo sa
rasplinutim, neodreenim i nepreciznim informacijama u bazi podataka. to je vea
rasplinutost informacija vei je podskup iz kojih moe da se uzme odgovarajua vrednost.

51
Fazi relacioni model baza podataka Buckles-a i Petry-ija oslanja se na specifikaciju
slinosti za svaki poseban skalarni domen u bazi. Relacija slinosti mapira slinost u
zatvoreni interval [0,1] za svaki par elementa posmatranog domena.
Meutim, postoje kritiki osvrti na upotrebu relacije slinosti u fazi relacionim
bazama podataka. Razloge ovih kritika moemo lako da ilustrujemo i adekvatnim
primerom. Posmatrajmo slinost izmeu brojeva 1,2,3 koji mogu da budu elementi nekog
skalarnog domena. Pretpostavimo da je slinost izmeu 1 i 2 izraena sa 0.8, a izmeu 2 i 3
takoe sa 0.8. Prema osobini max-min tranzitivnosti koja vai za relacije slinosti,
zakljuujemo da slinost izmeu 1 i 3 ne moe biti manja od 0.8. Odavde je uoljivo da se
1, 2 i 3 nalaze u istoj klasi ekvivalencije. Osobina tranzitivnosti uvodi vrlo restriktivno
ogranienje, to moe biti kontraintuitivno za odereene domene. U tom smislu, fazi
relacioni model baza podataka Buckles-a i Petry-ija se proiruje uvoenjem relacije
bliskosti na sklaranom domenu. Svojstva refleksivnosti i simetrije su veoma pogodna za
izraavanje stepena bliskosti ili blizine izmeu elemenata skalarnog domena.[62] Sada je
jasno da je relacija slinosti specijalni sluaj relacije bliskosti. Vana injenica koju nam
obezbeuje relacija bliskosti je particionisanje i klastorevanje skalarnog domena. Ako se
vratimo na prethodni primer, uoiemo da sada moemo da bliskost izmeu brojeva 1 i 3
izrazimo sa vrednou 0.6. Ovo nam daje znaajnu mogunost kada je re o klasterovanju
domena u fazi relacionim bazama podataka i efikasnije kreirenje SQL upita nad podacima
u bazi.
Primer: Posmatrajmo FRDBM u kojoj je prisutan fazi atirbut BOJA KOSE kao
fizika karakteristika neke individue. Relacija bliskosti izmeu elementa domena BOJA
KOSE prikazana je u sledeoj tabeli:
Boja Kose C TB K C S SB P
Crna 1.0 0.8 0.6 0.5 0.4 0.3 0.1
Tamno braon 0.8 1 0.7 0.6 0.6 0.5 0.2
Kestenjasta 0.6 0.7 1 0.8 0.7 0.4 0.3
Crvenkasta 0.5 0.6 0.8 1 0.7 0.5 0.4
Svetla 0.4 0.6 0.7 0.7 1 0.7 0.5
Svetlo braon 0.3 0.5 0.4 0.5 0.7 1 0.8
Plava 0.1 0.2 0.3 0.4 0.5 0.8 1
Tabela 13. Relacija bliskosti za Atribut BOJA KOSE [62]
Pretpostavimo sada situaciju da su pojedinci iz baze osumnjieni za podmetanje
poara. Jedini dokaz koji je dostupan u istrazi je boja kosa poinioca (svetlo braon), koju je
uspeo da zapazi jedan od uvara. Sada smo u mogunosti da formuliemo fazi upit:
SELECT *
FROM Fizicke karaktersitike
WHERE Boja_Kose = SB
WITH LEVEL (Boja_Kose) = 0.8)

52
Pogledajmo sada bazu podataka:
Ime Boja kose Graa
Marko Crna Veliki
Milo Kestenjasta Srednje razvijen
Petar Plava Veoma mali
Milorad Svetlo braon Mali
Rade Tamno braon Veliki
Momilo Crna Veoma veliki
Tabela 14. Baza podataka
Na osnovu formulisanog upita, dobijamo iz baze podataka da su osumnjiene dve
osobe:
Petar Plava Veoma mali
Milorad Svetlo braon Mali
Tabela 15. Rezultat upita
Dakle, prema dokazima sa kojim se raspolae preporuka je da se u dalja ispitivanja
ukljue Petar i Milorad. Sada moemo da diskutujemo i o efektu uvoenja relacije
bliskosti. Jedna od najzanimljivih stvari jeste klasterizacija domena. U naem primeru,
uoavamo sledee klastere za razliite vrednosti :
(0.8, 1] {Crna}, {Tamno braon}, {Kestenjasta}, {Crvenkasta}, {Svetla}, {Plava}.
(0.7, 0.8] {Crna, Tamno braon} , {Kestenjasta, Crvenkasta }, {Plava, Svetlo braon}
(0.5, 0.7] {Crna,Tamno Braon, Crvena, Crvenkasta }, {Svetla, Svetlo braon}
(0, 0.5] {Crna, Tamno braon, Crvenkasta, Kestenjasa, Plava, Svetla, Svetlo braon}.

3.2.4. Fazi upiti

Relacija bliskosti i particija domena [49,64] su veoma vni alati koje se koriste u
kreiranju fazi upita u fazi relacionim modelima baza podataka. Neka su dati domen D i
odgovarajua relacija bliskosti p definisana na domenu D. Vrednosti p(x,y) je potrebno
rasporediti u rastuem redosledu:
m1 < m2 < < mk=1
Podintervali (mr, mr+1], ukljuujui i [0, m1] nazvani p-particije se oznaavaju na sledei
nain:
[0, m1 ], ako je m1 0
I1
0 ako je m1 0
I2= (m1, m2],
I3= (m2, m3],
...
I= (m-1, m].
pri emu je k broj particija domena.
Za I1 particija (klaster) domena D se oznaava sa P1,
I2 particija (klaster) domena D se oznaava sa P2,
....
Ik particija (klaster) domena D se oznaava sa Pk.

53
Sledea nejednakost slui za definisanje poetnog broja particija (klastera) domena D:
c2 c
k 1
2
pri emu je c kardinalnost domena D.
Ako je Pi=Pi+1Pi+2 (Pi-1Pi) tada intervale Ii i Ii+1 spajamo i dobijamo proireni
interval. Na ovaj nain dolazimo do optimalnog broja klastera nekog domena D, pa imamo
sledeu notaciju:
Za J1 particija (klaster) domena D se oznaava sa Q1,
J2 particija (klaster) domena D se oznaava sa Q2,
....
Jm particija (klaster) domena D se oznaava sa Qm.
J1, J2,...,Jm zovemo optimalne p-particije ili jednostavnije reeno optimalne particije
domena D, pri emu je jasno da je je mk. Krajnje take intervala J1, J2,...,Jm zovu se
vorovi optimalne podele. Ove vorne take su jako vane prilikom donoenja odluka o
izboru nivoa vrednosti prilikom kreiranja fazi upita.
Na sledeem primeru prikazana je optimalna klasterizacija domena. Posmatrajmo relaciju
Fizike karakteristike (Ime, Boja_Kose,Graa).
Ime Boja Kose Graa
Marko Crna Veliki
Milo Tamno braon Srednje razvijen
Petar Kestenjasta Srednje razvijen
Ivan Svetla braon Mali
Vlada Tamno braon Srednje razvijen
Goran Crvenkasta Veoma mali
Saa Plava Veoma veliki
Ognjen Svetla braon Srednje razvijen
Tomo Kestenjasta Veliki
Boko Svetla braon Veliki
Tabela 16. Tabela fizike karakteristike
Graa Veoma veliki (VV) Veliki (V) Srednje r. (S) Mali (M) Veoma mali (VM)
VV 1.0 0.8 0.5 0.3 0.1
V 0.8 1.0 0.6 0.4 0.2
S 0.5 0.6 1.0 0.6 0.4
M 0.3 0.4 0.6 1.0 0.7
VM 0.1 0.2 0.4 0.7 1.0
Tabela 17. Relacija bliskossti na domenu atributa Graa
Boja_Kose={Crna, Tamno braon, Kestenjasta, Crvenkasta, Svetla, Svetlo braon, Plava}
Graa={Veoma veliki, Veliki, Srednje razvijen, Mali, Veoma mali}.
Tabela 16. reprezentuje fizike karakteristike osoba, pri emu svaka n-torka sadri
sledee informacije: ime osobe, njegova boja kose i graa. Vrednosti domena i nad njima
generisane relacije bliskosti su date u tabelama 13. i 17. Usmerimo nau panju na atribut
Boja_Kose.
Vrednosti iz relacije bliskosti date u rastuem redosledu:
0.1<0.2<0.3<0.4<0.5<0.6<0.7<0.8<0.9<1.0.

54
c2 c
Vidimo da ja 9 1 , pa su podintervali:
2
I1= [0, 0.1],
I2= (0.1, 0.2],
I3= (0.2,0.3],
I4= (0.3, 0.4],
I5= (0.4, 0.5],
I6= (0.5,0.6],
I7= (0.6, 0.7],
I8= (0.7, 0.8],
I9= (0.8,1.0],
Odgovarajue particije domena Boje_Kose uzimajui u obzir relaciju bliskosti na
ovom domenu:
P1= {C, TB, K, C, SB, P},
P2= {C, TB, K, C, SB, P},
P3= {C, TB, K, C, SB, P},
P4= {C, TB, K, C, SB, P},
P5= {C, TB, K, C, SB, P},
P6= {C, TB, K, C} { SB, P},
P7= {C, TB, K, C} { SB, P},
P8= {C, TB} {K, C} { SB, P} i
P9= {C} {TB}{K} {C} {SB}{P}.
Primeujemo da nismo navodili vrednost Svetla (S) za atribut Boja_Kose jer se ne
pojavljuje u relaciji Fizike karakteristike. Iz datih klastera vidimo da je P1= P2= P3= P4=
P5 i P6= P7. Prema tome, optimalna podela domena atributa Boje_Kose na intervalu [0,1]
je:
J1= I1 I2 I3 I4 I5 = [0,0.5],
J2= I6 I7 = (0.5, 0.7],
J3= I8 = (0.7, 0.8]
J4= I9 = (0.8, 1.0].
a odgovarajue optimalne particije (klasteri) domena vrednosti su:
Q1= {C, TB, K, C, SB, P},
Q2= {C, TB, K, C} { SB, P},
Q3= {C, TB} {K, C} { SB, P},
Q4= {C} {TB}{K} {C} {SB}{P}.

55
Ako je ( 0) vor definiemo - i + kao granine take klasterizovanog intervala:
[ p , ], ako je p 0

-
[0, ] ako je p 0

gde je p prethodni vor od . Ako je ( 1) tada je:
[, n ], ako je 0

[0, n ] ako je 0
gde je n sledei vor od .
Za vor definiemo gornju i donju toleranciju:
lenght ( - )
lt( )
lenght of [0,1]
lenght ( )
up( )
lenght of [0,1]

vor igra veoma vanu ulogu u donoenju odluka prilikom izbora nivoa vrednosti za
fazi upite iz dva razloga:
1. Promenljive vrednosti tolerancije lt() i up() za razliite vrednosti . U
prethodnom primeru lt(0.5)=50% i up(0.5)=20%.
2. Za bilo koje vrednosti 1 - i 2 +, odgovarajue particije domena D znaajno
su razliite bez obzira na vrednost razlike 2-1.
Ako nije vorna taka onda se donja tolerancija rauna po formuli:
lt()=(-p)=[100 (-p)] %
i gornja tolerancija:
ut()=(n-)=[100 (n-)] %
Ako izabrani nivo vrednosti nije vor, moe se videti da izborom odgovarajue
vrednosti poveavamo ili smanjujemo vrednosti gornje i donje tolerancije, ali se ne
menja odgovor na fazi upite. Meutim, ako je izabrani nivo vrednosti vorna taka, a pri
tome poveavamo za bilo koji iznos, odgovori na fazi upite se drastino menjaju, dok
smanjenjem vrednosti unutar opsega ne menja rezultat fazi upita.
U prethodom primeru moemo da formuliemo sledei upit:
Pronai osobe koje imaju manje ili vie svetlo braon boju kose i koje su manje ili vie
velike?
Ovaj upit moe da se prevede u sledeu formu u fazi relacionoj algebri:
SELECT *
FROM Fizke karakteristike
WHERE Boja_Kose=Svetlo braon
AND Graa=Veliki
WITH LEVEL (Boja_Kose)=0.8
LEVEL (Graa)=0.8.

56
Rezultat ovog fazi upita prikazan je u sledeoj tabeli:
Ime Boja_Kose Graa
Saa Plava Veoma veliki
Boko Svetlo braon Veliki
Tabela 18. Rezultat fazi upita

Ako umesto LEVEL(Boja_Kose)=0.8 0.8- uzmemo 0.801 0.8+ rezultat fazi upita
e izgedati:
Ime Boja_Kose Graa
Saa Plava Veoma veliki
Tabela 19. Rezultat fazi upita posle promene vrednosti

to znai da smo promenom nivoa za 0.001 dobili razliite rezultate fazi upita. To je
zbog injenica da je =0.8 vorna taka. Meutim, ako za uzmemo vrednost 0.9 koja
nije vorna taka, imaemo rezultat koji se ne razlikuje pri gornjoj i donjoj toleranciji od
10%.
Fazi relacioni model baza podataka predloen od strane Buckles-a i Petry-a,
zasnovan na teoriji slinosti, predstavlja generalizaciju klasine relacione baze podataka.
Shenoi i Melton [25,27,62] zamenjuju relaciju slinosti sa relacijom bliskosti i na taj nain
proiruju fazi relacioni model baza podataka. Uvoenjem relacije bliskosti znaajno se
pojednostavljuje generisanje fazi upita nad fazi relacionim bazama podataka, to je i
prikazano u ovom poglavlju.
to se tie kreiranja fazi upita nad relacionim bazama podataka, pored predloene
strategije koja podrazumeva da je prag () povezan sa fazi upitom, druga strategija se
oslanja na razlaganje fazi upita u osnovne operacije i procenu ovih operacija putem
efikasnih algoritama. U poreenju sa drugom strategijom koja podrazumeva izgradnju
potpuno novog sistema za implementaciju fazi upita, prva strategija moe da se
implementira pomou regularnog DBMS-a. Z.M. Ma i Li Yan predlau metod prevoenja
fazi upita tako da se prag prevodi u fazi brojeve [52]. Treba napomenuti da fazi uslovi u
fazi upitima mogu biti opisani fazi relacijama i fazi uslovima. Kombinujui fazi logiku i
osnovne operacije kao to su >, <, =, , , , te lingvistike varijable blizu, oko, najmanje,
najvie sa poznatim vrednostima formiraju se fazi uslovi. Prevoenje fazi upita je korisno u
sledeim situacijama:
- Fazi upit se sastoji od regularnih relacija = i fazi uslova,
- Fazi upit se sastoji od fazi relacija (oko, malo vie) i poznatih vrednosti.
Za ilustraciju prethodne diskusije, posmatrajmo osnovni fazi upit sa fazi operandima:
SELECT XX
FROM RR
WHERE AY
WITH [threshold]
gde je XX atribut(i), RR je relacija i AY je fazi uslov sa fazi operandima. moe biti >,
<, =, , , , between ili not between. Ako je between ili not between, AY ima sledeu
formu A between (not between) Y1 and Y2.

57
U zavisnosti od Y, sledei sluajevi se mogu identifikovati prilikom translacije fazi upita:
1. Y je jednostavan fazi uslov (fazi broj)
Neka je poznata vrednost praga , a to je vrednost iz intervala [0,1]. Manja vrednost
podrazumeva da je vei broj n-torki koji zadovoljavaju dati uslov. Korisnik moe da
izabere vrednost u skladu sa svojim zahtevima i svojim znanjem. Ako je Y= [a,b], onda
se fazi upiti mogu prevesti u klasine upite na sledei nain:
Fazi upit Klasini upit nakon translacije
SELECT XX SELECT XX
FROM RR FROM RR
WHERE A=Y WITH WHERE Aa AND Ab

SELECT XX SELECT XX
FROM RR FROM RR
WHERE A>Y WITH WHERE A>b

SELECT XX SELECT XX
FROM RR FROM RR
WHERE A<Y WITH WHERE A<a

SELECT XX SELECT XX
FROM RR FROM RR
WHERE AY WITH WHERE A<a OR A>b

SELECT XX SELECT XX
FROM RR FROM RR
WHERE AY WITH WHERE Aa

SELECT XX SELECT XX
FROM RR FROM RR
WHERE AY WITH WHERE Ab

Tabela 20. Translacija fazi upita 1 [52]

Fazi uslov A between Y1 AND Y2 moe biti posmatran kao A Y1 AND A Y2.
SELECT XX
FROM RR
WHERE A between Y1 AND Y2 WITH
Ovaj fazi upit se prvo prevodi u:
SELECT XX
FROM RR
WHERE A Y1 AND AY2 WITH
I onda se dobija:
SELECT XX
FROM RR
WHERE A b1 AND Aa2.

58
Lako je videti da uslov A b1 AND Aa2 ima smisla ako i samo ako je b1 a2.
2. Y je sloeni fazi uslov (fazi broj) uz upotrebu operatora :
Neka je data vrednost praga . Ako Y ima formu [a,b] or [c,d], onda se fazi upiti u
ovakvoj formi mogu translirati na nain prikazan u tabeli 21. Ovo je unija dva fazi broja
koja daje fazi broj koji dolazi kao rezultat operacije unije.
SELECT XX
FROM RR
WHERE A>Mlad Veoma_Star WITH
Ovaj fazi upit je ekvivalentan sa:
SELECT XX
FROM RR
WHERE A between Y1 AND Y2 WITH
Odnosno vai, kao u prethodnom sluaju:
SELECT XX
FROM RR
WHERE A Y1 AND AY2 WITH
Fazi upit Klasini upit nakon translacije
SELECT XX SELECT XX
FROM RR FROM RR
WHERE A=Y WITH WHERE Aa AND Ab
OR Ac AND Ad
SELECT XX SELECT XX
FROM RR FROM RR
WHERE A>Y WITH WHERE A>max(b,d)

SELECT XX SELECT XX
FROM RR FROM RR
WHERE A<Y WITH WHERE A<min(a,c)

SELECT XX SELECT XX
FROM RR FROM RR
WHERE AY WITH WHERE A<a OR A>b
OR A<c OR A>d
SELECT XX SELECT XX
FROM RR FROM RR
WHERE AY WITH WHERE A min(a,c)

SELECT XX SELECT XX
FROM RR FROM RR
WHERE AY WITH WHERE A max(b,d)

Tabela 21. Translacij fazi upita 2, [52]

59
Posmatrajmo relaciju Radnik (Ime, Godine, Zarada) i fazi upit:
SELECT Ime
FROM Radnik
WHERE Zarada najvie 5000 WITH 0.9
Pretpostavili smo da je vrednost praga =0.9. Osim toga, pretpostavka je da je domen
atributa Zarada [1.000,7.000] i fazi uslov najvie 5.000 je predstavljen funkcijom
pripadnosti:
1 u 5.000
5.500 u

najvise5000(u ) 5.000 u 5.500
500

0 u 5.500

1.0
0.9

1000 5000 5500 Zarada


Slika 10. Funkcija pripadnosti atributa Zarada

Fazi uslov najvie 5.000 za vrednost =0.9 prikazan je na slici 10. i rezultat je
[1000,5050]. Prema tome fazi upit prevodimo:

SELECT Ime
FROM Radnik
WHERE Zarada 1000 AND Zarada 5000

3.2.5. Redundancija podataka

Redundancija podataka je jedan od primarnih problema u klasinim bazama


podataka. Kao prvo, redundancija oznaava postojanje duplih n - torki, kojima nije
dozvoljeno da se pojavljuju u pojedinanim tabelama. To znai da nee postojati n- torke t
i t' u R, takve da su t i t' identine u odnosu na odgovarajue vrednosti atributa.
Definicija 3.11. Za n-torku t = (t(A1),t(A2),...,t(An)) i n - torku
t' = (t'(A1),t'(A2),...,t'(An)) u relaciji R, kaemo da su jednake ako i samo ako je
t(Ai) = t' (Ai), i = 1,2,...,n.
Alternativno, redundancija n - torki moe se takoe definisati na osnovu primarnog
kljua K, na osnovu koncepta zavisnosti podataka. Primarni klju K relacije R na
relacionoj emi R(U) je podskup od U takav da za jednake vrednost n - torki na K
impliciraju jednake vrednosti n - torki za svaki atribut Ai U, pa su tada dve n - torke t i t'
redundantne ako i samo ako su njihove odgovarajue vrednosti n - torki na K jednake.
Drugim reima, budui da iz t(K) = t'(K) impicira t(Ai) = t'(Ai), n - torke t i t' su
redundantne ako i samo ako je t(K) = t'(K).

60
Osim toga, redundancija takoe znai dupliranje vrednosti u odnosu na neke atribute
u skupu. U fazi relacionim bazama podataka ne postoji jasan nain potvrivanja da su dve
vrednosti atributa jednake ili razliite, ve se posmatra kada su one priblino jednake.
Zbog toga klasina razmatranja ne vae i problem redundancije nije vie trivijalan i
zahteva dodatna razmatranja.
Prvi problem nastaje zbog toga to vrednost nekog atributa n - torke moe biti
podskup domena ili moe biti i mogua distribucija. Na primer, Visina = {170, 180, 190}
ili Visina ={0.3/150, 0.9/175, 0.1/200}.
Drugi problem nastaje kada se neke fazi relacije definiu na datim domenima, na
primer relacija slinosti ili relacija bliskosti. Postoje situacije kada je potrebno uvesti takve
relacija nad domenima. U klasinom sluaju na domenu D = {crn, plav, braon, siv, zelen,
crven, Ijubiast, ut, bel} atribut Boja na D moe uzeti bilo koju vrednost iz domena D.
Ali, kada kaemo da je neto tamno? Da li je jasno tada odreena granica? Dalje, ako je
dozvoljeno da vrednosti atributa budu podskupovi domena D, sa ciljem da predstavimo
neodreenosti kao {crn, zelen}, {braon, crven}, {crn, siv, plav} itd., kako onda odrediti
jednakost ili slinost za neki par vrednosti.
Na kraju vei problemi nastaju kada su vrednosti atributa distribucije mogunosti
uzete zajedno sa nekom fazi relacijom definisanom na domenu atributa.

3.2.6. Redundacija u fazi relacionim bazama podataka

U ovom odeljku daemo neke od postojeih definicija redundancije u fazi relacionim


bazama podataka, koje su rezultat radova [23,28,55]. Ove definicije baziraju se uglavnom
na pojmu relacije slinosti, relacije bliskosti, te nekim varijantama Zadeove relacije
jednakosti.
a) U radu B u c k l e s i Petry redundancija n - torki definie se na osnovu relacije
slinosti meu vrednostima n - torki.
Definicija 3.12. Za date domene D1, D2, ..., Dn i relaciju R 2D1 2D2 ... 2Dn , dve
n - torke t i t' su - redundantne, gde je = (1, 2,..., n) [0,1]n, ako i samo ako je za
i = 1,2,...,n:
min
x , ydi dii
si ( x, y) i
gde je t = (d1,...,di, ..., dn) , t' = (d1,...,di, ..., dn)), di, di' D i i di, di' .
b) U radu S h e n o i i M e 1 t o n [8,27] dato je proirenje B u c k l e s i P e t r y
modela tako to relaciju slinost si, zamenjuju sa relacijom bliskosti pi, na datom domenu.
Autori ele kontrolisati neku osobinu u odnosu na particiju domena, pa zato uvode i
relaciju - bliskost.
Definicija 3.13. Ako je pi, relacija bliskosti na D i tada za dati i, 0 < i <1, dva elementa
iz D i , x i z, su i - bliski ( u oznaci xPiz) ako i samo ako je pi (x,z) > i ili ako postoji
konaan niz y1, y2,...,yr D i takav da je:
pi (x, y1) > i, pi (y1, y2) > i, ... , pi (yr-1, yr) > i, pi (yr, z) > i,

61
Definicija 3.14. Neka su dati pi, i = (1,...,n) i Pi . Dve n - torke t i t ' iz R su -
redundantne, jedna u odnosu na drugu, ako i samo ako xPiy vai za svako x,y di di',
i = 1,...,n, gde je = (1, 2,..., n) i t = (d1,...,di, ..., dn) , t' = (d1,...,di, ..., dn)).
Dakle dve n - torke su redundantne ako i samo ako za sve njihove vrednosti atributa
respektivno, elementi iz di di' pripadaju istoj klasi ekvivalencije.
c) R u d e n s t a j n e r i ostali autori baziraju njihova razmatranja na pojmu relacije
(Resi) na domenu D i koja je u sutini relacija bliskosti. U njihovom radu redundancija
n - torki je definisana na osnovu - preklasa.
Definicija 3.15. Dve n - torke t i t' su - - redundantne jedna u odnosu na drugu, gde je
= (1, 2,..., n) [0,1]n, [0,1], ako i samo ako za i = 1,...,n vai:
a) min
x , ytAi tAi'
Re si ( x, y) i
Ai ( x ) 0
' Ai ( x ) 0


b) min 1 Ai ( z ) Ai' ( z )
zDi

gde je t= (A1, A2,...., An), t' = ('A1, 'A2,...., 'An), tAi = {w : A1 (w) > 0, w D i } i
t' A i = {w : 'A1 (w) > 0, w D i }
d) Sada dajemo definiciju jednakosti n - torki u fazi modelu na bazi mogunosti
distribucije.
Za date dve n - torke ti= (A1, A2,...., An), t' = ('A1, 'A2,...., 'An), propozicija da t je jednako
sa t' definisana je preko mogunosti distribucije G na {T,F}, gde T oznaava Tano i F
oznaava Lano. Simboliki piemo:
G(t, t') = Poss ((A1= 'A1) and ... and (An= 'An)) = E(A1= 'A1) ... E(An= 'An)
= {g1/T, g2/F}
gde je 0 < g1 < 1, 0 < g2 < 1, E je preslikavanje iz (Di) (Di) u ({T,F}) i je
preslikavanje iz ({T,F}) ({T,F}}) u ({T,F}). Drugim reima, E i su dve
mogunosti distribucije na {T,F}. Vrednost E(A1,'A1) (T) i E(A1,'A1) (F) rauna se na
sledei nain:
E(Ai,'Ai) (T)= sup min (Ai(x),'A1(x)), x D i , i = 1,2...,n
E(Ai,'Ai) (F)= sup min (Ai(x),'A1(y)), x,y D i , xy, i = 1,2...,n
Primenjujui Zadeov princip proirenja na operaciju imamo:
g1=[E(A1,'A1)...E(An,'An)] ( T ) = sup m i n ( E(A1,'A1)(e1)...E(An,'An) (en)),
e1 e2 ... en T

g1= min (E(A1,'A1) (T) ... E(An,'An) (T)),


g2=[E(A1,'A1)...E(An,'An) ] ( F ) = sup m i n ( E(A1,'A1)(e1)...E(An,'An) (en)),
e1 e2 ... en F

Istinita vrednost g da je t = t' moe se dobiti na osnovu g1 i g2 na sledei nain:


g = (G(T) + 1 - G(F)) / 2 = (g1 + 1 - g 2 ) / 2

62
Primer 3.1. Neka je domen D = {a,b,c,d} i neka su date dve mogunosti distribucije
1= {1/a, 0.2/b} i 2= {1/c, 0.3/d}.
Prema prethodnoj definiciji mogunost da 1 = 2 je T jednako je :
E(1,2) (T)= sup min (1(x),2(x))=max(min(1,0), min(0.2,0), min(0,1), min(0,0.3)) = 0
xD i

i mogunost da 1 = 2 je lazno (F) jednako je :


E(1,2)(F)= sup min (1(x),2(y))=max(min(1,1), min(1,0.3), min(0.2,1),min(0.2,0.3))= 1
xy

Sledi da je nemogue da 1 i 2 budu jednaki.


Sada emo predstaviti podatke u fazi modelu sa prirenom mogunou.
Definicija 3.16. Neka je ci relacija bliskosti na domenu Di i neka je i odgovarajui prag
za ci 0 < i < 1. Neka je E preslikavanje iz (Di) (Di) u ({T,F}) i neka su t i t' dve
proizvoljne n - torke relacije R (D1) ... (Dn) sa t= (A1, A2,...., An) i
t' = ('A1, 'A2,...., 'An). Mogunost distribucije za t = t' oznaena sa Gc(t,t') je preslikavanje
iz R R u ({T,F}):
Gc(t,t') ={ g1c/ T , g2c/ F }
gde je:
g1c=[Ec(A1,'A1)...Ec(An,'An)( T ) = sup m i n ( Ec(A1,'A1)(e1)..Ec(An,'An)
e1 e2 ... en T

(en)= min(Ec(A1,'A1)(T),..., Ec(Ai,'Ai)(T))


i
g2c=[Ec(A1,'A1)...Ec(An,'An)] ( F ) = sup m i n ( Ec(A1,'A1)(e1)...Ec(An,'An)
e1 e2 ... en F

(en)= min(Ec(A1,'A1) (F),..., Ec(An,'An)(F))


i gde je: Ec(A1,'A1) (T)= sup min (Ai(x),'A1(y)), x,y D i , ci(x,y) i, i = 1,2...,n
Ec(A1,'A1) (F)= sup min (Ai(x),'A1(y)), x,y D i , ci(x,y)< i, i = 1,2...,n
Primer 3.2. Neka su D, 1 i 2 dati kao u prethodnom primeru i neka je ci na D dato u
sledeoj tabeli:
ci a b c d
a 1.0 0.2 0.9 0.1
b 1.0 0.2 0.95
c 1.0 0.1
d 1.0
Tabela 12. Relacija bliskosti za domen D

Mogunost distribucije da je 1 = 2 sa Ec je za i =0.9.


E(1,2) (T)= sup min (1(x),2(y))=max(min(1,1), min(0.2,0.3)) = 1
ci(x, y) i

E(1,2) (F)= sup min (1(x),2(y))=max(min(1,0.3), min(0.2,1)) = 0.3


ci(x, y) i

63
3.3. Fazi objektno-orijentisane baze podataka

Klasine relacione baze podataka i njihovo proirenje u vidu fazi modela ne


zadovoljavaju u potpunosti potrebu za modelovanjem kompleksnih objekata sa
nepreciznim i neodreenim informacijama. Objektno-orijentisani modeli baza podataka
mogu da predstavljaju sloene strukture objekata bez fragmentacije agragiranih podataka i
da se pri tome modeluju odnosi izmeu atributa. Trenutni napori u ovoj oblasti istraivanja
su koncentrisani na nadogradnju postojeih modela kako bi se dolo do mogunosti da se
upravlja komleksinim objektima i fazi informacijama istovremeno. Zbog toga u nastavku
dajemo pregled fazi objektno-orijentisanih modela baza podataka.
U sluaju fazi objektno-orijenitsanih baza podataka (FOODBs), fazi koncept moe
da se posmatra na nivou objekta ili na nivou klase i njihovih veza. Postoji vei broj radova
i modela u kojima je analizirana upotreba fuziness-a u objektno-orijentisanim bazama
podataka. U ovom radu dajemo pregled najvanijih.
Umano, Imada i ostali [92] predstavljaju fazi objektno-orijentisani model u kojem
atributi uzimaju fazi vrednosti sa odreenim faktorom odnosno stepenom pripadnosti, dok
se za manipulaciju podacima koristi SQL jezik. Sa druge strane, Gysegham i Caluwe [93]
uvode neodreenost i rasplinutost u objektno-orijentisane baze podataka preko fazi
skupova. Ponaanje i struktura objekata su nepotpuno definisani rezultati sa stanovita
njihovog instaciranja. Delimino nasleivanje, uslovno nasleivanje, kao i viestruko
nasleivanje su dozvoljeni u fazi hijerarhiji.
Grupa autora Bordogna, Pasi i Lucarella [94,95] predlae fazi objektno-orijenitsani
model zasnovan na grafovima. Pojam snage izraen pomou jezikih kvalifikatora se
koristi za iskazivanje odnosa izmeu instanci, kao i odnosa izmeu objekata i klasa. Fazi
klase i fazi hijerarhija su takoe modelovani u ovom radu. Pored toga, ovi autori
analiziraju i pretragu i selekciju podataka u predloenom modelu definiui operacije nad
podacima u fazi objektno-orijentisanim modelima, a koji mogu biti i crisp i fazi.
U modelu koji predlau Dubois, Prade i Rossazza [97] koristi se relacije slinosti.
Opseg vrednosti za svaki atrubut posmatrane klase reprezentuje skup dozvoljenih
vrednosti, a izmeu posmatranih vrednosti definie se stepen slinosti. U zavisnosti od
ukljuivanja stvarnih vrednosti atributa datog objekta iz raspona vrednosti za datu klasu
moe da se izrauna i stepen pripadnosti objekta klasi. Shodno tome, definiu se jaka i
slaba hijararhija klasa na osnovu monotono opadajue ili rastue funkcije pripadnosti
podklasa superklasi.
George, Srikanth, Petry i Buckles [98] proiruju prethodni model uvodei teoriju
verovatnoe. Neodreenost i neizvesnost su zastupljene u klasnoj hijerarhiji. Stepen
ukljuivanja objekata u nadtip ili superklasu zavisi od fazi vrednosti atributa i stepena
verovatnoe odnosno pripadnosti generikom tipu. Na taj nain se vri apstrakcija u kojoj
se skup slinih tipova objekata tretira kao generiki tip objekta (nadtip, superklasa).
"Slini" tipovi objekata su oni tipovi koji imaju neke zajednike atribute, veze i/ili
operacije. Specijalizacija je inverzni postupak u kome se za neki tip objekta, definiu
njegovi podtipovi, koji imaju neke njima specifine atribute, veze i/ili operacije. Na
primer, skup tipova Radnik, Student, Penzioner, Dete moe se predstaviti generikim
tipom Gradjanin, a za svaku od klasa se definie stepen pripadnosti vioj klasi. Isto tako se
tip Radnik, moe specijalizovati u podtipove Voza, Inenjer, Lekar i druge sa odreenim
stepenom verovatnoe. Ova ideja prisutna je i u naunim radovima Zong M. Ma, iji se
doprinos u ovoj oblasti smatra jako znaajnim. Na taj nain su sve velike ideje objektno-
orijentisanih modela kao to su objekti, klase, veze objekti-klase, podklase, superklase,

64
nasleivanje itd. inkorporirane u fazi informaciono okruenje. Pravila i operacije koje vae
u objektno-orijentisanim bazama podataka prisutna su i u generikim modelima FOODB.
U fazi generalizacionoj hijerarhiji objekata, takoe, vai pravilo nasleivanja osobina i
pravilo nasleivanja kao i operacija, kao to su:
- Podtipovi nasledjuju sve atribute i veze svoga nadtipa.
- Podtipovi nasledjuju sve operacije svoga nadtipa.
Poslednjih godina uinjeni su neki napori na uspostavljanju jedinstvenog okvira za
fazi objektno-orijentisane baze podataka koji su zasnovani na standardu koji predlae
posebno formirana grupa za upravljanje objektnim podacima (Object Data Managment
Group ODMG). U tom smislu predstavljen je koncept Nivo 2 fazi skupova koji se
bavi jedinstvenom i najpovoljnijom zastupljenou crisp i fazi informacija prilikom
predstavljanja realnog sveta i podataka. Cilj ove grupacije je da ilustruje i diskutuje kako
podaci iz realnog sveta mogu biti generalizovani kako bi se sa njima upravljalo na
najpovoljniji nain.

3.4. Fazi sistemi za upravljanje relacionim bazama podataka

Sistemi za upravljanje bazama podataka (DBMS) kao to su SQL Server i Oracle


koriste se za implementiranje klasinih relacionih baza podataka. Meutim, ovi sistemi
trenutno ne podravaju i mehanizme za rad sa fazi relacionim bazama podataka. Naravno,
to ne znai da ne postoje razliiti teorijski modeli i koncepti koji analiziraju proirenje
postojeih sistema za upravljanje bazama podataka, a koje bi trebalo da omogue
implementaciju fazi relacionih baza podataka. U literaturi se mogu nai razliiti teorijski
pristupi. Naalost, posledice ovih radova na praktinom planu su zanemarljive. Fazi
sistemi za upravljanje relacionim bazama podataka (FRDBMS) proiruju mogunosti
klasinih RDBMS kako bi se omoguilo upravljanje fazi informacijama. Sutinska ideja u
ovim radovima je proirenje SQL upitnog jezika i dodavanje dodatnog sloja/layer-a na
postojei RDBMS. Medina, Pons i ostali [99] predlau teorijski model i predstavljaju ideje
koje za cilj imaju izgradnju sistema i operativnu implementaciju GEFRED modela.
Tanije, oni predlau FRDBMS arhitekturu zasnovanu na klijent/server pristupu i
modulima koji omoguavaju manipulaciju podacima (fazi i crisp): pristup podacima,
generisanje fleskiblinih upita, razvoj razliitih aplikacija i podrka odluivanju, replikaciju
podataka iz drugih baza. Ovaj model nazivaju Fazi SQL Server. Fazi SQL server
inkorporira elemente i algoritme koji omoguavaju parsiranje relacione eme i konverziju
fazi SQL upita u standardnu SQL sintaksu. Touzi i Hassine [100] proiruju prethodni
model, oslanjajui se vie na Oracle-ov sisem za upravljanje bazama podataka. Ovaj
FRDBMS nudi sve funkcionalnosti klasinog sistema za upravljanje podacima (RDBMS).
Cilj ovih radova je da se omogui korisniku jednostavno upravljanje i manipulacija sa fazi
informacijama.

3.5. Fazi funkcionalne zavisnosti

Vanu ulogu u logikom dizajnu baza podataka predstavlja integritet podataka. Meu
ovim, najinteresantnije su zavisnosti podataka. Jedna od najvanijih zavisnosti podataka
jeste funkcionalna zavisnost. One dovode u relaciju vrednosti jednoga skupa atributa sa
vrednostima drugoga skupa atributa. Ukoliko funkcionalne zavisnosti ukljuimo u fazi
model baze podataka [68,73], tada nju nije mogue direktno primeniti u tom model jer se
ona temelji na konceptu jednakosti. Poto ne postoji jasan nain potvrivanja kada su dve
neprecizne vrednosti jednake, tada definicija funkcionalnih zavisnosti mora da se proiri

65
odnosno generalizuje. Ta proirena/generalizovana verzija funkcionalnih zavisnosti naziva
se fazi funkcionalna zavisnost [2,6,14,47,50,51,68,74,80]. Postoji vie razliitih definicija
fazi funkcionalnih zavisnosti, koje su dobivene kao rezultat upotrebe fazi logike u
klasinoj funkcionalnoj zavisnosti i sve takve definicije fazi funkcionalnih zavisnosti
asocirane su sa datim okvirom u fazi bazama podataka. Zbog toga su jedino primenljive
unutar datoga okvira, iako postoje osnovne odnosno generalne osobine i karakteristike koje
su potrebne da fazi funkcionalne zavisnosti poseduju.
U klasinim relacionim bazama podataka, funkcionalne zavisnosti odreuju kada
vrednost neke n-torke jednoga skupa atributa X, jedinstveno odreuje njegove vrednosti u
drugom skupu atributa Y ili stroije reeno:
Definicija 3.17. Neka je R(A1,A2,..., An) relaciona ema na domenima D1,D2,...,Dn sa
Dom(Ai) = D i i n e k a s u X i Y podskupovi skupa atributa U = { A 1 , A2,..., An} tj.
X, Y U i neka je r relacija od R, r D1 ... Dn . Kaemo da relacija r zadovoljava
funkcionalnu zavisnost X Y, ako za svake dve n - torke t i t ' r , z a koje vredi
t(X) = t'(X) implicira da vredi i t(Y) = t'(Y).
U optem sluaju kada vrednosti atributa ne poprimaju samo atomske elemente
domena, ve i mogunosti distribucije, tada stepen X Y nije nuno potrebno da bude 1,
ve moe da bude u jedininom intervalu [0,1]. Tako da se prirodno nameu sledea
pitanja. Kako odrediti t(X) = t'(X) i t(Y) = t'(Y) kada su t(X), t'(X), t(Y) i t'(Y) sve
neprecizne vrednosti predstavljene kao mogunosti distribucije. Kao drugo, kako odrediti
stepen propozicije Ako je t(X) = t'(X) tada je t(Y) = t'(Y) kada su t(X) = t'(X) i t(Y) = t'(Y)
delimino istiniti sa stepenom pripadnosti iz intervala [0,1]. I na kraju, kako proceniti
stepen od X Y ako razliiti parovi n - torki daju razliite istinitne vrednosti za
propoziciju Ako ... tada.
Otuda proizilazi da su ova pitanja povezana sa problemima fazi bliskosti podataka,
fazi logike implikacije i fazi i (and) operatora. Sada definiimo fazi funkcionalne
zavisnosti na sledei nain.
Definicija 3.18. Neka je R(A1,A2,..., An) relaciona ema na domenima D1,D2,...,Dn sa
Dom(Ai) = D i i n e k a s u X i Y podskupovi skupa atributa U = { A 1 , A2,..., An} tj.
X, Y U i neka je r relacija od R, r (D1) ... (Dn), gde je (Di) = { | je
mogua distribucija od Ai na Di}, i=1,2,...,n. Kaemo da X fazi funkcionalno odreuje

Y sa stepenom , oznaeno kao X Y ako i samo ako za r R:
min I(t(X)=c t'(X), t(Y) = c t'(Y)) , t,t' r.
gde je [0,1] =C [0,1] [0,1] [0,1] mera bliskosti i I: [0,1] [0,1] [0,1] je fazi
operator implikacije.

Ova definicija daje generalnu formu fazi funkcionalnih zavisnosti, koja izraava
semantiku da bliske Y vrednosti odgovaraju bliskim X vrednostima (sa stepenom ). Ako
se uzme odgovarajua mera bliskosti za =c i odgovarajua fazi implikaciju za I, tada se
moe i odrediti odgovarajua forma za fazi funkcionalne zavisnosti. Na primer:
Truth(t(X)=c t'(X))= Gc(t(X)=c t'(X)) (T),
Truth(t(Y)=c t'(Y))= Gc(t(Y)=c t'(Y)) (T)

66
gde je:
(t(A), t'(A))= Ec(t(A), t'(A)) (T)=sup min (A(u),'A(v)), u,v D A, cA A, A X.
(t(B), t'(B))= Ec(t(B), t'(B)) (T)=sup min (B(w),'B(z)), w,z D B , cA A, B Y.
Ovde je t(X) =c t'(X) uzeto kao minimun svih bliskih vrednosti za sve atribute A u X,
dok je t(Y) =ct'(Y) uzeto kao minimun svih bliskih vrednosti za sve atribute B u Y. Ako
mogunost distribucije na odgovarajuim vrednostima atributa nije normalizovana, tada za
(t(A), t'(A)) i (t(B), t'(B)) :
1 t(A) i t' (A) su identicni

(t(A), t' (A)) sup min( A (u), A (v)), inace
Cu,v(uD,vA)
A A

1 t(B) i t' (B) su identicni



(t(B), t' (B)) sup min( B (w), B (z)), inace
Cw,z(wD, zB)
A A

3.5.1. Pravila izvoenja za fazi funkcionalne zavisnosti

U klasinom relacionom modelu, esto je potrebno, da na osnovu datog skupa


zavisnih podataka, odrediti i neke druge zavisnosti nad istom bazom podataka, a koje su
posledica ve datog skupa zavisnosti. Tako u klasinim relacionim bazama podataka,
postoje tri pravila izvoenja poznata kao Armstrongove aksiome, a koje se koriste da iz
datih funkcionalnih zavisnosti izvodimo nove funkcionalne zavisnosti. Sada dajemo ova
pravila izvoenja [56]. Neka su X, Y, Z i W proizvoljan skup atributa.
A1: Ako je Y X tada postoji funkcionalna zavisnost X Y.
A2: Ako vai funkcionalna zavisnost X Y tada vai i funkcionalna zavisnost
XZ YZ.
A3: Ako vae funkcionalne zavisnosti X Y i Y Z tada vai i funkcionalna
zavisnost X Z.
Iz osnovnih osobina funkcionalnih zavisnosti mogu se izvesti i sledee osobine:
A4: Ako vae funkcionalne zavisnosti X Z i X Y tada vai i funkcionalna
zavisnost X YZ.
A5: Ako vae funkcionalne zavisnosti X Y i WY Z tada vai i funkcionalna
zavisnost XW Z.
A6: Ako vai funkcionalna zavisnost X Y i ako je Z Y tada vai funkcionalna
zavisnost X Z.
Fazi funkcionalne zavisnosti izraavaju relacije izmeu skupa atributa. Ako je data

relaciona ema na skupu atributa U i fazi funkcionalna zavisnost X Y koja je

zadovoljena u R, tada X Y oznaava da je zadovoljena u svim relacijama od R. ak ta
vie, za dati skup F fazi funkcionalnih zavisnosti, koji je zadovoljen u F, ne garantuje nam
samo da su ove fazi funkcionalne zavisnosti u F zadovoljene u svim relacijama od R, ve
nam i garantuje da je i svaka fazi funkcionalna zavisnost logiki implicirana sa F

67

zadovoljena u svim relacijama od R. Tako, na primer, ako znamo da vredi X Y u R,

tada moemo oekivati da u R vredi i X Y za iz [0,1]. Takoe, ako vredi X Y
tada moemo oekivati da XZ funkcionalno odreuje YZ do stepena koji je najmanje

jednak , za sve relacije od R. Dalje, ako vredi X Y i Y Z u R tada moemo
oekivati da X funkcionalno odreuje Z sa odreenim stepenom iz [0.1]. Intuitivno
moemo pretpostaviti da je = min(,) iz sledeih razloga:
a) Ako X funkcionalno odreuje Y sa stepenom i Y funkcionalno odreuje Z sa
stepenom , tada moemo oekivati da i X funkcionalno odreuje Z sa istim
stepenom.
b) Ako X funkcionalno odreuje Y sa stepenom i Y funkcionalno odreuje Z sa
stepenom , tada oekujemo da X funkcionalno odreuje Z sa stepenom . Na
taj nain, prethodno date tri Armstrongove aksiome u klasinoj relacionoj teoriji,
proirene su sa tri pravila izvoenja za fazi funkcionalne zavisnosti:

A'1: Ako je Y X tada postoji fazi funkcionalna zavisnost X Y za .

A'2: Ako vai fazi funkcionalna zavisnost X Y tada vai i fazi funkcionalna

zavisnost XZ YZ.

A'3: Ako vae fazi funkcionalne zavisnosti X Y i Y Z tada vai i fazi

funkcionalna zavisnost X Z sa = min(,), gde je , , , [0,1].
Iz osnovnih osobina fazi funkcionalnih zavisnosti mogu se izvesti i sledee osobine:

A'4: Ako vae fazi funkcionalne zavisnosti X Y i X Z tada vai i fazi

funkcionalna zavisnost X YZ sa = min(,).

A'5: Ako vae fazi funkcionalne zavisnosti X Y i WY Z tada vai i fazi

funkcionalna zavisnost XW Z sa = min(,).

A'6: Ako vai fazi funkcionalna zavisnost X Y i ako je Z Y tada vai fazi

funkcionalna zavisnost X Z.

A'7: Ako vae fazi funkcionalne zavisnosti X Y tada vai X Y za .
Osnovni zahtev koji moraju ispunjavati pravila izvoenja jeste da su ona korektna. To je
osigurano sledeom teoremom:
Teorema 1. Neka je F skup fazi funkcionalnih zavisnosti na relacionoj emi R(U) i neka je
P skup fazi funkcionalnih zavisnosti koji su logiki implicirani iz F. Tada je aksiomatski
sistem koga ine aksiome A'1, A'2, A'3 korekatan.

A'1: Ako je Y X tada postoji fazi funkcionalna zavisnost X Y F+ za iz
[0,1] .

68

A'2: Ako vai fazi funkcionalna zavisnost X Y F+ tada vai i fazi funkcionalna

zavisnost XZ YZ F+.

A'3: Ako vae fazi funkcionalne zavisnosti X Y F+ i Y Z F+ tada vai

fazi funkcionalna zavisnost X Z F+ sa = min(,), gde je , , , [0,1].
Kao posledica ovih pravila izvoenja, vrede sledei rezultati (zapisani kao A'4, A'5, A'6, A'7,
A'8) :

A'4: Ako vae fazi funkcionalne zavisnosti X Y F+ i X Z F+ tada vai i

fazi funkcionalna zavisnost X YZ F+ sa = min(,).

A'5: Ako vae fazi funkcionalne zavisnosti X Y F+ i WY Z F+ tada vai

i fazi funkcionalna zavisnost XW Z F+ sa = min(,).

A'6: Ako vai fazi funkcionalna zavisnost X Y F+ i ako je Z Y tada vai fazi

funkcionalna zavisnost X Z F+ .

A'7: Ako vae fazi funkcionalne zavisnosti X Y F+ tada vai X Y F+ za
.

A'8: X Y1, Y2,..., Yk F+ ako i samo ako X Yi F+ za i=1,2. ...,k.
Aksiomatski sistem je skup pravila zakljuivanja {A'1, A'2 i A'3) koji se koristi za
izvoenje novih fazi funkcionalnih zavisnosti koje su logika posledica skupa fazi
funkcionalnih zavisnosti F, za neku relacionu emu R. Neka je F+ skup fazi funkcionalnih
zavisnosti, koji je logiki impliciran sa skupom F i neka je FA skup fazi funkcionalnih
zavisnosti izveden pomou aksiomatskog sistema iz skupa F. Tada postoje dve vane
injenice. Prva se odnosi kao soundness (adekvatnost) FA F+ aksiomatskoga sistema , a
druga se odnosi na completeness (potpunost) F+ FA aksimatskog sistema. Sledea
teorema pokazuje da je dati aksiomatski sistem sound i complete [11]*.
Teorema 2. Aksiomatski system koga ine A'1, A'2 i A'3 je sound i complete. Tako je
F+ = FA.

3.5.2. Fazi funkcionalne zavisnosti i pravila izvoenja u modelu Raju i Majumdar-a

Fazi relacioni model R a j u i Majumdara [53] doputa da komponente


n-torki uzimaju kako atomik tako i neatomik vrednosti. U zavisnosti od kompleksnosti
domena, oni fazi relaciju dele na dve kategorije. U prvom tipu fazi relacije, domen moe
biti samo fazi skup ili klasini skup. U drugom tipu fazi relacije, omoguava se da svaki
domen atributa moe biti klasian skup, fazi skup ili skup fazi podskupova (ili mogunost
distribucije). Svaka fazi relacija u ovom modelu reprezentovana je tabelom koja ima
dodatnu kolonu, koja odreuje vrednost pripadnosti date n - torke odgovarajuoj relaciji.
Tako oni definiu fazi relacioni model na sledei nain:
Definicija 3.19. Neka je R(A1,...,An, r) fazi relaciona ema. Fazi relacija r na R je fazi
skup ili skup fazi podskupova na domenu dom(A1) ... dom(An) koji je odreen sa
funkcijom pripadnosti: r (ti): dom(A1) ... dom(An) [0,1].

69
Prvi tip fazi relacije izraava se kao:
r (t ) / t
ti r
i i

r (d
ti r
i1 ,..., d in ) /( d i1 ,..., d in )

gde je: dij= (aij)/ aij i (di1,,din) = min ( (ai1), ..., (ain)), aij dom(Aj) i j=1,2,...,n.
U drugom tipu fazi relacije svaka komponenta dij od ti data je kao:
dij= { (aij1)/aij1, ..., (aijk)/ aijk}
gde je aijl dom(Aj), l=1,2,...,k i (aijl) stepen pripadnosti od aijl.
Tako pripadna vrednost r (ti) mora zadovoljavati sledeu jednakost:
r (ti) = min ( (di1), , ( (din))
gde je (dij) = max ( (aij1), , (aijk)) za svako aijl dij i l=1,2,,k
R a j u i M a j u m d a r definiu fazi funkcionalne zavisnosti na sledei nain:
Definicija 3.20. Fazi funkcionalna zavisnost X Y , X,Y R, vredi u fazi relaciji r n a
R , ako za sve n -torke t 1 i t2 iz r ( r (ti) > 0 , i = 1,2), vredi:
EQ(t1[X], t2[X]) EQ(t1[Y], t2[Y])
gde je Equal(EQ) fazi relacija bliskosti na univerzalnom skupu U i definisana je kao fazi
podskup na U U i gde je EQ funkcija pripadnosti koja zadovoljava sledee uslove: Za
svako a,b U, EQ(a,a) = 1 (refleksivna) i EQ(a,b) =EQ(b,a) (simetrina).
Pravila zakljuivanja u modelu Raju i Majumdar.
RM
FF1: Refleksivnost: Ako je Y X tada postoji fazi funkcionalna zavisnost X Y
RM
FF2: Aditivnost: Ako vai fazi funkcionalna zavisnost X Y tada vai i fazi
RM
funkcionalna zavisnost XZ YZ.
RM RM
FF3: Tranzitivnost. Ako vae fazi funkcionalne zavisnosti X Y i Y Z tada
RM
vai i fazi funkcionalna zavisnost X Z.
Na osnovu ovih aksioma slede dodatna pravila:
RM RM
FF4: Unija: Ako vae fazi funkcionalne zavisnosti X Y i X Z tada vai i fazi
RM
funkcionalna zavisnost X YZ.
RM
FF5: Dekompozicija. Ako vai fazi funkcionaln zavisnost X YZ tada va i
RM RM
fazi funkcionaln zavisnost X Y i X Z.
RM RM
F F 6 : Pseudotranzitivnost. Ako vae fazi funkcionalne zavisnosti X Y i YW
RM
Z tada vai i fazi funkcionalna zavisnost XW Z.

70
3.5.3. Fazi funkcionalne zavisnosti i pravila izvoenja u modelu Shenoi-Melton

Njihova strategija za izraavanje nepreciznih informacija temelji se na ideji


sakupljanja istovrsnih elemenata konanog domena u blokove elemenata koji se ne
razlikuju sa odreenim nivoom preciznosti na tom domenu. Ova ideja je izraena u odnosu
na klase ekvivalencije na domenu particije. Particija domena Dk je skup nepraznih
disjunktnih podskupova ili klasa ekvivalencije od D k sa osobinom da svaki element iz Dk
je u tano jednoj klasi ekvivalencije. [8,65] Particionisanje domena na klase ekvivalencije
je klju za ouvanje nekoliko vanih osobina u klasinom modelu. Na osnovu toga oni
definiu redundansu na sledei nain:
Definicija 3.21. Neka su t i t' dve fazi n - torke. Komponente tk i t'k su k - redundantne
oznaeno sa tk k t'k , kada su tk i t'k podskupovi iste klase ekvivalencije za k - particije
temporalnog domena Dk.
Fazi relaciju definiu na sledei nain:
Definicija 3.22. Neka je R relaciona ema sa atributima (A1...,An) i pridruenim
particijama sa nivoima (1,..., n). Neka je r(R) 2D1 2D2 ... 2Dn. Tada je r fazi
relacija u odnosu na fazi relacionu emu R i temporalni domen D'1,...,D'm, ako je r skup
neredundantnih fazi n - torki sa respektom 1,..., n - nivom particija na D'1,...,D'm,
respektivno.
Izraavanje redundancije u klasinim funkcionalnim zavisnostima omoguilo je i
definisanje fazi funkcionalne zavisnosti u fazi relacionim bazama podataka. Poto je fazi
redundancija ograniena sa nivoom preciznosti, tada ovaj nivo preciznosti mora biti takoe
deo fazi funkcionalne zavisnosti. Tako, fazi funkcionalna zavisnost vredi kada god postoji
redundancija sa odreenim nivoom preciznosti na levoj strani atributa, tada postoji
redundancija na desnoj strani odgovarajuih atributa, sa odreenim nivoom preciznosti.
Tako imamo:
Definicija 3.23. Neka je R fazi relaciona ema sa atributima U i nivoom particije U. Neka
su X i Y skupovi atributa u U sa asociranim nivoima X = (p,..., q) i Y = (r,..., s)
u U. Neka je r fazi relacija sa temporalnim domenima D'p,...,D'q, i D'r...,D's, za skupove
atributa X i Y respektivno. Relacija r zadovoljava fazi funkcionalnu zavisnost iz X u Y sa
nivoima (X,Y) na datim particijama, kada za bilo koje n - torke t, t' r(R) vredi:
t x t' implicira t y t'
Na kraju oni dokazuju da ovako definisane fazi funkcionalne zavisnosti
zadovoljavaju Armstrong-ove aksiome.

3.5.4. Fazi funkcionalne zavisnosti i pravila izvoenja u modelu Saxena i Tyagi-a

U ovom fazi relacionom modelu fazi vrednostima atributa doputa se mogunost da


atribut nije primenljiv za dati objekat. Da bi bili u mogunosti da rade sa neodreenim
vrednostima podataka, oni definiu fazi relaciju na sledei nain.
Neka je 2 Ai , i = 1,2,...,n skup fazi podskupova na domenu dom Ai {e}, gde je e
ekstra element koji doputa mogunost da fazi vrednost atributa nije primenjena za dati
objekat, takav da za svaki skup a 2 Ai , funkcija pripadnosti od a zadovoljava uslov
a (e) = 0 ili a (e) = 1 skupa sa a (u) = 0 za svako u. Tada je fazi relacija r na
R = (A1...,An) definisana kao fazi podskup od Dekartovog proizvoda 2A1 2A2 ... 2An
=2 R , okarakterisana sa funkcijom pripadnosti:

71
r: 2 R [0,1].
Svaka n - torka t = (a1,...,an) gde je a 2 Ai , i = 1,2,...,n u r moe se posmatrati kao
mogunost distribucije za D = (dom A1 {e}) ... (dom An {e}) kao:
Poss(t[A1] = u1, ..., t[An] = un ) = min {r(t), a1 (u1),..., an (un)},
gde je ui Ai, {e}, i = 1...n. [61]
U ovome fazi relacionom modelu slinost izmeu elemenata datoga domena definie
se na sledei nain.
EQ(a1,a2) = min (a1 (u), a2 (u))
udomAi

Ovde je fazi relacija EQ na 2A - {}, gde je sa oznaeno da za atribut A, fazi skup


a 2A je takav da je a (e) = 1 i a (u) = 0 za ue, je definisana kao fazi podskup
(2A-{})(2 A -{}) tako da je njena funkcija pripadnosti definisana kao
EQ(2A - {})(2 A -{})[0,1] i koja zadovoljava EQ(a,a)=1 (refleksivna),
a 2 A -{} i EQ (a1,a 2 )=EQ (a2,a 1 ) (simetrina), a1, a2 2 A - {}. je fazi relacija
slinosti.
Na osnovu prethodnih razmatranja oni definiu fazi funkcionalne zavisnosti.
Definicija 3.24. Fazi funkcionalna zavisnost X Y , X,Y R, vredi u fazi relaciji r
na R, ako za bilo koje n-torke t1 i t2 iz r r(ti)> 0 , i = 1,2 vredi EQ(t1[X],t2[X])> 0,
t1[Y]= t2[Y] = ili postoji neprazan skup Y' Y takav da je t1[A]= = t2[A] za svako
AY', t1[Y- Y'] = t2[Y-Y'] = i EQ(t1[X], t2[X]) EQ(t1[Y'], t2[Y']).
Uvodei pravila izvoenja, data nie, oni dokazuju da su ta pravila sound i complete.
FF1': Refleksivnost: Ako je Y X tada postoji fazi funkcionalna zavisnost X Y,
FF2': Aditivnost: Ako vai fazi funkcionalna zavisnost X Y i V W tada vai i
fazi funkcionalna zavisnost XW YV.
FF3': Unija: Ako vae fazi funkcionalne zavisnosti X Y i X Z tada vai i fazi
funkcionalna zavisnost X YZ.
FF4': Dekompozicija: Ako vai fazi funkcionaln zavisnost X YZ tada va i fazi
funkcionaln zavisnost X Y i X Z.

3.5.5. Fazi funkcionalne zavisnosti i pravila izvoenja u modelu Dubois-Prade

D u b o i s i P r a d e [82,83] fazi funkcionalne zavisnosti uvode na sledei nain.


Ako su vrednosti atributa A za n - torke t i t' jednake tada i vrednosti atributa B za t i t'
ne smeju biti daleko jedna od druge. Ovu ideju oni modeliraju sa ispoljavanjem fazi
relacije bliskosti P (koja je refleksivna d, p(d,d) = 1 i simetrina d,d'
p(d,d') = p(d',d)), a koja je definisana na oblasti znaenja atributa B.
Ako je t(A) = t'(A) tada je B (t(B),t'(B)) >
gde predstavlja zadati prag.
Smatrajui da je t(B) i t'(B) odreeno u terminu funkcije raspodele mogunosti, imamo:
Ako je t(A) = t'(A) tada je (t(B) p t'(B)) >

72
Ova mogunost data je sa:
(t(B) p t'(B)) = sup min (P(v,w), t(B)(v), t' (B)(v))
v , wDB DB

gde je B funkcija raspodele mogunosti koja ograniava mogue znaenje atributa B za n


-torku t, a P funkcija pripadnosti fazi relacije bliskosti P.

3.5.6. Fazi funkcionalne zavisnosti i pravila izvoenja u modelu Wei-Yi Liu

U ovome radu najpre se definie koncept semantike distance izmeu dve fazi
vrednosti atributa, dok su fazi funkcionalne zavisnosti predstavljene sa fazi semantikom
distancom. Na osnovu semantike blizine daje se definicija fazi funkcionalnih zavisnosti
[7,11,47].
Stepen bliskosti izmeu dve fazi vrednosti je opisan pomou semantike blizine.
Semantika blizina zasnovana je na konceptu intervala i oznaavamo je sa SD(f1,f2), pri
emu je 0 SD(f1,f2) 1. Sledee karakteristike trebalo bi da budu zadovoljene:
Neka su f1=[a1,b1], f2=[a2,b2], g1=[c1,d1], g2=[c2,d2]. Tada vai:
1. SD(f1,f2)=1 ako i samo ako je a1 = a2 = b1 = b2,
2. SD(f1,f2)=0 ako i samo ako f1 f2 = ,
3. Ako je a1 = a2, b1 = b2, c1 = c2, d1 = d2 i |d1- c1| > |b1- a1| onda je i
SD(f1,f2) SD(g1,g2),
4. Ako je |2- b2| = |a1- b1| i f1 g1 f2 g1 onda je i SD(f1,g1) SD(f2,g1).
Semantiku distancu (blizinu) raunamo po sledeoj formuli:
SD(f1,f2)=||f1 f2||/||f1 f2|| - ||f1 f2||/
gde je ||h|| modularno sa odgovarajuim intervalom:
0, h0
h [a, a]

|| h ||
| b - a | h [ a, b]
h
je koeficijent takav da je ||f1 f2||, a veoma mali broj. Npr. =/10.000 se obino
uzima u konkretnim primerima.
Ako su t1= (x11, x12, ..., x1n) i t2= (x21, x22, ..., x2n) dve n-torke u relaciji, onda se
semantika blizina izmeu njih oznaava kao SD(t1,t2) i rauna kao
SD(t1,t2)=min{SD(x1i,x2i)}.
Semantika distanca SD(f1,f2) od dve fazi vrednosti f1(X) i f2(X) definisana je
pomou neke norme f1(X) - f2(X). Npr. SD(f1,f2) = max f1(X) - f2(X), xdom(A i ).
Komplement od SD(f1, f2) u oznaci SS(f1, f2) definisan je kao SS(f1, f2) = 1 - SD(f1, f2).
Semantika distanca fazi vrednosti opisanih na drugi nain se moe definisati na slian
nain.
Prethodno navedene karakteristike prikazane su i na sledeim primerima:
1. Pretpostavimo da je f1=[10,10] i f2=[10,10], =300 onda je
SD(f1,f2)= / - / = 1.

73
2. Ako je f1=[2,5] i f2=[6,7] onda je semantika distanca SD(f1,f2)= 0/5 - 0/ = 0.
3. Za f1=[2,5], f2=[2,5], g1=[2,8] i g2=[2,8] vai SD(f1,f2)= 3/3 - 3/300 = 0.99 i
SD(g1,g2)= 6/6 - 6/300 = 0.98. Vidimo da je SD(f1,f2) SD(g1,g2).
4. Za f1=[3,5], f2=[2,4] i g1=[3,6] je SD(f1,g1)= 2/3 - 2/300 = 0.66 i
SD(f2,g1)= 1/4 - 1/300 = 0.25. Imamo da je SD(f1,g1) SD(f2,g1).
Definicija fazi funkcionalne zavisnosti:
Definicija 3.25. Neka je r fazi relacija na relacionoj emi R(A1,...,An) i neka je U
univerzalan skup atributa A1,...,An i neka s u X i Y podskupovi od U. Kaemo da fazi
relacija r zadovoljava fazi funkcionalnu zavisnost X Y, X,Y R ako za svaki par
n - torki t1 i t2 u r vredi:
SS(t1[X], t2[X]) SS(t1[Y], t2[Y])
Pravila izvoenja za fazi funkcionalne zavisnosti u modelu W e i - Y i L i u :
L1: Ako je Y X tada postoji fazi funkcionalna zavisnost X Y.
L2: Ako vai fazi funkcionalna zavisnost X Y tada vai i fazi funkcionalna
zavisnost XZ YZ.
L3: Ako vae fazi funkcionalne zavisnosti X Y i Y Z tada vai i fazi
funkcionalna zavisnost X Z
Teorema 3. Pravila izvoenja {L1, L2, L3} su sound i complete.

3.5.7. Fazi funkcionalne zavisnosti i pravila izvoenja u modelu Sozati i Yazici

Jedna od najtemeljnijih definicija fazi funkcionalnih zavisnosti data je u radu [44]. U


analizi fazi funkcionalnih zavisnosti se polazi od sledeeg razmatranja.
Ako je t[X] slian sa t'[X], tada je i t[Y] slino sa t'[Y], Pri tome slinost izmeu Y
vrednosti je vea ili jednaka slinosti izmeu X vrednosti. Takva zavisnost oznaava sa
X Y. Kao primer takve zavisnosti navodimo: ''Slubenici sa slinim iskustvima moraju
F
imati sline plate''. U ovom sluaju vrednosti atributa Iskustvo i Plata mogu biti
neprecizne, dok je sama definicija zavisnoti precizno definisana. Meutim, ova definicija
fazi funkcionalne zavisnosti, nije u potpunosti odreena, u smislu da i zavisnost sama po
sebi moe biti neprecizna. Kao primer takve fazi funkcionalne zavisnosti je "Nivo
inteligencije osobe vie ili manje odreuje njen uspjeh" gde vie ili manje u reenici
odreuje nepreciznu zavisnost. Ako se zna da je osoba inteligentna, tada se moe zakljuiti
da e ona biti uspena. Meutim, ovaj nivo uspeha nije sasvim jasno ni precizno odreen
sa inteligencijom. Osoba moe biti vrlo uspena, manje uspena itd. Tako ova zavisnost ne
odreuje precizan nivo uspeha, ali ipak osigurava minimalan nivo uspeha. Pretpostavimo
da postoje dve osobe sa identinim inteligencijama i pretpostavimo da je prva osoba vrlo
uspena. Odavde se ne moe zakljuiti da je i druga osoba vrlo uspena, ali se moe rei da
nivo uspeha druge osobe e biti vie ili manje slian nivou uspeha prve osobe. Jedan nain
da se definie ovakva zavisnost jeste da se prihvati lingvistika jaina zavisnosti kao prag.
Na primer zavisnost "Slubenici sa slinim iskustvima moraju imati sline plate" ima
lingvistiku jainu 1, dok zavisnost "Nivo inteligencije vie ili manje odreuje uspeh " ima
lingvistiku jainu 0.7. Tako vrednost praga odreuje jainu zavisnosti i ona je zapisana u

formi X Y, gde je jaina zavisnosti.
F

74
Koncept slinosti je veoma vaan u fazi relacionim bazama podataka jer nam
omoguava da se proiri koncept identiteta u jasan model za rukovanje nepreciznim i
neodreenim informacijama. U Crisp modelima baza podataka, dve n-torke su identine
na posmatranom atributu ako i samo ako su im vrednosti tog atributa identine. U Fazi
modelima baza podataka, slinost vrednosti atributa se posmatra u odnosu na to koliko su
te vrednosti usaglaene na posmatranom atributu. U ovom fazi modelu, slinost izmeu
vrednosti atributa, definie se kao saglasnost (conformant) dveju n-torki na atributu. Ovo je
vrlo vaan apsekt predloen od strane Bosc-a i ostalih koji slui za poreenje vrednosti
nepreciznih, fazi atributa koritenjem koncepta usalglaenosti. Relacija usaglaenosti je
simetrina, refleksivna i tranzitivna.
Definicija 3.26. Saglasnost atributa Ak definisana na domenu Dk za bilo koje n-torke ti i tj
prezentovane u relaciji r i oznaene k a o C(Ak[ti,tj]) data je sa:

max{s( x, y)},
C (A k [t i , t j ]) = min min
max{s( x, y)}, min
xd i yd j xd j yd i
gde je di vrednost atributa Ak za n - torku ti, dj je vrednost atributa Ak za n - torku tj, s(x,y)
je relacija slinosti za vrednosti x i y, i s je preslikavanje svakog para elemenata iz domena
Dk u interval [0,1],
Ako je C(Ak[ti,tj]) > , za relaciju r, za n - torke ti i tj kaemo da su saglasne na
atributu A sa jainom zavisnosti . Ova definicija proirena je na opisivanje bliskosti za
dve n - torke na skupu atributa. Posmatrajmo sledei primer:
Usaglaenost na atributu CENA za n-torke t2 i t5 moe da se prikae kao:
C(CENA[t2,t5]) = min{min{max{s(S,S)}, max{s(P,S)}},
min{max{s(S,S), s(S,P}}}
= min{min{max{1}, max{0.8}},
min{max{1,0.8}}}
= min {min{1,0.8}, min{1}
= min {0.8, 1} = 0.8
Treba napomenuti da je mogua vrednost atributa CENA skromna (S) i prihvatljiva
(P) i da je slinost izmeu njih 0.8. Primetimo da je usaglaenost izmeu
{Skromna,Prihvatljiva} i {Skromna} 0.8, dok je u sluaju {Skromna,Prihvatljiva} i
{Skromna,Prihvatljiva} 1.
Relacioni model uporeuje dve n-torke na skupu atributa uporeujui vrednosti
atributa. Definicija usaglaenosti se proiruje kako bi se opisala bliskost izmeu dve n-
torke na skupu atributa.
Definicija 3.27. Saglasnost na skupu atributa X za bilo koje dve n - torke ti i tj date u
relaciji r i oznaena sa C(X[ti,tj]) data je je kao:
C(X[ti,tj]) = min {C(Ak[ti,tj])}
Ak X

Saglasnost atributa je veoma vana osobina koja se koristi u dokazivanju i izvoenju


pravila. Sada emo navesti osobine saglasnosti u vidu propozicija, a one e se koristiti u
dokazivanju teorema.
Propozcija 1. Ako je X Y, tada je C (Y[ti,tj]) C (X[ti,tj]).
Dokaz. Pretpostavimo da je Y = {A1, , An} , n 0 i X = {A1, , An, An+1, ..., Am}, m n.
Tada je:

75
C(Y[ti,tj]) = min {C(A1[ti,tj]), , C(An[ti,tj])}
C(X-Y[ti,tj]) = min {C(An+1[ti,tj]), , C(Am[ti,tj])} i
C(X[ti,tj]) = min {C(A1[ti,tj]), , C(Am[ti,tj])}
U tom sluaju moemo da piemo da je:
C(X[ti,tj]) = min {C(Y[ti,tj]),C(X-Y[ti,tj])}
Odakle proizilazi da je:
C (Y[ti,tj]) C (X[ti,tj]).
Analogno prethodnom, lako se dokazuju i sledee propozicije:
Propozicija 2. Ako je X(A1,...,An) i C(Ak[ti,tj]) za svako k, k=1,2,,n tada je
C(X[ti,tj]) za bilo koje dve n-torke ti i tj u r.
Propozicija 3. Ako je C(X[ti,tj]) i C(X[tj,tk]) tada je i C(X[ti,tk]) za svako
ti, tj, tk u r.
Definicija fazi funkcionalnih zavisnosti:
Definicija 3.28. Neka je r fazi relacija na relacionoj emi R(A1,...,An) i neka je U
univerzalan skup atributa A1,...,An i neka su X i Y podskupovi od U. Kaemo da fazi

relacija r zadovoljava fazi funkcionalnu zavisnost X Y, ako za svaki par ntorki
F
ti i t j u r vredi:
C (Y[ti,tj]) min (, C(X[ti,tj]))
gde je je realan broj iz [0,1] i opisuje lingvistiku jainu zavisnosti.
Fazi funkcionalne zavisnosti su generalizacija funkcionalnih zavisnosti. Tu injenicu
bi trebalo i matematiki dokazati. Da bismo dokazali konzistentnost, u definicijiciji FFD
primeniemo originalne uslove relacione teorije funkcionalnih zavisnosti.
Teorama 4. Fazi funkcionalne zavisnosti su konzistentne.
Dokaz. Relaciona teorija definie da u sluaju postojanja funkcionalnih zavisnosti =1.
Sluaj =0 je takoe validan, ali u tom sluaju funkcionalna zavisnost ne postoji. Ako
posmatramo sluaj =1 i primenimo to na definiciju fazi funkcionalnih zavisnosti, u tom
sluaju moemo da piemo da je:
C (Y[ti,tj]) C (X[ti,tj])
Ako koncept saglasnosti zamenimo sa konceptom identiteta (relaciju slinosti zamenimimo
sa relacijom identiteta), onda C (X[ti,tj]) moe imati vrednost 0 ili 1. Kada je C(X[ti,tj]) = 1,
tada je X[t1] = X[t2] jer su vrednosti atributa iste. Prema definiciji C (Y[ti,tj]) C (X[ti,tj]),
ako i samo ako je C (Y[ti,tj]) 1, to jeste Y[t1] = Y[t2].
Pravila zakljuivanja za fazi funkcionalne zavisnosti u modelu Sozati-a i Yazici-ja:
1 2
P1. Ako je X Y i 1 2 tada je i X Y Pravilo inkluzivnosti.
F F

P2. Ako je X Y, onda je X Y zadrana. Pravilo refleksivnosti.


F


P3. { X Y } XZ YZ Pravilo proirenja.
F F

76
1 2 min( 1 , 2 )
P4. {X Y, Y Z} X Z Pravilo tranzitivnosti.
F F F

Dodatna pravila izvoenja za fazi funkcionalne zavisnosti:


1 2 min( 1 , 2 )
P5. {X Y, X Z} X YZ Pravilo unije
F F F

1 2 min( 1 , 2 )
P6. {X Y, WY Z} WX Z Pravilo pseudotranzitivnosti
F F F


P7. Ako vredi X Y i Z Y tada vredi X Z. Pravilo dekompozicije.
F F

Vano svojstvo fazi funkcionalnih zavisnosti jeste da ova pravila izvoenja su sound. To
garantuje sledea teorema.
Teorema 5. Pravila izvoenja P1, P2, P3, P4 su sound.
Da bi se mogla formulisati i dokazati teorema potpunosti uvodi se pojam zatvaraa skupa
fazi funkcionalnih zavisnosti.
Definicija 3.29. Neka je F skup fazi funkcionalnih zavisnosti na skupu atributa U.
Zatvara od F, zapisano kao F+, je najmanji skup svih fazi funkcionalnih zavisnosti je koji
je zatvoren na primenu pravila u skupu {P1,P2,P3,P4}.
Definicija 3.30. Neka je F skup fazi funkcionalnih zavisnosti na skupu atributa U. Limit

jaine zavisnosti od X Y je definisan kao realan broj l u [0,1] takav da je:
F

i '
X Y u F+ i za svaki l > ' je X Y je u F+.
F F

Zatvara skupa atributa


Definicija 3.31.. Neka je F skup fazi funkcionalnih zavisnosti na skupu atributa U i neka
je X podskup od U. Tada X+() , zatvara od X, je skup atributa A tako da je:

X Y iz F+.
F

Sada na osnovu ovih razmatranja sledi teorema [44].


Teorema 6. Pravila izvoenja P1, P2, P3, P4 su sound i complete.

3.5.8. Primena saglasnosti (conformance) u analizi fazi funkcionalnih zavisnosti

Za odreivanje istinite vrednosti atributa koristi se definicija saglasnosti


(conformance) [44], koja e posluiti da se odredi kada je istinita vrednost atributa
zadovoljiva.
Neka je r podrelacija na relacionoj emi R, sa tano dve n-torke t1 i t2. Podrelacija r se
moe upotrebiti za definisanje istinitih vrednosti dodeljenih atributima u relacionoj emi R,
kada se oni uzimaju kao varijable. Sada dajemo definiciju za istinitu vrednost atributa.
Definicija 3.32. Neka je R(A1,...,An) relaciona ema i neka je r(R)={t1,t2} dvoelementna
poderlacija. Relaciji r pridruena valuacija je preslikavanje ir:R [0,1] za koje vredi:


0.5 ako je C(A k [ t i , t j ])
ir (A k )
0.5
ako je C(A k [ t i , t j ])

77
gde je [0,1] lingvistika jaina zavisnosti.
Sledei primer pokazuje istinitu vrednost atributa nad datom relacijom, gde se ova
istinita vrednost odreuje na osnovu bliskosti za dve n-torke nad odgovarajuim atributom.
Neka je Student(Ime_Prezime, Inteligencija, Predmet, Godine, Uspeh) relaciona ema i
neka je dvoelementna podrelacija r data tabelom 22. Ovde su domeni atributa Ime_Prezime
i Predmet klasini skupovi, dok su domeni atributa Inteligencija, Godine i Uspeh fazi
podskupovi.
Milan {Nadaren, Bistar} Matematika {Vrlo mlad} {veoma}
Marko {Nadaren} Informatika {Star} {Vie manje uspean}
Tabela 22. Podrelacija r
gde domen atributa Inteligencija moe biti dat sa:
Dom(Inteligencija)={Nadaren, Bistar, Prosjena, Iznad prosjeka}
Tabela 23. ilustruje relaciju slinosti na domenu Inteligencija:
Slinost Nadaren Bistar Prosean Iznad proseka
Nadaren 1 0.7 0.7 0.3
Bistar 0.7 1 0.8 0.3
Prosean 0.7 0.8 1 0.3
Iznad proseka 0.3 0.3 0.3 1
Tabela 23. Relacija slinosti na dom(Inteligencija)
Na slian nain moe se dati i relacija slinosti za ostale atribute. Sada izraunajmo stepen
saglasnosti na atributu inteligencija:
C(Inteligencija[t1,t2]) = min{min{max{s(Nadaren,Nadaren)}, max{s(Bistar,Nadaren)}},
min{max{s(Nadaren,Nadaren), s(Nadaren,Bistar)}}}
= min{min{max{1}, max{0.7}},
min{max{1,0.7}}}
= min {min{1,0.7}, min{1}}
= min {0.7, 1} = 0.7
Odavde sledi da je stepen saglasnosti na atributu Inteligencija jednaka 0.7. Neka je
jaina zavisnosti =0.6. Otuda je i C(Inteligencija[t1,t2])>. Ili ako je Inteligencija prve
osobe data sa {Nadaren, Bistar}, a druge {Nadaren} tada je stepen bliskosti izmeu njih
jednak 0.7, odnosno istinita vrednost atributa Inteligencija nad datom relacijom vea je od
0.5.
Na slian nain neka je stepen saglasnosti na atributu Uspeh za dve n-torke t1 i t2, na
istoj relaciji vea ili jednaka od , gde je [0,1], tj. neka je C(Uspeh[t1,t2]) . Uzmimo
dalje da je stepen saglasnosti na atributu Godine za dve n-torke t1 i t2, na istoj relaciji,
manja od , tj. C(Godine[t1,t2])<.
Poto su vrednosti atributa Ime_Prezime i Predmet atomik, tada
C(Ime_Prezime[t1,t2]) i C(Predmet[t1,t2]) mogu biti samo 0 ili 1, pa je i tada u datoj relaciji,
C(Ime_Prezime[t1,t2])=0 i C(Predmet[t1,t2])=0. Dakle, u ovom primeru imamo da je:

78
1. C(Inteligencija[t1,t2]) i C(Uspeh[t1,t2])
2. C(Godine[t1,t2])<, C(Ime_Prezime[t1,t2]) < i C(Predmet[t1,t2]) < .
Sada je oigledno na osnovu definicije 3.1 istinita vrednost atributa Inteligencija i
Uspeh nad datom relacijom r:
ir (Inteligencija) > 0.5 i ir (Uspeh) > 0.5,
dok je istinita vrednost atributa Ime_Prezime, Predmet i Godine:
ir (Ime_Prezime) 0.5, ir(Predmet) 0.5 i ir(Godine) 0.5.
Dakle, na ovom primeru su date istinite vrednosti pojedinih atributa u datoj relaciji r.

3.5.9. Analiza podataka i primena funkcionalnih zavisnosti u modelu Cubero -


Medina

Teorija normalizacije koju je uveo Codd je sistematski pristup pravilnom


projektovanju baza podataka. Glavna ideja je da ako smo suoeni sa relacijama u bazi
podataka koje zadovoljavaju funkcionalnu zavisnost (ne ukljuujui primarni klju), onda
moe da postoji redundantnost i auriranje postojee baze. Kako bismo izbegli
redundantnost, mi moemo originalnu relaciju razloiti, tj. napraviti dekompoziciju, a da
pri tome ne doe do gubitka informacija. Inae, u realnim bazama podataka, nije
uobiajeno da su date striktno stroge zavisnosti u odnosima. Ipak, mi moemo da
pronaemo funkcionalne i fazi funkcionalne zavisnosti, kao to je Teina osobe zavisi
vie ili manje od njegove visine i uzrasta. U ovakvim situacijama predlae se proces
dekompozicije [37] i izdvajanja informacija, potujui datu zavisnost, i kompresiju
originalnih podataka u relacionoj bazi podataka. Ideja je primena teorije fazi skupova i
tolerisanje nekih nepreciznosti u bazi, koje nam omoguava da objedinimo vie n-torki u
jednu. Razmotrimo, na primer, odnos koji se pojavljuje u sledeoj relaciji. Poseban
operator pridruivanja se koristi za ponovno dobijenje originalnih podataka iz relacije R, tj.
recovering.
X Visina Teina
X1 180 86
X2 170 74
X3 170 73
Tabela 24. Originalna relacija R

X Visina Teina
X1 Visok oko 85 kg
X2 170 74 kg
X3 170 oko 73 kg
Tabela 25. Uvoenje fazi vrednostu u relacionu strukturu

X Visina
X1 180
X2 170
X3 170
Tabela 26. Relacija r1

79
Visina Teina
Visok Oko 85 kg
170 74 ili oko 73 kg
Tabela 27. Dekompozicija R - relacija r2
Dekompozicija relacije R je data sa relacijama (projekcijama) r1 i r2, kao to je
prikazano u prethodnim tabelama. Kao to se moe videti u ovom primeru, imamo
smanjenu redundansu jer su druga i trea n-torka spojeni u jednu u relaciji r2. Od
primarnog znaaja u ovakvim situacijama je da kvantifikujemo koliku nepreciznost
moemo tolerisati, da bismo garantovali da su fazi vrednosti kao to su Oko 85 kg
dovoljno blizu originalnom podatku 86 kg. Da bismo to uradili, mi moramo koristiti meru
slinosti izmeu elemenata podataka. Za nove podatke u bazi, mi moemo da testiramo
fazi zavisnost posmatranjem n-torki u relaciji r2. Na ovaj nain koliina podataka smetena
u baze r1 i r2 je manja nego u relacij R. Originalni podaci koji se pojavljuju u R mogu se
dobiti spajanjem relacija r1 i r2.
Vano je naglasiti da jezike varijable, kao to je Oko 85 kg , su definisane i date
od strane strunjaka iskusnih projektanata informacionih sistema. Dakle, trebalo bi da
budemo u stanju da otkrijemo neka znanja u vidu fazi pravila koja e nam omoguiti da
posle dekompozicije originalne relacije, smanjimo i uklonimo redundantnost. To nam,
svakako omoguava da dobijemo bolje razumevanje realnog sveta, jer su fazi zavisnosti
izolovane u poseban odnos.
Definicija fazi funkcionalni zavisnosti u modelu Cubero-Medina:
Definicija 3.33. Ako je Ri(Xi(t1), Xi(t2)) i i onda mora da vai Rj(Yj(t1), Yj(t2)) j
j. Kao specijalan sluaj imamo t1, t2 r vai da je Xi(t1)=Xi(t2) i, tada je Rj(Yj(t1),
Yj(t2)) j j, za sluaj postojanja fazi funkcicionalne zavisnosti.
U sluaju klasinih relacionih baza podataka, kada u relaciji R postoji zavisnost
izmeu X i Y, projekcija XY bira vrednost tako da su XY n-torke sa istim vrednostima X
(a samimi tim imaju iste i Y vrednosti). Cilj je da u novodobijenoj relaciji smanjimo
koliinu informacija. Sledei korak je da se spoje n-torke sa istim X vrednostima. Sada za
dve n-torke t i t' sa X(t) = X(t') moe biti Y(t) Y(t'), ali da bismo zadovoljili postojeu
zavisnost moramo osigurati Y(t) Y(t'). To nam zapravo garantuje da neemo dobiti
previe rasplinute informacije (na primer ''izmeu 130 i 210''), ime emo ouvati
postojeu fazi funkcionalnu zavisnost i u projekciji XY. Osim toga, zavisnost moe da se
testira i za nove n-torke koje se dodaju u novu relaciju, preko ve projektovanih odnosa
koje smo koristili i za originalnu relaciju. Posmatrajmo sledei primer:
Z Visina Teina
Z1 185 86
Z2 185 90
Z3 192 99
Z4 194 95
Z5 160 65
Z6 176 79
Z7 160 65
Z8 160 66
Tabela 28. Relacija R

80
Ova relacija ne zadovoljava klasinu funkcionalnu zavisnost Visina Teina. Ako je
RT(86,90) i RT(65,66) , kaemo da postoji fazi funkcionalna zavisnost
(1, )
Visina Teina.
Visina Teina
185 oko 86
192 99
194 95
160 65
176 79
160 oko 65
Tabela 29. Projkecija VT
U prethodnom primeru, primetimo da je originalna relacija R klasina relaciona baza
podataka, dok je odgovarajua projekcija VT fazi relaciona baza podataka. Na osnovu
prethodno reenog, moemo da konstatujemo da je zadovoljena fazi funkcionalna
(1, )
zavisnost Visina Teina ako i samo ako je ista zadovoljena i u projekciji VT.
Dakle, Cubero, Medina i ostali uvode fazi funkcionalne zavisnosti u relacioni model
baza podataka. Takav pristup nam omoguava da otkrijemo veze izmeu atributa koje nisu
otkrivene klasinom aproksimacijom i izvrimo dekompoziciju potojui uspostavljene
fazi zavisnosti. Na taj nain, smanjujemo redundansu u bazama podataka, tedimo
raunarske resurse, a da pri tome nema gubitka informacija. Dokaz za to je mogunost
dobijanja originalnih podataka koje smo imali u poetnoj bazi, a koje pri tome nisu fazi.
Nedostatak ovog pristupa je injenica da je za efikasan dizajn i uspostavljanje fazi
funkcionalnih zavisnosti neophodna pomo strunjaka i iskusnih projektanata. Reenje za
ovakvu vrstu problema mogli bi da budu sistemi za rudarenje podataka odnosno
dizajniranje efikasnih algoritama za otkrivanje fazi funkcionalih zavisnosti bez
ukljuivanja subjektivnog ljudskog faktora.

3.5.10. Fazi aproksimativne zavisnosti

U analizi podataka u relacionim bazama, vrlo zanimljivo pitanje jeste otkrivanje


moguih odnosa izmeu vrednosti atributa, a na viem nivou i odnosa izmeu samih
atributa, tj. analiza funkcionalnih i vieznanih zavisnosti. U sluaju prisustva neizvesnosti
i neodreenosti podataka, specifine metode rudarenje podataka se koriste u otkrivanju
znanja. Kao to smo to ve napomenuli u ovoj disertaciji, teorija fazi skupova je korisna
alatka za postizanje tog cilja. Berzal, Blanco i ostali [10] predlau algoritam za raunanje
pribline fazi zavisnosti i razliitih tipova odnosa izmeu atributa u fazi relacionim
modelima baza podataka.
Metode otkrivanja znanja u bazama podataka se bave pronalaenjem nepoznatih i
potencijalno korisnih znanja iz baze. Taj proces se sastoji od tri koraka:
a) Priprema podataka,
b) Rudarenje podataka (pronalaenje skrivenih znanja) i
c) Interpretacija rezultata rudarenje podataka ime se obezbeuju nova znanja.
Teorija fazi skupova, i u ovom sluaju se pokazuje kao pogodan alat, kojim
dolazimo do novih saznanja i izraavamo odnose izmeu podataka. Najvanija injenica u
celoj ovoj prii jeste veza izmeu fazi skupova i sistema za otkrivanje znanja: u mnogim
sluajevima podaci su neprecizni i neodreeni, ali fazi relacioni modeli i fazi metod

81
zakljuivanja su razvijeni kako bi se nosili sa ovim potencijalnim problemima. Analiza
informacija zahteva specifine alate i fazi proirenja postojeih zavisnosti izmeu
podataka, te u tom kontkestu se govori o fazi priblinim zavisnostima, koje navode u svom
radu Berzal i ostali [15]. Grubo govorei, pribline zavisnosti su funkcionalne zavisnosti sa
pojedinim izuzecima. Ove zavisnosti se takoe koriste za predstavljanje odnosa izmeu
atributa.
Da bismo ilustrovali ove tvrdnje, posluiemo se jednostavnim primerom. Neka
Kategorija i Zarada predstavljaju dva atributa koji preciziraju platu i poziciju zaposlenog.
Pretpostavimo da su vrednosti atributa Kategorija, koji ukazuju na vrstu posla, unutar
skupa (Menader, Komercijalista, Podrka), a plata je numeriki podatak. Uobiajeno je
da postoji odnos izmeu kategorije i plate (via kategorija, vea zarada). Meutim, ako
elimo opisati ovaku vrstu odnosa pomou pravila kao to su: If Kategorija=Menader
then Zarada=100.000 nisu najbolje reenje jer postoje mnoge razliite numerike
vrednosti za plate menadera. Sa druge strane, semantiki sadaj ovakvih pravila je veoma
siromaan. U takvim okolnostima, mi preferiramo pravilima kao to su
If Kategorija=Menader then Zarada=Visoka. Da bi se otkrile i procenile ovakve vrste
pravila i odnosa izmeu podataka neophodni su specifini alati, kao to je algoritam za
otkrivanje fazi priblinih zavisnosti.
U realnim bazama podataka, susreemo se sa dve razliite vrste odnosa. Sa jedne
strane, postoje odnosi koji nisu implicitni, kod kojih su odnosi izmeu vrednosti atributa
skriveni i koji nisu dovoljno jasni u prvom trenutku. Ovaj tip zavisnosti se dobiva kroz
samu analizu baze podataka. Sa druge strane, esto se susreemo sa eksplicitnim odnosima
izmeu atributa koji se lako detektuju (Npr. Grad i Potanski broj). Ove dve vrste odnosa
izmeu atributa u relacionim strukturama baza podataka predstavljaju ogranienja
integriteta koja se nameu u toku dizajniranja baza podataka. U ovim sluajevima
govorimo da postoji funkcionalna zavisnost ili priblina zavisnost izmeu atributa.
Pretraga funkcionalnih zavisnosti u relacionim bazama podataka je predmet
interesovanja u oblasti rudarenje podataka, jer se ovaj vid poslovne inteligencije vrlo
strogo bavi strukturom podataka. Meutim, jako teko je savreno otkriti funkcionalne
zavisnosti u bazama podataka, jer jedan jedini izuzetak u pravilima utie na gubljenje
zavisnosti. Ako taj broj izuzetaka nije veliki, fazi funkcionalne zavisnosti sa izuzecima
mogu nam prikazati interesantne pravilnosti sadrane u podacima. ta vie, odreuje se i
prikazuje stepen zavisnosti koji postoji izmeu podataka. Ideja je da se meri ne samo
tanost zavisnosti, ve i podrka (proporcija n-torki u kojima se posmatrana zavisnost
pojavljuje). Dakle, za procenu zavisnosti koriste se poverenje (Confidence) uslovna
verovatnoa p(Y/X), u oznaci Conf (X Y) i podrka (Support) verovatnoa p(X Y),
u oznaci S (X Y).
Problem kod poverenja predstavlja injenica da se ne uzimaju u obzir negativne
zavisnosti, pa mogu da se dobiju visoki procenti poverenja u tim sluajevima koji mogu da
dovedu u zabludu. Zbog toga se u radovima predlae korienje faktora sigurnosti CF:
Conf (X Y) - S(Y)
, Conf (X Y) S(Y)
1 - S(Y)

Conf (X Y) - S(Y)
CF (X Y) , Conf (X Y) S(Y)
S(Y)
0 Inace

82
Faktor sigurnosti uzima vrednosti iz intervala [-1,1] i ukazuje nam u kojoj meri je
nae uverenje o postojanju zavisnosti tano. CF = 1 u situacijama kada je X=True tada
Y=True, a CF=-1 u suprotnom. Dva ekstremna sluaja su kada je S(Y)=0 i S(Y)=1. U oba
sluaja rezultat je trivijalan, pa je logino da tada uzimamo vrednost CF=0.
Vraajui se na ideju funkcionalnih zavisnosti, pribline zavisnosti se definiu kao
pravila koja se odnose na prisustvo zavisnosti u n-torkama posmatrane relacije. Sledee
interpretacije i koncepti se koriste u analizi aproksimativnih zavisnosti:
- Stavka je objekat povezan sa posmatranim atributom u relaciji R. Za svaki atribut
Atk R sa itAtk oznaavamo povezane stavke.
- Uvodimo skup IX kao:
IX = { itAtk Atk X}
- Tr je T-skup koji za svaki par n-torki (t,s) r r sadri transakciju ts Tr tako da
vredi:
itAtk ts t[Atk] = s[Atk]
Jasno je da je | Tr | = |r r| = n2.
Na primer, razmotrimo relaciju r prikazanu u tabeli 30. Prema prethodinim
interpretacijama T-skup Tr je prikazan u tabeli 31.
Sada priblina zavisnost X Y iz relacije r prelazi u pridrueno pravilo IX IY u
Tr. Podrka i faktor sigurnosti mere interes i tanost zavisnosti IX IY.
n-torke A B C
t1 a1 b1 c1
t2 a2 b1 c2
t3 a1 b1 c3
t4 a3 b2 c3
Tabela 30. Relacija r

Tr itA itB itC


t1t1 1 1 1
t1t2 0 1 0
t1t3 1 1 0
t1t4 0 0 0
t2t1 0 1 0
t2t2 1 1 1
t2t3 0 1 0
t2t4 0 0 0
t3t1 1 1 0
t3t2 0 1 0
t3t3 1 1 1
t3t4 0 0 1
t4t1 0 0 0
t4t2 0 0 0
t4t3 0 0 1
t4t4 1 1 1
Tabela 31. Relacija Tr

83
Definicija funkcionalne zavisnosti:
Definicija 3.33. Ako je CF (X Y) = 1 (a to implicira i da je Conf(X Y)=1) onda je
X Y funkcionlana zavisnost.
Podrka i tanost pribline zavisnosti X Y moe da se tumaiti kao agregacija
podrke i tanosti pridruenih pravila koja se odnose na vrednosti atributa X i Y. Zbog
toga, aproksimativne zavisnosti se mogu posmatrati kao rezime informacija sadranih u
ovim pravilima. Konkretno, primenom ove metodologije u relacionim bazama podataka
mogue je izdvojiti sve postojee funkcionalne i fazi funkcionalne zavisnosti. Dobijeni
skup zavisnosti moe da se smanji i redukuje u zavisnosti od potreba korisnika i faktora
sigurnosti CF. Tehnike rudarenja podataka mogu imati velike koristi od teorije fazi
skupova jer nam ovakav nain posmatranja problema omoguava da dobijemo vie
razumljive odnose izmeu podataka.

3.5.11. Fazi vieznane zavisnosti

Vieznane zavisnosti, koje predstavljaju drugu vanu formu zavisnost, pomau u


otklanjanju redundancije podataka u kreiranju baza podataka. Definicija vieznane
zavisnosti kae da ako su dve n - torke jednake na skupu atributa X tada postoji n -torka t3
u datoj relaciji r takva da je t3[X] = t1[X], t3[Y] = t1[Y] i t3[Z] = t2[Z] odnosno, imamo
sledeu definiciju:
Definicija 3.34. Neka je R relaciona ema, X, Y R, X Y= i Z = R-[XY]. Kaemo
da relacija r zadovoljava vieznanu zavisnost X Y ako vredi da za svake dve
n - torke t1 i t2 iz r za koje je ispunjeno t1[X] = t2[X], postoji n - torka t3 u r, takva d a j e
t3[X] = t1[X], t3[Y] = t1[Y] i t3[Z] = t2[Z].
Poto ova definicija vieznane zavisnosti nije primenljiva u fazi modelu, jer ne
postoji jasan nain odreivanja kada su dve neprecizne informacije jednake, nju je
potrebno proiriti sa nepreciznim informacijama. Te proirene verzija vieznanih
zavisnosti nazivaju se fazi vieznane zavisnosti [44,45,50,54].
Definicija 3.35. Neka je r fazi relacija na relacionoj emi R(A1,...,An) i neka je U
univerzalni skup atributa A1,...,An i neka su X i Y podskupovi od U. Kaemo da fazi
relacija r zadovoljava fazi vieznanu zavisnost X Y ako za svaki par n - torki t1 i t2 iz
r postoji n - torka t 3 u r , takva da je:
C (X[t1,t3]) min (, C(X[t1,t2])),
C (Y[t1,t3]) min (, C(X[t1,t2])),
C (Z[t2,t3]) min (, C(X[t1,t2])).
gde je , realan broj iz [0,1] i koji oznaava lingvistiku jainu zavisnosti.
Da ovako definisane fazi vieznane zavisnosti osiguravaju konzistentnost govori naredna
teorema.
Teorema 6. Fazi vieznane zavisnosti su konzistentne.
Sada dajemo emu aksioma za fazi vieznane zavisnosti.
1 2
A1: Ako vredi X Y i 1 2 tada je i X Y (Inkluzivno pravilo).
F F

84

A2: {X Y } X U-XY (Komplementarno pravilo).
F F


A3 : Ako vredi {X Y } i Z W tada vredi i W X YZ (ema aksioma
F F
pribrajanja).
1 2 min(1 , 2 )
A4: {X Y, Y Z} X Z-U (ema aksioma tranzitivnosti).
F F F


A5 : { X Y } X Y (Replicitno pravilo).
F F

1 2 2
A6: Ako vredi X Y i Z Y i za neki W iz Y vredi W Z tada vredi X Z.
F F F

Dodatna pravila izvoenja za fazi vieznane zavisnosti:

1 2 min(1 , 2 )
A7: {X Y, X Z} X YZ.
F F F

1 2 min(1 , 2 )
A8: {X Y, WY Z} WX Z.
F F F

1 2 min(1 , 2 )
A9: {X Y, WY Z} WX Z-WY.
F F F

1 2 min(1 , 2 ) min(1 , 2 )
A10: Ako vredi X Y, X Z tada vredi X Y Z, X YZ,
F F F F

min(1 , 2 )
X ZY.
F

1 2 min(1 , 2 )
A11: {X Y, XY Z} WX Z-Y.
F F F

Da su ova pravila sound i complete tvrdi naredna teorema.


Teorema 7. Praviia izvoenja {A1, A2, A3, A4, A5, A6} su sound i complete.
Dokaz kompletnosti ovih aksimoma dat je u radu [44].

3.6. Zakljuak

U ovome poglavlju posmatrana je uopteno kako klasina relaciona baza podataka


tako i fazi relaciona baza podataka. Najpre je uveden relacioni model baza podataka i u
njemu su definisani pojmovi iz relacione algebre, a zatim su date A r m s t r o n g o v e
aksiome i odgovarajua pravila izvoenja. Pored fazi relacione baze podataka,
predstavljena su dostignua u oblasti fazi objektno-orijentisanih baza podataka.
Zatim je uvedena definicija fazi funkcionalnih i vieznanih zavisnosti i data su
pravila izvoenja tih zavisnosti u ve poznatim modelima.
Sve navedene osobine i pojmovi u ovome poglavlju, kao i ve poznati rezultati iz
teorije fazi relacionih baza podataka, iskorieni su u svrhu naprednih istraivanja u ovoj
doktorskoj disertaciji.

85
4. Projektovanje relacionih baza podataka
Poseban znaaj u radu sa relacionim bazama podataka ima struktuiranje i
organizacija samih podataka. Podatke je na nivou korisnika potrebno struktuirati, a na
zikom nivou organizovati tako da njihovo odravanje bude najlake, a manipulisanje
njima najekasnije. Skup postupaka kojima se dolazi do dobro struktuiranih podataka u
bazi podataka naziva se metodama logikog projektovanja baze podataka. Skup postupaka
kojima se podaci ziki organizuju u bazi, tako da im je pristup i odravanje najekasnije,
naziva se metodama zikog projektovanja, tj. metodama zike organizacije podataka.
Ogromnu ulogu u logikom dizajnu baza podataka imaju funkcionalne zavisnosti,
vieznane zavisnosti, zavisnosti pridruivanja o kojima je bilo rei u prethodnim
poglavljima. U ovom radu su prikazani razliiti pristupi u analizi funkcionalnih zavisnosti
koje koriste projektantni informacionih sistema prilikom dizajniranja baza podataka. Zato
emo u uvom poglavlju pokuati da damo krau analizu logikog modeliranja i fizike
organizacije podataka u relacionim bazama, kako bi prethodna teorijska razmatranja mogla
da se implementiraju u potpunosti, a pod tim podrazumevamo realizaciju fazi relacionih
baza podataka koju daje prethodna analiza i teorija.

4.1. Logiki model baza podataka

Relacioni model baze podataka sastoji se od dva dela i to:


logikog i
fizikog modela.
Pod logikim projektovanjem relacione baze podataka podrazumeva se projektovanje
eme relacione baze podataka, tj. grupisanje pojedinih atributa u posebne relacije, ili
izdvajanje uoenih entiteta i odnosa meu entitetima u posebne relacije, a sve to na osnovu
analize informacionih zahteva i informacionog okruenja. Znaaj dobrog logikog
projektovanja relacione baze podataka lei u injenici da je takvu bazu mogue efikasnije
odravati, i da je manipulisanje podacima u njoj jednostavnije i pouzdanije [71].
Logiki model baze podataka nastaje kao rezultat:
analize postojeih i / ili dobijenih novih podataka,
definisanja tabela (relacija) i veza meu njima, te
dovoenja modela na relacioni oblik
uz prethodno definisanu strukturu i oblik podataka koji e initi sadraj baze.
Kvalitet logikog dizajna baza podataka uvek zavisi od toga koliko uspeno dizajn
modela odgovara realnom svetu. Klasine relacione baze podataka nam omoguavaju da
dizajniramo bazu sa informacijama iz realnog sveta koje su sve precizne i tane. Zapravo,
ova pretpostavka predstavlja restrikciju, jer u bazu mogu da se skladite samo precizne
informacije. Ovo ima za krajnju posledicu gubitak informacija. Neprecizne informacije su
posebno vane u sistemima i aplikacijama koji su ukljueni u proces donoenja odluka.
Najpogodniji nain da se neprecizne informacije sauvaju u bazi jeste da se poveu sa
konceptom fazi logike. Tako podaci u bazi dobijuju prefiks fazi. U radu su navedeni naini
i modeli predstavljanja fazi informacija u Fazi Relacionim Bazama podataka.

86
U logikom dizajnu baza podataka, ogranienja integriteta imaju kljunu ulogu.
Meu tim ogranienjima, zavisnost izmeu podataka predstavlja vanu i moda najire
ispitivanu klasu. Razne vrste zavisnosti, kao to su funkcionalne zavisnosti, vieznane
zavisnosti, zavisnosti pridruivanja itd. se koriste prilikom projektovanja baza podataka.
Druga, vrlo vana pretpostavka u relacionim bazama podataka jeste injenica da neki
podaci u potpunosti odreuju druge podatke ili su podaci potpuno nezavisni. Meutim, u
mnogim realnim situacijama, postoje podaci koji nisu 100% zavisni, ali ipak zavisnost
postoji (npr. Nivo inteligencije osobe manje ili vie odreuje uspeh u poslu.) U ovom
primeru i stepen uspeha i nivo inteligencije su fazi atributi, pa govorimo o fazi
zavisnostima. Ako znamo da je ovek inteligentan, mi znamo da e biti uspean, ali njegov
uspeh nije precizno odreen i definisan.
Vrlo vana stavka u analizi zavisnosti podataka je postojanje pravila zakljuivanja.
To je skup pravila koji projektantima informacionih sistema ostavlja mogunost ispravnog
logikog dizajniranja i zakljuivanja. Da bi se takva pravila i primenjevila, neophodno je
da budu sound i complete.
Znaaj funkcionalnih zavisnosti se ogleda pre svega u mogunosti da prilikom
dizajniranja relacione eme baze, eliminiemo redundansu koja je svakako prisutna. Za par
atributa X i Y kaemo da postoji funkcionalna zavisnost X Y, ako je t[X]=t[X] onda
vai i t[Y]=t[Y]. tj:
t[X]=t[X] t[Y]=t[Y]
pri emu je t[X] projekcija n-torke (vrste) t na atribute X.
Kod fazi funkcionalnih zavisnosti se ne moemo osloniti na koncept jednakosti.
Sozat i Yazici, Bosc i ostali [38,44] u analizi fazi funkcionalnih zavisnosti koriste relaciju
slinosti. U tom sluaju kaemo: Ako je t[X] slino sa t[X], t[Y] je takoe slino sa t[Y],
i piemo:

X Y.
F

Tipian primer FFD: "Zaposleni sa slinim iskustvom imaju sline plate. Iskustvo i plata
su atributi koji mogu da imaju vrednosti u vidu lingvistikih izraza. Jedan od naina da
izrazimo stepen zavisnosti je koristei prag vrednosti. Za prethodna dva primera imamo:
"Zaposleni sa slinim iskustvom imaju sline plate stepen zavisnosti moemo da
iskaemo sa vrednou 0.9 ili "Nivo inteligencije osobe manje ili vie odreuje uspeh u
poslu" lingvistika snaga 0.6. Ova vrednost se zove snaga, odnosno stepen fazi
funkcionalne zavisnosti, i oznaavamo je sa
Primer 4.1 Posmatrajmo bazu podataka koja je predstavljena sledeom relacionom
emom:
P (P_SIF, IME, BR_NASLOVA, DRZAVA)
I (I_SIF, NAZIV, STATUS, DRZAVA)
K (K_SIF, NASLOV, OBLAST)
KP (K_SIF, P_SIF, R_BROJ)
KI (K_SIF, I_SIF, IZDANJE, GODINA, TIRAZ)
Prve tri relacije predstavljaju tipove entiteta PISAC, IZDAVA i KNJIGA redom, i
imaju slinu strukturu kao i odgovarajui tipovi entiteta. Nov je prvi atribut u svakoj od
relacija, koji predstavlja ifru, tj. jedinstveni identikator pisca, izdavaa i knjige. Na

87
primer, ifra knjige, K_SIF, moe biti ISBN (International Standard Book Number), P_SIF
i I_SIF mogu biti matini broj pisca i izdavaa, redom. Relacija KP predstavlja apstraktni
tip entiteta AUTOR, tj. odnos izmeu tipova entiteta KNJIGA i PISAC, dok relacija KI
predstavlja apstraktni tip entiteta IZDAVATVO, tj. odnos izmeu tipova entiteta
KNJIGA i IZDAVA.
Ova relaciona baza podataka je dobro logiki projektovana jer omoguuje
jednostavno unoenje, brisanje i izmenu objekata (ili njihovih odnosa) predstavljenih
svakom pojedinanom tabelom. Neto formalnije, dobro logiko projektovanje relacione
baze podataka zasnovano je na karakteristinim zavisnostima koje postoje meu atributima
svake pojedinane relacije. Na primer, u relaciji I, jedinstveni identifikator vrste jeste ifra
izdavaa (atribut I_SIF), tj. I_SIF jednoznano odreuje vrednost svakog od atributa
NAZIV, STATUS, DRZAVA (svaki od atributa NAZIV, STATUS, DRZAVA
funkcionalno zavisi od atributa I_SIF). Ovo jednoznano odreenje, tj. funkcionalna
zavisnost, oznaava se na sledei nain:
I_SIF NAZIV
I_SIF STATUS
I_SIF DRZAVA
U relaciji I, atribut I_SIF je klju jer svi ostali atributi od njega funkcionalno zavise.
Razne n-torke relacije I moraju imati razliite vrednosti atributa I_SIF. Relacije opisane
izdavake baze podataka su dobro projektovane jer su sve zavisnosti posledice kljua (na
levoj strani imaju ceo klju).
Primer 4.2. Razmotrimo primer loe isprojektovane relacije R:
I_SIF K_SIF NAZIV
I1 K1 Prosveta
I3 K2 Deje novine
I3 K3 Deje novine
I4 K1 Matica srpska
I5 K1 Prosveta
I6 K2 Prosveta
Tabela 32. Primer projektovanja baze podataka

U ovoj relaciji postoje problemi sa unoenjem, brisanjem i izmenom podataka, tzv.


anomalije, jer nisu sve zavisnosti posledica kljua.
Razliite metodologije logikog projektovanja dolaze do eme relacione baze
razliitim postupcima, pri emu se ve u opisu znaenja logikog projektovanja uoavaju
dva globalno razliita postupka: jedan se zasniva na grupisanju atributa svojstava
informacionog okruenja u posebne relacije, a drugi na izdvajanju entiteta i odnosa u
posebne relacije. Prvi je sintaksno orijentisan i voen vezama meu atributima izraenim
kroz koncepte zavisnosti (funkcionalne, vieznane, zavisnosti spajanja), a drugi je
semantiki orjentisan i voen je vezama meu entitetima informacionog okruenja.
Metoda normalnih formi dosledno i kompletno realizuje prvi postupak logikog
projektovanja, dok razne metode semantikog modeliranja realizuju drugi postupak.
[71,73].

88
Dakle, problemu sinteze logikog modela pristupa se na dva naina i to:
postupkom normalizacije tabela ili
preko modela objekat-veze (MOV, Entity-Relationship Model, skraeno
E-R model), pri emu treba naglasiti da jedan pristup ne iskljuuje drugi, nego se
naprotiv, esto, meusobno i dopunjuju.

4.2. Logiko projektovanje postupkom normalizacije tabela

Logiko projektovanje moe, po jednom kriterijumu, da bude voeno pravilima o


grupisanju atributa u relacije na osnovu logikih veza meu atributima. Za relacije koje se
dobiju primenom takvih pravila kae se da se nalaze u odgovarajuim normalnim formama
[71]. Zbog toga su normalne forme isto sintaksna svojstva zasnovana na algebri zavisnosti
(funkcionalnih, vieznanih i zavisnosti spajanja). Dakle, projektovanju informacionog
sistema moe se prii prostim sakupljanjem i registrovanjem svih raspoloivih atributa. U
tom sluaju mora se posebno obratiti panja na to da logiki model ne sadri redundansu
podataka. Tabele sa sirovo nabacanim atributima retko kada zadovoljavaju ovaj uslov,
jer se pri njihovom modelovanju nije vodilo rauna o izboru tabela i njihovih atributa.
Optimalan izbor relacija i njihovih atributa naziva se normalizacija sistema.
Normalizacija je u stvari postupak izmene (najee dekompozicije, rastavljanja na vie
relacija) prvokoncipiranih tabela (relacija).
Dekompozicijom relacije dobija se uvek dve ili vie novih, meusobno povezanih
relacija, koje se nalaze i u nekoj od normalnih formi. U sluaju kada se projektovanju
sistema pristupa preko E-R modela, i ako se isti korektno izvede, onda e i relacije koje iz
njega slede ve biti u nekoj vioj normalnoj formi pa mnogi tako i proveravaju kvalitet
dobijenog E-R modela.
Tehniki postupak izvoenja normalizacije svodi se na operacije relacione algebre -
projekciju i spajanje, i to:
na dekompoziciju tabela generisanjem vertikalnih podskupova (operacija
projekcije), i
na generisanje novih relacija iz dvaju ili vie dobijenih vertikalnih podskupova
(operacija spajanja).
Ovakav pristup sintezi informacionog sistema naziva se vertikalna normalizacija u
kojoj postoji pet normalnih formi. Za praksu su najvanije druga i trea i na njima se esto
proces normalizacije i zaustavlja. Pomenimo da pored vertikalne postoji i horizontalna
normalizacija.
ta je to normalizovana, a ta nenormalizovana forma neke relacije (tabele), najbolje
se moe videti na sledeem primeru:
Primer 4.2. Pretpostavimo da neka trgovaka firma eli da vodi evidenciju o svome
poslovanju. U tu svrhu skuplja i obrauje podatke koji se nalaze u tabeli NARUDBA. To
su: ifra kupca, ime i prezime kupca, adresa kupca, koliina kupljene robe, ifra robe
(artikla), naziv robe, kvalitet i cena robe. Bez dublje analize problem poslovanja se moe
predstaviti u vidu jedne tabele NARUDZBA (Sifra_Kup#, Ime, Adresa, Kolicina,
Sifra_Art#, Naziv, Kvalitet, Cena).

89
Sifra_Kup# Ime Adresa Kolicina Sifra_Art# Naziv Kvalitet Cena
K1 Nikola Beograd 100 A1 Lak 2 220
K1 Nikola Beograd 200 A2 Boja 1 130
K1 Nikola Beograd 50 A3 Gips 3 20
K1 Nikola Beograd 300 A4 etke 2 70
... ... .... ... ... ... ... ...
K17 Milo Beograd 200 A2 Boja 1 130
Tabela 33. Table Nardudba
Ovako koncipiran model je lo iz sledeih razloga:
1. ifra kupca (Sifra_Kup#) i ifra robe (Sifra_Art#) su atributi tabele NARUDBA,
iako su u realnom svetu identifikatori dva razliitih objekta (KUPAC, ROBA).
Tako, na primer, kvalitet nije atribut kupca nego nekog drugog objekta koji bi
mogao da se zove ROBA.
2. Model sadri redundansu jer se adresa i ime kupca javljaju onoliko puta koliko
puta je neki kupac kupovao robu u toj trgovini. Isti zakljuak vredi i za artikle. Na
primer: opis artikla sa ifrom A2 (kvalitet, naziv i cena) javlja se dva puta, jer su
dva razliita kupca nabavljala taj isti artikl.
Prisustvo redundanse u bazi podataka dovodi do niza problema prvenstveno kod
izmene (auriranja), ali i kod korienja podataka. Ti problemi se nazivaju anomalije. To
su pre svega:
a. Anomalije pri upisu podataka
Ova anomalija sastoji se u tome da upis podataka o kupcu nije mogu sve dok neki
kupac neto ne kupi, iako on kao potencijalni kupac postoji i marketinki je interesantan.
Analogno vredi i za artikle. Na primer: kupac sa ifrom K2 nema jo nita narueno, i
njegovi podaci nisu uneseni u tabelu NARUDBA (iako je moda upravo taj kupac veoma
interesantan kao potencijalni kupac), ili podatke o artiklu sa ifrom artikla A5 ne moemo
imati u bazi (iako taj artikl postoji) sve dok neko ne izvri porudbinu.
b. Anomalije pri brisanju podataka
Brisanjem jedne narudbe iz tabele moe se desiti da se izgube svi podaci o kupcu
ili artiklu - robi. U konkretnom primeru: brisanjem kupca sa ifrom K17 bie izgubljeni svi
podaci o njemu s obzirom da je on izvrio narudbu samo jedanput. Na sreu, sluajno
nee biti izgubljeni i podaci o artiklu koji je on kupio, jer postoji jo jedan kupac (sa ifrom
K2) koji je kupio isti artikal. Ali zato, brisanjem nekoliko narudbi i takva greka moe da
se desi.
c. Anomalije pri izmeni podataka
Promenom imena ili adrese kupca nastaje problem izmene podataka na onoliko
mesta na koliko je kupac bio upisan. Isti zakljuak odnosi se i na artikle prilikom promene
imena ili svojstva (na primer cene) nekog artikla.

4.2.1. Prva, druga i trea normalna forma

Svi pobrojani nedostatci mogu biti eliminisani ako se prvobitno koncipirane relacije -
tabele normalizuju i dovedu u potrebnu normalnu formu. Pri tome treba samo obratiti
panju da tokom postupka normalizacije (koji se, kako rekosmo, svodi na dekompoziciju i
ponovo spajanje tabela) ne doe i do gubitka informacija.

90
Prva normalna forma. Relacija se nalazi u prvoj normalnoj formi (1NF) ako i samo
ako je njen domen (podaci u tabeli) skup atomskih vrednosti. Budui da je ovo i uslov da
bi neka tabela uopte bila relacija, sledi da se svaka relacija nalazi u prvoj normalnoj formi.
Pojava redundancije koja je u prvoj normalnoj formi praktino skoro uvek prisutna
(kao to smo to videli u prethodnom primeru), te mogunost svih prateih greaka, ukazuju
na to da prva normalna forma nije ni izdaleka dovoljna za sintezu upotrebljive baze
podataka. Neki autori stoga ovu formu nazivaju nenormalizovanom formom ili nultom
normalnom formom, tako da se kod raznih autora moe nai i razliit ukupan broj
normalnih formi.
Druga normalna forma. Druga normalna forma nema nekog veeg praktinog
znaaja, jer je veina pomenutih anomalija i dalje prisutna kod relacija koje su dovedene u
drugu normalnu formu. Pomenimo je stoga samo kao prethodnika tree normalne forme
koja za praksu ima najvei znaaj.
Po definiciji, relacija se nalazi u drugoj normalnoj formi ako svaki atribut, koji nije
kljuni, zavisi potpuno (ne delimino) od kljunog atributa.
Posmatrajmo opet prethodni primer. Relacija NARUDBA nije u drugoj normalnoj
formi (2NF) jer u toj relaciji je jedini mogui kandidat za klju sloeni klju (Sifra_Kup#,
Sifra_Art#), a atribut kvalitet oigledno zavisi samo od dela (Sifra_Art#), a ne i celoga
kljua. Prevedimo stoga relaciju NARUDBA u dve relacije, od kojih prva R1 sadri
podatke o kupcu, a druga R2, o artiklu koji je taj kupac kupio, i to na sledei nain:
R1 (Sifra_Kup#, Ime, Adresa) i
R2 (Sifra_Kup#, Sifra_Art#, Naziv, Kvalitet, Cena, Koliina).
Relacija R1 je u 2NF, ali R2 jo uvek nije jer ponovo atribut kvalitet zavisi samo od
dela kljua (Sifra_Art#), ali ne od celoga kljua (Sifra_Kup#, Sifra_Art#). Relaciju R2
moramo stoga opet razbiti na dve od kojih, prva R21 sadri samo podatke o robi , a druga
R22 o kupcu i robi koji je on kupio:
R21 (Sifra_Art#, Kvalitet, Cena)
R22 (Sifra_Kup#, Sifra_Art#, Koliina).
Sada su sve tri relacije R1, R21 i R22 u 2NF, jer R1 i R21 nemaju sloeni klju, a atribut
koliina u R22 zavisi potpuno, a ne delimino, od sloenog kljua te relacije.
Trea normalna forma. Relacije R1, R21 i R22, u ovom primeru, zadovoljavaju i
uslov tree normalne forme (3NF), to nikako ne znai da je to i u svakom drugom sluaju
tako, jer se moe desiti da dekompozicijom 1NF postignemo samo 2NF, a ne i vie od
toga. Pokaimo to na drugom primeru.
Pretpostavimo da unutar informacionog sistema nekog instituta imamo objekat -
entitet LABORANT sa atributima:
LABORANT (Sif_Lab#, Ime, Prezime, Broj_Sobe, Telefon)
Relacija LABORANT je ve u 2NF jer ima samo jedan kljuni atribut (Sif_Lab# - ifra
laboranta), i niz atributa. Meutim, izmeu atributa Broj_Sobe i Telefon moe da postoji
meusobna zavisnost (telefon se nalazi u sobi) pa e se stoga neki broj telefona u
laboratoriji pojaviti u relaciji onoliko puta koliko laboranata radi u njoj, pod uslovom da
koriste isti telefon.

91
Prema tome, iako je relacija LABORANT u 2NF, pojava redundancije podataka u toj
formi nije otklonjena, a time i sve anomalije pri odravanju kao na primer:
Broj jednog od telefona i broj sobe neke laboratorije nije mogue uneti u
informacioni sistem sve dok se ne unesu podaci o bar jednom laborantu koji radi
u njoj,
Brisanjem podatka o poslednjem laborantu neke laboratorije, gubi se podatak i o
broju telefona u njoj (iako laboratorija, prostorija i dalje postoji), te konano,
ako laboratorija promeni broj telefona, izmenu treba uneti onoliko puta koliko
laboranata radi u njoj.
Navedene slabosti ukazuju da relacija LABORANT mora biti dalje dekomponovana i
na taj nain dovedena do 3NF. Dekompozicija se izvodi tako da se nekljuni atributi, koji
su u meusobnoj funkcionalnoj vezi, izdvoje u zasebnu relaciju, te da se tako nastala
relacija povee sa ostatkom prvobitne preko jednog atributa. Konkretno, u posljednjem
primeru od relacije LABORANT treba napraviti dve:
LABORATORIJA (Broj_Sobe, Telefon)
LABORANT (Sif_Lab#, Ime, Prezime, Broj_Sobe)
U ovom primeru funkcionalna zavisnost izmeu atributa Sif_Lab#, Broj_Sobe i
Telefon postoji i dalje. Broj telefona, naime zavisi od broja sobe u kojoj se telefon nalazi, a
broj sobe je u vezi sa laborantom koji sedi u njoj. Ne bi bilo dobro da smo dekompozicijom
tabele izgubili tu zavisnost, jer model sistema ne bi vie bio realna slika stvarnosti.
Relacija LABORANT nije prema tome pre dekompozicije bila u treoj normalnoj
formi, jer je postojala veza meu atributima.
Relacija se nalazi u treoj normalnoj formi ako, i samo ako, nekljuni atributi nisu ni
funkcionalno ni tranzitivno zavisni od kljunog atributa, to znai da se svaka relacija koja
se nalazi u treoj normalnoj formi nalazi i u drugoj, dok obrnuto ne vai.
Definicija 4.1. Neka su X, Y, Z skupovi atributa relacije R(A1,,An). Kae se da skup
atributa Z tranzitivno zavisi od X ako vai X Y i Y Z. Relacija R je u treoj
normalnoj formi (u oznaci 3NF) ako je u 1NF i nijedan njen nekljuni atribut ne zavisi
tranzitivno ni od jednog njenog kljua.
Ako izmeu atributa unutar jedne n-torke postoje sledee funkcionalne zavisnosti:
X Y, X Z i Y Z onda se kae da je atribut Z tranzitivno i funkcionalno zavistan
od atributa X.
Pomenute meusobne zavisnosti atributa (funkcionalna i tranzitivna) nisu vetake
veze meu atributima, nego veze koje postoje i u stvarnosti i zato se, preslikavaju iz
realnog sveta u informacioni sistem. Dekompozicijom relacije ne smemo takve veze
potpuno raskinuti, jer e model u tom sluaju izgubiti svoju verodostojnost. To praktino
znai da svaka zavisnost unutar neke relacije mora logiki slediti i u relacijama koje su
generisane dekompozicijom, odnosno iz njih se mora dobiti operacijom prirodnog spajanja.
U protivnom, moe doi do gubitka informacija. Pravilo prilikom dekompozicije kojega se
treba drati glasi:
Relacija se dekomponuje bez opasnosti gubitaka funkcionalnih zavisnosti samo ako
se dekompozicija vri prema funkcionalnoj zavisnosti koja ne ide od kandidata kljua (kao
to je uraeno sa relacijama koje povezuju laboratorije i laborante).

92
4.2.2. Ostale normlalne forme

Pored pomenutih normalnih formi postoje jo i:


Boyse - Codd-ova normalna forma (BCNF) koja je u stvari stroi oblik tree
normalne forme i relevantna je za one eme relacija koje imaju vie kandidata za
klju, koji se pri tome jo i meusobno prekrivaju. U praksi su ovakvi sluajevi
retki.
etvrta normalna forma eliminie redundansu koja je u treoj normalnoj formi
mogua ako meu atributima postoji vieznana zavisnost, ime se eliminiu i
anomalije pri odravanju.
Posmatrajmo, na kraju, jo jedan primer kako bi i ova definicija postala razumljiva.
Pretpostavimo da relacija NASTAVA ima tri atributa i to: Sifra_Predmeta#,
Sifra_Nastavnika#, Sifra_Udzbenika#:
NASTAVA (Sifra_Predmeta#, Sifra_Nastavnika#, Sifra_Udzbenika#)
te da jedan predmet moe da predaje vie nastavnika, i da se za jedan predmet moe
koristiti vie udbenika. Tako u relaciji NASTAVA imamo dve vieznane zavisnosti jer
jednom predmetu (na primer fizici) pripada vie nastavnika (na primer Markovi, Pavlovi,
Mari) i vie udbenika (na primer Fizika materijala i Atomska i molekularna fizika).
Ovako koncipirana relacija NASTAVA sadri prema tome redundansu, jer se zapis o tome
da pojedini nastavnik predaje neki predmet javlja onoliko puta, koliko razliitih udbenika
on koristi za taj predmet.
I ova redundansa se moe dekompozicijom izbei, i tada se kae da je sistem u
etvrtoj normalnoj formi. Konkretno, u ovom sluaju relaciju NASTAVA treba predstaviti
dvema relacijama:
NASTAVA1 (Sifra_Predmeta#, Sifra_nastavnika#)
NASTAVA2 (Sifra_Predmeta#, Sifra_Udzbenika#)
Peta normalna forma je poslednji stupanj dekompozicije, koja reima iskazana
glasi: relacija se nalazi u petoj normalnoj formi ako se ne moe dalje, sa nekim smislom,
dekomponovati, odnosno, peta normalna forma se odnosi na relacije koje predstavljaju
vei broj entiteta ili njihovih odnosa (vie od 2). U takvim sluajevima, mogua je
dekompozicija relacije u vie projekcija, bez gubljenja informacija. Ovo svojstvo oznaava
prisustvo zavisnosti spajanja koje se zamenom relacije njenim projekcijama eliminie.

4.3. Normalizacija u fazi relacionim modelima baza podataka

U fazi relacionim modelima baza podataka, gde su vrednosti atributa predstavljeni


pomou mogunosti distribucije, a domeni definisani pomou relacije bliskosti, problem
anomalija i redundanse podataka i dalje postoji. Chen, Kerre i Vandenbulcke [12] proiruju
teoriju normalizacije relacionog modela baza podataka kako bi obezbedili smernice za
projektovanje fazi relacionih baza podataka. Normalizacija fazi baza podataka zasnovana
je na pojmu fazi funkcionalnih zavisnosti, a jedan broj pojmova kao to su kljuevi i
normalne forme su generalizovani. Kao rezultat toga, formuliu se q-kljuevi, prva fazi
normalna forma (F1NF), q - druga fazi normalna forma (q-F2NF), q - trea fazi normalna
forma (q-F3NF) i q- Boyce-Codd fazi normalna forma.

93
U fazi relacionim bazama podataka, u kojima egzistiraju fazi funkcionalne
zavisnosti, klju K relacije R(U) se moe definisati na nain da K funkcionalno odreuje U
sa odreenim stepenom.
Teorijske smernice fazi normalnih formi se definiu kako bi se objasnilo grupisanje
atributa u relacionim emama. Jedan od osnovnih problema, koji egzistira u ovakvim
modelima baza podataka, je postojanje deliminih, nepotpunih i/ili tranzitivnih fazi
funkcionalnih zavisnosti koji, kao i prethodnom sluaju nameu, postajanje redudantnosti i
anomalija. Broj normalnih formi se definie tako da se adekvatno definiu odnosi izmeu
atributa.
Generalna forma fazi funkcionalnih zavisnosti koja se koristi prilikom definisanja
fazi normalnih formi koristi relaciju bliskosti za mogunost distribucije na
odgovarajuem domenu, fazi operator implikacije I za pravila zakljuivanja IF-THEN i
min za operator AND. Konkretno X funkcionalno odreuje Y sa stepenom q ako i samo
ako je:
min I((t(X), t(X), (t(Y), t(Y)) q t, t R.
Na primer, Ako je (t(X), t(X)) = 0.95 i (t(Y), t(Y)) = 0.90 onda fazi funkcionlna
0 .9
zavisnost zadovoljava X Y.

Sada definiemo fazi normalne forme:


Definicija 4.2. Neka je Di domen atributa Ai. Relacija se nalazi u prvoj fazi normalnoj
formi (F1NF) ako i samo ako u relaciji R postoji vrednost atributa koja predstavlja
iskljuujuu mogunost distribucije.
Posmatrajmo sledeu relaciju koja zadovoljava uslove prve fazi normalne forme:
R (Ime, Godine, Jezik)
Ime Godine Jezik
Marko 21 E
Duan {0.7/16,1/17,0.8/18} {0.3/F, 0.6/N, 1/E}
Petar {25,26} F
Tabela 34. Primer F1NF
Napomenimo, da relacija nije u prvoj fazi normalnoj formi ako postoje vieznani atributi.
Na primer, ako i Duan govori francuski sa stepenom pripadnosti 0.3 i Nemacki sa
stepenom 0.6 i Engleski sa 1. Dakle, samo jednoznani atributi, koji su po prirodi
iskljuivi, zadovoljavaju uslove prve fazi normalne forme.
Definicija 4.3. Neka je F skup fazi funkcionalnih zavisnosti relacije R, a K q-klju
relacije. Relacija je u q-drugoj fazi normalnoj formi (q-F2NF), ako i samo ako je R u F1NF

i ako za bilo koji drugi atribut A, koji nije kljuni, vai K A u F+ (potpuna fazi
funkcionalna zavisnost), 0 a q.
Definicija 4.4. Neka su X, Y U. Y je potpuno funkcionalno zavisno od X sa stepenom
q q q
q, u oznaci X Y, ako i samo ako je X Y i ne postoji X X, X, tako da je X
Y. U suprotnom, kaemo da je Y parcijalno zavisno od X sa stepenom q.

94
0 .9
Razmotrimo prethodnu relaciju sa F={ Ime Godine }. {Ime, Jezik} je 0.9-klju jer je:

0 .9
Ime, Jezik Godine,

1 .0
Ime, Jezik Ime

1 .0
Ime, Jezik Jezik.

Meutim, R nije u q-F2NF, jer Godine nisu potpuno zavisne od {Ime, Jezik}.
Definicija 4.5. Neka je F skup fazi funkcionalnih zavisnosti relacije R, a K q-klju relacije.
Relacija je u q-treoj fazi normalnoj formi (q-F3NF), ako i samo ako je R u F1NF i za bilo
f
koju zavisnost X A u F+, tako da A nije u X, vai da je ili X q-superklju ili A je q-
primarni klju.
Definicija 4.6. Neka su K, S U i F skup fazi funkcionalnih zavisnosti u relaciji R. Onda
q
K zovemo q-klju (ili q-klju kandidat) relacije R ako i samo ako je K U F+ i ako je
q
K U potpuna funkcionalna zavisnost. Ako relacija R ima vie od jednog q-kljua, onda
moemo da odredimo jedan od kljueva kao q-primarni klju relacije R. S se zove q-super
klju ako i samo S sadri q-klju.
Definicija 4.7. Neka su AU, X U i K q-klju relacije R. A se zove q-primarni atribut
ako i samo ako A K. Isto tako, X se zove q-primarom ako i samo ako je X K. Za
ostale atribute kae se da su nekljuni.
Posmatrajmo relaciju R (Student#, Ime, Adresa, Godine) i skup fazi funkcionalnih
0 .9 0 .8 1
zavisnosti F={Student# Godine, Student# Adresa, Student# Ime,
1
Ime Student#}. Student# je 0.8-klju. Takoe, iz zadnje fazi funkcionalne zavisnosti
Ime je 0.8-klju. Bilo koja FFD u F+ zadovoljava ogranienja 0.8-F3NF. Prema tome,
relacija je u 0.8-treoj fazi normalnoj formi.
Definicija 4.8. Neka je F skup fazi funkcionalnih zavisnosti i K q-klju u relaciji R Za R
kaemo da zadovoljava uslove q-fazi Boyce-Codd normalne forme, u oznaci q-FBCNF,
f
ako i samo ako je R u F1NF i za bilo koju zavisnost X A u F+, tako da A nije u X, vai
da je X q-superklju.
Pozivajui se na teoriju normalizacije za klasine relacione baze podataka, kada
dekomponujemo fazi relacionu emu u vei broj jednostavnijih relacija, da bismo
eliminisali neeljene zavisnosti izmeu atributa, moramo da vodimo rauna da ne doe do
gubitka informacija, a da se pri tome ouvaju postojee zavisnosti. Zakonitost mora da
bude zadovoljena u svim fazi relacijama koje su u q-treoj fazi normalnoj formi (q-F3NF).
Da bismo ovo postigli koristiemo definiciju delimino/parcijalno slobodnih fazi
funkcionalnih zavisnosti.

95

Definicija 4.9. Fazi funkcionalna zavisnost Y B je parcijalno slobodna ako i samo ako

ne postoji X B u F+ tako da je X Y i <. Ako je svaka fazi funkcionalna zavisnost u
posmatranom skupu F parcijalno slobodna, tada za skup F kaemo da je parcijalno
slobodan.
Navedimo sada i teoremu na osnovu koje i vrimo dekompoziciju relacione eme u q-
F3NF relacije.
Teorema 1. Neka je R relaciona ema, F minimalni skup fazi funkcionalnih zavisnosti za
R i ={R1,R2,,Rk} dekompozicija relacione eme R. Ako je skup F parcijalno slobodan
onda zadovoljava zahtev za ouvanjem zavisnosti i svaka od Ri, i=1,2,,k je u q-treoj
q
fazi normalnoj formi q-F3NF tako da je Ui(F), YB=Ui, a Y B u F.

Dokaz. Kao prvo, zadovoljava zahtev za ouvanjem zavisnosti. Drugo, mi dokazujemo



da je Ri u q-F3NF. Pretpostavimo suprotno. Onda X A u Ui(F) tako da A ne pripada
X, X nije q-superklju i A nije primarni klju.
Za sluaj A=B imamo da je XBYB i B ne pripada X to implicira XY. Nadalje, iz
injenice da X nije superklju, mi imamo da je X Y. A kako je skup F parcijalno
q
slobodan Y B je parcijalno slobodna fazi funkcionalna zavisnost. Meutim, za X B
q q
mora da vai q. A to znai da postoji X B u F+ koja moe da zameni Y B u F,
to je kontradiktorno injenici da je F skup sa najmanjom pokrivenou.
Napomenimo da ako skup F nije parcijalno slobodan onda se Ri(Ui) u odnosi na skup fazi

funkcionalnih zavisnosti Ui(F)| = { V W | V W u F+, VW Ui}.


Na primer, neka je R={A,B,C,D,E} i skup fazi funkciolanih zavisnosti F={CD A,

CD B, AD E, CD E, A B, B E} i >min(,). Prema teoremi 1. ={CDA,
min ,
CDB, ADE, CDE, AB, BE}. A kako F nije parcijalno slobodan zbog postojanja A E
u F+. ADE je u -F3NF u odnosu na ADE(F)|, a ne u odnosu na ADE(F).
Teorema 2. Neka je R relaciona ema, F minimalni skup fazi funkcionalnih zavisnosti za
R i K -klju za R. Onda je relaciona ema RK sa U'=K u 1-F3NF u odnosu na K(F).

Dokaz. Pretpostavimo da RK nije u 1-F3NF. Onda V B K(F) tako da B nije u V,
V nije 1-superlju za RK i B nije 1-primarni klju. Mi isto tako znamo da je VBK i
1
K K.

Meutim, vai da je K 1-klju od K (ako nije, prema definiciji za 1-klju, mora da postoji
1
Z K tako da vai Z K. Kako je K U, a imamo i da je Z U, to je kontradiktorno

96
injenici da je K -klju relacione eme R). Sa druge strane, iz VBK imamo da je B
1-primarni klju u RK to je suprotno polaznoj pretpostavci jer vai da je RK u 1-F3NF.
Sada datu relacionu emu R i K kao -klju od R moemo da dekomponujemo kao:
= RK, gde je dekompozicija koju smo dobili algoritmom kreiranom iz teoreme 1.
Napomenimo da i omoguava spajanje bez gubitka informacija, analogno prethodnom.
Definiimo sada i pravila koja emo koristi za projektovanje fazi relacije R na osnovu
poznatog skupa fazi funkcionalnih zavisnosti, a koji e da bude u q-treoj fazi normalnoj
formi:
1. Input: Fazi relacija R i skup fazi funkcionalnih zavisnosti F,
2. Output: dekompozicija fazi relacije R,
P1. Ako postoje neki atributi fazi relacije R koji nisu sadrani ni u jednoj fazi
funkcionalnoj zavisnosti u skupu F (bilo na levoj ili desnoj strani zavisnosti), onda
ovi atributi mogu formirati relaciju Ai(F) i njih eliminiemo iz fazi relacije R.
P2. Ako neka od fazi funkcionalnih zavisnosti ukljuuje sve atribute fazi relacije R
onda je ={R}.

P3. Za svaku fazi funkcionalnu zavisnosti X Y u skupu F, kreiraemo relaciju u
tako da je Ri , Ui(F), Ui=XY.

4.4. Fizika organizacija podataka

Fiziki model baze podataka odreuje kako su podaci memorisani na memoriji


raunara i kako se njima manipulie - danas najee na disku. Fiziko projektovanje je
prevoenje logikog projekta na konkretnu opremu, konkretne softvere koji ukljuuju
konkretne baze podataka. [71] Strukture podataka (razliiti tipovi datoteka), zajedno sa
metodama pristupa i obrade podataka, ustvari predstavljaju ziku organizaciju podataka.
Osnovna motivacija za izuavanje razliitih zikih organizacija je injenica da je
vreme pristupa disku mnogo vee (za etiri do pet redova veliine) nego vreme pristupa
unutranjoj memoriji. Zato izbor zike organizacije ima za cilj minimizaciju broja
pristupa disku pri radu sa podacima.
Ne postoji optimalna zika organizacija, jer se razliite zike organizacije
pokazuju manje ili vie ekasnim u razliitim aplikacijama. Zato sistemi za upravljanje
bazama podataka obino podravaju vei broj zikih organizacija, tako da se za razne
delove baza podataka mogu koristiti najpogodnije strukture i algoritmi.
Najnii nivo arhitekture sistema baza podataka je unutranji nivo. To je zika
reprezentacija (obino na disku) cele baze podataka, niskog nivoa, koja se sastoji od
velikog broja zikih slogova (ili, krae, slogova1) razliitih tipova. Fiziki slogovi su
prema svom tipu, s take gledita DBMS-a (SUBP), grupisani u datoteke koje imaju
jedinstvene identikatore.
Fiziki slog odgovara logikom slogu koji predstavlja (npr. n-torci specine
relacije), ima jedinstveni identikator i sastoji se od niza bajtova. Prvih nekoliko bajtova
sadri informaciju o tipu zikog sloga, sledeih nekoliko bajtova je rezervisano za duinu

1
Terminologija, kao i reenja pojedinih problema u ovoj oblasti bitno se razlikuju od sistema do sistema, ali
principi zike reprezentacije i pristupa podacima uglavnom su standardni.

97
sloga u bajtovima ako je tip sloga promenljive duine, a zatim slede oznake i vrednosti
zikih polja.
Zadatak DBMS-a je da zahteve koje korisnik postavlja na konceptualnom nivou nad
logikim tipovima podataka (npr. relacijama i n-torkama) preslika, na unutranjem nivou, u
zahteve nad datotekama i zikim slogovima (preslikavanje skupa relacija u skup datoteka
ne mora biti 11. Zahtevi koje DBMS moe da proizvede na unutranjem nivou su sledei:
1. Pronai ziki slog s iz datoteke d,
2. Izmeniti ziki slog s u datoteci d,
3. Dodati novi ziki slog datoteci d i dobiti njegov identikator,
4. Izbrisati ziki slog s iz datoteke d,
5. Kreirati novu datoteku d,
6. Ukloniti datoteku d.
Da bi se ovi zahtevi izvrili, DBMS u svojstvu korisnika operativnog sistema koristi
funkcionalnost komponente operativnog sistema upravljaa datotekama (engl. le
manager), a upravlja datotekama svoju funkcionalnost izgrauje koristei funkcije
komponente operativnog sistema nieg nivoa upravljaa diskom.
Upravlja diskom ima informacije o svim zikim adresama na disku, i odgovoran je
za sve zike ulazno/izlazne operacije na disku (slika 12.). Za upravlja diskom (kao i za
upravlja datotekama), struktura zikog sloga nije od interesa i on predstavlja samo niz
bajtova na specinim adresama.
Upravlja datotekama vidi disk kao skup blokova ksne veliine koji se zovu
stranice. Stranice su numerisane tako da linearno ureenje skupa stranica odgovara
njihovom zikom redosledu. Veliina stranice je obino izraena brojem bajtova, tj.
brojem znakova. Stranice su logiki grupisane u grupe stranica od kojih svaka ima svoj
redni broj (tj. identikator). Stranice (odnosno grupe stranica) su, s take gledita
upravljaa datotekama, dalje grupisane u disjunktne stranine skupove (engl. page sets).
Svaki stranini skup ima jedinstveni identikator. Jedan stranini skup moe da sadri
zike slogove jednog ili raznih tipova, odnosno moe da ukljui i zike slogove koji, sa
take gledita DBMS-a, pripadaju razliitim datotekama.

98
DBMS

Zahtev za
Nadeni fizicki slog
fizickim slogom

Upravljac
datotekama
Zahtev za Nadena stranica
stranicom
Upravljac
diskom

U/I operacije
Procitani podaci
na disku

Podaci na disku

Slika 11. Slika DBMS, upravlja datotekama i upravlja diskom [71]


Preslikavanje stranice u zike adrese na disku koje odgovaraju toj stranici, ostvaruje
upravlja diskom (slika 11.). Zato je upravlja datotekama u mogunosti da postavi
(a upravlja diskom da izvri) sledee vrste zahteva:
1. Pretraiti stranicu p iz straninog skupa st,
2. Izmeniti stranicu p u straninom skupu st,
3. Dodati novu stranicu straninom skupu st i dobiti broj te stranice, p,
4. Ukloniti stranicu p iz straninog skupa st.
Preslikavanje datoteke u stranine skupove ostvaruje upravlja datotekama. Tako se
zahtevi koji se odnose na ziki slog, a koje DBMS postavlja na unutranjem nivou ANSI
arhitekture, realizuju pozivom upravljaa tekama. On odreuje broj stranice koja sadri
traeni ziki slog i poziva upravlja diskom koji realizuje ulazno/izlazne operacije nad
podacima koji odgovaraju traenoj stranici (slika 11.).
Mada ne mora da uestvuje u upravljanju stranicama, DBMS mora da zna za
njihovo postojanje, da bi izborom odgovarajue zike reprezentacije poveao ekasnost
pristupa podacima.
Odnos izmeu naina na koje upravlja datotekama i DBMS vide podatke na disku
ilustrovan je slikom 12. Stranice sa brojem 1 i 3 (sa ove slike) pripadaju jednom
straninom skupu, a stranice sa brojem 2, 4 i sve ostale stranice drugom straninom
skupu, npr. skupu slobodnih stranica. Oznake f.k1 f.k5 odnosno f.i1 f.i10
oznaavaju zike slogove kojima su predstavljene na disku n-torke relacije K sa
vrednostima k1 k5 atributa K_SIF, odnosno n-torke relacije I sa vrednostima i1 i10
atributa I_SIF (Primer 4.1). Stranice diska (kako ih vidi upravlja datotekama) obeleene
su brojevima 1, 2, 3, 4, itd. Isti stranini skup na unutranjem nivou DBMS-a vidi se kao
dve datoteke, a na konceptualnom nivou kao dve relacije.
Mada upravlja datotekama postoji kao komponenta operativnog sistema, vei broj
DBMS-a izgrauje svoj sopstveni upravlja datotekama da bi poveao ekasnost pristupa
podacima.

99
DBMS (Konceptualni nivo):

k1 i1
i2
k2 i3
i4
k3 i5
i6
k4 i7
i8
k5 i9
i10

Relacija 1 (K) Relacija 2 (I)

DBMS (Unutranji nivo):

1 2 3 4
f.k1 f.k4

f.k5
f.k2
f.k3
Datoteka 1
1 2 3 4

f.i1
f.k1 f.i2 f.i5 f.i6
f.i3 f.i4
f.i7 f.i8
f.i9 f.i10
Datoteka 2

Upravlja datotekama: stranini skup 1

1 2 3 4
f.k1 f.k4
f.i1f.k1f.i2 f.i5 f.i6
f.i3 f.i4 f.k5
f.k2 f.i7 f.i8
f.k3 f.i9 f.i10

Slika 12. Fizika organizacija podataka

4.4.1. Fizika reprezentacija relacije

Jedna relacija moe imati ziku reprezentaciju koja se sastoji od veeg broja
datoteka (sa take gledita DBMS-a), tj. od veeg broja straninih skupova (sa take
gledita operativnog sistema). U tekstu koji sledi bie razmatrana samo zika
reprezentacija sa take gledita DBMS-a koji ukljuuje funkcije upravljaa datotekama.

100
Fizika reprezentacija jedne relacije ukljuuje, obavezno, datoteku podataka, u
oznaci DP, koja sadri zike slogove koji odgovaraju podacima koji se vide na
logikom nivou (npr. n-torkama relacije). Meutim, da bi se postigla to vea ekasnost
obrade podataka u datoteci podataka, u zavisnosti od prirode podataka i vrste obrade,
zika reprezentacija moe da ukljui i druge datoteke datoteku promena, datoteku
prekoraenja, u koje moe da se iri datoteka podataka, i datoteke koje ubrzavaju pristup
podacima u datoteci podataka i koje se zovu indeksne datoteke. Tako se, uz odgovarajue
algoritme obrade podataka, dolazi do razliitih zikih organizacija podataka
sekvencijalne, indeks-sekvencijalne, indeksne, direktne.
Ekasnost pojedine zike organizacije podataka izraava se vremenom obrade
traenog zikog sloga, a to vreme ukljuuje vreme pristupa grupi stranica, vreme pristupa
stranici unutar grupe (koja sadri traeni slog), vreme donoenja odabrane stranice sa diska
u unutranju memoriju odnosno vreme upisa stranice iz unutranje memorije na odabranu
poziciju, kao i vreme obrade sloga u unutranjoj memoriji. Vreme pristupa grupi stranica i
vreme pristupa stranici unutar grupe zavisi od karakteristika ureaja (brzina pomeranja
glave diska), i nee se uzimati u obzir pri daljem razmatranju. Zato e se vreme itanja,
odnosno upisa stranice smatrati jednakim za sve stranice na disku. Takoe, vreme obrade
stranice u unutranjoj memoriji je za nekoliko redova veliine manje od vremena itanja,
odnosno upisa stranice na disk, pa se ni ono nee uzimati u obzir. Tako e jedina mera
ekasnosti pojedine zike organizacije biti broj stranica koje je potrebno upisati, odnosno
proitati sa diska, u realizaciji upita pri toj zikoj organizaciji.
Razmotrimo sledei primer. Neka datoteka podataka sadri n slogova grupisanih u
stranice, od kojih svaka moe da primi po m slogova. Dakle, datoteka podataka sadri
(logiki, jer stranini skup koji joj odgovara moe da sadri i slogove drugog tipa) n/m
stranica. Neka je vreme itanja, odnosno upisa pojedine stranice jednako t. Pretpostavimo
da je potrebno obraditi sve slogove iz te datoteke podataka. Ako se slogovima pristupa
serijski (redom, kako su upisani), za obradu svih slogova potrebno je vreme:
(n/m) t,
tj. vreme obrade pojedinanog sloga pri ovakvom pristupu je:
((n/m) t) = t/m.
Ako postoji mogunost direktnog pristupa slogu (po nekom svojstvu tog sloga), i ako
slogovi nisu grupisani po tom svojstvu, realna je pretpostavka da se dva sloga koja se
obrauju jedan za drugim nalaze na razliitim stranicama. Tada je za obradu cele datoteke
podataka potrebno vreme:
n t,
tj. vreme obrade pojedinanog sloga pri ovakvom pristupu je:
n t / n = t.
Ovo razmatranje dovodi do zakljuka da, kada je potrebno obraditi veliki broj slogova iz
datoteke podataka, vreme obrade po slogu, pa i celokupno vreme obrade svih slogova
daleko je manje u sluaju da se slogovima pristupa sekvencijalno u zikom redosledu
stranica, nego u sluaju da je pristup stranicama slobodan (preko reda).

101
4.5. Zakljuak

U ovom poglavlju opisan je nain i pristup projektovanju relacionih i fazi relacionih


baza podataka jer projektovanje predstavlja osnovni poligon za primenu rezultata i analiza
iz oblasti funkcionalnih zavisnosti, tj. funkcionalne i fazi funkcionalne zavisnosti igraju
veoma vanu ulogu u dizajniranju baza podataka. Problemi redundancije i pojave
anomolija u bazama podataka navode nas na zakljuak da baza nije dobro projektovana.
Upravo iz tog razloga, data je kraa analiza i smernice koje obezbeuju teorijsku osnovu u
dizajniranju istih.
Pored toga, prikazana je i fizika organizacija podataka u bazi, kako bi se stvorila
jasna slika celokupnog koncepta i pristupa projektovanju.
Na cilj je da rezultate razmatranja fazi funkcionalnih zavisnosti u ovoj doktorskoj
disertaciji primenimo i implementiramo u dizajniranju baza podataka, to je i uraeno u
estom poglavlju, jer oblast vetake inteligencije, teorija fazi skupova i drugi principi
prikazani u ovom radu izuavaju se sa aspekta dizajniranja FRDBM.

102
5. Analiza fazi funkcionalnih zavisnosti u relacionim bazama podataka
5.1. Uvodna razmatranja

U ovom poglavlju predstaviemo vezu izmeu teorije fazi funkcionalnih zavisnosti


u fazi relacionim bazama podataka i koncepta fazi logike, tj. fazi implikacija. Hipoteza od
koje smo krenuli u dalja istraivanja jeste da prilikom ispitivanja fazi funkcionalnih
zavisnosti svoje mesto imaju i metode zasnovane na fragmentu fazi logike. S obzirom da
fazi logika opisuje nepreciznost ljudske percepcije odgovarajuim matematikim alatom,
ovu metodologiju moemo da iskoristimo u identifikaciji relacija izmeu podataka
skladitenih u fazi relacijama i na taj nain utvrdimo skrivene zavisnosti izmeu atributa
relacije koje nisu uoljive na prvi momenat. Skup fazi funkcionalnih zavisnosti moemo
dobiti analizom fazi baze podataka i primenom fazi implikacija to je i potvreno analizom
u ovoj doktorskoj disertaciji.
Otkrivanje potencijalnih zavisnoti izmeu atributa posmatrane fazi relacije ustvari
predstavlja pronalaenje skrivenih i korisnih znanja odnosno rudarenje podataka, koje
moemo da koristimo za donoenje upravljakih odluka. Da bismo identifikovali fazi
funkcionalne zavisnosti u odgovarajuoj fazi relaciji potrebno je:
1. Pripremiti podatke za analizu,
2. Pronai podrelacije (parove n-torki) na posmatranim atributima u kojima se
potencijalno kriju fazi funkcionalne zavisnosti,
3. Pridruiti fazi funkcionalnim zavisnostima odgovarajue fazi implikacije,
4. Interpretirati rezultate istraivanja da bismo dobili konaan skup fazi funkcionalnih
zavisnosti.
Dakle, u ovoj disertaciji uvodimo relativno novu tehniku i algoritam za raunanje
fazi funkcionalnih zavisnosti. Koliko je poznato, predloena metodologija nije pronaena u
postojeoj bibliografiji. U svakom sluaju, dostupni pristupi i koncepti su navedeni u
prethodnim poglavljima.
Pronalaenje funkcionalnih zavisnosti u relacionim bazama podataka je predmet
interesovanja rudarenje podataka, jer su one veoma informativne za donoenje
upravljakih odluka, a naroito u situacijama kada ne raspolaemo sa preciznim i
egzaktinim informacijama. U tom sluaju menaderi mogu da donose odluke i procene u
realnom vremenu na bazi lingvistikih varijabli. Da bismo ovo ilustrovali, posmatrajmo
sledei jednostavan primer: ako elimo da opiemo odnos izmeu atributa fazi relacije
Duina puteva i Finansijka sredstva fazi funkcionalnom zavisnou
0 .8
Duina puteva Finansijka sredstva (Duina puteva prilino odreuje potrebna
finansijka sredstva projekta sa stepenom jaine 0.8), onda moemo da preferiramo
pravilima kao to su ''IF Duina puteva velika THEN Finansijka sredstva su veoma
visoka''. Poznavajui ovakav skup pravila fazi rezonovanjem (aproksimativnim
zakljuivanjem) moemo da kreiramo jedinstvenu upravljaku strategiju i generiemo
adekvatne zakljuke, a defazifikacijom doemo i do konkretnih vrednosti i procena
neophodnih za donoenje odluka. Odavde zakljuujemo da fazi funkcionalne zavisnosti
moemo da koristimo i prilikom estimacije nepoznatih vrednosti atributa. Za procenu i
detektovanje ovih pravila odnosno fazi funkcionalnih zavisnosti neophodno je razviti
poseban metod koji moe da se upotrebi kao specifian alat, naroito interesantan u analizi

103
statistikih modela baza podataka, geografskih informacionih sistema, sistema za
pronalaenje informacija...

5.2. Model fazi relacione baze podataka

U ovom radu analiziraemo postojanje fazi funkcionalnih zavisnosti u fazi relaciji na


bazi relacije bliskosti i fazi relaciji na bazi mogunosti distribucije (fazi model zasnovan na
fazi skupovima). Prvi model je pogodan za opisivanje i upravljanje atributima koji
vrednost uzimaju iz diskretnih domena, dok drugi predloeni model vie odgovara situaciji
kada su vrednosti atributa iz numerikog domena. Mi elimo da razmotrimo postojanje fazi
funkcionalnih zavisnosti u oba modela kako bismo dokazali predloeni metod i
verifikovali rezultate samostalnog istraivanja.
Neka je Radnik (Ime_Prezime, Godine, Iskustvo, Produktivnost, Jezik, Pozicija,
Zarada) fazi baza podataka zasnovana na relaciji bliskosti. Domeni atributa Ime_Prezime i
Pozicija su klasini skupovi, dok su domeni atributa Godine, Iskustvo, Produktivnost, Jezik
i Zarada fazi podskupovi. Predstavljajui podatke na ovaj nain mi smo uveli odreene
nepreciznosti i neodreenosti u relacionu bazu podataka i dobili fazi relaciju. Dakle, u
prvoj predloenoj relaciji kao vrednosti atributa mogu da se pojave lingvistike varijable ili
podskupovi diskretnog domena.
Ime_Prezime Godine Iskustvo Produktivnost Jezik Pozicija Zarada
{Engleski, Sistem
IP1 {veoma mlad} {poetnik} {zadovoljavajua} {prosena}
Ruski} inenjer
{specijalista, {prosena,
IP2 {star} {dobra, odlina} {Engleski} Menader
ekspert} visoka}
{mlad,
{senior, {veoma
IP3 srednjih {dobra} {Francuski} Direktor
specijalista} visoka}
godina}
{veoma mlad, {poetnik, {mala,
IP4 {loa} {Ruski} Prodaja
mlad} senior} prosena}
{zadovoljavajua, {Engleski,
IP5 {mlad} {senior} Nabavka {visoka}
dobra} Francuski}
Tabela 35. Fazi model na bazi relacije bliskosti

Domeni atributa posmatrane fazi relacije su:


Dom (Godine) = {veoma mlad, mlad, srednjih godina, star}
Dom (Iskustvo) = {poetnik, senior, specijalista, ekspert}
Dom (Produktivnost) = {loa, zadovoljavajua, dobra, odlina}
Dom (Jezik) = {Engleski, Francuski, Ruski}
Dom (Pozicija) = {nabavka, prodaja, sistem inenjer, menader, direktor}
Dom (Zarada) = {mala, prosena, visoka, veoma visoka}
Tabela 36. prikazuje relaciju bliskosti na domenu atributa Godine.

sGodine veoma mlad mlad srednjih godina star


veoma mlad 1 0.95 0.70 0.30
mlad 1 0.90 0.40
srednjih godina 1 0.50
star 1
Tabela 36. Relacija bliskosti na domenu Godine

104
Tabela 37. ilustruje relaciju bliskosti na domenu Iskustvo.
sIskustvo poetnik senior Specijalista ekspert
poetnik 1 0.70 0.70 0.30
senior 1 0.85 0.30
specijalista 1 0.50
ekspert 1
Tabela 37. Relacija bliskosti na domenu Iskustvo

Tabela 38. ilustruje relaciju bliskosti na domenu Produktivnost.


sProduktivnost loa zadovoljavajua dobra odlina
loa 1 0.80 0.50 0.10
zadovoljavajua 1 0.70 0.50
dobra 1 0.80
odlina 1
Tabela 38. Relacija bliskosti na domenu Produktivnost

Tabela 39. ilustruje relaciju bliskosti na domenu Jezik.


sJezik Engleski Francuski Ruski
Engleski 1 0.60 0.20
Francuski 1 0.30
Ruski 1
Tabela 39. Relacija bliskosti na domenu Jezik

Tabela 40. ilustruje relaciju bliskosti na domenu Pozicija.


sPozicija sistem inenjer menader direktor prodaja nabavka
sistem inenjer 1 0.70 0.60 0.50 0.50
menader 1 0.90 0.60 0.60
direktor 1 0.70 0.70
prodaja 1 0.80
nabavka 1.00
Tabela 40. Relacija bliskosti na domenu Pozicija

Tabela 41. ilustruje relaciju bliskosti na domenu Zarada.


sZarada mala prosena visoka veoma visoka
mala 1 0.85 0.55 0.25
prosena 1 0.75 0.35
visoka 1 0.80
veoma visoka 1
Tabela 41. Relacija bliskosti na domenu Zarada

Prilikom odreivanja relacije bliskosti nad elementima posmatranih domena koriste


se ekspertska znanja, tj. moemo da ih dobijemo intervjuisanjem eksperata. Napomenimo i
to da emo zbog prirode problema i potreba daljih istraivanja usvojiti da je slinost
izmeu vrednosti atributa Ime_Prezime 0.7, tj. slinost izmeu imena i prezimena osoba u
fazi relaciji jednaka je minimalnoj jaini zavisnosti izmeu atributa relacije koju emo
koristiti prilikom ispitivanja postojanja fazi funkcionalnih zavisnosti.

105
Druga relacija u kojoj emo tragati za fazi funkcionalnim zavisnostima jeste fazi
model na bazi mogunost distribucije. Formalno, neka je Radnik (Ime_Prezime, Godine,
Iskustvo, Produktivnost, Jezik, Pozicija, Zarada) relaciona ema i r fazi relacija nad
relacijskom emom Radnik. Vrednost atributa A u n-torci ti oznaiemo sa ai, a pridrueni
stepen pripadnosti (Ati), te dobijamo ureeni par (ai, (Ati)). U ovom sluaju neto to je
lingvistiki izraz moemo da zemenimo sa fazi vrednou (fazi brojem). Na ovaj nain
moemo da fazifikujemo relacionu bazu podataka i dobijemo GEFRED model za potrebe
istraivanja i ispitivanja razliitih tema u ovoj oblasti ili da generalizujemo postojeu bazu,
kako bismo pretraivali skrivena znanja. U ovakvim situacijama, prilikom definisanja
funkcija pripadnosti fazi atributa relacije r, uvek je neophodno konslutovati se sa
ekspetima projektantima IS i koristiti softvere za fazifikaciju i simulaciju vrednosti
posmatranog atributa. Tabela 42. prikazuje fazi relaciju r na bazi mogunosti distribucije
koja e nam posluiti za dalja istraivanja i dokazivanje ekvivalentnosti izmeu fazi
implikacija i fazi funkcionalnih zavisnosti.
Ime_Prezime Godine Iskustvo Produktivnost Jezik Pozicija Zarada
IP1, 1 g1, 0.61 i1, 0.76 p2, 0.65 Engleski, 1 Sistem inenjer, 1 z2, 0.81

IP2, 1 g3, 0.21 i3, 0.46 p3, 0.79 Engleski, 1 Menader, 1 z3, 0.92

IP3, 1 g2, 0.82 i2, 0.71 p2, 0.82 Francuski, 1 Direktor, 1 z4, 0.89

IP4, 1 g2, 0.78 i1, 0.89 p1, 0.90 Ruski, 1 Prodaja, 1 z1, 0.67

IP5, 1 g1, 0.85 i2, 0.73 p3, 0.60 Francuski, 1 Nabavka, 1 z2, 0.32
Tabela 42. Fazi relacija r

U ovoj relaciji pretpostavili smo da atributi Godine, Iskustvo, Produktivnost, Jezik i


Zarada mogu da uzme neku od predefinisanih vrednosti. Na primer, vrednost atributa
Godine moe da bude g1, g2, g3 to moe da odgovara lingvistikim izrazima mlad,
srednjih godina i star, respektivno. Dakle, vrednost g2 u posmatranoj n-torci pripada fazi
skupu ''Srednjih godina'' sa stepenom pripadnosti i(g2), gde je i oznaka i-te n-torke.
Analogno tome, vrednosti z1, z2, z3, z4 mogu da pripadaju fazi skupovima ''Mala zarada'',
''Prosena zarada'', ''Visoka zarada'', ''Veoma visoka zarada'' sa odgovarajuim stepenima
pripadnosti. Atribute koji ne mogu da uzmu numeriku vrednost iz posmatranog fazi
skupa, kao to su Iskustvo i Produktivnost, moemo da skaliramo. Tako fazi skupove
''Loa produktivnost'', ''Zadovoljavajua produktivnost'' i ''Dobra produktivnost'' moemo
da predstavimo trougaonim fazi brojevima (ai,bi,ci), gde Produktivnost predstavljamo i
ocenjujemo na skali od 1 do 10. Isto vai i za atribut Iskustvo, a to znai da vrednosti
atributa pripadaju nekom od fazi skupova ''Nedovoljno iskusan'', ''Srednje iskusan'' i
''Veoma iskusan''. Atributi Ime_Prezime, Jezik i Pozicija sadre crisp informacije, a da
bismo napravili ekvivalenciju sa fazi skupovima pisaemo da je stepen pripadnosti kojom
odgovarajua vrednost pripada nekom od ovih atributa jednaka 1. Predstavljajui podatke
na ovaj nain moemo da uspostavimo vezu izmeu dva predloena modela, a koji model
emo da istraujemo i ispitujemo zavisi od naih potreba i prirode problema, te dostupnosti
podataka koje prikupljamo i ekspertskih znanja za procenu lingvistikih i neodreenih
izraza. Ta znanja ustvari nam omoguavaju definisanje odgovarajuih funkcija pripadnosti.
Na sledeim slikama prikazani su primeri funkcija pripadnosti za atribute Godine i
Produktivnost, koje moemo da definiemo i koristimo za potrebe odreivanja stepena
pripadnosti pojedinih vrednosti atributa. Za ovakvu predstavu atributa fazi relacije
neophodna su i odgovarajua ekspertska znanja, koja moemo da dobijemo od strunjaka
iz ove oblasti.

106
Mlad Srednjih godina Star
1

0 25 30 40 45 80 Godine

Slika 13. Primer funkcije pripadnosti za atribut Godine

Loa ZadovoljavajuaDobra
1

0 10 Produktivnost

Slika 14. Primer funkcije pripadnosti za atribut Produktivnost

Meutim, da bismo pristupili problemu utvrivanja fazi funkcionalnih zavisnosti,


nama je neophodno da poznajemo stepen slinosti izmeu odgovarajuih fazi vrednosti. Iz
tog razloga uvodimo fazi relaciju bliskosti na posmatranim atributima, u oznaci sAi. Za ovu
relaciju pretpostavljamo da ima osobine simetrinost i refleksivnosti i kao takvu usvajamo
je za vrednost koja predstavlja stepen sa kojom se n-torke t1 i t2 slau na atributu Ai. Po
ovom osnovu mi definiemo fazi funkcionalne zavisnosti. U sledeim tabelema prikazane
su fazi relacije bliskosti za atribute Godine, Iskustvo, Produktivnost i Zarada.
sGodine g1 g2 g3
g1 1 0.70 0.30
g2 1 0.50
g3 1
Tabela 43. Fazi relacija bliskosti za domen Godine

SIskustvo i1 i2 i3
i1 1 0.80 0.40
i2 1 0.60
i3 1
Tabela 44. Fazi relacija bliskosti za domen Iskustvo

SProduktivnost p1 p2 p3
p1 1 0.75 0.45
p2 1 0.65
p3 1
Tabela 45. Fazi relacija bliskosti za domen Produktivnost

107
sZarada z1 z2 z3 z4
z1 1 0.95 0.55 0.25
z2 1 0.90 0.45
z3 1 0.90
z4 1
Tabela 46. Fazi relacija bliskosti za domen Zarada

Ova dva pristupa predstavljaju razliite okvire za predstavljanje fazi podataka, o


kojima je bilo rei u prethodnim poglavljima. Fazi relacije (Tabela 35. i Tabela 42.)
posluie nam za dokazivanje polazne hipoteze doktorske disertacije. Meutim, na
predloenim relacijama moemo da istraujemo i druge teme iz oblasti teorije fazi
relacionih baza podataka, kao to su projektovanje i dizajn baze, postojanje redundantnih
podataka, dekompozicija bez gubitka zavisnosti, primena Armstrongovih aksioma, procena
NULL vrednosti, a o emu smo takoe pisali u prethodnim poglavljima ovog rada. Fokus
istraivanja stavili smo na utvrivanje postojanja zavisnosti izmeu atributa datih relacija,
te utvrivanje jaine (stepana) zavisnosti primenom fazi implikacija, ime smo predstavili
novi pristup u izvoenju fazi funkcionalnih zavisnosti i obezbedili teorijsku osnovu za
primenu teorije normalizacije u fazi relacionim bazama podataka koja je opisana u
etvrtom poglavlju ovog rada.

5.3. Pretraga fazi funkcionalnih zavisnosti u FRDBMs



Polazei od definicije fazi funkcionalnih zavisnosti, ideja je da, poto X Y
moemo da posmatramo kao pravilo koje se odnosi na bliskost vrednosti atributa na
odgovarajuem paru n-torki titj, interpretiramo koncept u kojem moemo da otkrivamo
mogue odnose izmeu atributa datih relacija. Dakle, zamisao je da identifikujemo
podrelacije (parove n-torki) na posmatranim atributima u kojima se potencijalno kriju fazi
funkcionalne zavisnosti jer na taj nain dolazimo do prethodno nepoznatih i potencijalno
korisnih saznanja iz same baze. Podrelacija titj se moe upotrebiti za analizu podataka u
datim fazi relacijama koristei tumaenje Berzala i ostalih. Shodno tome, mogue relacije
izmeu vrednosti atributa iskoristiemo za detektovanje fazi funkcionalnih zavisnosti nad
posmatranim skupom atributa, a za postizanje tog cilja iskoristiemo mogunosti fazi
logike.
Za potrebe istraivanja u ovoj doktorskoj disertaciji modifikovali smo relaciju Tr kao
T-skup transakcija, i to na sledei nain:
- | Tr | = |r r|, gde je r posmatrana fazi relacija.
- Za svaki atribut Ai r, raunamo stepen saglasnosti izmeu svih parova n-torki
C(Ai[ti,tj]).
- Tr predstavlja relaciju ije su kolone C(Ai[ti,tj]), a redovi n-torke titj tako da vredi:
ti, tj r, ij par n-torki (titj) r r, tj. titj Tr,
C(Ai[ti,tj]) [0,1].
- k predstavlja kritinu jainu zavisnosti koja predstavlja parametar za detektovanje
zavisnosti izmeu n-torki posmatrane relacije. k je realan broj iz [0,1], tj. k
[0,1].

108
U tabeli 47. prikazana je relacija Tr prema prethodnim interpretacijama.
= k C(Ai[ti,tj]) C(Aj[ti,tj]) C(Ak[ti,tj])
t1t2 C(Ai[t1t2]) C(Aj[t1t2]) C(Ak[t1t2])

t1t3 C(Ai[t1t3]) C(Aj[t1t3]) C(Ak[t1t3])

t1t4 C(Ai[t1t4]) C(Aj[t1t4]) C(Ak[t1t4])

t1t5 C(Ai[t1t5]) C(Aj[t1t5]) C(Ak[t1t5])

t2t3 C(Ai[t2t3]) C(Aj[t2t3]) C(Ak[t2t3])

t2t4 C(Ai[t2t4]) C(Aj[t2t4]) C(Ak[t2t4])

t2t5 C(Ai[t2t5]) C(Aj[t2t5]) C(Ak[t2t5])

t3t4 C(Ai[t3t4]) C(Aj[t3t4]) C(Ak[t3t4])

t3t5 C(Ai[t3t5]) C(Aj[t3t5]) C(Ak[t3t5])

t4t5 C(Ai[t4t5]) C(Aj[t4t5]) C(Ak[t4t5])


Tabela 47. Relacija Tr dobijena iz fazi relacije r

Za procenu zavisnosti primenjujemo definiciju saglasnosti (conformance) C(Ai[ti,tj])


na paru n-torki (podrelaciji r(R) date relacijske eme). U fazi relacionom modelu na bazi
relacije bliskosti C(Ai[ti,tj]) raunamo po sledeoj formuli:


C (A i [t i , t j ]) = min min max{s(x, y)}, min max{s(x, y)},
xdi yd j xd j ydi

gde je di vrednost atributa Ai za n - torku ti, dj je vrednost atributa Ai za n - torku tj, s(x,y)
je relacija bliskosti za vrednosti x i y i s je preslikavanje svakog para elemenata iz domena
Di u interval [0,1], tj. relacija bliskosti na domenu Di.
U fazi relacionom modelu na bazi mogunosti distribucije C(Ai[ti,tj]) raunamo
prema sledeem:
C(Ai[ti,tj]) = min (ti(Ai), tj(Ai), s(ti(Ai), tj(Ai)),
gde je ti(Ai) stepen pripadnosti vrednosti atributa Ai n-torci ti, tj(Ai) stepen pripadnosti
vrednosti atributa Ai n-torci tj, a s(ti(Ai), tj(Ai)) fazi relacija bliskosti na domenu Di.
Ako je = k, tada moemo da formiramo tabelu (tabela 48.) u kojoj sa
oznaavamo da je C(Ai[ti,tj]) k, tj. stepen bliskosti posmatranih n-torki na atributu Ai je
vei od kritine jaine zavisnosti. Oznaimo dalje sa situaciju kada je stepen saglasnosti
za dve n-torke na posmatranom atributu Ai manji od k, C(Ai[ti,tj]) < k. Na ovaj nain
moemo preciznije da sagledamo i uoimo potencijalne zavisnosti izmeu podataka u fazi
relaciji, ali za odreivanje i raunanje paramtera mi moramo da korisitmo predloeni
algoritam baziran na fazi operatorima implikacije. Za povezivanje tj.agregaciju parova n-
torki u kojima postoje uoene zavisnosti koristi se minimum t-norma.
Interesantna stvar je i ideja da merimo procenat n-torki u kojima se fazi funkcionalna
zavisnost pojavljuje. Sledei pristup u ovom radu, mi otkrivamo fazi funkcionalne
zavisnosti, ali i uvodimo metriku pomou koje odreujemo proporciju n-torki P u fazi
relaciji gde su fazi funkcionalne zavisnosti sadrane.

109
Formalno, mi dobijamo parametar P na sledei nain:
C
P=
C uk

gde je C broj podrelacija u kojima postoji posmatrana fazi funkcionalna zavisnost X Y,
a Cuk ukupan broj parova n-torki relacije Tr. Cuk raunamo po sledeoj formuli:
n!
Cuk =
k! (n - k)!
gde je n broj redova (n-torki) fazi relacije, a k=2 s obzirom da se radi o parovima
n-tolanog skupa.

= k C(Ai[ti,tj]) C(Aj[ti,tj]) C(Ak[ti,tj])


t1t2 \ \ \

t1t3 \ \ \

t1t4 \ \ \

t1t5 \ \ \

t2t3 \ \ \

t2t4 \ \ \

t2t5 \ \ \

t3t4 \ \ \

t3t5 \ \ \

t4t5 \ \ \
Tabela 48. True i False vrednosti za C(Ai[ti,tj]) > k

5.4. Uloga fazi logike u ispitivanju fazi funkcionalnih zavisnosti

U klasinim relacionim bazama podataka funkcionalna zavisnost XY se


predstavlja klasinom implikacijom Ic. Dakle, u klasinoj logici pravilo IF X THEN Y
piemo u obliku XY. ''X povlai Y'', u naem sluaju, znai da jednakim X-vrednostima
odgovaraju jednake Y-vrednosti. Potpuna interpretacija ove operacije ukazuje na to da je Y
bar toliko tano koliko je tano X odnosno:
XY je tano (X) (Y)
1, if t(X) t ' (X) then t(Y) t ' (Y)
XY=
0, ostalo
Meutim, u fazi relacionim bazama podataka gde u sutini vrednosti atributa ne
moraju da budu pojedinani elementi domena, ve i podskupovi osnovnog skupa ili
mogunost distribucije, stepen funkcionalne zavisnosti ne mora implicitno da bude jednak
1 kao u crisp sluajevima. Prirodno, moe da se oekuje da to bude vrednost iz intervala
[0,1]. Zbog toga definiciju funkcionalnih zavisnoti generalizujemo i dobijamo fazi
funkcionalne zavisnosti FFD. U tom sluaju umesto klasine implikacije, FFD
predstavljamo fazi implikacijom, a relaciju jednakosti zamenjujemo relacijom bliskosti.

110
Fazi implikacija je tada proirenje klasine implikacije XY na domenu {0,1}. Dakle,
''IF-THEN'' pravilo u sluaju fazi funkcionalnih zavisnosti predstavljamo fazi implikacijom

If i piemo X Y, tj. min If (t(X)=ct'(X), t(Y)=ct'(Y)) , t,t' r,
gde je [0,1] =C [0,1] [0,1] [0,1] mera bliskosti i I: [0,1] [0,1] [0,1] je fazi
operator implikacije. Prema tome, funkcionalnim zavisnostima pridruujemo odgovarajuu
implikaciju I, kao to je navedeno:


I c, if t(X) t (X) then t(Y) t (Y)
' '

I=
I f, if t(X) t (X) then t(Y) t (Y)

' '

U ovoj doktorskoj disertaciji na cilj je da iskoristimo fazi implikacije i postavimo


teorijske osnove algoritma za pronalaenje fazi funkcionalnih zavisnosti. Ovde emo
odgovarajuim FFD pridruiti fazi implikacije i ispitivati postojanje zavisnosti, tj. umesto
fazi zavisnosti posmatraemo fazi implikacije. Dalji na cilj jeste da ova teorijska
razmatranja implementiramo na predloenim modelima fazi relacija, a nadalje da
iskoristimo dobijene rezultate za potrebe projektovanja i dizajniranja fazi baze podataka.

5.5. Karakterizacija fazi implikacija u fazi modelima baza podataka

Osnovni doprinos doktorskog rada je analiza fazi implikacija u smislu njihovog


ponaanja u bilo kom modelu fazi relacionih baza podataka. Mi razmatramo pod kojim
uslovima ovi fazi operatori imaju smisao iz inenjerske perspektive da se primenjuju u
analizi fazi funkcionalnih zavisnosti. Sa nae take gledita postoje faze implikacije koje
zadovoljajavaju kriterijume prihvatanja u problemima ispitivanja i identifikovanja
zavisnosti izmeu podataka. Sa druge strane, fazi operatori kao to su Lukasiewicz-eva i
Gdel-ova implikacija, ne mogu da se koriste u ovim konotacijama. Mi elimo da
okarakteriemo pravilno korienje implikacija u analizi fazi funkcionlanih zavisnosti u
datim fazi relacijama. Tragajui za osnovnim svojstvima fazi implikacija u kontekstu
njihove primene u raznim aplikacijama, za prihvatljive se smatraju one koje verifikuju
osobine interpretirane u ovom radu.
Mi moemo da razmatramo ponaanje razliitih fazi implikacija u analizi fazi
funkcionalnih zavisnosti. Fazi implikacije koje su odabrane za analizu i upotrebu u ovoj
doktorskoj disertaciji prikazane su u tabeli 49.

Fazi implikacija Korespodentna formula za X Y

Mamdani IMM=min(x,y)

Lukasiewicz IL=min(1,1-x+y)

Kleene-Diense IKL=max(1-x,y)

Early-Zade IEA=max(1-x,min(x,y))

Willmot Iw=min[max(1-x,y),max(x,1-x),max(y,1-y)]

Tabela 49. Fazi implikacije

111
Cilj doktorskog rada i sprovedenog istraivanja je da pokaemo da ovaj pristup, za
odgovarajue fazi implikacije, daje eljene rezultate kada je u pitanju procena jaine
zavisnosti izmeu podataka, tj. odreivanje jaine fazi funkcionalnih zavisnosti. Ova
studija daje nam odgovore na neka kritina pitanja kada koristimo koncept fazi logike u
razvoju sistema zasnovanih na znanju. U ovom poglavlju uspostavili smo vezu izmeu IF-
THEN operatora, tj. fazi implikacija i posmatranih relacija u kontekstu ispitivanja
zavisnosti izmeu podataka relacije. Efikasnost predloenog pristupa analiziraemo kroz
izlazni skup fazi funkcionalnih zavisnosti. Istu metodologiju primeniemo i na problem
dizajniranja fazi relacije.
Fazi implikacije imaju niz atraktivnih karateristika koje nam omoguavaju da
dokaemo poetnu hipotezu istraivanja. Prvo, pogodne su za primenu u fazi relacijama jer
je mogue izraziti jainu zavisnosti izmeu posmatranih atributa stvarnom realnom
vrednou. Drugo, fazi implikacije obezbeuju prirodni okvir koji inkorporira IF-THEN
pravila neophodna za razvoj novih tehnika pretraivanja znanja.
Prvi korak koji je neophodno sprovesti da bi se uspeno realizovalo istraivanje jeste
preciziranje metoda logikog objanjena. Dakle, neophodno je definisati kriterijume prema
kojima e fazi implikacije biti zadovoljive u kontekstu ispitivanja fazi funkcionalnih
zavisnosti u fazi bazama podataka. U bogatoj literaturi iz fazi logike, predloen je veliki
broj fazi implikacija. Na doprinos u ovom radu ogleda se u interpretaciji operatora
implikacije pomou kojih moemo da razvijemo efikasan algoritam za identifikovanje
zavisnosti izmeu podataka i otkrivanje novih znanja. Na osnovu predloene analize
projektanti mogu direktno da izaberu implikacije koje e koristi u svom radu.

Neka je X Y fazi funkcionalna zavisnost. Pridruiemo ovoj zavisnosti
Mamdanijevu implikaciju IMM=min(x,y). Da bismo proverili da li Mamdanijevu
implikaciju moemo da primenimo u validaciji ove zavisnosti iskoristiemo nauna
saznanja i definicije prezentovane u prethodnim poglavljima ovog rada, a to su:
- Saglasnost atributa X za n-torke ti i tj, C(X[ti,tj]):
Fazi model na bazi relacije bliskosti:


C (X[t i , t j ]) = min min max{s(x, y)}, min max{s(x, y)},
xd i yd j xd j yd i
Fazi model na bazi mogunosti distribucije:
C(X[ti,tj]) = min (ti(Ai), tj(Ai), s(ti(Ai), tj(Ai)),
- Saglasnost atributa Y za n-torke ti i tj, C(Y[ti,tj]):
Fazi model na bazi relacije bliskosti:

C (Y[t i , t j ]) = min min max{s(x, y)}, min max{s(x, y)},
xd i yd j xd j yd i
Fazi model na bazi mogunosti distribucije:
C(Y[ti,tj]) = min (ti(Ai), tj(Ai), s(ti(Ai), tj(Ai)),

- Definicija za fazi funkcionalnu zavisnosti X Y (Szat i Yazici):
C(Y[ti,tj]) min (, C(X[ti,tj]))

112

a) Odreivanje jaine () fazi funkcionalne zavisnosti X Y primenom Mamdani-ijeve
implikacije IMM iz fazi logike:

Pretpostavimo da vai fazi funkcionalna zavisnost X Y, gde su X i Y atributi fazi
relacije r(R), a jaina zavisnosti, [0,1].
Zbog pretpostavke da vredi fazi funkcionalna zavisnost imamo:
C(Y[ti,tj]) min (, C(X[ti,tj]))
U ovom sluaju parametar odrediemo primenom Mamdani-ijeve implikacije:
IMM=min(x,y), x,y [0,1].
Da bi pridruena fazi implikacija bila zadovoljiva mora da vai:
min(x,y) k
gde je k kritina jaina zavisnosti, k [0,1], k i k 0.5.

Kako smo ovde konstatovali da emo koristiti saglasnost n-torki nad posmatatranim
atributima, na osnovu prethodnog sledi:
x= C(X[ti,tj]) k,
y= C(Y[ti,tj]) k,
A zbog pretpostavke da vredi fazi funkcionalna zavisnost, imamo:
C(Y[ti,tj]) C(X[ti,tj]) k
Na ovaj nain smo verifikovali ekvivalentnost izmeu Mamdani-ijeve implikacije i fazi

funkcionalne zavisnosti X Y. Prema tome, jaina fazi funkcionalne zavisnosti
jednaka je:

p q, ako je C(X[t i , t j ]) C(Y[t i , t j ]) 0.5



=
p, ako je C(Y[t i , t j ]) X(Y[t i , t j ]) 0.5

gde je sa p i q oznaeno: p=x=C(X[ti,tj]) i q=y=C(Y[ti,tj]).



b) Odreivanje jaine () fazi funkcionalne zavisnosti X Y primenom Lukasiewicz-
eve implikacije IL iz fazi logike:

Pretpostavimo, kao i u prethodnom sluaju, da vai fazi funkcionalna zavisnost X Y,
gde su X i Y atributi fazi relacije r(R), a jaina zavisnosti, [0,1].
Zbog pretpostavke da vredi fazi funkcionalna zavisnost imamo:
C(Y[ti,tj]) min (, C(X[ti,tj]))
U ovom sluaju parametar pokuaemo da odredimo primenom Lukasiewicz-eve
implikacije:
IL=min(1,1-x+y), x,y [0,1]

113
Kako vredi fazi funkcionalna zavisnost, mora da bude zadovoljeno:
min(1,1-x+y) k
k je kritina jaina zavisnosti. Da bismo izmeu dva atributa konstatovali postojanje
zavisnosti, ova vrednost mora biti vea od 0.5. Kako vredi da je:
C(Y[ti,tj]) C(X[ti,tj]) 0.5
iz ovoga sledi da je:
1-x+y1,
tada mora biti:
min(1,1-x+y) 1.
Prema tome, jaina fazi funkcionalne zavisnosti , u najboljem sluaju, iznosi 1. S obzirom
da je za vrednost =1 re o klasinoj funkcionalnoj zavisnosti, konstatujemo da je
Lukasiewicz-evu fazi implikaciju nije mogue primeniti u analizi fazi funkcionalnih
zavisnosti u fazi relacionim bazama podataka.

c) Odreivanje jaine () fazi funkcionalne zavisnosti X Y primenom Kleene-Diense
implikacije IKL iz fazi logike:

Dokaimo sada ekvivalentnost fazi funkcionalne zavisnosti X Y sa Kleene-Diense-
ovom implikacijom u fazi logici. U ovom sluaju koristiemo isti metod kao u analizi
prethodnih tvrdnji.

Pretpostavimo da vai fazi funkcionalna zavisnost X Y, gde su X i Y atributi fazi
relacije r(R), a jaina zavisnosti, [0,1].
Zbog ove pretpostavke vai da je:
C(Y[ti,tj]) min (, C(X[ti,tj]))
Vrednost parametra u ovom primeru izraunaemo koristei Kleene-Diense implikaciju:
IKL=max(1-x,y), x,y [0,1]
U klasinoj Bulovoj logici implikacija X Y pie se u obliku:
X Y= X Y
Kleene-Diense implikacija proiruje klasinu implikaciju i izvodi se iz prethodne relacije.
Kada se zameni operator sa max operatorom, a za negaciju se primeni definicija negacije
u fazi logici, dobije se ova poznata fazi implikacija. Ve ova injenica nas navodi na
ekvivalentnost fazi funkcionalnih zavisnosti i Kleene-Diense fazi implikacije, a to
dokazujemo sledeom interpretacijom.
Kako vredi fazi funkcionalna zavisnost, mora da bude zadovoljeno:
max(1-x,y) k
gde je k kritina jaina zavisnosti, k [0,1], k i k0.5.
Da bi prethodna nejednakost vaila, mora da bude zadovoljeno:
1-x k, tj. 1-C(X[ti,tj]) k i
y k, tj. C(Y[ti,tj]) k.

114
Kako zbog nae pretpostavke da vredi fazi funkcionalna zavisnost imamo da je:
C(Y[ti,tj]) C(X[ti,tj]) k
iz prethodnog zakljuujemo da vai:
1- C(X[ti,tj]) C(Y[ti,tj]).
Oznaimo sa p i q: p=x=C(X[ti,tj]) i q=y=C(Y[ti,tj]).
Tada vai da je :

p q, ako je C(X[t i , t j ]) C(Y[t i , t j ]) 0.5



=
q, ako je C(Y[t i , t j ]) X(Y[t i , t j ]) 0.5

Zakljuujemo, dakle, da i Kleene-Diense implikacija moe da se koristi u analizi fazi


funkcionalnih zavisnosti, to emo i koristi u fazi relacijama u ovom radu.

d) Odreivanje jaine () fazi funkcionalne zavisnosti X Y primenom Early-Zade
implikacije IEA iz fazi logike:
U daljim istraivanjima proiriemo analizu i na Early-Zade fazi implikaciju, tj. ispitaemo
ponaanje ovog operatora u situacijama ispitivanja zavisnosti izmeu podataka u fazi
bazama podataka.
Kao i u prethodnim sluajevima, pretpostavimo da vai fazi funkcionalna zavisnost

X Y, gde su X i Y atributi fazi relacije r(R), a jaina zavisnosti, [0,1].
Otuda proizilazi da je:
C(Y[ti,tj]) min (, C(X[ti,tj]))
U ovom sluaju iskoristiemo Early-Zade fazi implikaciju za izraunavanje jaine
zavisnosti izmeu atributa X i Y:
IEA=max(1-x,min(x,y)), x,y [0,1]
Kako je u klasinoj logici implikacija X Y ekvivalentna i sa:
X Y= (X Y) X
primenjujui definicije iz fazi logike dobija se Early-Zade implikacija.
Dokaimo sada primenljivost IEA u interpretaciji jaine zavisnosti . Zbog pretpostavke o
postojanju fazi funkcionalne zavisnosti, mora da vai:
max(1-x,min(x,y)) k
gde je k kritina jaina zavisnosti, k [0,1], k i k0.5.
Da bi prethodna nejednakost vaila, mora da bude zadovoljeno:
1-x k, tj. 1- C(X[ti,tj]) k i
min(x,y) k, tj. min(C(X[ti,tj]),C(Y[ti,tj]) k.
Kako zbog nae pretpostavke da vredi fazi funkcionalna zavisnost imamo da je:
C(Y[ti,tj]) C(X[ti,tj]) k
iz prethodnog zakljuujemo da vai:
1-C(X[ti,tj]) C(Y[ti,tj])

115
Oznaimo sa p i q: p=x=C(X[ti,tj]) i q=y=C(Y[ti,tj]).
Tada vai da je :

p q, ako je C(X[t i , t j ]) C(Y[t i , t j ]) 0.5



=
p, ako je C(Y[t i , t j ]) X(Y[t i , t j ]) 0.5

Da ovaj odnos izmeu fazi implikacija i fazi funkcionaalnih zavisnosti nije sluajan,
dokazuje i Early-Zade fazi implikacija. Na osnovu parametra zakljuujemo da je
kalkulacija jaine zavisnosti izmeu posmatranih atributa u sluaju primene Kleene-
Diense i Early-Zade fazi implikacije nije identina.

e) Odreivanje jaine () fazi funkcionalne zavisnosti X Y primenom Willmot-ove
implikacije IW iz fazi logike:
Kao i u prethodnim sluajevima pokazaemo ekvivalentnost izmeu fazi funkcionalnih
zavisnosti i fazi implikacije po Willmotu koristei isti princip i metod zakljuivanja.

Krenimo od pretpostavke da vredi fazi funkcionalna zavisnost X Y, gde su X i Y
atributi fazi relacije r(R), a jaina zavisnosti, [0,1].
Zbog toga vai da je:
C(Y[ti,tj]) min (, C(X[ti,tj]))
Jainu zavisnosti izmeu atributa X i Y odrediemo koristei fazi implikaciju po
Willmotu:
IW= min[max(1-x,y),max(x,1-x),max(y,1-y)], x,y [0,1]
Kako smo na poetku pretpostavili da izmeu atributa X i Y postoji fazi funkcionalna
zavisnost, zakljuujemo da za pridruenu fazi implikaciju IW vai IW k, tj.:
min[max(1-x,y),max(x,1-x),max(y,1-y)]k
gde je k kritina jaina zavisnosti, k [0,1], k i k0.5.
Da bi ova nejednakost bila zadovoljena, mora biti:
max(1-x,y) k max(x,1-x) k max(y,1-y) k tj.
max(1-C(X[ti,tj]), C(Y[ti,tj])) k i
max(C(X[ti,tj]),1-C(X[ti,tj])) k i
max(C(Y[ti,tj]),1-C(Y[ti,tj])) k
Kako zbog nae pretpostavke da vredi fazi funkcionalna zavisnost imamo da je:
C(Y[ti,tj]) C(X[ti,tj]) k
iz prethodnog zakljuujemo da vai:
1-C(X[ti,tj]) C(Y[ti,tj]) i
1-C(X[ti,tj]) C(X[ti,tj]) i
1-C(Y[ti,tj]) C(Y[ti,tj])
Oznaimo sa p i q: p=x=C(X[ti,tj]) i q=y=C(Y[ti,tj])

116
Tada vai da je :

p q, ako je C(X[t i , t j ]) C(Y[t i , t j ]) 0.5



=
p, ako je C(Y[t i , t j ]) X(Y[t i , t j ]) 0.5

Karakterizacija operatora implikacije na prezentovani nain prua nam mogunost


njihove verifikacije u kontekstu analize fazi funkcionalnih zavisnosti. Ovaj metod logikog
objanjenja determinie kriterijume koje moramo da uzmemo u obzir kada primenjujemo
ovaj fragment fazi logike u fazi relacionim bazama podataka. Neke tipove fazi implikacija
primeniemo u predloenom algoritmu da bismo doli do novih znanja i procene jaine
zavisnosti . Implementacijom prethodnih saznanja dokazaemo postojanje fazi
funkcionalnih zavisnosti u fazi relacijama i na taj nain automatizovati izvoenje skrivenih
zavisnosti.

5.6. Izbor fazi implikacije u algoritmu za identifikovanje fazi funkcionalnih zavisnosti

Fazi logika se iroko primenjuju u realnim aplikacijama, o emu moe da se nae


veliki broj radova u bogatoj literaturi iz ove oblasti. Najvea praktina primena ostvarena
je u industrijskim reenjima i fazi sistemima za upravljanje i kontrolu. U ovoj doktorskoj
disertaciji predstavljena je jedna nova perspektiva u smislu primene koncepta fazi
implikacija u relacionim bazama podataka. Ovaj novi pristup pojanjava osnov algoritma
koji koristimo u identifikovanju fazi funkcionalnih zavisnosti i otvara nove ideje u danas
veoma aktuelnoj i izazovnoj oblastima istraivanja istraivanju podataka i sistemima
zasnovanim na znanju. Veliki broj informacionih sistema koristi relacione baze podataka.
Ova injenica navodi nas na zakljuak da ovaj koncept ima perspektivu, a fazi logika se jo
jednom pokazala kao moan alat u analizi podataka.
U prethodnim razmatranjima prikazali smo na koji nain moemo da okarakteriemo
pravilnu upotrebu fazi implikacija u fazi relacijama. Stoga se postavlja logino pitanje:
Koju od ovih fazi implikacija emo koristi u konkretnoj aplikaciji ili bazi podataka?
Razliiti projektanti informacionih sistema razliito interpretiraju znanja i zavisnosti koji
se identifikuju u posmatranom modelu. U analizi literature ustanovilo smo da je selekcija i
izbor optimalnog operatora fazi implikacije jedan od fundamentalnih problema u dizajnu
fazi sistema. Ova tematika je diskutovana od strane velikog broja autora (Bendler, Kendel,
Mizimuto, Fukami i dr.).
U istraivanju sprovedenom u ovom doktorskom radu dokazano je da samo neke fazi
implikacije mogu da se primenjuju, dok druge nisu pogodne u analizi fazi funkcionalnih
zavisnosti pod odreenim kriterijumima. Kod primene fazi implikacija u fazi modelima
baza podataka kljuna uloga je na projektantima informacionih sistema. Proces
identifikovanja zavisnosti izmeu podataka blizak je aproksimativnom razmiljanju.
Dizajner baze podataka svoje preferencije najbolje opisuje izborom odgovarajue fazi
implikacije. Primena konkretne fazi implikacije u prvom redu zavisi od prirode problema
koji elimo da prikaemo u formi baze podataka, a u drugom redu od procene, elje i
zahteva projektanta baze podataka. Izlazni skup fazi funkcionalnih zavisnosti se razlikuje
po tome koji fazi operatori se primenjuju u algoritmu. Prema tome, model fazi baze
podataka nije isti u sluaju primene Mamdani-ijeve i Kleene-Diense fazi implikacije.
Dakle, u sluaju primene fazi implikacija u razliitim bazama podataka, od izbora i
procena projektanta zavisi koji emo operator koristiti. Tu pre svega mislimo na ekspertska
znanja koja oni poseduju, jer oni jasno mogu da preciziraju kakvo reenje i u kakvom
obliku ele da imaju. Time projektanti dobijaju slobodu u modeliranju relacija jer imaju
pregled celokupnog procesa izvoenja fazi funkcionalnih zavisnosti i ukoliko im neki

117
rezultati izvoenja ne odgovaraju, mogu da ih modifikuju. Zbog toga je donosiocima
odluka i analitiarima potrebna asistencija projektanata, pre svega radi pripreme ulaznih
podataka u format pogodan za zakljuivanje. Svaka otkrivena i identifikovana zavisnost
odgovara IF-THEN pravilima. Na taj nain reenja dobijena primenom predloenog
algoritma prikazujemo u upotrebljivoj formi za krajnjeg korisnika. Naravno, projektanti
informacionih sistema mogu da koriste i vei broj fazi implikacija koje zadovoljavaju
kriterijume analize fazi funkcionalnih zavisnosti. U tom sluaju oni e izabrati onaj izlazni
skup zavisnosti i onaj model koji odgovara poetnim ciljevima i zahtevima projektovanja
baze podataka, jer fazi implikacije odreuju stepen zadovoljenja zakljuka.
Mamdanijeva aplikacija je najee koriena implikacija u fazi sistemima. Tu
injenicu emo zadrati i kada je re o primeni ovog koncepta fazi logike i u razliitim
modelima baza podataka. Razlog tome je to su fazi funkcionalne zavisnosti predstavljene
IF-THEN pravilima za koje je poznato da su lokalnog tipa. Ako kaemo da ''Visoka
inteligencija znaajno odreuje uspeh u studiranju'' sa jainom zavisnosti 0.9, to znai da
smo analizom baze podataka doli do takvog zakljuka. Ali to ne podrazumeva i druge
interpretacije skrivenih znanja koje postoje izmeu atributa relacije Inteligencija i Uspeh.
Druge prednosti korienja Mamdanijeve fazi implikacije u analizi fazi
funkcionalnih zavisnosti u relacionim bazama podataka:
- intuitivan operator,
- ima iroku primenu u aplikativnim reenjima gde se izlaz predstavlja fazi
pravilima,
- algoritamska efikasnost,
- raunarska efikasnost,
- jednostavnija za korienje,
- izlazni rezultati su prikazani u upotrebljivom obliku.
Da bismo uporedili ponaanje razliitih fazi implikacija, mi emo uraditi
komparativnu analizu na izabranom fazi modelu baze podataka, a o emu e biti rei u
narednim poglavljima doktorske disertacije.

5.7. Model algoritma za pronalaenje fazi funkcionalnih zavisnosti

Model algoritma za pronalaenje fazi funkcionalnih zavisnosti predstavljen u ovoj


doktorskoj disertaciji sadri 5 modula/komponenti:
1. Fazi relaciju,
2. Tr relaciju,
3. Fazi implikacioni procesor,
4. IF-THEN dijalog komponentu i
5. Korisnika/Menadera.

118
Fazi relacioni model
baze podataka

Tr model
C[Ai(ti,tj)]

Fazi implikacioni procesor

Fazi Def.
k
logika FFD

IF-THEN
komponenta
Jezik za
prikazivanje

Korisnik

Slika 15. Model za pronalaenje fazi funkcionalnih zavisnosti u fazi relacijama

Na slici 15. prikazana je arhitektura modela i koraci u procesu pronalaenja fazi


funkcionalnih zavisnosti. Fazi relacija sadri podatke o zaposlenim radnicima u jednoj
kompaniji. Na osnovu fazi baze podataka mi smo definisali Tr relaciju u kojoj smo
izraunali usaglaenost n-torki na svim atributima prvobitne baze. Ovako struktuirani
podaci se koriste u fazi implikacionom procesoru za utvrivanje potencijalnih zavisnosti
unutar skupa atributa. To je ujedno i bazina komponenta modela. IF-THEN dijalog
komponenta je predviena za translaciju informacija dobijenih u treem koraku u
lingvistike izraze pogodne za krajnje korisnike odnosno menadere koji direktno ili
indirektno uestvuju u donoenju odluka. Ovu kompenentu moemo da smatramo
semantikim nivoom jer interpretira rezultate iz prethodnog koraka i predstavlja interfejs
prema krajnjoj instanci. Poslednja komponenta je, dakle, korisnik koji eli da na
jednostavan, relativno lagan i razumljiv nain doe do eljenih informacija.

119
5.8. Zakljuak

U ovom poglavlju predstavili smo rezultate samostalnog istraivanja u pronalaenju


fazi funkcionalnih zavisnosti. Predstavljen je model i algoritam koji emo koristi u
sledeem poglavlju za eksperiment nad realnim podacima. Iako postoje razliiti pristupi u
posmatranju fazi funkcionalnih zavisnosti, oni nisi zadovoljavali sutinske potrebe u
analizi podataka. Zbog toga je razvijena metodologija koja korisnicima omoguava
dobijanje novih i ineresatnih saznanja iz baza podataka, a koji su iskoristivi u razliitim
poljima. Kao prvo, opisana je uloga fazi logike u identifikovanju fazi funkcionalnih
zavisnosti, zatim karakterizacija razliitih fazi implikacija, izbor odreenih fazi implikacija
i predstavljene su fazi relacije koje su koriene za verifikaciju rezultata istraivanja.

120
6. Algoritam za identifikovanje fazi funkcionalnih zavisnosti
6.1. Eksperiment nad realnim fazi relacijama

Prethodna razmatranja interpretiraemo na fazi relacijama prikazanim u Tabelama


35. i 42., uzimajui u obzir postojee relacije bliskosti izmeu vrednosti atributa (Tabela
36-41. i Tabela 43.-46.). Iskoristiemo ovaj primer da bismo dokazali polaznu (poetnu)
hipotezu istraivanja u ovoj doktorskoj disertaciji. U tom smislu, mi verujemo da ova
metodologija donosi nove mogunosti kada je u pitanju izraavanje relacija izmeu
podataka i atributa posmatrane baze. Dodatno, obezbedili smo metodologiju kojom smo
definisali algoritam za otkrivanje fazi funkcionalnih zavisnosti u fazi bazama podataka.
U sledeim primerima prikazaemo ekstrakciju fazi funkcionalnih zavisnosti iz
relanih podataka. Kao to je diskutovano, odreeni fragment fazi logike moe da se
primeni u otkrivanju novih znanja i interpretaciji istraivanja podataka.
Fazi relacije u Tabelama 35. i 42. sadre podatke o radnicima zaposlenim u nekom
preduzeu. Prikupljeni su podaci u formi fazi relacije za pet radnika (Ime, Godine,
Iskustvo, Produktivnost, Jezik, Pozicija, Zarada). Vrednosti atributa sadre crisp i fazi
informacije. Navoenje kompletne fazi relacije nema preveliki znaaj za predstavljanje
metodologije istraivanja u ovom radu. Razmatraemo dve situacije, dva aspekta iste
relacione eme: fazi model baze podataka na bazi relacije bliskosti i fazi model baze
podataka na bazi mogunosti distribucije.
Informacioni sistemi sadre veliki broj podataka koji su najee skladiteni u formi
relacione baze podataka. U takvoj situaciji, istakli smo znaaj utvrivanja zavisnosti
izmeu atributa relacije i otkrivanje novih znanja naroito iz pozicije menadera i
donosioca odluka. Podaci, naroito u fazi relacijama, sami po sebi ne predstavljaju
znaajan izvor upravljakih informacija. Zbog toga je vana analiza relacija izmeu
podataka i atributa i pretraga korisnih informacija i novih znanja sadranih u njima. Zbog
toga u ovom poglavlju analiziramo ovu problematiku.

6.2. Algoritam za pretragu fazi funkcionalnih zavisnosti u fazi modelu na bazi relacije
bliskosti

U ovom poglavlju pokazaemo kako na algoritam radi na praktinom primeru.


Tabela 35. prikazuje fazi model na bazi relacije bliskosti. Za svaki atribut koji definisana je
relacija bliskosti. Pretraga fazi funkcionalnih zavisnosti u fazi modelu na bazi relacije
bliskosti vri se primenom definicije saglasnosti na paru n-torki. Na relaciji Tr je mogue
primenjivati fazi implikacije i vriti ekstrakciju fazi funkcionalnih zavisnosti. Prema naoj
definiciji, vezivni operator koji povezuje uoene zavisnosti na parovima n-torki je uvek
minimum t-norma. Skup fazi funkcionalnih zavisnosti moe da se proiri primenom pravila
izvoenja za fazi funkcionalne zavisnosti.
Stepen saglasnosti n-torki na atributu Ime_Prezime:
C(Ime_Prezime[t1,t2]) = min{min{max{s(IP1,IP2)}}, min{max{s(IP2,IP1)}}},
= min{min{max{0.7}}, min{max{0.7}}},
= min{min{0.7}, min{0.7}}
= min{0.7,0.7} = 0.7

121
C(Ime_Prezime[t1,t3]) = min{min{max{s(IP1,IP3)}}, min{max{s(IP3,IP1)}}},
= min{min{max{0.7}}, min{max{0.7}}},
= min{min{0.7}, min{0.7}}
= min{0.7,0.7} = 0.7

C(Ime_Prezime[t1,t4]) = min{min{max{s(IP1,IP4)}}, min{max{s(IP4,IP1)}}},


= min{min{max{0.7}}, min{max{0.7}}},
= min{min{0.7}, min{0.7}}
= min{0.7,0.7} = 0.7

C(Ime_Prezime[t1,t5]) = min{min{max{s(IP1,IP5)}}, min{max{s(IP5,IP1)}}},


= min{min{max{0.7}}, min{max{0.7}}},
= min{min{0.7}, min{0.7}}
= min{0.7,0.7} = 0.7

C(Ime_Prezime[t2,t3]) = min{min{max{s(IP2,IP3)}}, min{max{s(IP3,IP2)}}},


= min{min{max{0.7}}, min{max{0.7}}},
= min{min{0.7}, min{0.7}}
= min{0.7,0.7} = 0.7

C(Ime_Prezime[t2,t4]) = min{min{max{s(IP2,IP4)}}, min{max{s(IP4,IP2)}}},


= min{min{max{0.7}}, min{max{0.7}}},
= min{min{0.7}, min{0.7}}
= min{0.7,0.7} = 0.7

C(Ime_Prezime[t2,t5]) = min{min{max{s(IP2,IP5)}}, min{max{s(IP5,IP2)}}},


= min{min{max{0.7}}, min{max{0.7}}},
= min{min{0.7}, min{0.7}}
= min{0.7,0.7} = 0.7

C(Ime_Prezime[t3,t4]) = min{min{max{s(IP3,IP4)}}, min{max{s(IP4,IP3)}}},


= min{min{max{0.7}}, min{max{0.7}}},
= min{min{0.7}, min{0.7}}
= min{0.7,0.7} = 0.7

C(Ime_Prezime[t3,t5]) = min{min{max{s(IP3,IP5)}}, min{max{s(IP5,IP3)}}},


= min{min{max{0.7}}, min{max{0.7}}},
= min{min{0.7}, min{0.7}}
= min{0.7,0.7} = 0.7

C(Ime_Prezime[t4,t5]) = min{min{max{s(IP4,IP5)}}, min{max{s(IP5,IP4)}}},


= min{min{max{0.7}}, min{max{0.7}}},
= min{min{0.7}, min{0.7}}
= min{0.7,0.7} = 0.7

122
Stepen saglasnosti n-torki na atributu Godine:
C(Godine[t1,t2]) = min{min{max{s(veoma mlad,star)}},
min{max{s(star,veoma mlad)}}}
= min{min{max{0.30}},
min{max{0.30}}}
= min{min{0.30}, min{0.30}}
= min{0.30,0.30} = 0.30

C(Godine[t1,t3]) = min{min{max{s(veoma mlad,mlad),s(veoma mlad,srednjih godina)}},


min{max{s(mlad,veoma mlad)},max{s(srednjih g.,veoma mlad)}}}
= min{min{max{0.95,0.70}},
min{max{0.95},max{0.70}}}
= min{min{0.95}, min{0.95,0.70}}
= min{0.95,0.70} = 0.70

C(Godine[t1,t4]) = min{min{max{s(veoma mlad,veoma mlad),s(veoma mlad,mlad)}},


min{max{s(veoma mlad,veoma mlad)},max{s(mlad,veoma mlad)}}}
= min{min{max{1,0.95}},
min{max{1},max{0.95}}}
= min{min{1}, min{1,0.95}}
= min{1,0.95} = 0.95

C(Godine[t1,t5]) = min{min{max{s(veoma mlad,mlad)}},


min{max{s(mlad,veoma mlad)}}}
= min{min{max{0.95}},
min{max{0.95}}}
= min{min{0.95}, min{0.95}}
= min{0.95,0.95} = 0.95

C(Godine[t2,t3]) = min{min{max{s(star,mlad),s(star,srednjih godina)}},


min{max{s(mlad,star)},max{s(srednjih godina,star)}}}
= min{min{max{0.40,0.50}},
min{max{0.40},max{0.50}}}
= min{min{0.50}, min{0.40,0.50}}
= min{0.50,0.40} = 0.40

C(Godine[t2,t4]) = min{min{max{s(star,veoma mlad),s(star,mlad)}},


min{max{s(veoma mlad,star)},max{s(mlad,star)}}}
= min{min{max{0.30,0.40}},
min{max{0.30},max{0.40}}}
= min{min{0.40}, min{0.30,0.40}}
= min{0.40,0.30} = 0.30

C(Godine[t2,t5]) = min{min{max{s(star,mlad)}},
min{max{s(mlad,star)}}}
= min{min{max{0.40}},
min{max{0.40}}}
= min{min{0.40}, min{0.40}}
= min{0.40,0.40} = 0.95

123
C(Godine[t3,t4]) = min{min{max{s(mlad,veoma mlad), s(mlad,mlad)}, max{s(srednjih
godina,veoma mlad), s(srednjih godina,mlad)}},min{max{s(veoma mlad,mlad), s(veoma
mlad,srednjih godina) }, max{s(mlad,mlad), s(mlad,srednjih godina)}}},
= min{min{max{0.95,1},max{0.70,0.90}},
min{max{0.95,0.70},max{1,0.90}}},
= min{min{1,0.90}, min{0.95,1}}
= min {0.90, 0.95} = 0.90

C(Godine[t3,t5]) = min{min{max{s(mlad,mlad)}, max{s(srednjih godina,mlad)}},


min{max{s(mlad,mlad),s(mlad,srednjih godina)}}},
= min{min{max{1},max{0.90}},
min{max{1,0.90}}},
= min{min{1,0.90}, min{1}}
= min {0.90, 1} = 0.90

C(Godine[t4,t5]) = min{min{max{s(veoma mlad,mlad)}, max{s(mlad,mlad)}},


min{max{s(mlad,veoma mlad),s(mlad,mlad)}}},
= min{min{max{0.95},max{1}},
min{max{0.95,1}}},
= min{min{0.95,1}, min{1}}
= min {0.95, 1} = 0.95

Stepen saglasnosti n-torki na atributu Iskustvo:


C(Iskustvo[t1,t2]) = min{min{max{s(poetnik,specijalista),s(poetnik,ekspert)}},
min{max{s(specijalista,poetnik)},max{s(ekspert,poetnik)}}}
= min{min{max{0.70,0.30}},
min{max{0.70},max{0.30}}}
= min{min{0.70}, min{0.70,0.30}}
= min{0.70,0.30} = 0.30

C(Iskustvo[t1,t3]) = min{min{max{s(poetnik,senior),s(poetnik,specijalista)}},
min{max{s(senior,poetnik)},max{s(specijalista,poetnik)}}}
= min{min{max{0.70,0.70}},
min{max{0.70},max{0.70}}}
= min{min{0.70}, min{0.70,0.70}}
= min{0.70,0.70} = 0.70

C(Iskustvo[t1,t4]) = min{min{max{s(poetnik,poetnik),s(poetnik,senior)}},
min{max{s(poetnik,poetnik)},max{s(senior,poetnik)}}}
= min{min{max{1,0.70}},
min{max{1},max{0.70}}}
= min{min{1}, min{1,0.70}}
= min{1,0.70} = 0.70

C(Iskustvo[t1,t5]) = min{min{max{s(poetnik,senior)}},
min{max{s(senior,poetnik)}}}
= min{min{max{0.70}},
min{max{0.70}}}
= min{min{0.70}, min{0.70}}
= min{0.70,0.70} = 0.70

124
C(Iskustvo[t2,t3]) = min{min{max{s(specijalista,senior),s(specijalista,specijalista)},
max{s(ekspert,senior), s(ekspert,specijalista)}}, min{max{s(senior,specijalista),
s(senior,ekspert)}, max{s(specijalista,specijalista),s(specijalista,ekspert)}}},
= min{min{max{0.85,1},max{0.30,0.50}},
min{max{0.85,0.30},max{1,0.50}}},
= min{min{1,0.50}, min{0.85,1}}
= min {0.50, 0.85} = 0.50

C(Iskustvo[t2,t4]) = min{min{max{s(specijalista,poetnik),s(specijalista,senior)},
max{s(ekspert,poetnik),s(ekspert,senior)}}, min{max{s(poetnik,specijalista),
s(poetnik,ekspert)}, max{s(senior,specijalista),s(senior,ekspert)}}},
= min{min{max{0.70,0.85},max{0.30,0.30}},
min{max{0.70,0.30},max{0.85,0.30}}},
= min{min{0.85,0.30}, min{0.70,0.85}}
= min {0.30, 0.70} = 0.30

C(Iskustvo[t2,t5]) = min{min{max{s(specijalista,senior)},max{s(ekspert,senior)}},
min{max{s(senior,specijalista),s(senior,ekspert)}}},
= min{min{max{0.85},max{0.30}},
min{max{0.85,0.30}}},
= min{min{0.85,0.30}, min{0.85}}
= min {0.30,0.85} = 0.30

C(Iskustvo[t3,t4]) = min{min{max{s(senior,poetnik),s(senior,senior)},
max{s(specijalista,poetnik),s(specijalista,senior)}}, min{max{s(poetnik,senior),
s(poetnik,specijalista)}, max{s(senior,senior),s(senior,specijalista)}}},
= min{min{max{0.70,1},max{0.70,0.85}},
min{max{0.70,0.70},max{1,0.85}}},
= min{min{1,0.85}, min{0.70,1}}
= min {0.85, 0.70} = 0.70

C(Iskustvo[t3,t5]) = min{min{max{s(senior,senior)},max{s(specijalista,senior)}},
min{max{s(senior,senior),s(senior,specijalista)}}},
= min{min{max{1},max{0.85}},
min{max{1,0.85}}},
= min{min{1,0.85}, min{1}}
= min {0.85,1} = 0.85

C(Iskustvo[t4,t5]) = min{min{max{s(poetnik,senior)},max{s(senior,senior)}},
min{max{s(senior,poetnik),s(senior,senior)}}},
= min{min{max{0.70},max{1}},
min{max{0.70,1}}},
= min{min{0.70,1}, min{1}}
= min {0.70,1} = 0.70

125
Stepen saglasnosti n-torki na atributu Produktivnost:
C(Produktivnost[t1,t2]) = min{min{max{s(zadovolj.,dobra),s(zadovolj.,odlina)}},
min{max{s(dobra,zadovolj.)},max{s(odlina,zadovolj.)}}}
= min{min{max{0.70,0.50}},
min{max{0.70},max{0.50}}}
= min{min{0.50}, min{0.70,0.50}}
= min{0.50,0.50} = 0.50

C(Produktivnost[t1,t3]) = min{min{max{s(zadovoljavajua,dobra)}},
min{max{s(dobra,zadovoljavajua)}}}
= min{min{max{0.70}},
min{max{0.70}}}
= min{min{0.70}, min{0.70}}
= min{0.70,0.70} = 0.70

C(Produktivnost[t1,t4]) = min{min{max{s(zadovoljavajua,loa)}},
min{max{s(loa,zadovoljavajua)}}}
= min{min{max{0.80}},
min{max{0.80}}}
= min{min{0.80}, min{0.80}}
= min{0.80,0.80} = 0.80

C(Produktivnost[t1,t5]) = min{min{max{s(zadovolj.,zadovolj.),s(zadovolj.,dobra)}},
min{max{s(zadovolj.,zadovolj.)},max{s(dobra,zadovolj.)}}}
= min{min{max{1,0.70}},
min{max{1},max{0.70}}}
= min{min{1}, min{1,0.70}}
= min{1,0.70} = 0.70

C(Produktivnost[t2,t3]) = min{min{max{s(dobra,dobra)},max{s(odlina,dobra)}},
min{max{s(dobra,dobra),s(dobra,odlina)}}},
= min{min{max{1},max{0.80}},
min{max{1,0.80}}},
= min{min{1,0.80}, min{1}}
= min {0.80,1} = 0.80

C(Produktivnost[t2,t4]) = min{min{max{s(dobra,loa)},max{s(odlina,loa)}},
min{max{s(loa,dobra),s(loa,odlina)}}},
= min{min{max{0.50},max{0.10}},
min{max{0.50,0.10}}},
= min{min{0.50,0.10}, min{0.50}}
= min {0.10,0.50} = 0.10

C(Produktivnost[t2,t5]) = min{min{max{s(dobra,zadovoljavajua),s(dobra,dobra)},
max{s(odlina,zadovoljavajua), s(odlina,dobra)}}, min{max{s(zadovoljavajua,dobra),
s(zadovoljavajua,odlina)}, max{s(dobra,dobra),s(dobra,odlina)}}},
= min{min{max{0.70,1},max{0.50,0.80}},
min{max{0.70,0.50},max{1,0.80}}},
= min{min{1,0.80}, min{0.70,1}}
= min {0.80, 0.70} = 0.70

126
C(Produktivnost[t3,t4]) = min{min{max{s(dobra,loa)}},
min{max{s(loa,dobra)}}}
= min{min{max{0.50}},
min{max{0.50}}}
= min{min{0.50}, min{0.50}}
= min{0.50,0.50} = 0.50

C(Produktivnost[t3,t5]) = min{min{max{s(dobra,zadovoljavajua),s(dobra,dobra)}},
min{max{s(zadovoljavajua,dobra)},max{s(dobra,dobra)}}}
= min{min{max{0.70,1}},
min{max{0.70},max{1}}}
= min{min{1}, min{0.70,1}}
= min{1,0.70} = 0.70

C(Produktivnost[t4,t5]) = min{min{max{s(loa,zadovoljavajua),s(loa,dobra)}},
min{max{s(zadovoljavajua,loa)},max{s(dobra,loa)}}}
= min{min{max{0.80,0.50}},
min{max{0.80},max{0.50}}}
= min{min{0.80}, min{0.80,0.50}}
= min{0.80,0.50} = 0.50

Stepen saglasnosti n-torki na atributu Jezik:


C(Jezik[t1,t2]) = min{min{max{s(Engleski,Engleski)},max{s(Ruski,Engleski)}},
min{max{s(Engleski,Engleski),s(Engleski,Ruski)}}},
= min{min{max{1},max{0.20}},
min{max{1,0.20}}},
= min{min{1,0.20}, min{1}}
= min {0.20,1} = 0.20

C(Jezik[t1,t3]) = min{min{max{s(Engleski,Francuski)},max{s(Ruski,Francuski)}},
min{max{s(Francuski,Engleski),s(Francuski,Ruski)}}},
= min{min{max{0.60},max{0.30}},
min{max{0.60,0.30}}},
= min{min{0.60,0.30}, min{0.60}}
= min {0.30,0.60} = 0.30

C(Jezik[t1,t4]) = min{min{max{s(Engleski,Ruski)},max{s(Ruski,Ruski)}},
min{max{s(Ruski,Engleski),s(Ruski,Ruski)}}},
= min{min{max{0.20},max{1}},
min{max{0.20,1}}},
= min{min{0.20,1}, min{1}}
= min {0.20,1} = 0.20

C(Jezik[t1,t5]) = min{min{max{s(Engleski,Engleski),s(Engleski,Francuski)},
max{s(Ruski,Engleski), s(Ruski,Francuski)}}, min{max{s(Engleski,Engleski),
s(Engleski,Ruski)}, max{s(Francuski,Engleski),s(Francuski,Ruski)}}},
= min{min{max{1,0.60},max{0.20,0.30}},
min{max{1,0.20},max{0.60,0.30}}},
= min{min{1,0.30}, min{1,0.60}}
= min {0.30, 0.60} = 0.30

127
C(Jezik[t2,t3]) = min{min{max{s(Engleski,Francuski)}},
min{max{s(Francuski,Engleski)}}}
= min{min{max{0.60}},
min{max{0.60}}}
= min{min{0.60}, min{0.60}}
= min{0.60,0.60} = 0.60

C(Jezik[t2,t4]) = min{min{max{s(Engleski,Ruski)}},
min{max{s(Ruski,Engleski)}}}
= min{min{max{0.20}},
min{max{0.20}}}
= min{min{0.20}, min{0.20}}
= min{0.20,0.20} = 0.20

C(Jezik[t2,t5]) = min{min{max{s(Engleski,Engleski),s(Engleski,Francuski)}},
min{max{s(Engleski,Engleski)},max{s(Francuski,Engleski)}}}
= min{min{max{1,0.60}},
min{max{1},max{0.60}}}
= min{min{1}, min{1,0.60}}
= min{1,0.60} = 0.60

C(Jezik[t3,t4]) = min{min{max{s(Francuski,Ruski)}},
min{max{s(Ruski,Francuski)}}}
= min{min{max{0.30}},
min{max{0.30}}}
= min{min{0.30}, min{0.30}}
= min{0.30,0.30} = 0.30

C(Jezik[t3,t5]) = min{min{max{s(Francuski,Engleski),s(Francuski,Francuski)}},
min{max{s(Engleski,Francuski)},max{s(Francuski,Francuski)}}}
= min{min{max{0.60,1}},
min{max{0.60},max{1}}}
= min{min{1}, min{0.60,1}}
= min{1,0.60} = 0.60

C(Jezik[t3,t5]) = min{min{max{s(Ruski,Engleski),s(Ruski,Francuski)}},
min{max{s(Engleski,Ruski)},max{s(Francuski,Ruski)}}}
= min{min{max{0.20,0.30}},
min{max{0.20},max{0.30}}}
= min{min{0.30}, min{0.20,0.30}}
= min{0.30,0.20} = 0.20

Stepen saglasnosti n-torki na atributu Pozicija:


C(Pozicija[t1,t2]) = min{min{max{s(sistem inenjer,menader)}},
min{max{s(menader,sistem inenjer)}}}
= min{min{max{0.70}},
min{max{0.70}}}
= min{min{0.70}, min{0.70}}
= min{0.70,0.70} = 0.70

128
C(Pozicija[t1,t3]) = min{min{max{s(sistem inenjer,direktor)}},
min{max{s(direktor,sistem inenjer)}}}
= min{min{max{0.60}},
min{max{0.60}}}
= min{min{0.60}, min{0.60}}
= min{0.60,0.60} = 0.60

C(Pozicija[t1,t4]) = min{min{max{s(sistem inenjer,prodaja)}},


min{max{s(prodaja,sistem inenjer)}}}
= min{min{max{0.50}},
min{max{0.50}}}
= min{min{0.50}, min{0.50}}
= min{0.50,0.50} = 0.50

C(Pozicija[t1,t5]) = min{min{max{s(sistem inenjer,nabavka)}},


min{max{s(nabavka,sistem inenjer)}}}
= min{min{max{0.50}},
min{max{0.50}}}
= min{min{0.50}, min{0.50}}
= min{0.50,0.50} = 0.50

C(Pozicija[t2,t3]) = min{min{max{s(menader,direktor)}},
min{max{s(direktor,menader)}}}
= min{min{max{0.90}},
min{max{0.90}}}
= min{min{0.90}, min{0.90}}
= min{0.90,0.90} = 0.90

C(Pozicija[t2,t4]) = min{min{max{s(menader,prodaja)}},
min{max{s(prodaja,menader)}}}
= min{min{max{0.60}},
min{max{0.60}}}
= min{min{0.60}, min{0.60}}
= min{0.60,0.60} = 0.60

C(Pozicija[t2,t5]) = min{min{max{s(menader,nabavka)}},
min{max{s(nabavka,menader)}}}
= min{min{max{0.60}},
min{max{0.60}}}
= min{min{0.60}, min{0.60}}
= min{0.60,0.60} = 0.60

C(Pozicija[t3,t4]) = min{min{max{s(direktor,prodaja)}},
min{max{s(prodaja,direktor)}}}
= min{min{max{0.70}},
min{max{0.70}}}
= min{min{0.70}, min{0.70}}
= min{0.70,0.70} = 0.70

129
C(Pozicija[t3,t5]) = min{min{max{s(direktor,nabavka)}},
min{max{s(nabavka,direktor)}}}
= min{min{max{0.70}},
min{max{0.70}}}
= min{min{0.70}, min{0.70}}
= min{0.70,0.70} = 0.70

C(Pozicija[t4,t5]) = min{min{max{s(prodaja,nabavka)}},
min{max{s(nabavka,prodaja)}}}
= min{min{max{0.80}},
min{max{0.80}}}
= min{min{0.80}, min{0.80}}
= min{0.80,0.80} = 0.80

Stepen saglasnosti n-torki na atributu Zarada:


C(Zarada[t1,t2]) = min{min{max{s(prosena,prosena),s(prosena,visoka)}},
min{max{s(prosena,prosena)},max{s(visoka,prosena)}}}
= min{min{max{1,0.75}},
min{max{1},max{0.75}}}
= min{min{1}, min{1,0.75}}
= min{1,0.75} = 0.75

C(Zarada[t1,t3]) = min{min{max{s(prosena,veoma visoka)}},


min{max{s(veoma visoka,prosena)}}}
= min{min{max{0.35}},
min{max{0.35}}}
= min{min{0.35}, min{0.35}}
= min{0.35,0.35} = 0.35

C(Zarada[t1,t4]) = min{min{max{s(prosena,mala),s(prosena,prosena)}},
min{max{s(mala,prosena)},max{s(prosena,prosena)}}}
= min{min{max{0.85,1}},
min{max{0.85},max{1}}}
= min{min{1}, min{0.85,1}}
= min{1,0.85} = 0.85

C(Zarada[t1,t5]) = min{min{max{s(prosena,visoka)}},
min{max{s(visoka,prosena)}}}
= min{min{max{0.75}},
min{max{0.75}}}
= min{min{0.75}, min{0.75}}
= min{0.75,0.75} = 0.75

C(Zarada[t2,t3])= min{min{max{s(prosena,veom.visoka)},max{s(visoka,veom.visoka)}},
min{max{s(veoma visoka,prosena),s(veoma visoka,visoka)}}},
= min{min{max{0.35},max{0.80}},
min{max{0.35,0.80}}},
= min{min{0.35,0.80}, min{0.80}}
= min {0.35,0.80} = 0.35

130
C(Zarada[t2,t4]) = min{min{max{s(prosena,mala),s(prosena,prosena)},
max{s(visoka,mala), s(visoka,prosena)}}, min{max{s(mala,prosena),s(mala,visoka)},
max{s(prosena,prosena),s(prosena,visoka)}}},
= min{min{max{0.85,1},max{0.55,0.75}},
min{max{0.85,0.55},max{1,0.75}}},
= min{min{1,0.75}, min{0.85,1}}
= min {0.75, 0.85} = 0.75

C(Zarada[t2,t5]) = min{min{max{s(prosena,visoka)},max{s(visoka,visoka)}},
min{max{s(visoka,prosena),s(visoka,visoka)}}},
= min{min{max{0.75},max{1}},
min{max{0.75,1}}},
= min{min{0.75,1}, min{1}}
= min {0.75,1} = 0.75

C(Zarada[t3,t4]) = min{min{max{s(veoma visoka,mala),s(veoma visoka,prosena)}},


min{max{s(mala,veoma visoka)},max{s(prosena,veoma visoka)}}}
= min{min{max{0.25,0.35}},
min{max{0.25},max{0.35}}}
= min{min{0.35}, min{0.25,1}}
= min{0.35,0.25} = 0.25

C(Zarada[t3,t5]) = min{min{max{s(veoma visoka,visoka)}},


min{max{s(visoka,veoma visoka)}}}
= min{min{max{0.80}},
min{max{0.80}}}
= min{min{0.80}, min{0.80}}
= min{0.80,0.80} = 0.80

C(Zarada[t4,t5]) = min{min{max{s(mala,visoka)},max{s(prosena,visoka)}},
min{max{s(visoka,mala),s(visoka,prosena)}}},
= min{min{max{0.55},max{0.75}},
min{max{0.55,0.75}}},
= min{min{0.55,0.75}, min{0.75}}
= min {0.55,0.75} = 0.55

Na ovaj nain izraunali smo saglasnost n-torki na atributima fazi relacije koristei relaciju
bliskosti izmeu elemenata datih domena. Poznavajui ove vrednosti, mi nadalje moemo
da pristupimo otkrivanju fazi funkcionalnih zavisnosti koristei metodologiju zasnovanu
na fazi implikacijama koju smo predstavili u prethodnom poglavlju, a koja nam
omoguava da odredimo jainu zavisnosti izmeu atributa fazi relacije. Vrednosti
C(Ai[ti,tj]) prikazane su u tabeli 50. Dobijene zavisnosti predstavljaju IF THEN pravila u
kojima koristimo lingvistike kvantifikatore kao to su prilino, znaajno, itd...U
sluajevima kada izmeu atributa fazi relacije postoji fazi funkcionalna zavisnost u vie n-
torki koriste se t-norma funkcije, a zbog efikasnosti algoritma odabrali smo min t-normu
Tmin.

131
k C(IP[ti,tj]) C(God[ti,tj]) C(Isk[ti,tj]) C(Pro[ti,tj]) C(Jez[ti,tj]) C(Poz[ti,tj]) C(Zar[ti,tj])
t1t2 0.70 0.30 0.30 0.50 0.20 0.70 0.75
t1t3 0.70 0.70 0.70 0.70 0.30 0.60 0.35
t1t4 0.70 0.95 0.70 0.80 0.20 0.50 0.85
t1t5 0.70 0.95 0.70 0.70 0.30 0.50 0.75
t2t3 0.70 0.40 0.50 0.80 0.60 0.90 0.35
t2t4 0.70 0.30 0.30 0.10 0.20 0.60 0.75
t2t5 0.70 0.40 0.30 0.70 0.60 0.60 0.75
t3t4 0.70 0.90 0.70 0.50 0.30 0.70 0.25
t3t5 0.70 0.90 0.85 0.70 0.60 0.70 0.80
t4t5 0.70 0.95 0.70 0.50 0.20 0.80 0.55
Tabela 50. C(Ai[ti,tj]) na atributima fazi relacije na bazi relacije bliskosti

U interpretaciju rezultata istraivanja krenuemo od tabele 48. koju emo primeniti


na datom fazi modelu baze podataka. Kao to je objanjeno u prethodnom poglavlju,
iskorostiemo vrednosti C(Ai[ti,tj]) da bismo utvrdili zadovoljivost pojedinih atributa za
primenu u pridruenom algoritmu. Minimalnu vrednost kritine jaine zavisnosti k
fiksiraemo na prag 0.7 za identifikovanje fazi funkcionalnih zavisnosti.
0.7 C(IP[ti,tj]) C(God[ti,tj]) C(Isk[ti,tj]) C(Pro[ti,tj]) C(Jez[ti,tj]) C(Poz[ti,tj]) C(Zar[ti,tj])
t1t2
t1t3
t1t4
t1t5
t2t3
t2t4
t2t5
t3t4
t3t5
t4t5
Tabela 51. C(Ai[ti,tj]) na atributima fazi relacije na bazi relacije bliskosti sa C(Ai[ti,tj])0.70

U skladu sa ovim vrednostima, definicijom fazi funkcionalnih zavisnosti


C(Y[ti,tj]) min (k,C(X[ti,tj])) i metodologijom predloenom u ovoj doktorskoj disertaciji
identifikujemo sledee fazi funkcionalne zavisnosti u fazi relaciji prikazanoj u Tabeli 35.:
a) Otkrivanje fazi funkcionalnih zavisnosti primenom Mamdani-ijeve implikacije IMM za
sluaj k=0.70:
0.70
Ime_Prezime Godine, P=60%
Tmin(Ime_Prezime,Godine) = min(min(0.70,0.70), min(0.70,0.95), min(0.70,0.95),
min(0.70,0.90),min(0.70,0.90), min(0.70,0.95)) = min (0.70,0.70,0.70,0.70,0.70,0.70)=0.70
6
P= =0.60, tj. 60%
10
0.70
Ime_Prezime Iskustvo, P=60%
Tmin(Ime_Prezime,Iskustvo) = min(min(0.70,0.70), min(0.70,0.70), min(0.70,0.70),
min(0.70,0.70),min(0.70,0.85), min(0.70,0.70)) = min (0.70,0.70,0.70,0.70,0.70,0.70)=0.70

132
6
P= =0.60, tj. 60%
10
0.70
Ime_Prezime Produktivnost, P=60%
Tmin(Ime_Prezime,Produktivnost) = min(min(0.70,0.70), min(0.70,0.80), min(0.70,0.70),
min(0.70,0.80),min(0.70,0.70), min(0.70,0.70)) = min (0.70,0.70,0.70,0.70,0.70,0.70)=0.70
6
P= =0.60, tj. 60%
10
0.70
Ime_Prezime Pozicija, P=50%
Tmin(Ime_Prezime,Pozicija) = min(min(0.70,0.70), min(0.70,0.90), min(0.70,0.70),
min(0.70,0.70),min(0.70,0.80)) = min (0.70,0.70,0.70,0.70,0.70)=0.70
5
P= =0.50, tj. 50%
10
0.70
Ime_Prezime Zarada, P=60%
Tmin(Ime_Prezime,Zarada) = min(min(0.70,0.75), min(0.70,0.85), min(0.70,0.75),
min(0.70,0.75),min(0.70,0.75), min(0.70,0.80)) = min (0.70,0.70,0.70,0.70,0.70,0.70)=0.70
6
P= =0.60, tj. 60%
10
0.70
Godine Iskustvo, P=10%
Tmin(Godine,Iskustvo) = min(min(0.70,0.70))= 0.70
1
P= =0.10, tj. 10%
10
0.70
Godine Produktivnost, P=10%
Tmin(Godine,Produktivnost) = min(min(0.70,0.70))= 0.70
1
P= =0.10, tj. 10%
10
0.70
Iskustvo Produktivnost, P=30%
Tmin(Iskustvo,Produktivnost) = min(min(0.70,0.70), min(0.70,0.80), min(0.70,0.70)) =
= min (0.70,0.70,0.70)=0.70
3
P= =0.30, tj. 30%
10
0.70
Iskustvo Pozicija, P=20%
Tmin(Iskustvo,Pozicija) = min(min(0.70,0.70),min(0.70,0.80)) = min(0.70,0.70)=0.70
2
P= =0.20, tj. 20%
10

133
0.70
Iskustvo Zarada, P=20%
Tmin(Iskustvo,Zarada) = min(min(0.70,0.85),min(0.70,0.75)) = min(0.70,0.70)=0.70
2
P= =0.20, tj. 20%
10
0.70
Produktivnost Pozicija, P=20%
Tmin(Produktivnost,Pozicija) = min(min(0.80,0.90),min(0.70,0.70)) = min(0.80,0.70)=0.70
2
P= =0.20, tj. 20%
10
0.70
Produktivnost Zarada, P=40%
Tmin(Produktivnost,Zarada) = min(min(0.80,0.95), min(0.70,0.75), min(0.70,0.75),
min(0.70,0.80)) = min (0.80,0.70,0.70,0.70)=0.70
4
P= =0.40, tj. 40%
10
0.70
Pozicija Zarada, P=20%
Tmin(Pozicija,Zarada) = min(min(0.70,0.75),min(0.70,0.80)) = min(0.70,0.70)=0.70
2
P= =0.20, tj. 20%
10
0.70
Godine Ime_Prezime, P=10%
Tmin(Godine,Ime_Prezime) = min(min(0.70,0.70))= 0.70
1
P= =0.10, tj. 10%
10
0.70
Iskustvo Ime_Prezime, P=50%
Tmin(Iskustvo,Ime_Prezime) = min(min(0.70,0.70), min(0.70,0.70), min(0.70,0.70),
min(0.70,0.70),min(0.70,0.70)) = min (0.70,0.70,0.70,0.70,0.70)=0.70
5
P= =0.50, tj. 50%
10
0.70
Iskustvo Godine, P=60%
Tmin(Iskustvo,Godine) = min(min(0.70,0.70), min(0.70,0.95), min(0.70,0.95),
min(0.70,0.90),min(0.85,0.90), min(0.70,0.95)) = min (0.70,0.70,0.70,0.70,0.85,0.70)=0.70
6
P= =0.60, tj. 60%
10

134
0.70
Produktivnost Ime_Prezime, P=40%
Tmin(Produktivnost,Ime_Prezime) = min(min(0.70,0.70), min(0.70,0.70), min(0.70,0.70),
min(0.70,0.70)) = min (0.70,0.70,0.70,0.70)=0.70
4
P= =0.40, tj. 40%
10
0.70
Produktivnost Godine, P=40%
Tmin(Produktivnost,Godine) = min(min(0.70,0.70), min(0.80,0.95), min(0.70,0.95),
min(0.70,0.90)) = min (0.70,0.80,0.70,0.70)=0.70
4
P= =0.40, tj. 40%
10
0.70
Produktivnost Iskustvo, P=30%
Tmin(Produktivnost,Iskustvo) = min(min(0.70,0.70), min(0.70,0.70), min(0.70,0.85)) =
= min (0.70,0.70,0.70)=0.70
3
P= =0.30, tj. 30%
10
0.70
Pozicija Ime_Prezime, P=30%
Tmin(Pozicija,Ime_Prezime) = min(min(0.70,0.70), min(0.70,0.70), min(0.70,0.70)) =
= min (0.70,0.70,0.70)=0.70
3
P= =0.30, tj. 30%
10
0.70
Pozicija Godine, P=30%
Tmin(Pozicija,Godine) = min(min(0.70,0.90), min(0.70,0.90), min(0.80,0.95)) =
= min (0.70,0.70,0.80)=0.70
3
P= =0.30, tj. 30%
10
0.70
Pozicija Iskustvo, P=20%
Tmin(Pozicija,Iskustvo) = min(min(0.70,0.70),min(0.70,0.85)) = min(0.70,0.85)=0.70
2
P= =0.20, tj. 20%
10
0.70
Pozicija Produktivnost, P=10%
Tmin(Pozicija,Produktivnost) = min(min(0.70,0.70))= 0.70
1
P= =0.10, tj. 10%
10

135
0.75
Zarada Godine, P=30%
Tmin(Zarada,Godine) = min(min(0.85,0.95), min(0.75,0.95), min(0.80,0.90)) =
= min (0.85,0.75,0.80)=0.75
3
P= =0.30, tj. 30%
10
0.80
Zarada Iskustvo, P=10%
Tmin(Zarada,Iskustvo) = min(min(0.80,0.85))= 0.80
1
P= =0.10, tj. 10%
10
Pridruujui predloenu metodologiju na skup atributa prikazanim u fazi relaciji
(tabela 35.) i uzimajui u obzir relacije bliskosti nad vrednostima posmatranih atributa
dobili smo sledei skup fazi funkcionalnih zavisnosti:
0.70 0.70
Ime_Prezime Godine, P=60% Produktivnost Iskustvo, P=30%
0.70 0.70
Godine Ime_Prezime, P=10% Iskustvo Pozicija, P=20%
0.70 0.70
Ime_Prezime Iskustvo, P=60% Pozicija Iskustvo, P=20%
0.70 0.70
Iskustvo Ime_Prezime, P=50% Iskustvo Zarada, P=20%
0.70 0.80
Ime_Prezime Produktivnost, P=60% Zarada Iskustvo, P=10%
0.70 0.70
Produktivnost Ime_Prezime, P=40% Produktivnost Pozicija, P=20%
0.70 0.70
Ime_Prezime Pozicija, P=50% Pozicija Produktivnost, P=10%
0.70 0.70
Pozicija Ime_Prezime, P=30% Produktivnost Zarada, P=40%
0.70 0.70
Ime_Prezime Zarada, P=60% Pozicija Zarada, P=20%
0.70 0.70
Godine Iskustvo, P=10% Pozicija Godine, P=30%
0.70 0.75
Iskustvo Godine, P=60% Zarada Godine, P=30%
0.70
Godine Produktivnost, P=10%
0.70
Produktivnost Godine, P=40%
0.70
Iskustvo Produktivnost, P=30%
Tabela 52. Fazi funkcionalne zavisnosti dobijene primenom I MM. za k=0.7

136
b) Otkrivanje fazi funkcionalnih zavisnosti primenom Kleene-Diense implikacije IKL za
sluaj k=0.70:
0.70
Ime_Prezime Godine, P=60%
Tmin(Ime_Prezime,Godine) = min(max(1-0.70,0.70), max(1-0.70,0.95), max(1-0.70,0.95),
max(1-0.70,0.90), max(1-0.70,0.90), max(1-0.70,0.95)) =
= min(max(0.30,0.70), max(0.30,0.95), max(0.30,0.95), max(0.30,0.90), max(0.30,0.90),
max(0.30,0.95)) = min(0.70,0.95,0.95,0.90,0.90,0.95) = 0.70
6
P= =0.60, tj. 60%
10
0.70
Ime_Prezime Iskustvo, P=60%
Tmin(Ime_Prezime,Iskustvo) = min(max(1-0.70,0.70), max(1-0.70,0.70), max(1-0.70,0.70),
max(1-0.70,0.70), max(1-0.70,0.85), max(1-0.70,0.70))=
= min(max(0.30,0.70), max(0.30,0.70), max(0.30,0.70), max(0.30,0.70), max(0.30,0.85),
max(0.30,0.70)) = min(0.70,0.70,0.70,0.70,0.85,0.70) = 0.70
6
P= =0.60, tj. 60%
10
0.70
Ime_Prezime Produktivnost, P=60%
Tmin(Ime_Prezime,Iskustvo) = min(max(1-0.70,0.70), max(1-0.70,0.80), max(1-0.70,0.70),
max(1-0.70,0.80), max(1-0.70,0.70), max(1-0.70,0.70))=
= min(max(0.30,0.70), max(0.30,0.80), max(0.30,0.70), max(0.30,0.80), max(0.30,0.70),
max(0.30,0.70)) = min(0.70,0.80,0.70,0.80,0.70,0.70) = 0.70
6
P= =0.60, tj. 60%
10
0.70
Ime_Prezime Pozicija, P=50%
Tmin(Ime_Prezime,Pozicija) = min(max(1-0.70,0.70), max(1-0.70,0.90), max(1-0.70,0.70),
max(1-0.70,0.70), max(1-0.70,0.80)) =
= min(max(0.30,0.70), max(0.30,0.90), max(0.30,0.70), max(0.30,0.70), max(0.30,0.80)) =
= min(0.70,0.90,0.70,0.70,0.80) = 0.70
5
P= =0.50, tj. 50%
10
0.70
Ime_Prezime Zarada, P=60%
Tmin(Ime_Prezime,Iskustvo) = min(max(1-0.70,0.75), max(1-0.70,0.85), max(1-0.70,0.75),
max(1-0.70,0.75), max(1-0.70,0.75), max(1-0.70,0.80))=
= min(max(0.30,0.75), max(0.30,0.85), max(0.30,0.75), max(0.30,0.75), max(0.30,0.75),
max(0.30,0.80)) = min(0.75,0.85,0.75,0.75,0.75,0.80) = 0.70

137
6
P= =0.60, tj. 60%
10
0.70
Godine Iskustvo, P=10%
Tmin(Godine,Iskustvo) = min(max(1-0.70,0.70)) = min(max(0.30,0.70)) = 0.70
1
P= =0.10, tj. 10%
10
0.70
Godine Produktivnost, P=10%
Tmin(Godine,Produktivnost) = min(max(1-0.70,0.70)) = min(max(0.30,0.70)) = 0.70
1
P= =0.10, tj. 10%
10
0.70
Iskustvo Produktivnost, P=30%
Tmin(Iskustvo,Produktivnost) =min(max(1-0.70,0.70), max(1-0.70,0.80), max(1-0.70,0.70))
= min(max(0.30,0.70), max(0.30,0.80), max(0.30,0.70) = min(0.70,0.80,0.70) = 0.70
3
P= =0.30, tj. 30%
10
0.70
Iskustvo Pozicija, P=20%
Tmin(Iskustvo,Pozicija) = min(max(1-0.70,0.70), max(1-0.70,0.80)) =
= min(max(0.30,0.70), max(0.30,0.80)) = min(0.70,0.80) = 0.70
2
P= =0.20, tj. 20%
10
0.75
Iskustvo Zarada, P=20%
Tmin(Iskustvo,Zarada) = min(max(1-0.70,0.85), max(1-0.70,0.75)) =
= min(max(0.30,0.85), max(0.30,0.75)) = min(0.85,0.75) = 0.75
2
P= =0.20, tj. 20%
10
0.70
Produktivnost Pozicija, P=20%
Tmin(Produktivnost,Pozicija) = min(max(1-0.80,0.90), max(1-0.70,0.70)) =
= min(max(0.20,0.90), max(0.30,0.70)) = min(0.90,0.70) = 0.70
2
P= =0.20, tj. 20%
10

138
0.75
Produktivnost Zarada, P=40%
Tmin(Produktivnost,Zarada) = min(max(1-0.80,0.85), max(1-0.70,0.75), max(1-0.70,0.75),
max(1-0.70,0.80)) = min(max(0.20,0.85),max(0.30,0.75),max(0.30,0.75),max(0.30,0.80))=
= min(0.85,0.75,0.75,0.80) = 0.75
4
P= =0.40, tj. 40%
10
0.75
Pozicija Zarada, P=20%
Tmin(Pozicija,Zarada) = min(max(1-0.70,0.75), max(1-0.70,0.80)) =
= min(max(0.30,0.75), max(0.30,0.80)) = min(0.75,0.80) = 0.75
2
P= =0.20, tj. 20%
10
0.85
Zarada Iskustvo, P=10%
Tmin(Zarada,Iskustvo) = min(max(1-0.80,0.85)) = min(max(0.20,0.85)) = 0.85
1
P= =0.10, tj. 10%
10
0.90
Zarada Godine, P=30%
Tmin(Zarada,Godine) =min(max(1-0.85,0.95), max(1-0.75,0.95), max(1-0.80,0.90))
= min(max(0.15,0.95), max(0.25,0.95), max(0.20,0.90) = min(0.95,0.95,0.90) = 0.90
3
P= =0.30, tj. 30%
10
0.70
Pozicija Produktivnost, P=10%
Tmin(Pozicija,Produktivnost) = min(max(1-0.70,0.70)) = min(max(0.30,0.70)) = 0.70
1
P= =0.10, tj. 10%
10
0.70
Pozicija Iskustvo, P=20%
Tmin(Pozicija,Iskustvo) = min(max(1-0.70,0.70), max(1-0.70,0.85)) =
= min(max(0.30,0.70), max(0.30,0.85)) = min(0.70,0.85) = 0.70
2
P= =0.20, tj. 20%
10
0.90
Pozicija Godine, P=30%
Tmin(Pozicija,Godine) =min(max(1-0.70,0.90), max(1-0.70,0.90), max(1-0.80,0.95))
= min(max(0.30,0.90), max(0.30,0.90), max(0.20,0.95) = min(0.90,0.90,0.95) = 0.90

139
3
P= =0.30, tj. 30%
10
0.70
Pozicija Ime_Prezime, P=30%
Tmin(Pozicija,Ime_Prezime) =min(max(1-0.70,0.70), max(1-0.70,0.70), max(1-0.70,0.70))
= min(max(0.30,0.70), max(0.30,0.70), max(0.30,0.70) = min(0.70,0.70,0.70) = 0.70
3
P= =0.30, tj. 30%
10
0.70
Produktivnost Iskustvo, P=30%
Tmin(Produktivnost,Iskustvo) =min(max(1-0.70,0.70), max(1-0.70,0.70), max(1-0.70,0.85))
= min(max(0.30,0.70), max(0.30,0.70), max(0.30,0.85) = min(0.70,0.70,0.85) = 0.70
3
P= =0.30, tj. 30%
10
0.70
Produktivnost Godine, P=40%
Tmin(Produktivnost,Godine) = min(max(1-0.70,0.70), max(1-0.80,0.95), max(1-0.70,0.95),
max(1-0.70,0.90)) = min(max(0.30,0.70),max(0.20,0.95),max(0.30,0.95),max(0.30,0.90))=
= min(0.70,0.95,0.95,0.90) = 0.70
4
P= =0.40, tj. 40%
10
0.70
Produktivnost Ime_Prezime, P=40%
Tmin(Produktivnost,Ime_Pr) = min(max(1-0.70,0.70), max(1-0.70,0.70), max(1-0.70,0.70),
max(1-0.70,0.70)) = min(max(0.30,0.70),max(0.30,0.70),max(0.30,0.70),max(0.30,0.70))=
= min(0.70,0.70,0.70,0.70) = 0.70
4
P= =0.40, tj. 40%
10
0.70
Iskustvo Godine, P=60%
Tmin (Iskustvo,Godine) = min(max(1-0.70,0.70), max(1-0.70,0.95), max(1-0.70,0.95),
max(1-0.70,0.90), max(1-0.85,0.90), max(1-0.70,0.95)) =
= min(max(0.30,0.70), max(0.30,0.95), max(0.30,0.95), max(0.30,0.90), max(0.15,0.90),
max(0.30,0.95)) = min(0.70,0.95,0.95,0.90,0.90,0.95) = 0.70
6
P= =0.60, tj. 60%
10

140
0.70
Iskustvo Ime_Prezime, P=50%
Tmin(Iskustvo,Ime_Prezime) = min(max(1-0.70,0.70), max(1-0.70,0.70), max(1-0.70,0.70),
max(1-0.70,0.70), max(1-0.70,0.70)) =
= min(max(0.30,0.70), max(0.30,0.70), max(0.30,0.70), max(0.30,0.70), max(0.30,0.70)) =
= min(0.70,0.70,0.70,0.70,0.70) = 0.70
5
P= =0.50, tj. 50%
10
0.70
Godine Ime_Prezime, P=10%
Tmin(Godine,Ime_Prezime) = min(max(1-0.70,0.70)) = min(max(0.30,0.70)) = 0.70
1
P= =0.10, tj. 10%
10
0.70 0.70
Ime_Prezime Godine, P=60% Pozicija Iskustvo, P=20%
0.70 0.75
Godine Ime_Prezime, P=10% Iskustvo Zarada, P=20%
0.70 0.85
Ime_Prezime Iskustvo, P=60% Zarada Iskustvo, P=10%
0.70 0.70
Iskustvo Ime_Prezime, P=50% Produktivnost Pozicija, P=20%
0.70 0.70
Ime_Prezime Produktivnost, P=60% Pozicija Produktivnost, P=10%
0.70 0.75
Produktivnost Ime_Prezime, P=40% Produktivnost Zarada, P=40%
0.70 0.75
Ime_Prezime Pozicija, P=50% Pozicija Zarada, P=20%
0.70 0.90
Pozicija Ime_Prezime, P=30% Pozicija Godine, P=30%
0.70 0.90
Ime_Prezime Zarada, P=60% Zarada Godine, P=30%
0.70
Godine Iskustvo, P=10%
0.70
Iskustvo Godine, P=60%
0.70
Godine Produktivnost, P=10%
0.70
Produktivnost Godine, P=40%
0.70
Iskustvo Produktivnost, P=30%
0.70
Produktivnost Iskustvo, P=30%
0.70
Iskustvo Pozicija, P=20%
Tabela 53. Fazi funkcionalne zavisnosti dobijene primenom I KL za k=0.7

141
Ukoliko bismo minimalni prag jaine zavisnosti k poveali na vrednost 0.8, finalni
skup fazi funkcionlanih zavisnosti izgledao bi znaajno drugaije. Iz tabele 54. vidimo da
je broj parova n-torki u kojima postoji saglasnost na posmatranim atributima mnogo manji
u poreenju sa tabelom 51. Stoga, logino je da e skup fazi funkcionalnih zavisnosti u
ovom sluaju biti drastino promenjen.
0.8 C(IP[ti,tj]) C(God[ti,tj]) C(Isk[ti,tj]) C(Pro[ti,tj]) C(Jez[ti,tj]) C(Poz[ti,tj]) C(Zar[ti,tj])
t1t2
t1t3
t1t4
t1t5
t2t3
t2t4
t2t5
t3t4
t3t5
t4t5
Tabela 54. C(Ai[ti,tj]) na atributima fazi relacije na bazi relacije bliskosti sa C(Ai[ti,tj])0.80

c) Otkrivanje fazi funkcionalnih zavisnosti primenom Kleene-Diense implikacije IKL za


sluaj k=0.80:
0.90
Produktivnost Pozicija, P=10%
Tmin(Produktivnost,Pozicija) = min(max(1-0.80,0.90)) = min(max(0.20,0.90)) = 0.90
1
P= =0.10, tj. 10%
10
0.85
Produktivnost Zarada, P=10%
Tmin(Produktivnost,Zarada) = min(max(1-0.80,0.85)) = min(max(0.20,0.85)) = 0.85
1
P= =0.10, tj. 10%
10
0.85
Zarada Iskustvo, P=10%
Tmin(Zarada,Iskustvo) = min(max(1-0.80,0.85)) = min(max(0.20,0.85)) = 0.85
1
P= =0.10, tj. 10%
10
0.90
Zarada Godine, P=20%
Tmin(Zarada,Godine) = min(max(1-0.85,0.95), max(1-0.80,0.90)) =
= min(max(0.15,0.95), max(0.20,0.90)) = min(0.95,0.90) = 0.90
2
P= =0.20, tj. 20%
10
0.95
Pozicija Godine, P=10%
Tmin(Pozicija,Godine) = min(max(1-0.80,0.95)) = min(max(0.20,0.95)) = 0.95

142
1
P= =0.10, tj. 10%
10
0.95
Produktivnost Godine, P=10%
Tmin(Produktivnost,Godine) = min(max(1-0.80,0.95)) = min(max(0.20,0.95)) = 0.95
1
P= =0.10, tj. 10%
10
0.90
Iskustvo Godine, P=10%
Tmin(Iskustvo,Godine) = min(max(1-0.85,0.90)) = min(max(0.15,0.90)) = 0.90
1
P= =0.10, tj. 10%
10
d) Otkrivanje fazi funkcionalnih zavisnosti primenom Mamdani-ijeve implikacije IMM za
sluaj k=0.80:
0.80
Produktivnost Pozicija, P=10%
Tmin(Produktivnost,Pozicija) = min(min(0.80,0.90)) = 0.80
1
P= =0.10, tj. 10%
10
0.80
Produktivnost Zarada, P=10%
Tmin(Produktivnost,Zarada) = min(min(0.80,0.85)) = 0.80
1
P= =0.10, tj. 10%
10
0.80
Zarada Iskustvo, P=10%
Tmin(Zarada,Iskustvo) = min(min(0.80,0.85)) = 0.80
1
P= =0.10, tj. 10%
10
0.80
Zarada Godine, P=20%
Tmin(Zarada,Godine) = min(min(0.85,0.95), min(0.80,0.90)) = min(0.85,0.80) = 0.80
2
P= =0.20, tj. 20%
10
0.80
Pozicija Godine, P=10%
Tmin(Pozicija,Godine) = min(min(0.80,0.95)) = 0.80
1
P= =0.10, tj. 10%
10

143
0.80
Produktivnost Godine, P=10%
Tmin(Produktivnost,Godine) = min(min(0.80,0.95)) = 0.80
1
P= =0.10, tj. 10%
10
0.85
Iskustvo Godine, P=10%
Tmin(Iskustvo,Godine) = min(min(0.85,0.90)) = 0.85
1
P= =0.10, tj. 10%
10
Moe se videti da se izborom odgavarajue vrednosti za k finalni skup fazi
funkcionalnih zavisnosti menja u znaajnoj meri. Projektant informacionog sistema, na
bazi svoje procene i interesa i krajnjeg cilja istraivanja, bira vrednost. Ovde istiemo da
na izbor vrednosti k utie iskustvo i ekspertsko znanje samog dizajnera.
U tabeli 55. su prikazane fazi funkcionalne zavisnosti dobijene primenom Mamdani-
ijeve IMM i Kleene-Diense IKL fazi implikacije kada smo vrednost kritine jaine zavisnosti
k promenili sa 0.70 na 0.80.
k=0.80 Kleene-Diense Mamdani P
0.90 0.80
1. Produktivnost Pozicija, Produktivnost Pozicija 10%
0.85 0.80
2. Produktivnost Zarada, Produktivnost Zarada 10%

0.85 0.80
3. Zarada Iskustvo Zarada Iskustvo 10%

0.90 0.80
4. Zarada Godine Zarada Godine 20%

0.95 0.80
5. Pozicija Godine Pozicija Godine 10%

0.95 0.80
6. Produktivnost Godine Produktivnost Godine 10%

0.90 0.85
7. Iskustvo Godine Iskustvo Godine 10%

Tabela 55. Poreenje FFDs dobijenih primenom IMM i IKL za k=0.8

Na datim skupovima zavisnih podataka moemo da koristimo pravila izvoenja za


fazi funkcionalne zavisnosti, a koja nam omoguavaju da doemo do novih zavisnosti. Ove
zavisnosti predstavljaju logiku posledicu otkrivenih funkionalnih zavisnosti. Ova pravila
prikazana su u poglavlju 3. (taka 3.5.1). Za sluaj primene IKL imamo:
0.90
Produktivnost Godine
0.85
Produktivnost Iskustvo, Godine

144
0.85
Zarada Godine
0.85
Produktivnost Pozicija, Zarada, Godine
0.85
Zarada Iskustvo, Godine
Na ovaj nain obogatili smo skup fazi funkcionalnih zavisnosti F sa novim
zavisnostima. Proireni skup oznaavamo sa F+.

6.3. Algoritam za pretragu fazi funkcionalnih zavisnosti u fazi modelu na bazi


mogunosti distribucije

Nakon to smo utvrdili postajanje fazi funkcionalnih zavisnosti u fazi modelu na bazi
relacije bliskosti, predloeni algoritam emo koristiti i u fazi modelu na bazi mogunosti
distribucije. Osnovna razlika izmeu ova dva fazi modela baza podataka lei u nainu
utvrivanja saglasnosti n-torki na posmatranim atributima. Naime, u ovom sluaju
saglasnost n-torki t = (A1, A2,..., An) i t = (A1, A2,..., An) na atributu Ai zavise od
mogunosti distribucija Ai i fazi relacije bliskosti definisane na moguim vrednostima
datog atributa. Na primeru iz tabele 42., saglasnost n-torki na datim atributima su:
Saglasnost n-torki na atributu Ime_Prezime:
C(Ime_Prezime[t1,t2]) = min(1,1,0.70) = 0.70
C(Ime_Prezime[t1,t3]) = min(1,1,0.70) = 0.70
C(Ime_Prezime[t1,t4]) = min(1,1,0.70) = 0.70
C(Ime_Prezime[t1,t5]) = min(1,1,0.70) = 0.70
C(Ime_Prezime[t2,t3]) = min(1,1,0.70) = 0.70
C(Ime_Prezime[t2,t4]) = min(1,1,0.70) = 0.70
C(Ime_Prezime[t2,t5]) = min(1,1,0.70) = 0.70
C(Ime_Prezime[t3,t4]) = min(1,1,0.70) = 0.70
C(Ime_Prezime[t3,t5]) = min(1,1,0.70) = 0.70
C(Ime_Prezime[t4,t5]) = min(1,1,0.70) = 0.70
Saglasnost n-torki na atributu Godine:
C(Godine[t1,t2]) = min(0.61,0.21,0.30) = 0.21
C(Godine[t1,t3]) = min(0.61,0.82,0.70) = 0.61
C(Godine[t1,t4]) = min(0.61,0.78,0.70) = 0.61
C(Godine[t1,t5]) = min(0.61,0.85,1) = 0.61
C(Godine[t2,t3]) = min(0.21,0.82,0.50) = 0.21
C(Godine[t2,t4]) = min(0.21,0.58,0.50) = 0.21
C(Godine[t2,t5]) = min(0.21,0.85,0.30) = 0.21
C(Godine[t3,t4]) = min(0.82,0.78,1) = 0.78
C(Godine[t3,t5]) = min(0.82,0.85,0.70) = 0.70
C(Godine[t4,t5]) = min(0.78,0.85,0.70) = 0.70

145
Saglasnost n-torki na atributu Iskustvo:
C(Iskustvo[t1,t2]) = min(0.76,0.46,0.40) = 0.40
C(Iskustvo[t1,t3]) = min(0.76,0.71,0.80) = 0.71
C(Iskustvo[t1,t4]) = min(0.76,0.89,1) = 0.76
C(Iskustvo[t1,t5]) = min(0.76,0.73,0.80) = 0.73
C(Iskustvo[t2,t3]) = min(0.46,0.71,0.60) = 0.46
C(Iskustvo[t2,t4]) = min(0.46,0.89,0.40) = 0.40
C(Iskustvo[t2,t5]) = min(0.46,0.73,0.60) = 0.46
C(Iskustvo[t3,t4]) = min(0.71,0.89,0.80) = 0.71
C(Iskustvo[t3,t5]) = min(0.71,0.73,1) = 0.71
C(Iskustvo[t4,t5]) = min(0.89,0.73,0.80) = 0.73

Saglasnost n-torki na atributu Produktivnost:


C(Produktivnost[t1,t2]) = min(0.65,0.79,0.65) = 0.65
C(Produktivnost[t1,t3]) = min(0.65,0.82,1) = 0.65
C(Produktivnost[t1,t4]) = min(0.65,0.90,0.75) = 0.65
C(Produktivnost[t1,t5]) = min(0.65,0.60,0.65) = 0.60
C(Produktivnost[t2,t3]) = min(0.79,0.82,0.65) = 0.65
C(Produktivnost[t2,t4]) = min(0.79,0.90,0.45) = 0.45
C(Produktivnost[t2,t5]) = min(0.79,0.60,1) = 0.60
C(Produktivnost[t3,t4]) = min(0.82,0.90,0.75) = 0.75
C(Produktivnost[t3,t5]) = min(0.82,0.60,0.65) = 0.60
C(Produktivnost[t4,t5]) = min(0.90,0.60,0.45) = 0.45

Saglasnost n-torki na atributu Jezik:


C(Jezik[t1,t2]) = min(1,1,1) = 1
C(Jezik[t1,t3]) = min(1,1,0.60) = 0.60
C(Jezik[t1,t4]) = min(1,1,0.20) = 0.20
C(Jezik[t1,t5]) = min(1,1,0.60) = 0.60
C(Jezik[t2,t3]) = min(1,1,0.60) = 0.60
C(Jezik[t2,t4]) = min(1,1,0.20) = 0.20
C(Jezik[t2,t5]) = min(1,1,0.30) = 0.30
C(Jezik[t3,t4]) = min(1,1,1) = 1
C(Jezik[t3,t5]) = min(1,1,1) = 1
C(Jezik[t4,t5]) = min(1,1,0.30) = 0.30

146
Saglasnost n-torki na atributu Pozicija:
C(Pozicija[t1,t2]) = min(1,1,0.70) = 0.70
C(Pozicija[t1,t3]) = min(1,1,0.60) = 0.60
C(Pozicija[t1,t4]) = min(1,1,0.50) = 0.50
C(Pozicija[t1,t5]) = min(1,1,0.50) = 0.50
C(Pozicija[t2,t3]) = min(1,1,0.90) = 0.90
C(Pozicija[t2,t4]) = min(1,1,0.60) = 0.60
C(Pozicija[t2,t5]) = min(1,1,0.60) = 0.60
C(Pozicija[t3,t4]) = min(1,1,0.70) = 0.70
C(Pozicija[t3,t5]) = min(1,1,0.70) = 0.70
C(Pozicija[t4,t5]) = min(1,1,0.80) = 0.80

Saglasnost n-torki na atributu Zarada:


C(Zarada[t1,t2]) = min(0.81,0.92,0.90) = 0.81
C(Zarada[t1,t3]) = min(0.81,0.89,0.45) = 0.45
C(Zarada[t1,t4]) = min(0.81,0.67,0.95) = 0.67
C(Zarada[t1,t5]) = min(0.81,0.32,1) = 0.32
C(Zarada[t2,t3]) = min(0.92,0.89,90) = 0.89
C(Zarada[t2,t4]) = min(0.92,0.67,0.55) = 0.55
C(Zarada[t2,t5]) = min(0.92,0.32,0.90) = 0.32
C(Zarada[t3,t4]) = min(0.89,0.67,0.25) = 0.25
C(Zarada[t3,t5]) = min(0.89,0.32,0.45) = 0.32
C(Zarada[t4,t5]) = min(0.67,0.32,0.95) = 0.32
Vrednosti usaglaenosti n-torki na atributima fazi relacije na bazi mogunosti
distribucije prikazane u tabeli 56.
k C(IP[ti,tj]) C(God[ti,tj]) C(Isk[ti,tj]) C(Pro[ti,tj]) C(Jez[ti,tj]) C(Poz[ti,tj]) C(Zar[ti,tj])
t1t2 0.70 0.21 0.40 0.65 1 0.70 0.81
t1t3 0.70 0.61 0.71 0.65 0.60 0.60 0.45
t1t4 0.70 0.61 0.76 0.65 0.20 0.50 0.67
t1t5 0.70 0.61 0.73 0.60 0.60 0.50 0.32
t2t3 0.70 0.21 0.46 0.65 0.60 0.90 0.89
t2t4 0.70 0.21 0.40 0.45 0.20 0.60 0.55
t2t5 0.70 0.21 0.46 0.60 0.30 0.60 0.32
t3t4 0.70 0.78 0.71 0.75 1 0.70 0.25
t3t5 0.70 0.70 0.71 0.60 1 0.70 0.32
t4t5 0.70 0.70 0.73 0.45 0.30 0.80 0.32
Tabela 56.. C(Ai[ti,tj]) na atributima fazi relacije na bazi mogunosti distribucije

147
Kao i u prethodnom sluaju, u zavisnosti od kritine jaine zavisnosti k pristupiemo
analizi fazi funkcionalnih zavisnosti u fazi relaciji na bazi mogunosti distribucije. Za
sluaj k=0.70. u sledeoj tabeli prikazani su parovi n-torki u kojima se potencijalno kriju
fazi funkcionalne zavisnosti.

0.7 C(IP[ti,tj]) C(God[ti,tj]) C(Isk[ti,tj]) C(Pro[ti,tj]) C(Jez[ti,tj]) C(Poz[ti,tj]) C(Zar[ti,tj])


t1t2
t1t3
t1t4
t1t5
t2t3
t2t4
t2t5
t3t4
t3t5
t4t5
Tabela 57. C(Ai[ti,tj]) na atributima fazi relacije na bazi mogunosti distribucije za sluaj C(Ai[ti,tj])0.70

a) Otkrivanje fazi funkcionalnih zavisnosti u fazi modelu na bazi mogunosti distribucije


primenom Mamdani-ijeve implikacije IMM za sluaj k=0.70:
0.70
Ime_Prezime Godine, P=30%
Tmin(Ime_Prezime,Godine) = min(min(0.70,0.78), min(0.70,0.70), min(0.70,0.70)) =
min (0.70,0.70,0.70) = 0.70
3
P= =0.30, tj. 30%
10
0.70
Ime_Prezime Iskustvo, P=60%
Tmin(Ime_Prezime,Iskustvo) = min(min(0.70,0.71), min(0.70,0.76), min(0.70,0.73),
min(0.70,0.71),min(0.70,0.71), min(0.70,0.73)) = min (0.70,0.70,0.70,0.70,0.70,0.70)=0.70
6
P= =0.60, tj. 60%
10
0.70
Ime_Prezime Produktivnost, P=10%
Tmin(Ime_Prezime,Produktivnost) = min(min(0.70,0.75)) = 0.70
1
P= =0.10, tj. 10%
10
0.70
Ime_Prezime Jezik, P=30%
Tmin(Ime_Prezime,Jezik) = min(min(0.70,1), min(0.70,1), min(0.70,1)) =
min (0.70,0.70,0.70) = 0.70
3
P= =0.30, tj. 30%
10

148
0.70
Ime_Prezime Pozicija, P=50%
Tmin(Ime_Prezime,Pozicija) = min(min(0.70,0.70), min(0.70,0.90), min(0.70,0.70),
min(0.70,0.70),min(0.70,0.80)) = min (0.70,0.70,0.70,0.70,0.70) = 0.70
5
P= =0.50, tj. 50%
10
0.70
Ime_Prezime Zarada, P=20%
Tmin(Ime_Prezime,Zarada) = min(min(0.70,0.81),min(0.70,0.89))=min (0.70,0.70) = 0.70
2
P= =0.20, tj. 20%
10
0.70
Godine Iskustvo, P=20%
Tmin(Godine,Iskustvo) = min(min(0.70,0.71),min(0.70,0.73))=min (0.70,0.70) = 0.70
2
P= =0.20, tj. 20%
10
0.70
Godine Jezik, P=20%
Tmin(Godine,Jezik) = min(min(0.78,1),min(0.70,1)) = min (0.78,0.70) = 0.70
2
P= =0.20, tj. 20%
10
0.70
Godine Pozicija, P=20%
Tmin(Godine,Pozicija) = min(min(0.70,0.70),min(0.70,0.80))=min (0.70,0.70) = 0.70
2
P= =0.20, tj. 20%
10
0.71
Iskustvo Produktivnost, P=10%
Tmin(Iskustvo,Produktivnost) = min(min(0.71,0.75)) = 0.71
1
P= =0.10, tj. 10%
10
0.71
Iskustvo Jezik, P=20%
Tmin(Iskustvo,Jezik) = min(min(0.71,1),min(0.71,1)) = min (0.71,0.71) = 0.71
2
P= =0.20, tj. 20%
10
0.73
Iskustvo Pozicija, P=10%
Tmin(Iskustvo,Pozicija) = min(min(0.73,0.80)) = 0.73
1
P= =0.10, tj. 10%
10

149
0.75
Produktivnost Jezik, P=10%
Tmin(Produktivnost,Jezik) = min(min(0.75,1)) = 0.75
1
P= =0.10, tj. 10%
10
0.70
Pozicija Zarada, P=10%
Tmin(Pozicija,Zarada) = min(min(0.70,0.81)) = 0.70
1
P= =0.10, tj. 10%
10
0.89
Zarada Pozicija, P=10%
Tmin(Zarada,Pozicija) = min(min(0.89,0.90)) = 0.89
1
P= =0.10, tj. 10%
10
0.81
Zarada Jezik, P=10%
Tmin(Zarada,Jezik) = min(min(0.81,1)) = 0.81
1
P= =0.10, tj. 10%
10
0.70
Pozicija Jezik, P=30%
Tmin(Pozicija,Jezik) = min(min(0.70,1), min(0.70,1), min(0.70,1)) = min (0.70,0.70,0.70) =
= 0.70
3
P= =0.30, tj. 30%
10
0.70
Pozicija Produktivnost, P=10%
Tmin(Pozicija,Produktivnost) = min(min(0.70,0.75)) = 0.70
1
P= =0.10, tj. 10%
10
0.70
Pozicija Godine, P=20%
Tmin(Pozicija,Godine) = min(min(0.70,0.78),min(0.70,0.70)) = min (0.70,0.70) = 0.70
2
P= =0.20, tj. 20%
10
0.70
Pozicija Ime_Prezime, P=30%
Tmin(Pozicija,Ime_Prezime) = min(min(0.70,0.70), min(0.70,0.70), min(0.70,0.70)) =
min (0.70,0.70,0.70) = 0.70
3
P= =0.30, tj. 30%
10

150
0.75
Produktivnost Godine, P=10%
Tmin(Produktivnost,Godine) = min(min(0.75,0.78)) = 0.75
1
P= =0.10, tj. 10%
10
0.71
Iskustvo Godine, P=10%
Tmin(Iskustvo,Godine) = min(min(0.71,0.78)) = 0.71
1
P= =0.10, tj. 10%
10
0.70
Godine Ime_Prezime, P=20%
Tmin(Godine,Ime_Prezime) = min(min(0.70,0.70),min(0.70,0.70)) = min (0.70,0.70) = 0.70
2
P= =0.20, tj. 20%
10
0.70 0.71
Ime_Prezime Godine, P=30% Iskustvo Jezik, P=20%
0.70 0.73
Godine Ime_Prezime, P=20% Iskustvo Pozicija, P=10%
0.70 0.75
Ime_Prezime Iskustvo, P=60% Produktivnost Jezik, P=10%
0.70 0.70
Ime_Prezime Produktivnost, P=10% Pozicija Zarada, P=10%
0.70 0.89
Ime_Prezime Jezik, P=30% Zarada Pozicija, P=10%
0.70 0.81
Ime_Prezime Pozicija, P=50% Zarada Jezik, P=10%
0.70 0.70
Pozicija Ime_Prezime, P=30% Pozicija Jezik, P=30%
0.70 0.70
Ime_Prezime Zarada, P=20% Pozicija Produktivnost, P=10%
0.70 0.75
Godine Iskustvo, P=20% Produktivnost Godine, P=10%
0.71
Iskustvo Godine, P=10%
0.70
Godine Jezik, P=20%
0.70
Godine Pozicija, P=20%
0.70
Pozicija Godine, P=20%
0.71
Iskustvo Produktivnost, P=10%
Tabela 58. Fazi funkcionalne zavisnosti u fazi modelu na bazi mogu.distr.dobijene primenom I MM. za k=0.7

151
U tabeli 58. prikazane su identifikovane fazi funkcionalne zavisnosti izmeu atributa koji
definiu fazi model na bazi mogunosti distribucije. Ove zavisnosti moemo da prikaemo
u vidu IF-THEN pravila ili lingvistikim izrazima kao to su:
''Ime i prezime slubenika u veoj meri odreuje njegovo iskustvo'' je zavisnost sa
lingvistikom jainom 0.70 ili
''Slubenici priblinih godina otprilike imaju i slino iskustvo'' ima lingvistiku jainu 0.70
ili
''Zarada slubenika u manjoj meri odreuje i jezik koji govori'' ima lingvistiku jainu
0.81.
Ove zavisnosti ne odreuju precizan nivo skrivenih znanja, ali ipak osiguravaju potreban
nivo neophodan za donoenje upravljakih odluka. O praktinim primenama fazi
funkcionalnih zavisnosti bie rei u ovom poglavlju doktorske disertacije.
b) Otkrivanje fazi funkcionalnih zavisnosti u fazi modelu na bazi mogunosti distribucije
primenom Kleene-Diense implikacije IKL za sluaj k=0.70:
0.70
Ime_Prezime Godine, P=30%
Tmin(Ime_Prezime,Godine) = min(max(1-0.70,0.78), max(1-0.70,0.70), max(1-0.70,0.70))
= min(max(0.30,0.78), max(0.30,0.70), max(0.30,0.70)) = min (0.78,0.70,0.70) = 0.70
3
P= =0.30, tj. 30%
10
0.71
Ime_Prezime Iskustvo, P=60%
Tmin(Ime_Prezime,Iskustvo) = min(max(1-0.70,0.71), max(1-0.70,0.76), max(1-0.70,0.73),
max(1-0.70,0.71), max(1-0.70,0.71), max(1-0.70,0.73)) = min(max(0.30,0.71),
max(0.30,0.76), max(0.30,0.73), max(0.30,0.71), max(0.30,0.71), max(0.30,0.73)) =
= min (0.71,0.76,0.73,0.71,0.71,0.73)=0.71
6
P= =0.60, tj. 60%
10
0.75
Ime_Prezime Produktivnost, P=10%
Tmin(Ime_Prezime,Produktivnost) = min(max(1-0.70,0.75)) = min(max(0.30,0.75)) = 0.75
1
P= =0.10, tj. 10%
10
1
Ime_Prezime Jezik, P=30%
Tmin(Ime_Prezime,Jezik) = min(max(1-0.70,1), max(1-0.70,1), max(1-0.70,1)) =
= min(max(0.30,1), max(0.30,1), max(0.30,1)) = min (1,1,1) = 1
3
P= =0.30, tj. 30%
10

152
0.70
Ime_Prezime Pozicija, P=50%
Tmin(Ime_Prezime,Pozicija) = min(max(1-0.70,0.70), max(1-0.70,0.90), max(1-0.70,0.70),
max(1-0.70,0.70), max(1-0.70,0.80)) = min(max(0.30,0.70), max(0.30,0.90),
max(0.30,0.70), max(0.30,0.70), max(0.30,0.80)) = min (0.70,0.90,0.70,0.70,0.80) = 0.70
5
P= =0.50, tj. 50%
10
0.81
Ime_Prezime Zarada, P=20%
Tmin(Ime_Prezime,Zarada) = min(max(1-0.70,0.81), max(1-0.70,0.89)) =
=min(max(0.30,0.81), max(0.30,0.89)) = min (0.81,0.89) = 0.81
2
P= =0.20, tj. 20%
10
0.71
Godine Iskustvo, P=20%
Tmin(Godine,Iskustvo) = min(max(1-0.70,0.71), max(1-0.70,0.73)) = min(max(0.30,0.71),
max(0.30,0.73)) = min (0.71,0.73) = 0.71
2
P= =0.20, tj. 20%
10
1
Godine Jezik, P=20%
Tmin(Godine,Jezik) = min(max(1-0.78,1), max(1-0.70,1)) = min(max(0.22,1), max(0.30,1))
= min (1,1) = 1
2
P= =0.20, tj. 20%
10
0.70
Godine Pozicija, P=20%
Tmin(Godine,Pozicija) = min(max(1-0.70,0.70), max(1-0.70,0.80)) = min(max(0.30,0.70),
max(0.30,0.80)) = min (0.70,0.80) = 0.70
2
P= =0.20, tj. 20%
10
0.75
Iskustvo Produktivnost, P=10%
Tmin(Iskustvo,Produktivnost) = min(max(1-0.71,0.75)) = min(max(0.29,0.75)) = 0.75
1
P= =0.10, tj. 10%
10
1
Iskustvo Jezik, P=20%
Tmin(Iskustvo,Jezik) = min(max(1-0.71,1), max(1-0.71,1)) = min(max(0.29,1),
max(0.21,1)) = min (1,1) = 1
2
P= =0.20, tj. 20%
10

153
0.80
Iskustvo Pozicija, P=10%
Tmin(Iskustvo,Pozicija) = min(max(1-0.73,0.80)) = min(max(0.27,0.80)) = 0.80
1
P= =0.10, tj. 10%
10
1
Produktivnost Jezik, P=10%
Tmin(Produktivnost,Jezik) = min(max(1-0.75,1)) = min(max(0.25,1)) = 1
1
P= =0.10, tj. 10%
10
0.81
Pozicija Zarada, P=10%
Tmin(Pozicija,Zarada) = min(max(1-0.70,0.81)) = min(max(0.30,0.81)) = 0.81
1
P= =0.10, tj. 10%
10
0.90
Zarada Pozicija, P=10%
Tmin(Zarada,Pozicija) = min(max(1-0.89,0.90)) = min(max(0.11,0.90)) = 0.90
1
P= =0.10, tj. 10%
10
1
Zarada Jezik, P=10%
Tmin(Zarada,Jezik) = min(max(1-0.81,1)) = min(max(0.19,1)) = 1
1
P= =0.10, tj. 10%
10
1
Pozicija Jezik, P=30%
Tmin(Pozicija,Jezik) = min(max(1-0.70,1), max(1-0.70,1), max(1-0.70,1)) =
= min(max(0.30,1), max(0.30,1), max(0.30,1)) = min(1,1,1) = 1
3
P= =0.30, tj. 30%
10
0.75
Pozicija Produktivnost, P=10%
Tmin(Pozicija,Produktivnost) = min(max(1-0.70,0.75)) = min(max(0.30,0.75)) = 0.75
1
P= =0.10, tj. 10%
10
0.70
Pozicija Godine, P=20%
Tmin(Pozicija,Godine) = min(max(1-0.70,0.78), max(1-0.70,0.70)) = min (max(0.30,0.78),
max(0.30,0.70)) = min (0.78,0.70) = 0.70
2
P= =0.20, tj. 20%
10

154
0.70
Pozicija Ime_Prezime, P=30%
Tmin(Pozicija,Ime_Prezime) = min(max(1-0.70,0.70), max(1-0.70,0.70), max(1-0.70,0.70))
= min (max(0.30,0.70), max(0.30,0.70), max(0.30,0.70)) = min (0.70,0.70,0.70) = 0.70
3
P= =0.30, tj. 30%
10
0.78
Produktivnost Godine, P=10%
Tmin(Produktivnost,Godine) = min(max(1-0.75,0.78)) = min(max(0.25,0.78)) = 0.78
1
P= =0.10, tj. 10%
10
0.78
Iskustvo Godine, P=10%
Tmin(Iskustvo,Godine) = min(max(1-0.71,0.78)) = min(max(0.29,0.78)) = 0.78
1
P= =0.10, tj. 10%
10
0.70
Godine Ime_Prezime, P=20%
Tmin(Godine,Ime_Prezime) = min(max(1-0.70,0.70), max(1-0.70,0.70)) =
= min (max(0.30,0.70), max(0.30,0.70)) = min (0.70,0.70) = 0.70
2
P= =0.20, tj. 20%
10
Tabela broj 59. prikazuje otkrivene fazi funkcionalne zavisnosti koje smo dobili
primenom razliitih fazi implikacija, tj. Mamdanijeve IMM i Kleene Diense IKD. Iz tabele
zakljuujemo da je lingvistika jaina zavisnosti vea ili jednaka kada je raunamo
pomou Kleene Diense fazi implikacije. O ovome e biti rei u narednim odeljcima ove
doktorske disertacije.

155
0.70 0.70
Ime_Prezime Godine, P=30% Ime_Prezime Godine, P=30%
0.70 0.70
Godine Ime_Prezime, P=20% Godine Ime_Prezime, P=20%
0.70 0.71
Ime_Prezime Iskustvo, P=60% Ime_Prezime Iskustvo, P=60%
0.70 0.75
Ime_Prezime Produktivnost, P=10% Ime_Prezime Produktivnost, P=10%
0.70 1
Ime_Prezime Jezik, P=30% Ime_Prezime Jezik, P=30%
0.70 0.70
Ime_Prezime Pozicija, P=50% Ime_Prezime Pozicija, P=50%
0.70 0.70
Pozicija Ime_Prezime, P=30% Pozicija Ime_Prezime, P=30%
0.70 0.81
Ime_Prezime Zarada, P=20% Ime_Prezime Zarada, P=20%
0.70 0.71
Godine Iskustvo, P=20% Godine Iskustvo, P=20%
0.71 0.78
Iskustvo Godine, P=10% Iskustvo Godine, P=10%
0.70 1
Godine Jezik, P=20% Godine Jezik, P=20%
0.70 0.70
Godine Pozicija, P=20% Godine Pozicija, P=20%
0.70 0.70
Pozicija Godine, P=20% Pozicija Godine, P=20%
0.71 0.75
Iskustvo Produktivnost, P=10% Iskustvo Produktivnost, P=10%
0.71 1
Iskustvo Jezik, P=20% Iskustvo Jezik, P=20%
0.73 0.80
Iskustvo Pozicija, P=10% Iskustvo Pozicija, P=10%
0.75 1
Produktivnost Jezik, P=10% Produktivnost Jezik, P=10%
0.70 0.81
Pozicija Zarada, P=10% Pozicija Zarada, P=10%
0.89 0.90
Zarada Pozicija, P=10% Zarada Pozicija, P=10%
0.81 1
Zarada Jezik, P=10% Zarada Jezik, P=10%
0.70 1
Pozicija Jezik, P=30% Pozicija Jezik, P=30%
0.70 0.75
Pozicija Produktivnost, P=10% Pozicija Produktivnost, P=10%
0.75 0.78
Produktivnost Godine, P=10% Produktivnost Godine, P=10%
Tabela 59. FFDs dobijene primenom Mamdani-ijeve i Kleene-Diense fazi implikacije

156
I u ovom primeru emo da izraunamo i odredimo fazi funkcionalne zavisnosti kada
prag kritine jaine zavisnosti k poveamo na vrednost 0.80. U sledeoj tabeli su prikazani
parovi n-torki u kojima je vrednost C(Ai[ti,tj]) 0.80.
0.8 C(IP[ti,tj]) C(God[ti,tj]) C(Isk[ti,tj]) C(Pro[ti,tj]) C(Jez[ti,tj]) C(Poz[ti,tj]) C(Zar[ti,tj])
t1t2
t1t3
t1t4
t1t5
t2t3
t2t4
t2t5
t3t4
t3t5
t4t5
Tabela 60. C(Ai[ti,tj]) na atributima fazi relacije na bazi mogunosti distribucije za sluaj C(Ai[ti,tj])0.80

Iz ove tabele vidimo da je mogue utvrditi postojanje dve fazi funkcionalne


zavisnosti, a to su:
c) Otkrivanje fazi funkcionalnih zavisnosti u fazi modelu na bazi mogunosti distribucije
primenom Mamdani-ijeve implikacije IMM za sluaj k=0.80:
0.89
Zarada Pozicija, P=10%
Tmin(Zarada,Pozicija) = min(min(0.89,0.90)) = 0.89
1
P= =0.10, tj. 10%
10
0.81
Zarada Jezik, P=10%
Tmin(Zarada,Jezik) = min(min(0.81,1)) = 0.81
1
P= =0.10, tj. 10%
10
d) Otkrivanje fazi funkcionalnih zavisnosti primenom Kleene-Diense implikacije IKL za
sluaj k=0.80:
0.90
Zarada Pozicija, P=10%
Tmin(Zarada,Pozicija) = min(max(1-0.89,0.90)) = min(max(0.11,0.90)) = 0.90
1
P= =0.10, tj. 10%
10
1
Zarada Jezik, P=10%
Tmin(Zarada,Jezik) = min(max(1-0.81,1)) = min(max(0.19,1)) = 1
1
P= =0.10, tj. 10%
10

157
Moe se videti da smo u sluaju primene Kleene-Diense fazi implikacije dobili istu
1
funkcionalnu zavisnost Zarada Jezik. S obzirom da se u naoj fazi relaciji vrednost za
zaradu z2 pojavljuje u dve n-torke, t1 i t5, vrednosti atributa Jezik u ovom sluaju nisu
identine jer z2 reprezentuje jako udaljene vrednosti.
Primenom pravila izvoenja za fazi funkcionalne zavisnosti moemo dobijeni skup F

proiriti u F+ dodajui novu zavisnost Zarada Pozicija,Jezik. Za sluaj primene IMM
=0.81, a kada koristimo IKL vrednost jaine zavisnosti =0.90.
k=0.80 Kleene-Diense Mamdani P
0.90 0.89
1. Zarada Pozicija, Zarada Pozicija, 10%

1 0.81
2. Zarada Jezik, Zarada Jezik, 10%

0.90 0.81
3. Zarada Pozicija, Jezik Zarada Pozicija, Jezik 10%

Tabela 61. Skup F+ za k=0.8

6.4. Upotreba fazi priloga

Korienjem fazi priloga fazi funkcionalne zavisnosti moemo da transliramo u


lingvistika pravila i da na taj nain omoguimo korisnicima informacija i saznanja iz baza
podataka da ih koriste na prirodan nain, u tzv. ljudski-orijentisanom modu (human-
oriented mode). Ova logika dobija potvrdu u injenici da i prirodni jezik obuhvata mnoge
nepreciznosti i neodreenosti koje su kompatibilne sa prirodom fazi funkcionalnih
zavisnosti. U ovoj doktorskoj disertaciji navodili smo primere fazi funkcionalnih
zavisnosti, kao to su:
''Inteligencija manje ili vie odreuje uspeh studenta''
''Iskustvo veoma utie na zaradu zaposlenog''
''Zarada slubenika u manjoj meri odreuje i jezik koji govori''
Upotreba fazi priloga kao to su manje ili vie, otprilike, veoma, proseno, u manjoj meri,
veinom, priblino itd. dozvoljava nam fleksibilnost u interpretaciji algoritma za

identifikovanje fazi funkcionalnih zavisnosti. Dakle, zavisnost tipa Pozicija Zarada
moe da se iskae i u lingvistikoj formi koja je prihvatljivija krajnjim korisnicima
saznanja.
Da bismo reprezentovali upotrebu fazi priloga u kontekstu i interpretaciji fazi
funkcionalnih zavisnosti predlaemo korienje jaine zavisnosti i parametra P za opis
primene istih. Na sledeoj slici prikazan je primer kako moemo da upotrebimo pojedine
lingvistike izraze u interpretaciji zavisnosti u formi prirodnog jezika. Eksperti i
projektanti informacionih sistema predlau i definiu nain i modele, kao to je ovaj
primer, korienja fazi priloga. Razmatrajui da neki od priloga mogu da imaju isto ili
slino znaenje, mi koristimo izraze iz defisnisanog modela.

158

1

0.9

er oj

a
e li
m an j

om
vi je i
m

an

Ve
0.8

M
0.7

0.6

0.5

0.4

0.3

0.2

0.1

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1


P
Slika 16. Model upotrebe fazi priloga

ta donosi metrika? Procenat n-torki u kojima postoji posmatrana zavisnost ukazuje


nam na intenzitet i bogatstvo zavisnosti u datoj fazi relaciji. to je vrednost parametra P
vea, fazi funkcionalna zavisnost je sadrana u veem broju n-torki. U tom kontekstu,
predloena metodologija donosi nove aspekte analize fazi funkcionalnih zavisnosti. U
sistemima za podrku odluivanju to znai da vei prioritet u donoenju odluka imaju one
zavisnosti, tj. pravila IF-THEN tipa, koja imaju veu vrednost parametra P. To
podrazumeva veu proporciju parova n-torki koji zadovoljavaju opisane uslove. A to nam
dalje ukazuje na injenicu da takve zavisnosti moemo da primenjujemo u proceni
nepoznatih (NULL) vrednosti atributa i da sa odreenom verovatnoom/stepenom istine
pretpostavljamo da je nepoznata vrednost atributa upravo ona koju smo dobili primenom
ove metodologije. to je vrednost parametra P manja, tada zakljuujemo da je fazi
funkcionalna zavisnost sadrana samo u pojedinanom ili manjem broju parova n-torki, pa
je faktor sigurnosti procenjene nepoznate vrednosti znatno nii. Za donosioca odluke to je
znak za dalju analizu i procenu prilikom donoenja odluka.
Naroito istiemo, u kontekstu predloene metodoligije, da ona omoguava
ekstrakciju svih fazi funkcionalnih zavisnosti. Dobijeni skup zavisnosti moe kasnije da se
redukuje ili proiri prema korisnikovim potrebama i zamislima, ali i da se koristi za
estimaciju NULL vrednosti sa odreenim faktorom sigurnosti i verovatnoe.

6.5. Poreenje primene razliitih fazi implikacija

Sa praktine strane gledita, mi primeujemo da u identifikovanim fazi


funkcionalnim zavisnostima postoji dvoznanost kada primenjujemo razliite fazi
implikacije. U ovom poglavlju analiziramo upotrebu razliitih operatora fazi implikacije
kako bi se u konkretnom primeru mogao izabrati najpogodniji. U prethodnim poglavljima
prikazane su tabele sa fazi funkcionalnim zavisnostima koje su dobijene primenom
Mamdani-ijeve i Kleene-Diense fazi implikacije. Ako uporedimo rezultate dobijene
primenom fazi implikacija koji zadovoljavaju kriterijume prihvatanja u analizi opisane u
petom poglavlju, moemo da zakljuimo sledee:

159
- Kleene-Diense fazi implikacija daje nam vee vrednosti jaine zavisnosti u
poreenju sa Mamdani-ijevom, Wilmot-ovom i Early-Zade fazi implikacijom
(Tabela 62.).
- Mamdani, Willmot i Early-Zade fazi operatori daju nam iste rezultate i vrednosti
jaine zavisnosti , s tim da ta vrednost nije uvek manja vrednosti koja je dobijena
primenom Kleene-Diense fazi implikacije.
- Proporcija/procenat n-torki u kojima postoje fazi funkcionalne zavisnosti je
nezavisna od izbora odgovarajueg operatora fazi implikacije.
- Dobijene vrednosti jaine zavisnosti su zavisne od usaglaenosti n-torki na
posmatranim atributima. U ovoj doktorskoj disertaciji prikazali smo dve razliite
fazi relacije i dve formule za raunanje saglasnosti n-torki na atributima datih fazi
modela.
U sledeoj tabeli prikazane su vrednosti jaine zavisnosti za razliite fazi
implikacije koje smo koristili u identifikovanju fazi funkcionalnih zavisnosti u ovoj
doktorskoj disertaciji.
IMM IKL IEA IW
k 1 2 1 1
Tabela 62. Vrednosti jaine zavisnosti dobijene primenom razliitih fazi implikacija

Napomenimo da je vrednost 2 1, a to smo uoili i konstatovali na primeru fazi


funkcionalnih zavisnosti koje smo identifikovali primenom predloene metodologije na
fazi relacijima u ovom radu.

6.6. Praktina primena metodologije

Postoji veliki broj situacija i scenarija u kome ovaj koncept moe biti jako koristan.
Neki primeri su:
- Identifikovane fazi funkcionalne zavisnosti reprezentovane su sa fazi implikacijama
koje nam omoguavaju ekstrakciju relevantnih i prethodno nepoznatih informacija
neophodnih za donoenje upravljakih i poslovnih odluka. Menaderi u
savremenim korporacijama sve vie se oslanjaju na podatke iz baza podataka kako
bi doli do novih saznanja i auriranih informacija. Na taj nain odreeni fragment
fazi logike omoguava nam definisanje novih tehnika rudarenja podataka odnosno
istraivanje i analizu velikih koliina podataka s ciljem otkrivanja znaajnih paterna
i pravila. To je praktino samo deo pronalaenja znanja u bazama podataka, ali sa
pravom moemo rei i kljuni deo.
- Istraivanje podataka ima sve vei znaaj u procesu upravljanja zbog neogranienih
mogunosti primene, ukljuujui prodaju i marketing, slubu podrke kupcima,
razvoj baze znanja itd. Izgradnja prediktivnih modela ponaanja potroaa danas je
jako zastupljena tema u velikom broju kompanija koje su trino orjentisane.
Prikupljeni podaci se modeliraju, vri se analiza, targetiranje, izvetavanje i
identifikacija potencijalno novih podruija za poveanje profita. U takvim
okolnostim, ovo metodologija ima veliki znaaj. No, pretraga znanja je zastupljena
i u drugim modelima baza podataka.

160
- Predloena metodologija moe da se koristi i u pronalaenju funkcionalnih
zavisnosti u crisp relacijama, tj. klasinim relacionim bazama podataka. Prilikom
kreiranja logikog modela nove baze podataka, pronalaenje crisp funkcionalnih
zavisnosti vodi direktno u redukciju broja atributa za koje treba prikupljati podatke
i zapamtiti u bazi podataka. Na primer, ako je jedan atribut u potpunosti zavistan od
nekoliko atributa, onda se on moe izraunati. Podskup atributa X funkcionalno
odreuje atribut Y (X Y) ako je svaki X asociran sa tano jednim Y. Na primer
atributi teritorija i gustina stanovnika. Kod fazi funkcionalnih zavisnosti izmeu
atributa, pitanje je koliko jako treba da su atributi zavisni da se za njih ne
prikupljali podaci. Odnosno, kada prikupljanje podataka za zavisne atribute ima, a
kada nema smisla. Fazi funkcionalne zavisnosti treba paljivije koristiti kod
redukcije atributa u tabelama. Kod postojeih baza podataka cilj je redukcija broja
entitetovih atributa za budua auriranja manjeg broja atributa. Ovo je kombinacija
modifikacije logikog modela i ekstrakcije informacija iz baza podataka.
- Fazi funkcionalne zavisnosti imaju iroku primenu kod ekstrakcije informacija i
pravila iz podataka. Na primer da li veina entiteta iz baze podataka sa osobinom A
ima osobinu B? Gde su A i B izrazi prirodnog jezika tipa visoka zarada, malo
preduzee itd. Tema je interesantna s pogleda moguih primena i u oficijalnoj
statistici: intrastat, popisi stanovnitva, registri, generisanju fazi upita
- Navie, pronalaenjem fazi funkcionalnih zavisnosti se moe redukovati ne samo
broj atributa, ve i broj entiteta se moe redukovati ili se mogu samo raspoznati
veoma slini entiteti i na taj nain se smanjuje redundantnost.
- U ovoj doktorskoj disertaciji mi smo se fokusirali na fazi relacione baze podataka,
jer su praktinije za analizu. Razlog je jednostavan. Pretpostavimo da je
kardinalnost domena atributa Zarada velika u poreenju sa brojem entiteta, tj.
dom(Zarada) R. Da bismo utvrdili postojanje fazi funkcionalnih zavisnosti
koristimo relaciju bliskosti izmeu vrednosti atributa. Mnogo jednostavniji i
efikasniji nain za analizu relacija izmeu atributa posmatrane baze je da umesto
crips podataka poredimo meusobno lingvistike izraze kao to su mala, srednja,
visoka, veoma visoka zarada. U tom sluaju domen atributa Zarada je skup etiri
vrednosti dom(Zarada) = {mala, srednja, visoka, veoma visoka}. Poreenjem
lingvistikih izraza ili raunanjem semantike distance izmeu dva fazi broja
znaajno pojednostavljujemo proceduru predstavljenu u ovom radu. Dakle, daje se
prednost i ukazuje na vanost fazifikacije podataka. U literaturi postoji razliiti
naini i modeli fazifikacije klasinih baza podataka. Ove injenice nas navode na
zakljuak da su fazi relacione baze podataka efikasnije za dobijanje informacija
neophodnih za donoenje upravljakih odluka. Cilj nije dobiti to vie informacija
iz ogromne koliine podataka skladietnih u relacionim bazama, ve bolje i
kvalitetnije informacije.
- U pogledu primene fazi funkcionalnih zavisnosti znaajno mesto zauzima i analiza
i procena nepoznatih odnosno NULL vrednosti. To su one vrednosti koje postoje, a
koje ne znamo. Fazi funkcionalne zavisnosti posmatramo kao rezultat istraivanja,
a koji moe da ima praktinu primenu. Algoritam predstavljen u ovoj doktorskoj
disertaciji koristiemo u buduim istraivanjima za procenu nepoznatih vrednosti
atributa koji se odnose optine u jednom regionu u Republici Slovakoj (npr. broj
snenih dana u godini za pojedine optine). Na osnovu poznatog skupa fazi
funkcionalnih zavisnosti moemo da generiemo sistem fazi pravila koja sa
odreenom verovatnoom manifestuju nepoznatu vrednost atributa. Dakle, fazi

161
pravila generiemo direktno iz relacione baze podataka koristei otkrivene fazi
funkcionalne zavisnosti.
- Poseban znaaj metodologije predstavljene u ovom radu ogleda se u mogunosti
logikog projektovanja fazi relacionih baza podataka. Kao i u sluaju klasinih
relacionih baza podataka problem redundancije i anomalija je prisutan i u fazi
modelima ukoliko nisu adekvatno dizajnirani. Chen, Kerre i Vandenbulke su u
svojim radovima predstavili teorijske smernice za logiko projektovanje fazi
relacija na osnovu poznatog skupa fazi funkcionalnih zavisnosti. Zbog toga
algoritam pomou kojeg dolazimo do datog skupa je veoma vaan korak u
pravilnom dizajniranju. U radovima pomenutih autora nije prikazano kako moemo
doi do skupa fazi funkcionalnih zavisnosti koji u stvari predstavlja input za radni
okvir predstavljen u njihovom radu. Zbog toga emo na sledeem primeru prikazati
kako u naem sluaju fazi relacije mogu da se dekomponuju pomou skupa
zavisnosti do kojih smo doli primenom algoritma predstavljenog u ovoj doktorskoj
disertaciji.

6.7. Projektovanje fazi relacionih baza podataka

U etvrtom poglavlju predstavili smo teorijske smernice za normalizaciju fazi


relacionih baza podataka. Istakli smo da fazi funkcionalne zavisnosti imaju veoma vanu
ulogu u projektovanju istih. Slino kao i kod klasinih relacija, problem anomalija i
redundancije prisutan je i kod fazi relacija kada nisu pravilno dizajnirane. Chen, Kerre i
Vandenbulcke [12] proiruju teoriju normalizacije prilagoavajui je fazi modelima.
Zapravo, oni formuliu q-fazi normalne forme koje omoguavaju dekompoziciju
prvobitnih relacija/tabela uz ouvanje postojanih fazi funkcionalnih zavisnosti.
Dekomponovane tabele mogue je ponovo spajati, a da pri tome ne doe do gubitka
informacija. Napomenimo i da se problem anomalija i redundantnosti podataka smatra
manje ozbiljnim u fazi relacijama pre svega zbog raspoloivosti i raznovrsnosti vrednosti
atributa.
Ovaj radni okvir je razvijen za fazi modele na bazi mogunosti distribucije i fazi
modele na bazi relacije bliskosti, koji su i analizirani u ovoj doktorskoj disertaciji. Stoga
emo da analiziramo projektovanje fazi relacija prikazanih u tabelama 35. i 42. U analizi
emo koristiti skupove fazi funkcionalnih zavisnosti koji su dobijeni primenom Mamdani-
ijeve aplikacije. Primenjujui pravila izvoenje i Armstrongove aksiome zavisnosti,
vriemo komprimovanje poetnog skupa kako bismo dobili minimalne skupove odnosno
skupove fazi funkcionalnih zavisnosti sa najmanjom pokrivenou.

6.7.1. Prva fazi normalna forma (F1NF)

S obzirom da su vrednosti atributa u fazi relacijama prikazanim u tabelama 35. i 42.


jednoznane odnosno u sluaju fazi modela na bazi mogunosti distribucije vrednosti
atributa predstavljaljaju iskljuujuu mogunost distribucije, konstatujemo da se obe fazi
relacije nalaze u prvoj fazi normalnoj formi jer zadovoljavaju kriterijume za F1NF. Kao
vrednosti atributa u datim fazi relacijama pojavljuju se podskupovi osnovnog skupa
domena, lingvistike varijable i mogunost distribucije i sve one zadovoljavaju uslove prve
fazi normalne forme. Sa druge strane, u sluaju postojanja vieznanih vrednosti,
mogunost distribucije nije iskljuujua jer su vrednosti/elementi fazi skupa povezani
operatorom AND. U tom sluaju, da bismo dobili fazi model koji zadovoljava kriterijume
prve fazi normalne forme, mogunost distribucije A={a1/x1,a2/x2,,an/xn} mora da bude
transfmorisana u vei broj iskljuujuih, i to: Ai={ai/xi}, i=1,2,,n.

162
6.7.2. q-Druga fazi normalna forma (q-F2NF)

Da bi fazi relacija bila u q-drugoj fazi normalnoj formi, mora da bude u F1NF i da svi
atributi nekljuni potpuno zavise od q-kljua fazi relacije. U naem primeru, prvi preduslov
je ispunjen, tj. obe fazi relacije su u F1NF. Ispitaemo sada da li nekljuni atributi potpuno
ili parcijalno zavise od q-kljua relacije.
Posmatrajmo prvo fazi model na bazi relacije bliskosti i skup fazi funkciolanih
zavisnosti F koji smo dobili primenom algoritma osmiljenog u ovoj doktorskoj disertaciji
(Tabela 52.). {Ime_Prezime, Jezik} je 0.7-klju ove fazi relacije jer vai:
1
Ime_Prezime, Jezik Ime_Prezime,

0 .7
Ime_Prezime, Jezik Godine,

0 .7
Ime_Prezime, Jezik Iskustvo,

0 .7
Ime_Prezime, Jezik Produktivnost,

1
Ime_Prezime, Jezik Jezik,

0 .7
Ime_Prezime, Jezik Pozicija,

0 .7
Ime_Prezime, Jezik Zarada.

Meutim, ova fazi relacija nije u 0.7-F2NF jer atributi Godine, Iskustvo,
Produktivnost, Pozicija i Zarada ne zavise potpuno od sloenog kljua relacije
{Ime_Prezime, Jezik} ve parcijalno odnosno delimino. Naime, zbog postojanja fazi
0 .7 0 .7
funkcionalnih zavisnosti {Ime_Prezime Godine, Ime_Prezime Iskustvo,
0 .7 0 .7 0 .7
Ime_Prezime Produktivnost, Ime_Prezime Pozicija, Ime_Prezime Zarada} u skupu
F, zakljuujemo da dati atributi potpuno zavise samo od dela kljua, tj. od primarnog
kljua Ime_Prezime, ali ne i od 0.7-kljua {Ime_Prezime, Jezik}. Prema tome, nisu
ispunjeni uslovi da konstatujemo da je data fazi relacija u 0.7-drugoj fazi normalnoj formi.
Analizirajmo sada fazi model na bazi mogunosti distribucije i identifikovani skup
fazi funkcionalnih zavisnosti koji je prikazan u tabeli 58. U ovom primeru Ime_Prezime je
0.7-klju relacije. Kako svi ostali atributi, tj. atributi koji nisu kljuni, potpuno zavise od
0.7-kljua Ime_Prezime, q=min(0.7,0.7,0.7,0.7,0.7,0.7)=0.70:
0 .7
Ime_Prezime Godine,

0 .7
Ime_Prezime Iskustvo,

163
0 .7
Ime_Prezime Produktivnost,

0 .7
Ime_Prezime Jezik,

0 .7
Ime_Prezime Pozicija,

0 .7
Ime_Prezime Zarada,

zakljuujemo da je ova fazi relacija R u 0.7-F2NF.


Dakle, fazi model na bazi relacije bliskosti nije u 0.7-drugoj fazi normalnoj formi,
dok to ne vai za fazi model na bazi mogunosti distribucije. Napomenimo ovde da
q-druga fazi normalna forma q-F2NF nema vei praktini znaaj za projektovanje fazi
relacionih baza podataka, za razliku od q-tree fazi normalne forme q-F3NF. Zbog toga
nije od presudne vanosti da li neka fazi relacija zadovoljava kriterijume q-F2NF. U
definiciji za q-F3NF vidimo da je dovoljan i potreban uslov da je fazi relacija u q-F3NF da
je u F1NF i da ispunjava kriterijume tree fazi normlane forme. Dakle, q-druga fazi
normalna forma ne reava problem anomalija i redundancije u fazi relacijama. Kao i kod
klasinih relacionih baza podataka i u sluaju fazi relacionih modela vai:
q-F3NF q-F2NF FlNF.

6.7.3. q-Trea fazi normalna forma (q-F3NF)

Za dovoenje fazi relacija u q-treu fazi normalnu formu koristiemo teoremu,


pravila i definicije koje su prikazane u etvrtom poglavlju ove doktorske disertacije. Ova
fazi normalna forma ima najvei praktini znaaj kada je re o projektovanju fazi
relacionih baza podataka. Stoga emo u analizi koristiti skupove fazi funkcionalnih
zavisnosti koje smo dobili analizom fazi modela na bazi mogunosti distribucije i fazi
modela na bazi relacije bliskosti za sluajeve k=0.70 i k=0.80. Napomenimo da algoritam
prikazan u 4.3. poglavlju omoguava dekompoziciju fazi relacija u q-F3NF uz ouvanje
postojeih fazi funkcionalnih zavisnosti i spajanje bez gubitka informacija. Da bismo
analizu uinili jednostavnijom i preglednijom atribute fazi relacija (Ime_Prezime, Godine,
Iskustvo, Produktivnost, Jezik, Pozicija, Zarada) oznaiemo slovnim oznakama A, B, C,
D, E, F,G respektivno.
Posmatrajmo prvo fazi model na bazi relacije bliskosti i skup fazi funkcionalnih
zavisnosti F koje smo dobili za sluaj k=0.70. {Ime_Prezime, Jezik} je 0.7-klju.
Preduslov da je relacija u F1NF je ispunjen. Meutim, fazi model na bazi relacije bliskosti
nije u q-F3NF. Kako {Ime_Prezime, Jezik} parcijalno odreuje ostale atribute fazi relacije
i atribut Jezik se ne nalazi ni u jednoj od fazi funkciolanih zavisnosti u identifikovanom
skupu, izvriemo dekompoziciju na dve relacije R1 i R2:
={R1,R2}
pri emu je R1= ABCDFG(F), a R2= AE(F) koje su u 0.7-F3NF i 1-F3NF.
U drugom primeru, fazi modelu na bazi mogunosti distribucije koji je u F1NF,
0.7-klju Ime_Prezime potpuno odreuje sve ostale atribute fazi relacije, pa kako fazi

164
0 .7
funkcionalna zavisnost A B,C,D,E,F,G ukljuuje sve atribute fazi relacije, onda prema
pravilu za dekompoziciju relacije u q-F3NF, zakljuujemo da je:
={R},
tj. fazi relacija na bazi mogunosti distribucije je u 0.7-F3NF. Ovo je scenario koji vai za
k=0.70
Preimo sada na sluaj relacione eme sa skupom fazi funkcionalnih zavisnosti
dobijenih za k=0.80. U prvom primeru, u tabeli 55., prikazan je skup fazi funkcionalnih
zavisnosti F za fazi model na bazi relacije bliskosti. Kao to smo naveli, posmatraemo
skup dobijen primenom Mamdani-ijeve aplikacije. Da bismo mogli da izvrimo pravilnu
dekompoziciju na osnovu poznatih fazi funkcionalnih zavisnosti neophodan nam je
minimalni skup F tj. skup F sa najmanjom pokrivenou fazi funkcionalnih zavisnosti. U
konkretnom primeru F moemo da predstavimo kao:
0.80 0.80 0.80
F={CDFG B, D FG, G C}.

odnosno:
0.80
Iskustvo, Produktivnost, Pozicija, Zarada Godine,

0.80
Produktivnost Pozicija, Zarada,

0.80
Zarada Iskustvo.

Dati skup F je parcijalno slobodan. Atributi Ime_Prezime i Jezik se ne pojavljuju ni u


jednoj fazi funkcionalnoj zavisnosti, pa ih prema utvrenim pravilima eliminiemo iz
relacije R i kreiramo relacionu emu R'. {Produktivnost, Zarada} je 0.8-klju relacione
eme R. Iz svega navedenog zakljuujemo da relacionu emu R moemo da
dekomponujemo kao:
= R' {R1,R2,R3},
gde je:
R'(A,E)= AE,
R1= CDFG(F),
R2= BFG(F),
R3= GC(F).
Relacije R1, R2, R3 su u treoj fazi normalnoj formi sa stepenima 0.8, 0.8 i 0.8 respektivno.
Dakle, problem anomalija i redundanse u relacionoj emi R zasnovanoj na relaciji bliskosti
moemo reiti tako to izvrimo dekompoziciju u odnosu na minimalni skup fazi
funkcionalnih zavisnosti: AE, CDFG(F), BFG(F), GC(F).
Kako je {Produktivnost, Zarada} 0.8-klju. Prema teoremi 2. iz pogljavlja 4.3.
imamo da je:
= {D,G}= {Produktivnost,Zarada}.

165
a da je pri tome {Produktivnost,Zarada} u 1-F3NF. Pored toga, i omoguava spajanje
bez gubitka informacija.
Osvrnimo se sada na fazi model na bazi mogunosti distribucije i skup fazi
funkcionalnih zavisnosti F koji smo dobili za sluaj k=0.80. U tabeli 61. prikazan je skup
F, gde vidimo da je u sluaju primene Mamdan-ijeve aplikacije:
0.81
F={G EF},

odnosno:
0.81
F={Zarada Jezik,Pozicija}.

Kako u navedenom primeru atributi Ime_Prezime, Godine, Iskustvo i Produktivnost nisu


obuhvaeni fazi funkcionalnim zavisnostima u skupu F, kreiraemo relacionu emu
R' (Ime_Prezime,Godine, Iskustvo, Produktivnost). S obzirom da je skup F parcijalno
slobodan, prema algoritmu za dekompoziciju imamo:
= R' {R1},
gde vai da je:
R'(A,B,C,D)= ABCD i
R1= GEF(F).
Zarada je 0.81-klju fazi relacije R, koju smo dobili nakon eliminisanja atributa koji se ne
pojavljuju u skupu fazi funkcionalnih zavisnosti F. Dodajmo ovde i to da se za proveru da
li je neki skup fazi funkcionalnih zavisnosti parcijalno slobodan ili ne koristi algoritam koji
proizilazi iz same definicije.

6.8. Efikasnost algoritma

Tragajui za fazi funkcionalnim zavisnostima u fazi relacijama primenom predloene


metodologije, neophodno je sa praktine strane gledita uraditi i analizu efikasnosti. Mi
smo predloili ovaj algoritam zbog njegove fleksibilnosti i intuitivnosti, a u ovom
poglavlju razmatraemo i njegovu efikasnost.
Naa definicija kree od principa usaglaenosti na paru n-torki. Da bismo doli do
skupa fazi funkcionalnih zavisnosti u fazi relaciji neophodno je primeniti odgovarajua
pravila i transformisati originalnu relaciju u oblik pogodan za ekstrakciju odgovarajuih
zavisnosti.
Pretpostavimo da je n broj n-torki u originalnoj fazi relaciji, a m ukupan broj
atributa. U naem sluaju, prema modelu koji smo razvili, kreiramo parove n-torki da
bismo dobili relaciju Tr i za svaki par n-torki raunamo usaglaenost C(Ak[ti,tj]), k=1,,m,
n
i,j=1,..,n i ij na posmatranom atributu. Dakle, mi razmatramo parova n-torki na
2
svakom od atributa. U najgorem sluaju, ukupan broj parova Suk sa odgovarajuim
n
vrednostima je m* , tj.:
2
m * n!
Suk =
2!(n 2)!

166
Osnovni nedostatak koji se pojavljuje je ukupan broj transakcija (moguih parova n-torki
sa povezanim vrednostima) koje je neophodno izraunati, a to moe biti jako skupo za
velike baze podataka. Poveanjem broja n-torki, kao i broja atributa relacione eme, broj
transakcija raste eksponencijalno, stim da Suk ima bri rast. Na grafiku 1. prikazan je broj
transakcija u zavisnosti od broja entiteta relacione eme, a na grafiku 2. ukupan broj
transakcija u zavisnosti od broja atributa m iste relacije.

n Cuk m Suk
2 1 2 2
5 10 5 50
10 45 10 450
15 105 15 1575
20 190 20 3800
25 300 25 7500
30 435 30 13050
35 595 35 20825
40 780 40 31200
45 990 45 44550
50 1225 50 61250
Tabela 63. Broj transakcija algoritma

Grafik 1. Ukupan broj parova n-torki za koje raunamo usaglaenost na posmatranom atibutu

167
Grafik 2. Ukupan broj transakcija u relaciji T r

Meutim, u radu predlaemo i pokazujemo da je mogue poveati efikasnost algoritma i


smanjiti broj transakcija za koje raunamo C(Ak[ti,tj]):
- Primenom projekcije i restrikcije nad originalnom bazom smanjujemo broj atributa
odnosno n-torki (pn, rm), iz ega sledi da je:
E(p,r) E(n,m).
Da bismo mogli da redukujemo ukupan broj transakcija neophodna su nam
ekspertska znanja i iskustvo. Na taj nain mogue je predvideti najznaajnije
delove relacije ijom analizom moemo doi do skupa fazi funkcionalnih
zavisnosti. To nam omoguava znaajno unapreenje efikasnosti algoritma.
- Sa druge strane, savremeni raunarski sistemi, sa monim procesorima i
memorijskim ipovima novije generacije, pruaju nam mogunosti obrade velike
koliine podataka, to moe da bude dodatna pogodnost kada je re o relacijama sa
velikim brojem zapisa. Virtuelizacija, novi hard diskovi sa SSD tehologijom itanja
i upisa podataka i sve vei broj jezgara u procesorima znaajno smanjuje vreme
izvrenja predloenog algoritma. Ovo predstavlja praktino posmatranje.
Majkrosoft SQL Server 2008 prua mogunost generisanja razliitih statistikih
izvetaja. Na primer, SELECT upit nad jedim atribtom u relaciji sa 50.000 zapisa se
izvri za 30ms. Veliina baze koju smo koristili je 300 MB i relaciona ema ima
ukupno 19 atributa. SQL server je instaliran na virtuelnoj maini sa 4vCPUs i 4.84
GB RAM memorije. Baza podataka koju smo koristili za aproksimaciju se skladiti
na 4x600GB hard diskovima u RAID5 strukturi. Koristei ovaj podatak, mi
moemo aproksimativno izraunati vreme izvrenja naeg algoritma. U relaciji sa 5
atributa i 50.000 rekorda aproksimativno vreme generisanja funkcionalnih
zavisnosti je 625s. Sa teorijske take gledita, napredne raunarske tehnologije ne
mogu da reavaju praktine probleme eksponencijelne prirode u prihvatljivom
vremenskom intervalu. Meutim, elimo naglasiti da priroda posmatranog
problema odreuje efikasnost algoritma. Postoje baze podataka u kojima
kompresija nije neophodna, dok u drugim sluajevima, kada govorimo o ogromnim

168
bazama podataka, razliite tehnike za kompresiju i redukciju koliine zapisa se
koriste, kao to su fazifikacija, klasterizacija, granulacija, predstavljanje slinih
rekorda sa jednim reprezentom itd.
Meutim, da bismo identifikovali fazi funkcionalne zavisnosti , mi moramo da
primenimo fazi implikacije na nain opisan u ovoj doktorskoj disertaciji. Prema utvrenoj
metodologiji, relacije izmeu atributa se utvruju primenom fazi logike. Ako je m broj
atributa posmatrane fazi baze podataka, onda je ukupan broj moguih fazi funkcionalnih
m
zavisnosti 2* . Teoretski, ovo je najvei mogui broj u skupu fazi funkcionalnih
2
zavisnosti. Ako primenjujemo razliite fazi implikacije, onda imamo vie iteracija i u
m
svakoj od iteracija 2* moguih fazi funkcionalnih zavisnosti. Ako tome dodamo da je
2

po definiciji fazi funkcionalna zavisnost A1 A2 prisutna ako i samo ako je
C(A2[ti,tj]) min (, C(A1[ti,tj])), onda dolazimo do injenice da uporeujemo meusobne
vrednosti usaglaenosti n-torki na svakom paru atributa, pa je ukupan broj kalkulacija
m
Cuk* , gde je Cuk broj parova n-torki fazi relacije. Meutim, ovaj broj je u praksi
2
znaajno manji zbog postojanja logikih uslova. Naime sve vrednosti C(Ak[ti,tj])< k, gde
je k kritina jaina zavisnosti, se ne uzimaju u razmatranje, pa je broj kalkulacija mnogo
manji. U naem primeru, za k=0.80 u fazi modelu na bazi mogunosti distribucije, od
7
moguih 10* =210 ispitivanja ispunjenosti uslova postojanja fazi funkcionalnih
2
zavisnosti, razmatrali smo svega dve situacije i utvrdili postojanje dve fazi funkcionalne
zavisnosti. Napomenimo i to da je primer i eksperiment vren nad realnim podacima.

6.9. Zakljuak

U ovom poglavlju dokazana je metodologija razvijena za potrebe pronalaenja fazi


funkcionalnih zavisnosti u fazi relacijama. U tom cilju, najpre smo uradili analizu u fazi
modelu na bazi relacije bliskosti i korienjem Mamdani-ijeve i Kleene-Diense fazi
implikacije ustanovili skup fazi funkcionalnih zavisnosti. Isti metod rada primenili smo i u
sluaju fazi relacije na bazi mogunosti distribucije. Zatim smo ukazali na mogunosti
primene rezultata rada i dokazali njihovo korienje u sluaju logikog dizajniranja fazi
modela baza podataka i konverziju zavisnosti u lingvistike forme koje su intuitivnije sa
stanovita krajnjeg korisnika informacija. Na kraju uradili smo i analizu efikasnosti kako
bismo ukljuili i ispitivanje nedostatka u predloenom algoritmu.

169
7. Zakljuak
U oblasti fazi logike postoje mehanizmi koji nalaze primenu u definisanju i
pronalaenju fazi funkcionalnih zavisnosti u bazama podataka. Fazi relacione baze
podataka na prirodan nain proiruju funkciju klasinih relacija integriui nepreciznosti,
neodreenosti i nejednoznanosti koje se ne mogu zanemariti u realnim aplikacijama i
sistemima. Fazi funkcionalne zavisnosti predstavljaju vei nivo adaptacije fazi bazi znanja
u njihovoj svakodnevnoj upotrebi. U savremenim korporacijama sve vei broj ljudi, od
obinih inenjera i menadera, pa sve do eksperata su zavisni od informacija iz baza
podataka, koje su im neophodne za obavljanje svakodnevnih zadataka. Ove injenice
dovode nas do shvatanja znaaja i uloge fazi funkcionalnih zavisnosti, koje nam
omoguavaju da pristupimo informacijama iz baze na jedan fleksibilniji i pristupaniji
nain. Cilj nije da dobijemo to vie informacija , ve korisnija i efikasnija znanja, u smislu
posedovanja filtriranih informacija umesto ogromne koliine podataka koje su skladitene
u posmatranim relacijama. Zbog toga se menaderi prilikom donoenja upravljakih
odluka oslanjaju na korienje saznanja dobijenih analizom fazi funkcionalnih zavisnosti.
U disertaciji je dat pregled vie okvira za definisanje fazi funkcionalnih zavisnosti
kao i odgovarajua pravila izvoenja, zasnovana na Armstrongovim aksiomama, a koja
nam omoguavaju da iz datog skupa zavisnosti logiki dobijemo i neke druge fazi
funkcionalne zavisnosti. Meutim, problem kod fazi relacionih baza podataka jeste
injenica da nije postojao algoritam ili procedura pronalaenja fazi funkcionalnih
zavisnosti. U ovom doktorskom radu razvijena je originalna metodologija koja omoguava
da analizom zapisa doemo do zavisnosti izmeu atributa u fazi relacionim bazama
podataka. Problem pronalaenja fazi funkcionalnih zavisnosti reen je na jedan potpuno
nov nain, primenom relacije bliskosti i odgovarajueg fragmenta fazi logike. Vana tema
u ovom istraivanju bila je karakterizacija fazi implikacija (Mamdani, Lukasiewcz, Early-
Zade itd.) i definisanje pravila za predstavlanje zavisnosti u formi pogodnoj za ljudsku
percepciju. Dakle, u ovoj doktorskoj disertaciji adresiran je problem i predloen je
algoritam za njegovo reavanje, a iji fokus je reprezentovanje odnosa izmeu atributa.
Teorijsko razmatranje i eksperiment nad realnim podacima pokazali su da vai
polazna hipoteza doktorske disertacije:
- Teorija fazi skupova i odreeni fragment fazi logike mogu da se primenjuju u
analizi fazi funkcionalnih zavisnosti u fazi relacionim bazama podataka.
Sprovedenim istraivanjem pokazali smo da fazi funkcionalnim zavisnostima moemo da
pridruimo odgovarajue fazi implikacije kako bismo doli do relacija izmeu atributa u
posmatranoj bazi podataka.
Pored opte i polazne hipoteze istraivanja u doktorskoj disertaciji dokazali smo da
vrede i sledee posebne hipoteze:
- Razvijena metodologija analize fazi funkcionalnih zavisnosti moe da se koristi za
logiko dizajniranje fazi relacionih baza podataka.
- Fazi implikacije su adekvatne za procenu jaine zavisnosti izmeu atributa fazi
relacione baze podataka.
- Teorija fazi skupova i odreeni fragment fazi logike pruaju poboljane mogunosti
u analizi funkcionalnih zavisnosti.

170
- Za otkrivanje fazi funkcionalnih zavisnosti mogu da se koriste razliite fazi
implikacije.
- Fazi funkcionalne zavisnosti poveavaju efikasnost statistikih baza podataka.
Dokazivanjem navedenih hipoteza ostvarili smo temeljni cilj istraivanja u ovoj doktorskoj
disertaciji koji se odnosi na ispitivanje zavisnosti izmeu atributa fazi relacionih baza
podataka.
Generalno, nae istraivanje pokazuje kako da dobijemo inteligentne informacije iz
fazi relacija. Da bismo doli do moguih relacija izmeu atributa fazi baze najpre je
neohodno pripremiti podatke za analizu odnosno kreirati tabelu sa parovima n-torki i
vrednostima usaglaenosti na svim atributima originalne relacije. U drugom koraku
pronalazimo podrelacije u kojima su zadovoljeni kriterijumi za postojanje fazi
funkcionalnih zavisnosti. U treem koraku fazi funkcionalnim zavisnostima pridruujemo
odgovarajue fazi implikacije. Konano, mi interpetiramo rezultate iz prethodnih koraka
kako bismo dobili finalni skup fazi funkcionalnih zavisnosti.
Najvaniji doprinos ove doktorske disertacije predstavlja karaterizacija teorije fazi
skupova i fazi implikacija u kontekstu izgradnje alata i algoritma koji omoguava
identifikaciju odnosa izmeu atributa u posmatranim relacionim emama. Treba
napomenuti da ovaj rad predstavlja empirijsku studiju i ''prof-of-concept'' i da nije razvijen
komercijalni softver. No, krajnji rezultat istraivanja je prototip koji definie sve faze i
korake u projektovanju i programiranju softvera koji bi reavao adresirani problem. Sa
druge strane, mi verujemo da ideja prezentovana u ovom istraivanju obezbeuje
metodologiju koja moe biti u znaajnoj meri eksploatisana u buduim konkretnim
istraivanjima.
U saetku, doprinos i znaaj ove doktorske disertacije ogleda se u praktinim
primenama predloene metodologije kao to su:
- Modelovanje i projektovanje fazi relacionih baza podataka,
- Podrka sistemima za podrku odluivanju,
- Ekvivalencija izmeu fazi implikacija i fazi funkcionlanih zavisnosti,
- Predstavljanje fazi funkcionalnih zavisnosti u lingvistikoj formi koja omoguava
bolje razumevanje dobijenih rezultata,
- Izvoenje fazi funkcionalnih zavisnosti na nivou podrelacija,
- Poveanje efikasnosti i redukovanje optereenja respondenata prilikom prikupljanja
i slanja podataka u statistikim modelima baza podataka,
- Smanjenje redundantnosti otkrivanjem slinih entiteta,
- Integracija razliitih pristupa u definisanju fazi funkcionalnih zavisnosti,
- Izvoenje finalnog skupa fazi funkcionalnih zavisnosti,
- Metodologija moe da se primenjuje u svim fazi modelima gde je mogue primeniti
relaciju bliskosti ili mogunost distribucije.

171
U toku rada identifikovali smo i pravce buduih istraivanja i neke otvorene
probleme koji proizilaze iz ove teme:
- Primena opisane metodologije u proceni NULL vrednosti u relacionim modelima
baza podataka. Prvi koraci u istraivanju ove tematike su napravljeni na primeru
statistikih modela baza podataka. Ovo moe da bude jako interesantna oblast za
istraivanje zbog prednosti koja se moe iskoristiti prilikom prikupljanja podataka.
To je naroitno vano za organizacije koje manipuliu sa velikim koliinom
podataka. Na taj nain postupak procene i odreivanja nepoznatih vrednosti
atributa pribliujemo aproksimativnom rezonovanju, a to znai da estimacija IF-
THEN pravilima lei unutar fazi logike.
- Proirenje i nadgradnja sistema za upravljanje bazama podataka. Postojei sistemi
za upravljanje bazama podataka nemaju implementirane mehanizme za integraciju i
upravljanje fazi informacija. Model opisan u ovoj doktorskoj disertaciji moe da
bude prototip za eliminsanje ogranienja u sistemima za upravljanje bazama
podataka poput SQL i Oracla. S obzirom na irinu sagledavanja problema
prilagoavanje ne bi trebalo da ima dodatne potekoe.
- Mogunost definisanja i implementacije novih implikacija u fazi logici i njihova
integracija u predloenu metodologiju.
- Predstavljanje novih tehnika i metoda u okviru rudarenje podataka-a. Rudarenje
podataka koristi razliite vrste alata za analizu podataka i otkrivanje zakonitosti i
veza izmeu istih koje se mogu dalje iskoristiti za izradu validnih projekcija.
Rudarenje podataka nije pojedinana tehnika ili tehnologija ve je to skup srodnih
metoda i metodologija koje su usmerene ka pronalaenju i automatskom izvlaenju
pravila, ablona, paterna i drugih karakteristinih struktura iz podataka. Koncpet
zasnovan na fazi logici i teoriji fazi skupova svakako predstavlja novu
metodologiju koja moe aktivno da se koristi u razliitim pretragama, a izbor alata
zavisi od prirode zadatka. Jedna od tehnika rudarenje podataka-a, pored web
mining-a i rudarenje podataka multimedije, u kojoj istaivanje predstavljeno u ovoj
doktorskoj disertaciji moe da bude interesantno jeste i text mining. Tekst mining
predstavlja analizu teksta u cilju izvlaenja termina, entiteta i odnosa izmeu tih
termina i entiteta. To je deo ireg polja otkrivanja znanja koje, poinjui od grupe
podataka relevantnih za reenje specifinog problema, trai zanimljive i prethodno
nepoznate ablone. U okviru text mininga koriste se razliite tehnike, kao to su
izvlaenje termina, izvlaenje informacija i analiza veza. Pretpostavka je da analiza
zavisnosti zasnovana na fazi implikacijama i relaciji bliskosti moe da dovede do
novih interpretacija i pronalaenja zanimljivih informacija u velikim skupovima
tekstova, gde se pod zanimljivim informacijama podrazumevaju netrivijalne,
skrivene, prethodno nepoznate i potencijalno korisne.

172
8. Prilog - Programski kod za Algoritam napisan u C#
namespace Fuzzy
{
public class FuzzyProcessor
{
public FuzzyProcessor()
{}
public static string Calculate(int exampleId, float undefinedCloseness, float
criticalDependence)
{
List<int> tupleIds = GetTupleIds(exampleId);
List<int> attributeIds = GetAttributeIds(exampleId);
var dt = GetAttributeValues(exampleId);
return xxx(exampleId, tupleIds, attributeIds, dt, undefinedCloseness,
criticalDependence);
}
public static string Calculation1(int exampleId, List<int> tupleIds, List<int>
attributeIds, dsFuzzy.AttributeValuesDataTable dt, float undefinedCloseness, float
criticalDependence)
{
dsFuzzy.AttributeValueClosenessDataTable dtClosenes =
GetAttributeValueCloseness(exampleId);
int d = tupleIds.Count;// *(tupleIds.Count - 1) / 2;
float[, ,] array = new float[d, d, attributeIds.Count];
for (int i = 0; i < tupleIds.Count; i++)
{
for (int j = i+1; j < tupleIds.Count; j++)
{
for (int a = 0; a < attributeIds.Count; a++)
{
float adI = dt.Where(x => x.TupleId == tupleIds[i] && x.AttributeId ==
attributeIds[a]).First().AffilationDegree;
int adomainI = dt.Where(x => x.TupleId == tupleIds[i] && x.AttributeId
== attributeIds[a]).First().AttributeDomainId;
float adJ = dt.Where(x => x.TupleId == tupleIds[j] && x.AttributeId ==
attributeIds[a]).First().AffilationDegree;
int adomainJ = dt.Where(x => x.TupleId == tupleIds[j] && x.AttributeId
== attributeIds[a]).First().AttributeDomainId;

173
var closenessItem = dtClosenes.Where(x => x.AttributeId == attributeIds[a]
&& (x.AttributeValueCandidateA==adomainI &&
x.AttributeValueCandidateB==adomainJ
|| x.AttributeValueCandidateA == adomainJ &&
x.AttributeValueCandidateB == adomainI)).FirstOrDefault();
float closeness = closenessItem != null ? (float)closenessItem.Closeness :
undefinedCloseness;
array[i, j, a] = Math.Min(adI, adJ);
array[i, j, a] = Math.Min(array[i, j, a], closeness);
array[j, i, a] = array[i, j, a];
//if (a==4)
System.Diagnostics.Debug.WriteLine("i:" + i + " j:" + j + " a:" + a + " =>
" + array[i, j, a]);
}
// int x = Math.Min( tupleIds[i], attributeIds[j]);
// System.Diagnostics.Debug.WriteLine(x);
}
}
return Calculation2(exampleId, tupleIds, attributeIds, array, criticalDependence);
}
private static string Calculation2(int exampleId, List<int> tupleIds, List<int>
attributeIds, float[, ,] array, float criticalDependence)
{
StringBuilder sb = new StringBuilder();
int dt = tupleIds.Count * (tupleIds.Count - 1) / 2;
int da = attributeIds.Count * (attributeIds.Count - 1) / 2;
float[, , ,] final = new float[dt, dt, da, da];
for (int a = 0; a < attributeIds.Count; a++)
{
for (int b = a+1; b < attributeIds.Count; b++)
{
//if (a != b)
{
int percent = 0;
float teta = 1;

174
for (int i = 0; i < tupleIds.Count; i++)
{
for (int j = i + 1; j < tupleIds.Count; j++)
{
//System.Diagnostics.Debug.WriteLine(" a:" + a + " b:" + b + " i:" + i
+ " j:" + j);
//System.Diagnostics.Debug.WriteLine(" aValue:" + array[i, j, a] + "
bValue:" + array[i, j, b]);
// final[i, j, a, b] = 0;
if (array[i, j, a] <= array[i, j, b])
{
if (array[i, j, a] >= criticalDependence)
{
System.Diagnostics.Debug.WriteLine("i:" + i + " j:" + j + " *** "
+ GetAttributeName(attributeIds[a]) + " & " + GetAttributeName(attributeIds[b]) + "
=> a: " + array[i, j, a] + " b: "+ array[i, j, a]);
percent++;
if (teta > array[i, j, a])
teta = array[i, j, a];
}
}
}
}
//System.Diagnostics.Debug.WriteLine(" a:" +
GetAttributeName(attributeIds[a]) + " b:" + GetAttributeName(attributeIds[b]) + "
percent:" + percent/dt + " teta:" + teta);
if (((float)percent / dt > 0) && teta >= 0.7f)
sb.AppendLine(GetAttributeName(attributeIds[a]) + " =>" +
GetAttributeName(attributeIds[b]) + " Percent:" + (float)percent / dt + " Teta:" + teta);
}
}
}
for (int b = 0; b < attributeIds.Count; b++)
{
for (int a = b + 1; a < attributeIds.Count; a++)
{
//if (a != b)

175
{
int percent = 0;
float teta = 1;
for (int i = 0; i < tupleIds.Count; i++)
{
for (int j = i + 1; j < tupleIds.Count; j++)
{
if (array[i, j, a] <= array[i, j, b])
{
if (array[i, j, a] >= criticalDependence)
{
percent++;
if (teta > array[i, j, a])
teta = array[i, j, a];
}
}
}
}
if (((float)percent / dt > 0) && teta >=0.7f)
sb.AppendLine(GetAttributeName(attributeIds[a]) + " =>" +
GetAttributeName(attributeIds[b]) + " Percent:" + (float)percent / dt + " Teta:" + teta);
}
}
}
return sb.ToString();
}
private static List<int> GetTupleIds(int exampleId)
{
List<int> tupleIds = new List<int>();
SqlConnection dataConnection = new SqlConnection();
dataConnection.ConnectionString =
ConfigurationManager.ConnectionStrings["Fuzzy.Properties.Settings.FuzzyConnectionStri
ng"].ConnectionString;
SqlCommand dataCommand = new SqlCommand();
dataCommand.Connection = dataConnection;
dataCommand.CommandType = CommandType.Text;

176
dataCommand.CommandText = ("select id from dbo.Tuple where exampleid = " +
exampleId);
try
{
dataConnection.Open();
SqlDataReader reader = dataCommand.ExecuteReader();

while (reader.Read())
{
tupleIds.Add(reader.GetInt32(0));
}
reader.Close();
}
catch
{
}
finally
{
dataConnection.Close();
}
return tupleIds;
}
private static List<int> GetAttributeIds(int exampleId)
{
List<int> attributeIds = new List<int>();
SqlConnection dataConnection = new SqlConnection();
dataConnection.ConnectionString =
ConfigurationManager.ConnectionStrings["Fuzzy.Properties.Settings.FuzzyConnectionStri
ng"].ConnectionString;
SqlCommand dataCommand = new SqlCommand();
dataCommand.Connection = dataConnection;
dataCommand.CommandType = CommandType.Text;
dataCommand.CommandText = ("select id from dbo.Attribute where exampleid = "
+ exampleId);
try
{

177
dataConnection.Open();
SqlDataReader reader = dataCommand.ExecuteReader();
while (reader.Read())
{
attributeIds.Add(reader.GetInt32(0));
}
reader.Close();
}
catch
{
}
finally
{
dataConnection.Close();
}
return attributeIds;
}
private static string GetAttributeName(int attributeId)
{
SqlConnection dataConnection = new SqlConnection();
dataConnection.ConnectionString =
ConfigurationManager.ConnectionStrings["Fuzzy.Properties.Settings.FuzzyConnectionStri
ng"].ConnectionString;
SqlCommand dataCommand = new SqlCommand();
dataCommand.Connection = dataConnection;
dataCommand.CommandType = CommandType.Text;
dataCommand.CommandText = ("select AttributeName from dbo.Attribute where
id = " + attributeId);
try
{
dataConnection.Open();
object result = dataCommand.ExecuteScalar();
//while (reader.Read())
{
return result.ToString();
}

178
}
catch
{
}
finally
{
dataConnection.Close();
}
return "unknown!";
}
private static dsFuzzy.AttributeValuesDataTable GetAttributeValues(int exampleId)
{
dsFuzzy.AttributeValuesDataTable dtAttributeValues = new
dsFuzzy.AttributeValuesDataTable();
dsFuzzyTableAdapters.AttributeValuesTableAdapter adapter = new
dsFuzzyTableAdapters.AttributeValuesTableAdapter();
dtAttributeValues = adapter.GetDataBy(exampleId);
return dtAttributeValues;
}
private static dsFuzzy.AttributeValueClosenessDataTable
GetAttributeValueCloseness(int exampleId)
{
dsFuzzy.AttributeValueClosenessDataTable dtAttributeValues = new
dsFuzzy.AttributeValueClosenessDataTable();
dsFuzzyTableAdapters.AttributeValueClosenessTableAdapter adapter = new
dsFuzzyTableAdapters.AttributeValueClosenessTableAdapter();
dtAttributeValues = adapter.GetDataBy(exampleId);

return dtAttributeValues;
}
}
}

179
9. Literatura
1. P. Bosc, D. H. Kraft, F. Petry, Fuzzy sets in database and information systems, status
and opportunities, Fuzzy Sets and Systems, 156 (3) (2005) pp. 418-426.
2. D. H. Kraft, F. Petry, Fuzzy information systems, managing uncertainty in databases
and information retrieval systems, Fuzzy Sets and Systems, 90 (2) (1997) pp. 183-191.
3. D.Dubois, H.Prade, Fuzzy sets and systems, theory and application, Academic Press
New York, 1980.
4. A. Kaufman, An intraduction to the theory of fuzzy subsets, Academic Press New York,
1985.
5. J. M. Medina, M. A. Vila, J. C. Cubero, O. Pons, Towards the implementation of a
generalized fuzzy relational database model, Fuzzy Sets and Systems, 75 (3) (1995) pp.
273-289.
6. P. Bosc, O. Pivert, On the impact of regular functional dependencies when moving to a
possibilistic database framework, Fuzzy Sets and Systems, 140 (1) (2003) pp. 207-227.
7. W.Y. Liu, Constraints on fuzzy values and fuzzy functional dependencies, Information
Sciences, 78 (1994) pp. 303-309.
8. S. Shenoi, A. Melton, L.T. Fan, Functional dependencies and normal forms in the fuzzy
relational database model, Information Sciences, 60 (1992) pp. 1-28.
9. B.K. Tyagi, A. Sharfuddin, R.N. Dutta, D. K. Tayal, A complete axiomatization of
fuzzy functional dependencies using fuzzy function, Fuzzy Sets and Systems, 151 (2)
(2005) pp. 363-379.
10. F. Berzal, I. Blanco, D. Snchez, J.M. Serrano, M.A. Vila, A definition for fuzzy
approximate dependencies, Fuzzy Sets and Systems, 149 (1) (2005) pp. 105-12.
11. W.Y. Liu, A relational data model with fuzzy inheritance dependencies
Fuzzy Sets and Systems, 89 (2) (1997) pp. 205-213.
12. G. Chen, E. E. Kerre, J. Vandenbulcke, Normalization based on fuzzy functional
dependency in a fuzzy relational data model, Information Systems, 21 (3) (1996) pp.
299-310.
13. J. C. Cubero, J. M. Medina, O. Pons, M. A. Vila, Transitive fuzzy dependencies (II),
Fuzzy Sets and Systems, 106 (3) (1999) pp. 433-448.
14. W.Y. Liu, Fuzzy data dependencies and implication of fuzzy data dependencies, Fuzzy
Sets and Systems, 92 (3) (1997) pp. 341-348.
15. F. Berzal, I. Blanco, D. Snchez, J.M. Serrano, M.A. Vila, A definition for fuzzy
approximate dependencies, Fuzzy Sets and Systems, 149 (1) (2005) pp. 105-129.
16. T. Radecki, A theoretical background for applying fuzzy set theory in information
retrieval, Fuzzy Sets and Systems, 10 (1983) pp. 169-183.
17. E. A. Rundensteiner, L. W. Hawkes, W. Bandler, On nearness measures in fuzzy
relational data models, International Journal of Approximate Reasoning, 3 (3) (1989)
pp. 267-298.
18. L.A. Zadeh, Fuzzy sets, Information and control, 8 (1965) pp.338-353.

180
19. L.A. Zadeh, Fuzzy sets as a basis of theory of possibility, Fuzzy Sets and Systems,
(1978) pp. 3-28.
20. L.A. Zadeh, The role of fuzzy logic in the managment of uncertainty in expert systems
and aproximate reasoning, Elsevier Science Publishers, (1985) pp. 3-27.
21. L.A. Zadeh, The concept of a lingustic variable and its application to aproximate
reasoning, American Elsevier Publishing Company, 1973.
22. B.P. Buckles, F. E. Petry, Extending the fuzzy database with fuzzy numbers,
Information Sciences, 2 (1984) pp.145-159.
24. A. Melton, S. Shenoi, Fuzzy relations and fuzzy relational databases,
Computers & Mathematics with Applications, 21 (11-12) (1991) pp.129-138.
25. R. Kruse, J. Gebhard, F.Klawonn, Foundation of fuzzy sets, John Wiley and Sons,
England 1994.
26. S. Shenoi, A. Melton, An extended version of the fuzzy relational database model,
Information Sciences, 52 (1) (1990) pp. 35-52.
27. J. Kacprzyk, B.P. Buckles, F.E. Petry, Fuzzy information and database systems, Fuzzy
Sets and Systems, 38 (2) (1990) pp. 133-135.
28. J.M. Medina, O. Pons, M. Amparo Vila, GEFRED: A generalized model of fuzzy
relational databases, Information Sciences, 76 (1-2) (1994) pp. 87-109.
29. A. Gonzalez, R. Perez, Completeness and consistency conditions for learning fuzzy
rules, Fuzzy Sets and Systems, 96 (1) (1998) pp. 37-51.
30. D.H. Hong, S.Y. Hwang, A note on the value similarity of fuzzy systems variables,
Fuzzy Sets and Systems, 66 (3) (1994) pp. 383-386.
31. L. Li, J. Zhang, Attribute reduction in fuzzy concept lattices based on the
T- implication, Knowledge-Based Systems, (2010).
32. G. Moreno, V. Pascual, A hybrid programming scheme combining fuzzy-logic and
functional-logic resources, Fuzzy Sets and Systems, 160 (10) (2009) pp. 1402-1419.
33. T. Sudkamp, Similarity, interpolation and fuzzy rule construction,
Fuzzy Sets and Systems, 58 (1) (1993) pp. 73-86.
34. M. Schneider, Design and implementation of finite resolution crisp and fuzzy spatial
objects, Data & Knowledge Engineering, 44 (1) (2003) pp. 81-108.
35. V. B. Robinson, Some implications of fuzzy set theory applied to geographic
databases, Computers, Environment and Urban Systems, 12 (2) (1988).
36. J. C. Cubero, J. M. Medina, O. Pons, M. A. Vila, Data summarization in relational
databases through fuzzy dependencies, Information Sciences, 121 (3-4) (1999) pp.
233-270.
37. S.M. Chen, C.M. Huang, A new approach to generate weighted fuzzy rules using
genetic algorithms for estimating null values, Expert Systems with Applications, 35 (3)
(2008) pp. 905-917.
38. P. Bosc, M. Galibourg, Indexing principles for a fuzzy database,
Information Systems, 14 (6) (1989) pp. 493-499.

181
39. G. Chen, E.E. Kerre, J. Vandenbulcke, The dependency-preserving decomposition and
a testing algorithm in a fuzzy relational data model,
Fuzzy Sets and Systems, 72 (1) (1995) pp. 27-37.
40. J. C. Cubero, J. M. Medina, O. Pons, M. A. Vila, Non-transitive fuzzy dependencies
(I), Fuzzy Sets and Systems, 106 (3) (1999) pp. 401-431.
41. D.A. Chiang, L.R. Chow, N.C. Hsien, Fuzzy information in extended fuzzy relational
databases, Fuzzy Sets and Systems, 92 (1) (1997) pp. 1-20.
42. J. Galindo, J.M. Medina, M.C. Aranda-Garrido, Fuzzy division in fuzzy relational
databases - an approach, Fuzzy Sets and Systems, 121 (3) (1998).
43. M.I. Szat, A. Yazici, A complete axiomatization for fuzzy functional and multivalued
dependencies in fuzzy database relations, Fuzzy Sets and Systems, 117 (2) (2001) pp.
161-181.
44. T.K. Bhattacharjee, A.K. Mazumdar, Axiomatisation of fuzzy multivalued
dependencies in a fuzzy relational data model, Fuzzy Sets and Systems, 96 (3) (1998)
pp. 343-352.
45. L. Weiyi, The reduction of the fuzzy data domain and fuzzy consistent join,
Fuzzy Sets and Systems, 50 (1) (1992) pp. 89-96.
46. W.Y. Liu, Extending the relational model to deal with fuzzy values,
Fuzzy Sets and Systems, 60 (2) (1993) pp. 207-218.
47. B. Bhuniya, P. Niyogi, Lossless join property in fuzzy relational databases,
Data & Knowledge Engineering, 11 (2) (1993) pp. 109-124.
48. S. Kumar De, R. Biswas, A.R.Roy, On extended fuzzy relational database model with
proximity relations, Fuzzy Sets and Systems, 117 (2) (2001) pp. 195-201.
49. S. Jyothi, M. S. Babu, Multivalued dependencies in fuzzy relational databases and
lossless join decomposition, Fuzzy Sets and Systems, 88 (3) (1997) pp. 315-332.
50. R. Vandenberghe, A. V. Schooten, R. De Caluwe, E. E. Kerre, Some practical aspects
of fuzzy database techniques - an example, Information Systems, 14 (6) (1989) pp.
465-472.
51. Z.M. Ma, L. Yan, Generalization of strategies for fuzzy query translation in classical
relational databases, Information and Software Technology, 49 (2) (2007) pp. 172-180.
52. K. V. S. V. N. Raju, A. K. Majumdar, The study of joins in fuzzy relational databases,
Fuzzy Sets and Systems, 21 (1) )(1987) pp. 19-34.
53. R. C. Tripathy, P. C. Saxena, Multivalued dependencies in fuzzy relational databases,
Fuzzy Sets and Systems, 38 (3) (1990) pp. 267-279.
54. B.P. Buckles, F. E. Petry, A fuzzy representation of data for relational databases, Fuzzy
Sets and Systems, 7 (3) (1982) pp. 213-226.
55. G.Chen, Fuzzy logic in data modeling, semantics, constraints and database design,
Kluwer Academic Publisher, 1998.
56. C.W.Enteman, A Fuzzy logic with interval truth value, Fuzzy Sets and Systems, (2000)
pp. 161-189.
57. H.Habiballa, Fuzzy general resolution, AFM, 2000.

182
58. R.C.T.Lee, Fuzzy logic and resolution principle, Journal of the Association for
Computing, (1982) pp. 109-119.
59. H.B. Potoczny, On similarity relations in fuzzy relational databases,
Fuzzy Sets and Systems, 12 (3) (1984) pp. 231-235.
60. P. C. Saxena, B. K. Tyagi, Fuzzy functional dependencies and independencies in
extended fuzzy relational database models, Fuzzy Sets and Systems, 69 (1) (1995) pp.
65-89.
61. S. Shenoi, A. Melton, Proximity relations in the fuzzy relational database model, Fuzzy
Sets and Systems, 100 (1999) pp. 51-62.
62. X. Tang, G. Chen, Equivalence and transformation of extended algebraic operators in
fuzzy relational databases, Fuzzy Sets and Systems, 157 (12) (2006) pp. 1581-1596.
63. B. P. Buckles, F. E. Petry, H. S. Sachar, A domain calculus for fuzzy relational
databases, Fuzzy Sets and Systems, 29 (3) (1989) pp. 327-340.
64. S. Shenoi, A. Melton, L. T. Fan, An equivalence classes model of fuzzy relational
databases, Fuzzy Sets and Systems, 38 (2) (1990) pp. 153-170.
65. W. Siler, J. Buckley, Fuzzy expert systems and Fuzzy reasoning, Wiley&Sons 2005.
66. Fuzzy logic toolbox for the use with Matlab, MathWorks, 2001

67. R. Belohlavek, Codd's Relational Model from the Point of View of Fuzzy Logic,
Journal of Logic and Comuptation Advance Access, 21 (2009) pp.851-862.
68. P. Bosc, P. Pivert, O. Ughetto, Database mining for the discovery of extended
functional dependencies, Fuzzy Information Processing Society, 18th International
Conference of the North American, 2002.
69. T. Hussai, M. M. Awais, S. Shamail, Applying fuzzy logic to measure completeness of
a conceptual model, 2006.

70. G.P. Lazeti, Uvod u relacione baze podataka, Matematiki fakultet Beograd, 2008.

71. M. McNeill, E. Thro, Fuzzy logic - A practical approach, Academic Press, 1994.

72. Z. Ma, Fuzzy database modeling of imprecise and uncertain engineering information,
Springer, 2006.

73. J. Haris, Fuzzy logic application in engineering science, Springer, 2006.

74. Z.M. Ma, Li Yan, A literature overview of Fuzzy database models, Information
Science and Engineering, (2008) pp. 172-180.
75. S.B. Yahia, H. Ounalli, A. Jaoua, An extension of classical functional dependency,
dynamic fuzzy functional dependency, Information Scinece, 119 (1999) pp. 219-234.
76. P.Bosc, O. Pivert, D. Rocacher, Characterizing the result of the division of fuzzy
relations, International Journal of Aproximate Reasoning, 45 (2007) pp. 511-530.

77. R. Bouaziz, S. Chakhar, V. Mousseau, S. Ram, A. Telmoudi, Database design and


querying within the fuzzy semantic model, Information Sciences, 177 (2007) pp. 4598
4620.

183
78. R. A. Ribeiro, A. M. Moreira, Fuzzy query interface for a business database, Int. J.
Human-Computer Studies, 58 (2003) pp. 63391.

79. R. B. Bhatt, M. Gopal, On the extension of functional dependency degree from crisp to
fuzzy partitions, Pattern Recognition Letters, 27 (2006) pp. 487491.

80. F. E. Petry, L. Zhao, Rudarenje podataka by attribute generalization with fuzzy


hierarchies in fuzzy databases, Fuzzy Sets and Systems, 160 (2009) pp. 2206 2223.

81. D. Dubois, H. Prade, The three semantics of fuzzy sets, Fuzzy Sets and Systems, 90
(1997) pp. 141-150.

82. D. Dubois, H. Prade, Fuzzy set and possibility theory-based methods in articial
intelligence, Articial Intelligence, 148 (2003) pp. 19.

83. D. Driankov, H.Hellendorron, M.Reinfrank, An intraduction to fuzzy control, Springer,


1996.

84. D. Dubois, H.Prade, Operations in a fuzzy valued logic, Information and Control,
(1989) pp. 224-240.

85. J. F. Baldwin, A new approach to aproximate reasoning using fuzzy logic, Fuzzy Sets
and Systems, (1989) pp. 308-325.

86. E. H. Mamdani, Application of fuzzy logic to approximate reasoning using linguistic


systems, IEEE Transc Computer, 26 (1987) pp.1189-1191.

87. P. Magrez, P.Smets, Fuzzy modus ponens, a new model suitable for application in
knowledge based systems, Intelligent System, (1989) pp. 181-200.

88. M. Mizimuto, Fuzzy reasoning inder new new competional rules of inference,
Kybernets, (1985) pp. 107-117.

89. E. F. Codd, A relational model of data for large shared databases, ACM, 1970.

90. D. Maier, The theory of relational databases, Computer Scinence Press, 1985.

91. J. D. Ulmann, Priniples of database and knowledge-based systems, Computer Science


Press, 1989.
92. M. Umano, T. Imada, I. Hatono and H. Tamura, Fuzzy object-oriented databases and
implementation of its SQL-type data manipulation language, in Proceedings of the 7th
IEEE International Conference on Fuzzy Systems, 2 (1998) pp. 1344- 1349.
93. V. Cross, R. Caluwe and N. van Gyseghem, A perspective from the fuzzy object data
management group (FODMG), in Proceedings of the 6th IEEE International
Conference on Fuzzy Systems, 2 (1997) pp. 721-728.
94. G. Bordogna and G. Pasi, Graph-based interaction in a fuzzy object oriented database,
International Journal of Intelligent Systems, 16 (2001) pp. 821-841.
95. G. Bordogna, G. Pasi, and D. Lucarella, A fuzzy object-oriented data model for
managing vague and uncertain information, International Journal of Intelligent
Systems, 14 (1999) pp. 623-651.

184
96. G. de Tr and R. de Caluwe, Level-2 fuzzy sets and their usefulness in object-oriented
database modeling, Fuzzy Sets and Systems, 140 (2003) pp. 29-49.
97. D. Dubois, H. Prade and J. P. Rossazza, Vagueness, typicality, and uncertainty in class
hierarchies, International Journal of Intelligent Systems, 6 (1991) pp. 167-183.
98. R. George, R. Srikanth, F. E. Petry and B. P. Buckles, Uncertainty management issues
in the object-oriented data model, IEEE Transactions on Fuzzy Systems, 4 (1996) pp.
179-192.
99. J.M.Medina, O.Pons, M.A.Vila and J. C. Cubero, Client/Server architecture for Fuzzy
Relational Databases, Mathware&Soft Computing 3, 3 (1996) pp.415-424.
100. A.G. Touzi and M. A.B. Hassine, New Architecture of Fuzzy Database Management
Systems, The International Arab Journal of Information Technology, 6 (3) (2009)
pp.213-222.

185
10. Biografija
Miljan Vueti roen je 28.03.1984.godine u Sarajevu. Osnovnu kolu i gimnaziju
zavrio je u Sokocu. Za uspeh u osnovnoj i srednjoj koli nagraen je "Vukovom
diplomom". Petogodinje akademske studije zavrio je na Saobraajnom fakultetu u
Beogradu, smer telekomunikacije, sa prosenom ocenom 9.93. U dosadanjem kolovanju
dobio je niz pohvala i priznanja za ostvarene rezultate, a kruna dosadanjeg rada i
najznaajnija priznanja su: student generacije, najbolji student od osnivanja Saobraajnog
fakultetu, povelja Univerziteta u Beogradu za najbolje studente generacije 2008/2009.
dodeljena na sveanosti organizovanoj povodom dana Univerziteta u Beogradu.
Doktorske studije upisao je 2009. godine na Fakultetu organizacionih nauka, smer
elektronsko poslovanje.
Nauno-istraivakim radom bavi se od 2007. godine. Naime, na 10-toj
Internacionalnoj konferenciji "Upravljanje kvalitetom i pouzdanou"-ICDQM 2007,
odranoj 13. i 14. juna 2007. u Beogradu, zajedno sa prof.dr Zoranom Avramoviem
objavio rad pod nazivom "O prirodi sebi-slinosti u eternet saobraaju". U sklopu
nastave na predmetima Elektronika i Statistika teorija telekomunikacija saraivao je i bio
angaovan kao saradnik u nastavi na Saobraajnom fakultetu u Beogradu. U dosadanjem
nauno-istraivakom radu objavio je vei broj radova na domaim i meunarodnim
konferencijama, asopisima InfoM, JITA, Arhiv za tehnike nauke, te asopisima sa SCI
liste Expert System with Applications i TTEM. U oktobru 2011. uestovao je na CyberC
2011 meunarodnoj konferenciji u Pekingu, Kina, sa radom -hlth trnsfrmtin
mdl in Srbi: dsign, rchitctur nd dvlping indeksiranom u IEEE Xplore bazi.
Zbg l z nprkidnim strunim usvrvnjm i vldvnjm nvih znnj i
vtin, uspn ph kursv Cisc CCNA, Gustv Kisr i icrsft rining
Prgrm im stk sttus srtifikvng innjr z rzliit blsti. Pored toga
poseduje sledee Microsoft sertifikate Windows Server 2008 Server Administrator,
Windows Server 2008 Network Infrastructure, Windows Server 2008 AD Configuring.
Praktina iskustva sticao je na Saobraajnom fakultetu u Beogradu, razliitim
projektima na kojima je bio angaovan, te kompanijama Telekom Srpske, VeratNet i
E-Smart Systems u kojoj je trenutno i zaposlen.

186
Spisak objavljenih radova:

1. Miljan Vueti, Zoran Avramovi: "O prirodi sebi-slinosti u eternet


saobraaju" - XIV Internacionalna kofrenecija ICDQM, Beograd 2007,
2. Miljan Vueti, Slavia Nogoti: "Simulacija rada rutera u telekomunikacionim
mreama primenom algoritama inspirisanih ponaanjem mrava", SYMOPIS,
Ivanjica 2009.
3. Slavia Nogoti, Miljan Vueti: "Bajes-Neov ekvilibrijum u zapeaenim
aukcijama", SYMPOIS, Ivanjica 2009,
4. Miljan Vueti: "Strategija razvoja e-zdravstva u Srbiji:primena smart card
tehnologije u realizaciji zdravstvenog informacionog sistema", SYMOPIS, Tara
2010.
5. Nenad Gligori, Miljan Vueti, Ana Uzelac, Ljiljan Milosavljevi: "Napredni
sistemi za pomo pri vonji bazirani na interakciji sa drugim vozilima i
infrastrukturnoj komunikaciji", InfoM, Vol. 34 2010.
6. Miljan Vueti, Ana Uzelac, Nenad Gligori: "Transformacioni model e-zdravstva
u Srbiji", InfoM, Vol. 36 2010.
7. Uee u izradi Zbirke zadataka iz Elektronike, tampanoj na Saobraajnom
fakultetu u Beogradu 2008.
8. Ana Uzelac, Dragan Zoranovi, Miljan Vueti, Nenad Gligori, Ljiljana
Milosavljevi: "Promene u zdravstvenim sistemima zemalja u razvoju omoguene
razvojem mobilnih tehnologija sa primerima", Arhiv za tehnike nauke Bijaljina,
No.5 2011.,
9. Miljan Vueti: Analiza podataka u fazi relacionim bazama podataka,
SYMOPIS konferencija, septembar 2011, Zlatibor.
10. Miljan Vueti: Fazi relacioni modeli baza podataka, SYMOPIS konferencija,
septembar 2011, Zlatibor.
11. Miljan Vueti: Functional dependencies analysis in fuzzy relational database
model, Journal of Information Technology and Applications, vol. 1, No2.,
Banjaluka 2011.
12. Miljan Vueti, Ana Uzelac, Nenad Gligori: E-health transformation model in
Serbia:design, architecture and developing, CyberC 2011 International
Conference on Cyber-Enabled Distributed Computing and Knowledge Dicsovery,
Bejing, China, October 2011.
13. Miljan Vueti: "Primena fazi logike u relacionim bazama podataka", InfoM,
vol.40 2011.
14. Miljan Vueti, Mirko Vujoevi: "A literature overview of functional
dependencies in fuzzy relational database models", Techniques Technologies
Education Managment, vol. 7, No.4., 2012 IF=0.351.
15. Miljan Vueti, Miroslav Hudec, Mirko Vujoevi: "A new method for computing
fuzzy functional dependencies in relational database systems", Expert Systems with
Applications, Vol. 40 (7) Jun 2013 IF=2.455.

187
16. M. Stefanovi, V.Pejovi, M.Vueti: "Komunikacioni protokol izmeu AMM
centra i koncetratora podataka kao podrka interoperabilnosti celokupnog
sistema", CIRED 2012 konferencija, Vrnjaka banja.
17. Miljan Vueti: "Teorijski model za generisanje upita u fazi relacijama", SYMOPIS
2012 konferencija, septembar 2012, Tara.
18. Miljan Vueti: "Projektovanje fazi relacionih baza podataka", InfoM, vol.44
2012.

188

Вам также может понравиться