Академический Документы
Профессиональный Документы
Культура Документы
DEPARTAMENTI I INFORMATIKS
DISERTACION
JULIANA LULA
Tiran, 2014
UNIVERSITETI I TIRANS
FAKULTETI I SHKENCAVE T NATYRS
DEPARTAMENTI I INFORMATIKS
Disertacion
I paraqitur nga:
Specialiteti: Informatik
ii
Prmbajtja
Prmbajtja .......................................................................................................................................... ii
Lista e tabelave .................................................................................................................................. v
Lista e figurave ................................................................................................................................. vi
Hyrje ............................................................................................................................................... viii
Kapitulli 1: Teknika dhe standarte t DWH ...................................................................................... 1
1.1 Hyrje ........................................................................................................................................ 1
1.2 Historiku i sistemeve n mbshtetje t vendimmarrjes (DSS) ................................................ 3
1.3 Krahasimi DWH/OLTP ........................................................................................................... 4
1.4 Zgjedhja e metodiks pr ndrtimin e DWH ........................................................................... 5
1.4.1 Metodika Top-down ......................................................................................................... 5
1.4.2 Metodika Bottom-Up........................................................................................................ 6
1.5 Zgjedhja e arkitekturs s sistemeve DWH ............................................................................. 7
Kapitulli 2: Aplikimi i zgjidhjeve DWH/BI n telekomunikacion ................................................... 9
2.1 Hyrje ........................................................................................................................................ 9
2.2 Gjendja e telekomunikacionit n vndin ton ......................................................................... 9
2.3 Ndryshimi i mjedisit t biznesit t telekomunikacionit ......................................................... 11
2.3.1 Strategjia ......................................................................................................................... 11
2.3.2 Evoluimi ......................................................................................................................... 12
2.4 Funksionet e BI n telekomunikacion ................................................................................... 14
Shembull i plot i zbatimit t BI.............................................................................................. 15
2.5 Prshkrimi i t dhnave kryesore t nj kompanie telekomunikacioni ................................. 16
Kapitulli 3 Modelimi i nj datamart-i pr thirrjet e detajuara ......................................................... 19
3.2 Prshkrimi i problemit ........................................................................................................... 19
3.3 Modelimi i przgjedhur i t dhnave ..................................................................................... 20
3.3.1 Modelimi Konceptual ..................................................................................................... 21
3.3.2 Modelimi Llogjik ............................................................................................................ 25
3.3.3 Modelimi Fizik ............................................................................................................... 27
3.4 Metoda e aplikuar pr grumbullimin e t dhnave ............................................................... 29
3.5 Analizat e prftuara sipas krkess ....................................................................................... 40
3.6 Problematika t hasura gjat puns mbi modelin e datamart-it ............................................ 42
3.7 Konkluzione ......................................................................................................................... 43
Kapitulli 4: Menaxhimi i TELCO-KPI me zgjidhjet BI .................................................................. 44
4.1 Hyrje ...................................................................................................................................... 44
4.2 Prcaktimi i problemit ........................................................................................................... 44
4.3 Analiza e problemit dhe zgjidhja e problemit ....................................................................... 45
4.4 Metoda e aplikuar pr grumbullimin e informacionit ........................................................... 48
4.5 Ndrtimi i kubit OLAP .......................................................................................................... 52
4.6 Analizat e prftuara nga baza e t dhnave pr eksperiment ................................................. 55
Analiza 1 .................................................................................................................................. 55
Analiza 2 .................................................................................................................................. 57
Analiza 3 .................................................................................................................................. 58
Analiza 4 .................................................................................................................................. 59
iii
Analiza 5 .................................................................................................................................. 60
Analiza 6 .................................................................................................................................. 61
4.7 KPI pr kontrollin e balancave t klientve.......................................................................... 62
4.8 KPI pr kontrollet e sigurimit t t ardhurave ....................................................................... 66
4.9 Monitorimet e Kpi ................................................................................................................. 68
4.10 Problematika t hasura gjat puns s ndrtimit t datamart-it .......................................... 69
4.11 Konkluzione ....................................................................................................................... 71
Kapitulli 5: Zbulimi i njohurive n t dhnat e telekomunikacionit................................................ 72
5.1 Hyrje ...................................................................................................................................... 72
5.2 Aplikacionet Data-mining ..................................................................................................... 73
5.3 Profilizimi i klientve ............................................................................................................ 73
5.4 Zbulimi i abuzimeve (Fraud) ................................................................................................. 76
5.5 Izolimi i defekteve t rrjetit ................................................................................................... 77
Kapitulli 6: Prdorimi i Learning Objects n ndihm t proesit t edukimit n distance sipas
arkitekturs s DWH me tre shtresa ................................................................................................ 80
6.1 Hyrje ...................................................................................................................................... 80
6.2 Modeli i propozuar pr LO .................................................................................................... 81
6.3 Prdorimi i DWH pr ruajtjen e LO ...................................................................................... 84
Kapitulli 7: Faktort thelbsor pr suksesin e sistemit DWH ....................................................... 86
7.1 Njohja e qllimeve ................................................................................................................. 86
7.2 Kontroll pr cilsin e t dhnave n sistemet DWH ............................................................ 86
7.3 Performanca ........................................................................................................................... 88
7.4 Volumet e t dhnave: Ngarkesat dhe menaxhimi ................................................................ 88
7.5 Marrdhnia e vazhdueshme me prdoruesit ........................................................................ 89
7.6 Mbshtetja ekzekutive ........................................................................................................... 89
Prfundime ...................................................................................................................................... 90
Referenca ......................................................................................................................................... 92
Falenderime ..................................................................................................................................... 94
Biblografia ....................................................................................................................................... 95
Publikime:.................................................................................................................................... 95
Referime shkencore: .................................................................................................................... 95
Prmbledhje ..................................................................................................................................... 96
Abstract ............................................................................................................................................ 97
iv
Lista e tabelave
v
Lista e figurave
vi
Figura 5.1 Raporti i thirrjeve pr do or 74
Figura 5.2 Diagrama e TASA 78
Figura 6.1 Sisteme adaptive dhe t personalizuara t msimit 81
Figura 6.2 Modeli i LO 82
Figura 6.3 Arkitektura e aplikacionit 82
Figura 6.4 Pamja e faqes s aplikacionit ku mund te shihen LO 83
Figura 6.5 Pamja e faqes s aplikacionit ku mund t msohet nga nj LO 84
Figura 6.6 Arkitekura me tre shtresa e shfrytzimit t LO 85
Figura 7.1 Kontrolli i cilsis s t dhnave 87
vii
Hyrje
N ditt e sotme, tregu sa vjen e bhet m krkues duke ecur me ritme t shpejta e t
ndryshueshme. N kto kushte, informacioni gjithmon e m shum shihet si nj burim
ky pr t prftuar avantazhe konkuruese. Siprmarrjet nevojiten t bjn analiza t
shumta dhe komplekse t sjelljes s klientve, q t kuptojn ekzaktsisht at far
klientt duan. Ato duhet t prgjigjen n koh dhe me efikasitet me shrbimet q
ofrojn.
Qllimi i ktij punimi sht studimi i teknikave pr ndrtimin e sistemeve DWH duke
u fokusuar m s shumti n aplikimin real t tyre n fushn e telekomunikacionit. Ky
punim shtron argumentat q tregojn nevojn e ktyre sistemeve, duke ju referuar
gjithmon krkesave konkrete t nj kompanie telekomunikacioni. Prezantimi i
zgjidhjeve n kt punim, shoqrohet me paraqitjen e problematikave t hasura gjat
puns, si dhe masat e marra pr zgjidhjen e tyre. Aplikimi i modeleve t teknologjis
Business Intelligence (BI) mbi sistemet e ndrtuara, ofron fleksibilitet, lehtsi dhe
shumllojshmri analizash.
viii
Kapitulli 3 demostron aplikimin e nj modeli shum dimensional t ndrtuar pr
analizn e rekordeve t detajuara t trafikut n nj kompani telekomunikacioni. N t,
prezantohet hap pas hapi modelimi i nj datamart-i, q do t shrbej pr analiza t
detajuara t prdorimit t rrjetit, sjelljes s klientve dhe analizave t interkonjeksionit.
Ai trajton ndrtimin e proeseve ETL, t cilat konsiderohen si detyrat m kritike t
ndrtimit t nj sistemi DWH.
ix
Kapitulli 1: Teknika dhe standarte t DWH
1.1 Hyrje
Sot prdoruesit fundor nuk jan m pasive, ata krkojn mundsi interaktive pr
gjenerimin e analizave t tyre. Prdoruesit kan nevoj pr mjete q jan fleksibl dhe
lehtsisht t prdorshm. Sepse n shumicn e rasteve nuk jan t qart pr analizat e
sakta q ju interesojn, para se t marrin vendimet. Ata krkojn t ken nj pamje sa
m t gjer t informacionit t mundshm.
1
Pr vendimmarrsit sht nj humbje kohe t marrin informacione t detajuara dhe t
panumrta. Ata drejtohen nga t dhnat thelbsore e t prpunuara, q realisht kan
rndsi pr vendimet e tyre strategjike.
N do sistem operacional, jan disa t dhna q mund t jen jo korrekte apo jan t
paprdorshme pr arsye nga m t ndryshmet. Rezultatet e prftuara prej ktyre t
dhnave normalisht do t ken nj prqindje gabimi.
Lista e msiprme e problemeve mund t prdoret pr t nxjerr listn e fjalve kye
q paraqesin krkesat pr ndrtimin e DWH. Krkesat pr sistemin n mbshteje t
vendimmarrjes jan:
2
1.2 Historiku i sistemeve n mbshtetje t vendimmarrjes (DSS)
Deri n vitet 1980, kompanit ruanin vetm informacionin e sistemeve Online
Transaction Processing (OLTP) n databazat e tyre [15]. Pr do krkes raportimi apo
analize mbi t dhnat, duhej t nxirrej informacioni nga databazat operacionale,
nprmjet prmbledhjes s tij, nga raportet q ndrtoheshin mbi t dhnat burim, si
figura 1.1 m posht. Sipas ksaj mnyre, sa m shum shtohej informacioni aq m t
pakta bheshin njohurit.
3
1.3 Krahasimi DWH/OLTP
Kto sisteme grumbullojn t dhna nga shum burime dhe duhet t ofrojn nj version
unik rezultatesh duke integruar n mnyr korrekte sistemet operacional (OLTP). Ato
prgjithsisht ruajn informacionin e disa viteve, n ndryshim nga sistemet OLTP, t
cilat ruajn vetm veprimet e fundit operacionale. Sistemet DWH duhet t popullohen
n mnyr frekuente me t dhnat e fundit. Ato operojn si databaza vetm pr lexim,
prandaj metodat e konceptimit llogjik t ktyre sistemeve jan t ndryshme nga ato
operacionale. Po kshtu tipet e krkesave jan t ndryshme. N sistemet operacionale,
ndrtohen krkesa q kryesisht ekzekutohen n nj baz t vogl t dhnash, ndrsa
tipet e krkesave t DWH jan shum dimensionale dhe nxjerrin analiza nga nj sasi e
madhe informacioni historik.
4
1.4 Zgjedhja e metodiks pr ndrtimin e DWH
Prcaktimi i metodiks apo edhe arkitekturs s ndjekur, bhet mbasi fillimisht jan
kuptuar nevojat prej disa pyetjeve t tjera:
far duan prdoruesit fundor? A mund t bien dakort grupe t ndryshme pune n
siprmarjen, n lidhje me krkesat e tyre? A kan nj koh t prcaktuar pr
prfundimin e sistemit, si n kuptimin afatgjat apo afatshkutr t tij? Sa sht buxheti
q disponon kompania pr kt projekt?
5
sht i pajisur me t gjitha mjetet e duhura q mundson informacion t besueshm pr
vendimarrjen e drejtuesve t nje kompanie. DWH prfshin gjith proeset e nxjerrjes
s informacionit, transformimit, pastrimit dhe integrimit n nj databaz prmbledhse,
prej t cils do prdorues mund t aksesoj informacionin dhe mund t gjeneroj
analiza komplekse [16].
M von n koh, Ralph Kimball [2] prezantoi nj model t quajtur Buttom-Up dhe
sipas ktij modeli, datamart-et krijohen t parat pr t mundsuar raportime dhe analiza
analitike pr proese specifike t biznesit. Datamart-et prmbajn Dimensione dhe
Fakte. Tabelat Fakt mund t prmbajn si t dhna atomike, t detajuara dhe t dhna
t prmbledhura. Nj datamart i vetm ndrtohet pr nj fush biznesi t caktuar si
shitjet, produktet, trafiku, etj.
Kto datamart-e mund t integrohen pr t krijuar nj sistem fizik DWH.
Sipas ksaj metodike duhet t ndrtohet nj prmbledhje e dimensioneve, fakteve dhe
matjeve t gjith siprmarrjes, ku sigurisht t njjtat dimensione shfrytzohen pr
analizimin e informacionit t shum tabelave Fakt n datamart-e t ndryshme. Nj
matric e till quhet Bus-matrix. Kjo mundson integrimin e datamart-eve me njra-
tjetrn.
Sipas ktij modeli, krkohet nj menaxhim shum i mir i arkitekturs s DWH q
bazohet n kt matric. Puna m e rndsishme n t tilla modele sht sigurimi i
konsistencs s dimensioneve prgjat gjith datamart-eve t ndrtuar.
6
1.5 Zgjedhja e arkitekturs s sistemeve DWH
Tiparet thelbsore t arkitekturs s sistemeve DWH jan si m posht [12]:
7
N tabeln e mposhtme, pmbledhim avantazhet dhe disavantazhet e arkitekturave
standarte:
Avantazhet Disavantazhet
Shkakton probleme
Arkitektura
Zgjidhje ekonomike performance n sistemet
me nj shtres
burim
Arkitektura Veprimet analitike ndahen nga ato
me dy shtresa operacionale
Arkitektura Veprimet analitike ndahen nga ato
Zgjidhje e shtrenjt
me tre shtresa operacionale. Cilsi e lart t dhnash
8
Kapitulli 2: Aplikimi i zgjidhjeve DWH/BI n telekomunikacion
2.1 Hyrje
N mars t 2012, firma ndrkombtare e vlersimit t markave Brand Finance [36],
prezantoi emrat e firmave m t vlersuara n bot n sektorin e telekomunikacionit.
N analizat e detajuara t kryesuesve t lists, prmendet prdorimi efikas i zgjidhjeve
t sofistikuara DWH/BI, si nj mjet shum i mir n duart e drejtuesve, pr nj
vendimmarrje t drejt dhe t menur n biznes.
N fund t vitit 2012, numri i prdoruesve t telefonis s lvizshme (karta SIM aktive)
arriti n rreth 5.6 milion duke u rritur me rreth 7% krahasuar me vitin 2011. Ndrsa
numri i pajtimtarve aktive (pajtimtar q kan prdorur shrbime celulare n 3 muajt e
fundit) arriti n 3.5 milion, q prbn rritje me 14% n krahasim me vitin 2011.
Numri i prdoruesve pr 100 banor n fund t 2012 ishte 198%, pr karta SIM aktive
dhe 125% e matur me prdorues aktiv.
9
Figura 2.1- Burim AKEP 2012 [33]
10
Nga matjet e msiprme, nxjerim prfundimet:
2.3.1 Strategjia
Kompanit fokusohen drejt produktit dhe vazhdojn ti reklamojn ato drejt mass.
Pr t konkurruar, ato detyrohen t shtojn shum shpenzimet e reklamimit dhe t
marketing-ut, ndrkoh q ulin mimin e produkteve t tyre. Fatkeqsisht, kjo
strategji e ka uar besnikrin e klientit n nivelet m t ulta deri m sot. Pr
shembull, me mundsit e reja q ofron portabiliteti i numrave, nuk sht e pazakont
q gjat nj viti t vetm, nj klient t kaloj nga Kompania A n Kompanin B dhe
m pas n Kompanin C, dhe pastaj t rikthehet n Kompanin A.
Edhe n vendin ton, kjo mund t jet arsyeja prse kompanit raportojn sipas
AKEP nj prqindje t lart shkputje klientsh gjat nj viti dhe ende shfaqin nj
rritje n ndarjen e tregut [33]. sht e qart q ky model biznesi parashtron vshtirsi
t konsiderueshme dhe me kalimin e kohs, ka rrezik q ti oj mundsit e
prfitimit n nivele t ulta dhe t papranueshme.
11
Strategjia pr klientin
Zgjedhja ose integrimi i ktyre strategjive dhe kalimi n kt mjedis t ri sht nj nga
vendimet m t rndsishme me t cilat prballen kompanit e telekomunikacionit n
mbar botn, prfshir edhe vendin ton.
2.3.2 Evoluimi
12
Rritja e konkurrencs
Optimizimi
Sfida
Figura 2.3 [17] ilustron mnyrn se si aftsit specifike lidhen me seciln nga kto
fusha.
13
Figura 2.3 Lidhja e aftsit specifike me fushat e interesit [17]
Nga figura pasqyrohen fushat q mbulon BI, ato jan vendimtare pr menaxhimin e
biznesit. Sistemet DWH gjejn shum mir aplikim pr t mundsuar aftsit e BI.
14
o performancn e fushats
o vlern e performancs s klientve e shtrir n koh
o volumet maksimale t rrjetit
o detyrimet e pagrumbulluara
Zhvillimin e aftsive t ndrlikuara t raportimit, t cilat bjn t
mundur zbulimin e problemeve dhe mundsive t reja. N fushat
tipike pr analiza prfshihen:
o planifikimi i kanaleve
o strategjia dhe vendosja e mimeve
o arritje te klientt dhe prfitimi
o ndarja e klientve
o prcaktimi i ofertave specifike
o njohja e modeleve lidhur me sjelljen dhe nevojat e klientve
15
1. Analizat BI do t prdoret pr t gjurmuar matsit kryesor t
performancs q lidhen me veprimet e aktivizimeve dhe shkputjes s
lidhjeve me klientt.
2. Kjo do t sillte paralajmrim t hershm t shtimit t veprimeve t
shkputjes. Nse veprimet e shkputjes do t fillonin t'i tejkalonin
kufijt e pranueshm, pr t analizuar arsyet e shkputjes s
klientve dhe pr t hamendsuar ndikimin n prfitimet e
kompanis do t prdorej BI.
3. Nse ndikimet n prfitime do t ishin t papranueshme, pr t
hartuar strategjit pr mbajtjen e klientve do t prdorej BI.
4. Pas hartimit t strategjive, BI do t mund t prdorej pr t zhvilluar
modele parashikuese (Data-mining), t cilat do t bashkrendonin
strategjit e ruajtjes s klientve pr kt kategori.
5. Kto modele do t prdoreshin nga departamenti i caktimit t fushatave
pr t'i prcaktuar listat e klientve q do prpilohen pr fushatat e
duhura t mbajtjes.
6. Kto fushata do t inicioheshin nga drejtuesit e biznesit, t cilt do t
menaxhonin edhe zbatimin e tyre.
7. Rezultati i fushats, prsri do te analizohet me ndihmn e BI.
16
Sa prmendm m sipr konsiderohen si burime t brndshme, pasi kompania
zakonisht ka edhe burime t jashtme. Sikurse mund t jen t dhnat e marra nga nj
ent rregullator pr telekomunikacionin, si psh numrat q ndryshojn rrjet dhe mbartin
numrin, n baz t rregullave t MNP.
-Nj rekord CDR i thirrjes, prmban informacion t detajuar si: numri origjinues i
thirrjes, numri destinacion, koha e sakt e gjenerimit t rekordit, tipi i thirrjes, identiteti
i rekordit, t dhna t rrugtimit t thirrjes, etj. Ky rekord q gjenerohet nga platforma
MSC sapo thirrja prfundon, kalon n sistemin e faturimit nprmjet platforms
Mediation q realizon prkthimin, transformimin dhe prshtatjen e informacionit pr
n sistemin e faturimit.
SMSC-CDR
MSC-CDR DATA-CDR
Moduli
Mediation
SISTEMI I FATURIMIT
Bazuar mbi kto sisteme kompanit jan t interesuar pr grumbullimin dhe integrimin
e informacionit t platformave q gjenerojn rekordet e detajuara t do tip trafiku si:
thirrje, sms apo t dhna t shrbimit internet. Mediation gjithashtu prkthen
informacionin binar t gjeneruar nga platformat n skedar t tipit tekst.
17
Skema e mposhtme tregon burimet minimale q shfrytzohen pr ndrtimin e DWH,
prej t cilit mund t ndrtohen analizat e biznesit, q ndihmojn n vendimmarrje.
SMSC GGSN
MSC
SGSN
Sistemi i
Faturimit
ERP
MEDIATION
DWH
18
Kapitulli 3 Modelimi i nj datamart-i pr thirrjet e detajuara
3.1 Hyrje
1- Analizat e Interkonjeksionit
19
2- Analiza mbi sjelljen e klientve
-far t dhne mund t marrim pr prdorimin e celularit gjat dits apo gjat javs?
-Si mund t prcaktojm periudhat e pikut (niveli m i lart i trafikut) gjat dits?
Gjithashtu, duke u nisur nga prshkrimi i problemit dhe duke krahasuar elementt e dy
metodikave kryesore pr ndrtimin e zgjidhjes, u przgjodh metodika Kimball q
20
bazohet mbi datamart-e. Elementt kriter t przgjedhjes jan paraqitur n tabeln e
mposhtme:
Zgjidhja jon duhet t ishte e shpejt, ekonomike, rreth nj qllimi t caktuar. Fokusi
lidhej, me prftimin e informacionit t fshehur n t dhnat e panumrta t trafikut.
Funksione
Transformimi
MSC
Ngarkimi
Datamart
GGSN
SGSN
Zona Stage
ETL ETL
21
Nga analiza e krkesave tona u vendos q niveli m i ult i informacionit t ishte
thirrja, sepse veanrisht analizat e mposhtme krkojn informacion t detajuar:
- Analizat e investigimeve
- Analizat rakordimeve
- Analizat e detajuara t interkonjeksionit
Prandaj nga analizat e krkesave t mbledhura, vum re se ato ishin t orientuar drejt
elementve t mposhtm q do t jen edhe dimensionet e datamart-it ton:
-Koha
-Tipi i CDR
-Kategori GSM
-Destination
-Klasifikimi i thirrjes
-Antenat
U prcaktuan matjet: kohzgjatja e thirrjes. Ndrkoh tabela Fakt do t jet ajo e CDR.
Gjat modelimit konceptual, nj vend t vecant zuri analiza e elementit koh.
Dimensioni koh sht pjes e do analize t mundshme, ai mund t jet i nevojshm
deri n nivel sekonde pr analiza t detajuara investigative.
22
Zgjidhja q prdor sht ndarja n nj tabel t veant e t gjitha fushave, t cilat
duhet t ndryshojn shpesh vlera, kto tabela njihen me emrin mini-dimensione [9].
Keshtu pr do kombinim t vetm t ktyre atributeve, do t ket nj rresht n tabeln
mini-dimension. Pr popullimin e ktyre tabelave, u ndrtua nje proedur n Oracle.
Dim_kohe
Dim_kohe_KEY
Sekonda
Minuta
Dim_Date_Kohe Ore
Interval_kohe
Sekonda
Minuta
Ore Dim_Data
Data
Dit_e_muajit Dim_data_key
Dit_e_vitit Data
Dit_javs Dit_e_muajit
Muaji Dit_e_vitit
Nr_muajit Dit_javs
Katrmujor Muaji
Viti Nr_muajit
Katrmujor
Viti
23
v_minuta := TO_CHAR (v_koha_plote, 'MI');
v_ore := TO_CHAR (v_koha_plote, 'HH24');
v_intervali_kohes := TO_CHAR (v_koha_plote, 'HH24:MI:SS');
24
3.3.2 Modelimi Llogjik
Modelimi llogjik n zgjidhjen ton, transformon modelin konceptual n model
dimensional, q shpesh sht skema Star. Kjo tip skeme prbhet nga nj tabel e
madhe me fakte (tabela fakt) dhe nj numr tabelash t tjera q prmbajn t dhna
prshkruese (dimensionet) [15]. Skema ngjan me formn e nj ylli prandaj ka marr at
emrtim. Ato gjejn pdorim t gjer, n zgjidhjet DWH.
Secili prej elsave mund t jet nj numr q fillon me 1 dhe rritet n mnyr t
vazhdueshme.
N modelimin shum dimensional, rekomandohet krijimi i elsave SK, pr t
rregjistruar t dhna t pasigurta. Kjo situat njihet me termin nuk e di dhe mundson
t shtosh nj rrjesht n tabeln e dimensioneve, q do t ket si vler t barabart me
-1[11]. Kto mund t prfshijn rekordet problematike, me informacione jo t plota.
25
Pr kto dimensione, informacioni prshkruhet si pjes e tabels Fakt. Kto lloj
dimensionesh njihen me emrin dimensione t degjeneruara.
Prve strukturimit t dimensioneve duhet t ndrtohen edhe tabela Fakt. Zakonisht kjo
tip tabel prmban t gjitha elsat e huaj (FK), si dhe t gjitha matjet numerike t
quajtuara si Fakte. N rastin e tabels Fakt t modelit, do t jet vetm nj matje
numerike q ka t bj me kohzgjatjen e telefonats.
26
Dimensioni_Destinacion
PK Dest_Key
Dim_kohe
Kodi_operatorit
Dim_kohe_KEY Kodi_shtetit
Sekonda Emri_operatorit
Minuta Emri_shtetit
Ore Kodi_ID
Interval_kohe
Tabela Fakt-Trafiku-CDR
PK Emri_skedarit Dim_Data
Dim_Antenat
PK Nr_rekordit
PK Antenat_KEY Dim_data_key
Dim_kohe_KEY Data
Antenat_ID Dim_data_KEY Dit_e_muajit
Pershkrimi KAT_KEY Dit_e_vitit
Dest_KEY Dit_javs
Nr_origjinues Muaji
Nr_terminues Nr_muajit
Antenat_KEY Katrmujor
Load_date Viti
Load_time
Tipi_rekordit
Klas-KEY
...
PK KAT-KEY PK Klas-KEY
KAT-ID Klas-ID
Emri_Kategorise Emri_Kaklasifikimit
1- Standartizimi.
27
2- Krijimi i planit t t dhnave q do t grumbullohen
28
subpartition SYS_SUBP3235 tablespace trafiku_tbl,
subpartition SYS_SUBP3236 tablespace trafiku_tbl
)
alter table Tabela_Fakt_Trafiku-CDR
add constraint trafiku_PRIM primary key (Emri_Skedarit, Nr_skedarit)
using index
tablespace trafiku_index
pctfree 10
initrans 2
maxtrans 255
storage
(
initial 64K
next 1M
minextents 1
maxextents unlimited
);
29
Sipas arkitekturs specifike destinacioni i t dhnave, do t jet nj datamart i ndrtuar
pr nj proes biznesi. Duhet t prcaktohet nse informacioni sapo t nxirret nga
burimet do t tranformohet me mjetet e duhura dhe m pas t ngarkohet n sktrukturn
e databazs destinacion, apo fillimisht do t ngarkohet ashtu si sht n databaz n
tabela Stage, pr tu transformuar nga proedura t vet databazs destinacion.
Pr rastin ton do t prdorim metodat ETL. Proeset (ETL) jan n vetvete zgjidhje
software-ike t cilat jan prgjegjse pr trheqjen e t dhnave nga burime t
ndryshme, pr pastrimin e tyre, prshtatjen dhe ngarkimin n databaza [13].
Duke ndjekur edhe tiparin e ndarjes t sistemeve DWH, proeset ETL duhet t bhen
mbi nj databaz t ndryshme dhe t pavarur nga burimet dhe DWH. Aplikimi i
teknikave ETL, me an t komponentit Data-stage- Designer do t bhet me kto hapa:
30
Nevojitet t ndrtohet nj proes parsimi, mbi rekordet e MSC. Ky proes do t
realizoj strukturimin e t dhnave.
Ndrkoh burimet e tjera t informacionit si SMSC, GGSN, SGSN, prodhojn
informacion t strukturuar, ku do rekord i skedarit t prodhuar ka t njjtn
prmbajtje. Pr kto rekorde nuk nevojitet proesi i parsimit dhe strukturimit.
Proesi fillestar ndodh kur nuk ka asnj informacion n destinacion, ndrsa freskimi
sht ai proes q sigurohet se t dhnat jan t fundit dhe nxjerr vetm at pjes t
informacioni q sht e shtuar apo ndryshuar nga version paraardhs.
Pr prcaktimin e t dhnave t ndryshuara ka disa metodika, por ajo q ne do t
prdorim pr dimensionet tona sht si m posht:
2- Strukturimi i informacionit.
31
Figura 3.5 Rregullat e ndarjes s informacionit n module t veanta
32
Figura 3.6 Diagrama e proesit t transformimit
Duke ndjekur do lloj modeli pr sistemet DWH, prpara se t filloj nxjerrja dhe
transformimi i informacionit, ndrtojm nj tabel q lidh logjikisht burimet me
destinacionin. Kjo tabel prmban lidhjet midis nyjeve m t skajshme t burimit dhe
elementve m t skajshm t destinacionit. Ajo prcakton edhe rradhn e ngarkimit t
informacionit q tradicionalisht fillon me dimensionet dhe prfundon me tabelat Fakt.
Proesi i transformimit q do t vijoj, e shfrytzon kte dokument si nj hart
udhheqje.
33
Identifikimi i defekteve t informacionit sht e rndsishm n procesit ETL, sepse
kjo faz prmirson cilsin e t dhnave. Nse do prmendim problematikat m t
shpeshta t t dhenave q hasm dhe prmirsuam jan:
-T dhna t pa rregullta.
34
Figura 3.7 Job-i i datastage q transformon t dhnat e MSC
35
Figura 3.8 Transformimi i t dhnave t nj rekordi MSC
36
4. Ngarkimi i t dhnave
37
referenca Koha referenca Data referenca Antenat
Data ID Zevendesohet
Zevendesohet Koha Zevendesohet Antenat
Koha ID Data ID me Data ...
ID me Koha KEY ID me Antenat KEY
Antenat ID KEY
...
Tabela Fakt me Surrogate-Key
Data KEY
Koha KEY
Antenat KEY
...
Gjat proesit t ngarkimit, mund edhe t shtojm element shtes informative, si sht
rasti i fushs: data_ngarkimit, koha_ngarkimit, emri_skedarit q duhet pr t mbajtur
n tabel kohn e ngarkimit t rekordit n database, si n figurn m posht. Kto
element t shtuar nuk gjenden n t dhnat burim, por gjenerohen nga sistemi me an
t funksioneve standart t Datastage. Fushat q prmendm shrbejn pr
menaxhimin e ngarkimit t informacionit, apo pr investigime n rast problemesh.
38
Figura 3.11 Job-i i Data-stage pr shtim informacioni
5-Automatizimi i proesit
39
Figura 3.13 Monitorimi i ekzekutimit ETL
Nse gjat puns, ndodh ndonj problem, proesi sht konfiguruar t ndaloj duke
mos kaluar n hapin vijues pr veprimeve ETL. Kjo bhet, pr t ruajtur konsistencn e
informacionit t shtuar. Parametri q e mundson kt sjellje, sht paraqitur m
posht. Sipas ktij parametrizimi, job-i pasardhs do t vijoj vetm nse proesi
paraardhs prfundon suksesshm:
Mbi kt datamart mund t ndrtohen kube OLAP. M posht demostrohen disa nga
analizat q mund t prftohen nga nj datamart i till.
40
M posht sht nj ilustrim i rezultatit t thirrjeve sipas ditve t javs dhe i
kohzgjatjes s tyre gjat orve t dits dhe ditve t javs.
400000
350000
300000
250000
200000
150000
100000
50000 Total
0
30000
25000 E Djele
20000 E Enjte
15000 E hene
10000 E Merkure
5000 E Premte
0 E Shtune
00 02 04 06 08 10 12 14 16 18 20 22
Figura 3.16 Kohzgjatja mesatare e thirrjeve sipas orve dhe dits s javs.
Nga rezultatet e msiprme duket q, dita m e mir prsa i prket trafikut sht e
enjtja. Gjithashtu kohzgjatja mesatare e thirrjeve gjat dits s enjte sht m e lart
se ditt e tjera (n orn 21:00 sht kulmi).
41
Po kshtu, duke ditur shprndarjen e thirrjeve sipas ditve t javs dhe orve t dits,
zgjidhet dita dhe ora me trafik m t ult pr aplikimin e ndonj ndryshimi teknik n
sistem q krkon shkputje t sistemeve. N kt mnyr, rrisku pr klient t
impaktuar nga shkputja do t jet shum e ult.
3-Ky model vlen edhe pr krkesat teknike, bazuar mbi dimensionin antenat, pr
analiza t shfrytzimit t antenave apo investigim t problematikave specifike.
Analizat e prdorimit t shrbimit sipas vendodhjes, jan shum t rndsishme pr
sherbimet e bazuara n vendodhje, sikurse jan faturimet sipas vendodhjes.
4-T dhnat e detajuara t trafikut nga platformat e rrjetit, vlejn edhe pr kontrolle dhe
rakordime t trafikut t realizuar me at t tarifuar. Do ta trajtojm me detaje n
kapitullin pasardhs.
2-Problem tjetr i hasur gjat puns, ishte performanca e ekzekutimit t ETL. Mqs
fluksi i t dhnave t ngarkuara n dit ishte shum i lart (rreth 5 GB t dhna t
shtuara n dit) shpesh proeset ETL shfaqnin probleme ekzekutimi.
42
c- Gjithashtu pr t evituar pengesat q sjellin indekset veanrisht gjat
ngarkimit t t dhnave, ato fshihen para ngarkimit t t dhnave, pr tu
rikrijuar automatikisht, sapo prfundon ngarkimi i informacionit.
3.7 Konkluzione
sht e qart q prpara se t ndrtohej llogjika e proeseve ETL krkoi studim t mir
t burimeve pr t zhvilluar mnyrn e ngarkimit t informacionit n datamart.
Proeset ETL jan n zhvillim t vazhdueshm pr arsye t ndryshimeve apo
prmirsimeve q mund t ket si n sistemet burim apo edhe n skemn e DWH.
N ditt e sotme, shum kompani telekomunikacioni grumbullojn dhe analizojn t
dhna masive dhe rekordet e thirrjeve t detajuara, sht fusha m e nxeht pr
eksplorimin e njohurive n telekomunikacion. Pr ket arsye modelimi i nj datamart-i
pr kto t dhna sht shum interesant pr tu zhvilluar. Ky datamart mund t
zgjerohet, pr t prfshir n t edhe informacione shtes q do t ndihmonin m tej n
analizn e sjelljes s klientve.
43
Kapitulli 4: Menaxhimi i TELCO-KPI me zgjidhjet BI
4.1 Hyrje
Deri tani trajtuam, mundsit e analizave prej t dhnave t gjeneruar nga platformat e
rrjetit, por edhe t dhnat e sistemit t faturimit, jan shum t rendsishme.
Ky sistem ka shum informacione q lidhen si me aktivitetin e klientve, t ardhurat q
gjenerojn. sht shtja e prdorimit t tyre sipas mnyrs s duhur, pr t prfituar
avantazhet q kto kompani krkojn.
44
Pr mbajtjen e klientve, nevojiten njohje t mira t segmentimit t klientve. Sepse n
baz t segmentimit mund t ndrtohen produkte q kan pr synim te rrisin
prdorimin e shrbimeve nga nj segment i caktuar klientsh.
Me nj baz t segmentuar t klienteve n karakteristika apo sjellje, mund t ndrtohen
oferta dhe produkte q synojn t ken sukses n nj segment t caktuar klientsh. N
kt mnyr sht m e leht t matet nes impakti i prfitimit nga oferta sht sikurse
parashikohej. KPI n telekomunikacion, jan edhe t tipit kontrollues pr ecurin e
aktivitetit t sistemeve.
45
- T identifikohet informacioni prej nga duhet t dalin kto matje.
- T bhet nj ndrlidhje e burimit t informacionit me destinacionin.
- T ndrtohet proesi q nxjerr, transformon, pastron dhe ngarkon t dhnat n nj
database destinacion.
- T prodhohen matjet e sipr prmendura.
Tip
Dim. Seg-Kohe
Dim Kat. GSM
Dim P. Tarifor
Dim. Klientet
Dim.Balanca
Destinacion
Segmentim
Rimbushje
Dim Kohe
Dim.
Dim.
Dimensione/
Fakte
Tabela Fakt
X X X X X
Trafiku
Tabela Fakt
X X X
Te ardhurat
Tabela Fakt
X X X
MOU
Tabela Fakt
X X X X X
Rimbushjet
46
Kategori GSM- Ruan profilin e klientit (me para pagim/me kontrat)
Tipi i rimbushjes- Ruan informacionin e tipit t rimbushjes (kart gervishse,
rimbushje elektronike
Balanca Ruan informacion mbi balancat ku bhet rimbushja, q mund t jet
balance monetare apo njsish.
Seg-Koh- Ruan informacion t kohs me muajin si niveli me i detajuar i
informacionit.
Segmentim - Ruan detajet e segmenteve ku prfshihen emri i segmentit, vlera
m e lart dhe m e ult dhe nj indikator pr matjet q segmenti i referohet.
Zakonisht kto segmente jan lista t prcaktuara nga marketing-u pr
segmentimin e t ardhurave, minutave t trafikut apo rimbushjet.
47
Dimensioni Kohe
Dimensioni Destinacion Dimensioni Seg-Kohe
PK TID Dimensioni Tipi rimbushjes
PK Dest_id PK SK_ID
PK RID
Dita
Java Emri Muaj
Pershkrimi Tre_mujor Emri_Tipit
Muaji
Vit Pershkrimi_Tipit
Viti
1-Sistemi i faturimit dhe ai i skems s datamart-it kan t njjtin tip databaz (Oracle).
48
Diagrama e mposhme paraqet proeset ELT t ndrtuara pr nxjerrjen, ngarkimin dhe
transformimin e t dhnave:
Duhet theksuar gjat puns mund t ket probleme me vet informacionin e ruajtur n
sistemin burim, q prcakton nevojn e ndrtimit t proedurave t veanta t cilat
merren me kontrollin dhe mbivendosjen e t dhnave t burimit t ndryshuara me dat
t mpasme, si psh informacioni i dats 3 Shkurt, pr ndonj arsye teknike ndryshon n
date 5 Shkurt n sistemet burim.
49
Dt_fillimit Dt_mbarim
Klienti Klient_id( Data_aktivi it
Key (PK) NK) Emri zimit Kat_id
RR. Sami
26938 35001 aaa bbb Frasheri 01 03/02/10
Dt_fillimit
Klient_id(
Key (PK)
Dt_mbari
Klienti
Kat_id
izimit
Emri
NK)
Dt_fillimit
Klient_id(
Tabela Fakt
Dt_mbari
Key(PK)
Klienti
Thirrjet e klientit
Kat_id
izimit
Emri
NK)
mit
aaa S. 03/03/
26970 35001 bbb Frasheri 02 13
50
Gjithashtu transformohet edhe informacioni i trafikut t detajuar, q ndodhet n Stage.
Para ngarkimit n datamart, ai pajiset me gjith SK m t fundit t dimensioneve.
51
Mbas popullimit t datamart-it, prdoren mjete t ndryshme BI pr t nxjerr analizat e
krkuara t perdoruesit. Kto mund t jen raporte, kube OLAP, dashboard-et (do t
prezantohen n vijim).
52
Figura 4.6 Burim nga Spago BI
-SpagoBI Server sht nj aplikacion web i bazuar mbi serverin J2EE. sht i
aksesueshm nga do shfletues web. Ofron t gjitha funksionalitet e BI.
53
Figura 4.7 Prcaktimi i dimensioneve t kubit
54
Mbasi ndrtohet modeli, mund t gjenerohet pr tu publikuar n serverin Spago BI.
Nprmjet web-it, klientt mund t prftojn analizat e krkuara.
Modeli OLAP Mondrian sht nj OLAP (me kod t hapur) i shkruar n Java.
Mbshtet shprehjet shum dimensionale dhe gjithashtu XML pr analizat. Spago BI
jep mundsin e prdorimit t ketij modeli. Prcaktimi i rregullave t ndrtimit t
OLAP q prmendm m sipr, sipas modelit Mondrian prmblidhen n nj skedar
XML, q transferon n server llogjikn e kubit t ndrtuar.
Analiza 1
Duke u prqndruar n analizat e trafikut pr ofertn specifike, fokusohemi te analiza e
trafikut n dy destinacionet, q jan fokus i ksaj oferte: Destinacioni1, Destinacioni 2
Prdoruesit fundor mund t marrin analiza t larmishme prej kubit t ndrtuar.
N figurn e mposhtme shfaqet analizat e trafiku pr dy destinacionet, prgjat 5
mujorit t par t viteve 2013, 2014.
-Nga analizat e trafikut pr secilin nga 5 muajt e ktyre viteve, rezultoi q trafiku
specifikisht pr dy destinacionet e interesuara sht n rritje gjat 5 mujorit t par t
vitit 2014, far tregon impaktin e mire t oferts.
55
Matja e kubit q ka lidhje me numrin unik t klientve t cilt kan br trafik n kto
destinacione, sht rritur ndjeshm dhe ka shtuar me gati 30% bazn e klientv q
jan aktiv n trafikun ndaj ktyre destinacioneve.
Nga grafiku i mposhtm duket q vetm trafiku drejt destinacionit 1 gjat 2014, po
prbn rreth 50% t minutave total t trafikut. Kjo tregon nj prdorim t lart t ksaj
oferte.
Kshtu mbi kubin zgjedhim si dimensione Planin Tarifor dhe konkretisht muajin Prill
pr t krahasuar t ardhurat. Rezultati tregon se pavarsisht se oferta ofronte mime
m t ulta n trafikun drejt Destinacioni1 dhe Destinacioni1, prsri t ardhurat q i
vijn kompanis prej ksaj ofert jan n vlera t prafrta me vlerat prkatse t vitit
2013.
56
3,000,000
2,500,000
2,000,000
1,500,000
1,000,000
500,000 Destinacioni1 Shuma
0 Destinacioni2 Shuma
Rezultat 1
Bazuar mbi modelin e datamart-it te msiprm mund t ndrtohen edhe kube t tjera t
cilat japin prgjigjen e shum analizave q kan lidhje segmentimin e klienteve si me
posht:
Analiza 2
57
3500
3000
2500
2000
1500
1000
500
0
Rezultati 2
Analiza 3
Cilt jan klientt mbi t cilt duhet t prqndrohet kompania pr rritjen e prdorimit
t shrbimeve t saj? Ose e thn ndryshe, cilt jan ata klientt me gjasa pr tu
larguar.
Prgjigjen e ksaj pyetje mund ta marrin prej rezultatit t OLAP si m posht:
250
200
150
100
Nr_klientve
50
58
Rezultate 3
Analiza 4
30000
20000
Nr Rimbushjeve
10000
0
0.01- 300 301 - 500 500 - 800 800+
59
Rezultat 4
25000
20000
15000
10000
Minuta_te_rimbushura
5000
0 201 +
10 30
31 60
61 90
91 120
121 150
151 200
far tregon se klientt q blejn m shum minuta ndrkombtare nga baza q u morr
pr eksperiement, jan ata t segmentit 61-90 minuta.N baz t rezultatit drejtuesit
mund t parashikojn tarifat e interkonjeksionit q lidhen me prdorimin e rrjetit drejt
operatorve ndrkombtare.
Analiza 5
Nj analiz e shpesht q duhet pr drejtuesit, sht edhe ecuria e sjelljes s klientve e
shtir n koh. Kjo analiz krkohet si pr trafikun realizuar prej klientve, por edhe
pr veprime t tjera sikurse jan rimbushjet, blerjet e ofertave etj. Ecuria e klientve e
shtrir n koh, prbn nj informacion ky pr monitorimin e sjelljes s klientve
[20].
M posht sht nj nga rezultatet e prftura nga OLAP i msiprm pr t kuptuar
shprndarjen e t ardhurave t nj muaji sipas moshs s klientve n kompani.
Mosha e klientve n kompani ka lidhje m kohn kur klienti ka lidhur kontratn.
Kshtu pr kt krkese marim rezultatin e mposhtm:
60
Janar 2009
Shkurt 2009
Mars 2009
Prill 2009
Maj 2009
Qershor 2009
Korrik 2009
Rezultate 5
Klientt q kan lidhur kontrat n muajt paraardhs, vazhdojn t jen po aq aktiv n
rrjet edhe n muajt vijues. Abonentt e krijuar n Mars 2009 kan nj performanc m
t mir krahasuar me t tjert. Pr t gjetur arsyen prse diferencon ky muaj, drejtuesit
mund t futen m thell n analizime me an t operacioneve OLAP, pr t kuptuar
nse ky rezultat ka lidhje me ndonj ofert, destinacion apo me nj plan tarifor
specifik.
Analiza 6
Gjithashtu me vler esht kontrolli i ecuris s klintve n baz t moshs s tyre me
kompanin. Kshtu analiza e mposhtme tregon ecurin n muaj, pr klientet e
rregjistruar n Janar 2009.
1,800,000
1,600,000
1,400,000
1,200,000
1,000,000
800,000
600,000
400,000 Janar 2009
200,000
0
61
4.7 KPI pr kontrollin e balancave t klientve
Prcaktimi i problemit
Analiza e problemit
Sistemi i faturimit do t jet burimi prej nga do t grumbullohen t dhnat e duhura.
Nga analiza e problemit, u pcaktuan n nivelin m t lart entitet-et nga ku duhet t
grumbullohen t dhnat. T dhnat e mposhtme prbjn bazn e modelimit
konceptual t databazs q do t ndrtojm.
Ky veprim i kryer nga klienti ul balancn e klientit me vlern q kushton trafiku i kryer
i klientit.
Ky veprim i kryer nga klienti ul balancn e klientit me vlern q kushton oferta e bler.
62
Gjithashtu sht thelbsore t gjendet mnyra e kapjes s vlers s balancave
prkatsisht n dy periudhat kohore t krkess.
Diagrama e mposhtme paraqet skemn e zgjidhjes s problemit t kontrollit t
balancave t klientve:
Rimbushjet Mujore Trafiku i kryer Mujor Blerja e ofertave-Mujore Veprime t tjera monetare
Krahasohet
balanca reale n
JO fund t muajit me
Investigim at t
prllogaritur.
sht e njjt?
PO
END
Modelimi llogjik
Gjat ktij modelimi duhet t identifikojm tabelat e sistemit burim, prej nga do t
merren t dhnat pr zgjidhjen e problemit. Si dhe t prcaktojm mnyrn si do t
bhet nxjerja e informacioint. Modelimi llogjik prcaktoi llojin e t dhnave t
nevojshme pr ndrtimin e analizave. Pr t dhnat q duhet t nxjerim, analizojm
burimin. Tabelat prej nga do t grumbullohet informacioni jan:
Proeset ELT
Gjithashtu mund edhe t detajohen elementt q japin rezultatin e ktij KPI. Nse
duhet informacion m i detajuar, pr elementt prbrs marrin raportin e prmbledhur
t mposhtm (me vlera demonstrative):
64
Rasti i modelit t ksaj analize, kontrollon t dhnat e databazs, por edhe ndihmon n
identifikimin e ndonj problematike t mundshme n sistemin e faturimit.
Ky i fundit sht edhe qllimi i ksaj analize. do vler m e lart se normalja e lejuar
pr kt KPI, do t vijoj me investigime n dy drejtime:
Gjithashtu vlen pr tu prmendur se vlera e ktij KPI n kushte reale nuk mund t jet
asnjher 0, pasi n momentin q nxiren t dhnat e balances s klientit prej tabels
llogari_klienti, ai mund t jet duke kryer nj nga veprimet q prmendm m sipr.
Pr kto veprime, ende mund t mos jet rregjistruar rekordi prkats. Prandaj vlera e
lejuar e KPI, sht nj vler e vogl e ndryshme nga 0.
Automatizimi i proesit
Automatizimi konsiston n:
65
4.8 KPI pr kontrollet e sigurimit t t ardhurave
Kontrolli dhe ulja e mundsive pr humbje t ardhurash sht nj nga pikat kryesore t
nj kompanie telekomunikacioni. Fakti q informacioni rrjedh n disa platform, deri sa
t prfundoj n sistemin e faturimit, shton mundsin q pr ndonj arsye, t ket
rrjedhje t t ardhurave.
- T lidhura me rrjetin.
Si pr shembull: rekordet e thirrjve/sms/data q nuk kalojn nprmjet switch-
it, rekordet q nuk rregullohen nga Mediation, rekordet q nuk jan t tarifuar
n rregull nga sistemi i faturimit, gabimet e interkonjeksionit, etj
- T lidhura me Mediation.
Si pr shembull rasti kur, gjat filtrimit t rekordeve me parapages/ apo me
kontrat ndodhin problematika, rekordet e dyfishta q gabimisht mund t
gjeneroj kjo platform.
- T lidhura me faturimin.
Pr shembull t lidhura me planin tarifor jo korrekt, ulje m e madhe e faturimit
se duhet, faturimi i vonuar, etj.
66
N parim gjith ky proes, krkon prplasje rezultatesh. BI kontribuon n identifikimin
e ktij problemi. Zakonisht modeli i BI kontrollon t dhnat para dhe pas do elementi
t sipr prmendur.
Pr shembull, trafiku kopjohet n DWH prpara se t futet n sistemin e Mediation dhe
gjithashtu edhe pasi t dal prej tij. Nj shembull i nj gabimi mund t jet kur nje
numr kalon nga numr me para pagese n numr me kontrat dhe Mediation e filtron
pr numr me parapages, sepse nuk ka mar akoma profilin e ndryshuar t numrit.
DWH
67
Mjetet e BI ofrojn edhe nj pamje vizuale t KPI q lidhen me sigurimin e t
ardhurave. Nprmjet monitorimit t vlerave t KPI, q zakonisht sht diferenca e
lejuar midis rezultateve t dy sistemeve, kapet n momentin m t pare devijimet nga
vlerat e lejuara dhe reagimi ndaj do problematike sht m i shpejt.
68
4.10 Problematika t hasura gjat puns s ndrtimit t datamart-it
69
7- Ndrtimi i nj skeme monitorimi pr:
70
4.11 Konkluzione
Duke ndjekur t njjtn llogjik si datamart-i i msiprm, mund t ndrtohen edhe
modele t tjera shum dimensionale t drejtuar drejt subjekteve si:
Fokusi i Bi nuk jan vetm t dhnat aktuale por edhe ato historike dhe gjithashtu
analizat parashikuese. N kapitullin q vijon, do t trajtojm mundsit e prfitimit t
analizave parashikuese.
71
Kapitulli 5: Zbulimi i njohurive n t dhnat e telekomunikacionit
5.1 Hyrje
Por nga ana tjetr, pr t funksionuar si duhet kto teknika hasin vshtirsi sepse:
72
5.2 Aplikacionet Data-mining
Aplikacione Data-
mining Proeset e biznesit
Mat vlern e klientve dhe mban klientt q i sjellin m shum
prfitim
Profilizimi Gjeneron profilet e klientve dhe nxjerr njohuri pr qllim t
marketingut
Trheq klient t rinj
Rrit fitimin
Analiza t fenomenit 'churn'
Zbulimi i
Abuzimeve Identifikimi i prdoruesve abuziv
Zbulimi i elementve abuziv q hyjn n llogarit klintv
Zbulimi i modeleve jo t zakonshm si ort e zna, dyndjet e
rrjetit
Izolimi
problemeve t
rrjetit Identifikimi i defekteve t rrjetit
Menaxhimi i ngarkess s sistemit dhe prdorimi i tij
Identifikimi i sjelljes s grupeve t prdoruesve dhe krahasimi i
t dhnave t trafikut
73
Nga zgjidhet q ndrtuam me modelin e datamart-eve, mund t prmendim disa prej
rezultateve q do t vlejn si tipare pr teknikat Data-minig n prcaktimin e sjelljes s
nj klienti dhe profilizimin:
74
-Me an t teknikave Data-mining, parashikohet edhe fenomeni churn, t ciln e
prmendm edhe n kapitujt paraardhs.
Ky sht proesi i largimit t nj klienti nga nj kompani pr t shkuar te nj kompani
tjetr [17]. N situatn e sotme do klienti i lejohet t largohohet nga kompania duke u
rregjistuar me t njjtin numr si pjes e nj kompanie tjetr, fal proesit Mobile
Number Portability (MNP).
75
5.4 Zbulimi i abuzimeve (Fraud)
Abuzimet n telekomunikacion, q n termin ndrkombtar quhen Fraud, jan
probleme serioze q ojn n humbje t mdha t kompanive.
Sipas Wikipedia [37], nga nj raport i vitit 2011 humbjet e kompanive prej abuzimeve
(PBX/ Voicemail Systems) ishte rreth $4.96 Bilion (USD). Prandaj do kompani
telekominikacioni i kushton nj rndsi t veant identifikimit sa m t shpejt t
abuzimeve.
1- Abuzim rregjistrimi
Kjo ndodh n rastet kur nj klient rregjistrohet n kompani me qllimin pr t mos
paguar asnjhr detyrimet.
76
Metoda m e zakonshme e identifikimit t abuzimeve sht nprmjet ndrtimit t nj
profili pr sjelljen e klientve dhe krahason kt profil me aktivitetin historik.
Kto aplikacione bazohen n metodat e identifikimit t devijimit.
77
Sequence Analyzer (TASA). Ky ndihmon n prftimin e njohurive prej korrelimit t
alarmeve [26].
Ky mjet zbulon tipet e alarmeve q prsriten s bashku me vlerat statistikore t tyre,
duke prdorur teknika Data-mining, si n figurn m posht.
M tej specialistt e rrjetit prdorin kt informacion pr t ndrtuar nj system
korrelues t bazuar n rregulla.
Prezantimi i
Zbulimi rregullave
i rregullit
78
Zakonisht mesazhet e rrjetit, nuk ruhen n sisteme DWH, prandaj aplikimi i funksionit
t izolimit t rrjetit krkon sisteme t veant pr ruajtjen e rekordeve t gjendjes s
rrjetit.
79
Kapitulli 6: Prdorimi i Learning Objects n ndihm t proesit t
edukimit n distance sipas arkitekturs s DWH me tre shtresa
6.1 Hyrje
Aplikimi i sistemeve DWH sht evident edhe n fushn e edukimit. Sisteme t tilla
mund t aplikohen pr t shfrytzuar sa m t mir t objektet msimore, n struktura
m komplekse dhe m t personalizuara t msimmarrjes.
N kt kapitull ndrtohet nj model i thjesht instruksional pr krijimin e nj LO dhe
shpjegohet ndrtimi dhe arkitektura e nj aplikacioni q nga njra an u jep mundesin
instruktorve pr krijimin dhe manipulimin e LO edhe pa patur prvoja teknike n
zhvillim, nga ana tjetr cdo individ mund t prftoj njohuri prej tyre sipas nj objektivi
t caktuar.
Gjithashtu pr nj efikasitet m t lart, propozohet prfshirja e ktyre objekteve n
sisteme DWH. Aftsit e ndrveprimit q kan sistemet DWH, mundsojn q kto LO
t jen pjes e nj migrimi n sisteme t prbashkt dhe me njohuri lehtsisht t
shkmbyeshme.
80
Figura 6.1 Sisteme adaptive dhe t personalizuara t msimit
Sisteme t tilla ndrtohen mbi bazn e Learning Objects, t cilat duhet t ndrtohen
paraprakisht n mnyr q t funksionoj ne trsi procesi E-Learning sipas skems s
msiperme. Nj LO konsiderohet si nj pjes instruksionale e pavarur, dixhitale ose jo,
nprmjet t cils mson nj koncept t fokusuar. Nse dixhitalizohet, LO mund t
riprdoret n varietete t ndryshme, duke kursyer kohn dhe kostot e rizhvillimit t
ktij objekti. Teorit instruksionale t ofruara nga studjues si Wiley, Keith Reigeluthiv
[29], mbshtesin ndarjen e prmbajtjes instruksionale n pjes t vogla konsistente, dhe
grumbullimin e ktyre pjesve n nj larmshmri mnyrash pr t arritur qllime
specifike dhe efiente gjat proesit t msimit. Po sipas ktyre studiuesve, nj LO
prbhet nga tre element kryesor:
-Prmbajtja instrusionale: q ofron njohuri pr lexuesit dhe u jep mundsin pr t
arritur nj objektiv t caktuar njohurish.
-Metadata: q prmban fjal kye t cilat prshkruajn atributet pr nj LO.
Metadata u jep prdoruesve fuqin e specifikimit t atributeve t duhura pr nj
prmbajtje instruksionale. Metadata e bn krkimin m efient dhe sjell lehtsi n
riprdorim t objekteve npr kurse t ndryshme dhe aplikacione t ndryshme.
-Ndrveprimi: q bn t mundur ndrtimin e Objekteve Msimore sipas
specifikimeve teknike t bazuara mbi standarde teknike q mundsojn edhe
komunikimin i tyre me sisteme t tjera menaxhimi, databaza dhe aplikacione t tjera
web-i.
81
Figura 6.2 Modeli i LO
82
Aplikacioni prbhet nga faqe dinamike. T tilla faqe nga ana konceptuale, ndajn
llogjikn, t dhnat, dhe metodn prezantuese n shtresa t vecanta dhe sht pikrisht
aplikacioni i serverit q do ti ribashkoj ato sipas nj llogjike t caktuar. Faqet
dinamike lejojn q prezantimi dhe llogjika e t msuarit, t krijohet nj her n server
dhe t prdoret n shum instanca nga shum prdorues.
Me t dhnat e ndara nga llogjika dhe prezantimi bhet e mundur q n aplikacion t
krijohen ndrfaqe t ndryshueshme, q i japin mundsi edhe nj perdoruesi pa njohuri
teknike t ndrtoj dhe t ndryshoj LO. ColdFusion MX s bashku me Flash
Communication Server mundsojn aplikimin e disa tipareve t E-Learning brenda
aplikacionit tone, si personalizimi i msimit sipas individit, krkime, formatim dinamik
t prmbajtjes, dhe prftim i prmbajtjes n koh t menjhershme.
Komponentt e ColdFusion (CFCs & Flash Remoting) prdoren si metoda komunikimi
n kt aplikacion dhe bjn t mundur shprndarjen n mnyr t shpejt dhe t pastr
t dhenave dinamike.
N figurat 6.3 dhe 6.4 paraqiten pamja t faqeve ku mund t shihen LO t rregjistruar,
dhe t msohet prej tyre duke ndjekur hapat: msim, praktika, vlersim .
83
Figura 6.5 Pamja e faqes s aplikacionit ku mund t msohet nga nj LO
84
LO1 LO2
Mjetet ETL
RC
Meta - Data
KURSET
LMS
85
Kapitulli 7: Faktort thelbsor pr suksesin e sistemit DWH
a)Nj grup prdoruesish zbulon se nuk u prfshi n krkesat fillestare dhe krkon t
prfshihet me krkesa t reja q ndryshojn fokusin e projektit.
86
Impakti i mungess s cilsis s t dhnave sht i lart. Nse lejohet q kto tip
problemesh t prseriten, shkakton mosbesim te drejtuesit e kompanis dhe pr
rrjedhoj mos prdorim t ketyre sistemeve.
Lind pyetja: Kush duhet t menaxhoj kt detyr t rendsishme?
Proeset
fillestare Datamart
ETL
Proeset
Burimet fundor DWH
ETL Raportet e
biznesit pr
Kontrolli kontroll t
cilsis
Proeset ETL
Raportet teknike
T dhnat nuk pr kontroll t
plotsojn krkesat cilsis Korrigjimi i t dhnave
87
Por gjithashtu kontrollet aplikohen edhe gjat prdorimit t sistemit. Kontrolli i
vazhdueshm ndihmon n identifikimin m t shpejt t nj problemi q mund lidhet
me:
Pr kto kontrolle, kompania krijon KPI t veant kontrolli, si ishte rasti i trajtuar n
kapitullin 4.
7.3 Performanca
DWH do t dshtoj nse prdoruesit nuk i marrin prgjigjet n koh. Kjo sht arsyeja
prse teknologjia e DWH ka n themel parimin e databazave paralele t t dhnave,
krijimi i indekseve t avancuara, modelimi i t dhnave, grumbullimi dhe prmbledhja
e tyre. Kjo sht nj fush ku investimi ka kuptim - jo vetm n teknologji, por edhe
pr ekspertt q din si ta maksimizojn dobin e ksaj teknologjie, pr arsye t
kompleksitetit q ofron sistemi. N fushn e telekomunikacionit kjo shtje merr
akoma m shum kuptim, prej t dhnave t panumrta q zotron. N kapitullin 4 q
ilustruam disa nga masat konkrete q duhen marr mbi datamart-in e ndrtuar, pr t
patur nj performanc sa m t mir, n drejtim t indeksimit, particionimit, etj.
88
7.5 Marrdhnia e vazhdueshme me prdoruesit
Nj projekt i drejtuar vetm nga analistt teknik mbart rrezik t lart pr prshtatje
t ngadalt, kthim t ult t investimeve ose pr dshtim t plot. Nj projekt i
drejtuar vetm nga prdoruesit mbart rrezikun e dyfishimit t prpjekjeve,
mungess s integrimit me sistemet e tjera baz t kompanis dhe krijimit t nj
mjedisi t pa prshtatshm.
89
Prfundime
Pjes e punimit jan edhe masat konkrete q u morrn si pr modelin e ndrtuar prej t
dhnave t rrjetit, por edhe pr modelet e ndrtuara prej t dhnave t sistemit t
faturimit. Kto masa lidhen si me optimizimin e proeseve ETL/ELT, por edhe me
optimizimin e proedurave dhe funksionimit t databazs Oracle.
Ato rezultuan t sukseshme, prderisa prmirsuan situatn.
90
Megjithat duhet t themi se duke ndjekur zgjidhjet me ndrtimin e datamart-eve,
problemi i mungess s konsistencs s t dhnave midis disa datamart-eve sht
shpesh prezent n rezultatet q prodhohen.
Kjo sht arsyeja prse favorizohet krijimi i nj sistemi t vetm qndror DWH pr
kto kompani. Ndonse mund t nevojiten disa kompromise pr t plotsuar nevojat e
shumics, t paktn kjo zgjidhje do t siguronte konsistenc t t dhnave dhe t
qllimit nga njri departament i kompanis n tjetrn. Prve ksaj, informacioni sht
m i besueshm, sepse proesi i marrjes dhe i pastrimit t t dhnave sht m
sistematik dhe menaxhohet me m shum kujdes.
91
Referenca
[1] Power, D.J.(2002) Decision support systems: Concepts and Resources for
Managers, Quorum books
[2] Kimball R(1997): A Dimensional Modeling Manifesto, Miller Freeman Inc, 40-60
[3] Rizzi, S(2006). Conceptual modeling solutions for data warehouse. In Data
Warehouses and OLAP: Concepts, Architectures and Solutions, R. Wrembel and C.
Koncilia
[4] Sprague, R.H., and E.D Clarlson (1982). Building effective Decision Support
Systems, Prentice Hall Barry Delvin From Architecture to Implementation,
pp.150-160
[5] Matthias Jarke(2003), Fundamentals of Data Warehouses, pp 59-75
[6] Galhardas, H., Florescu, D., Shasha, D., (2001). Declaratively Data Cleaning:
Language, Model, and Algorithms. In Proceedings of the 27th International
Conference on Very Large Databases (VLDB), Roma, Italy.
[7] Ballard C., Farrell D.M., Gupta A., Mazuela C., Vohnik S. (2006), Dimensional
Modeling: In a Business Intelligence Environment, International Business Machines
Corporation, 161-172
[8] Camilovic D. (2008): A Call Detail Analysis Getting Insight into Customer Behavior,
Tenth Annual International Conference of the Global Business and Technology
Association, Madrid, 183-190.
[9] Camilovic D. (2008): Data Warehouse as Support for Telecommunications Services
Customer Relationship Management
[10] Grcar M., Mladenic D., Grobelnik M. (2006): User Profiling for the web, Computer
Science and Information Systems (ComSIS), Belgrade, Vol. 3, No. 2
[11] Kimball R., Ross M. (2002): The Data Warehouse Toolkit (Second Edition)
the Complete Guide to Dimensional Modeling, Vol 2, 56-75
[12]R. Kimball: The Data warehouse Toolkit: Practical Techniques for
Building Dimensional Data warehouses, 2000
[13]R. Kimball: The Data Warehouse ETL Toolkit: Practical Techniques for Extracting,
Cleaning, Conforming, and Delivering Data,2004
[14]C. Normile: Business Intelligence for Telecommunication industry,2008
[15]M. George Marakas: Decision support systems in the 21st century, 2008.
[16]W.H. Inmon: Building the Data Warehouse, 2nd edition, Wiley, 1996, pp.127-156
[17]B. Claude: Combating Customer Churn. Telecommunications (3), Horizon House
Publications, 2000.
[18]Frost,,S.Sullivan: Customer Segmentation, 2006, pp. 195-198.
[19]A. Abello, J. Samos, F. Saltor: A Data Warehouse Multidimensional Data Models
Classification, 2000.
92
[20]C. Todman: Designing a Data Warehouse: Supporting Customer Relationship
Management, Prentice Hall, New Jersey, 2000, pp. 72-80.
[21]Cortes, C., Pregibon, D. Signature-based methods for data streams. Data Mining and
Knowledge Discovery 2001; 5(3):167-182.
[22]Fawcett, T., Provost, F. Adaptive fraud detection. Data Mining and Knowledge
Discovery 1997; 1(3):291-316.
[23]Roset, S., Murad, U., Neumann, E., Idan, Y., Pinkas, G. Discovery of fraud rules for
telecommunicationschallenges and solutions. Proceedings of the Fifth ACM
SIGKDD International Conference on Knowledge Discovery and Data Mining; 409-
413, San Diego CA. New York: ACM Press, 1999.
[24]Han, J., Altman, R. B., Kumar, V., Mannila, H., Pregibon, D. Emerging scientific
applications in data mining. Communications of the ACM 2002; 45(8): 54-58.
[25]Mani, D. R., Drew, J., Betz, A., Datta, P. Statistics and data mining techniques for
lifetime value modeling. Proceedings of the Fifth ACM SIGKDD International
Conference on Knowledge Discovery and Data Mining; 94-103. San Diego. ACM
Press: New York, NY, 1999.
[26]Klemettinen, M., Mannila, H., Toivonen, H. Rule discovery in telecommunication
alarm data. Journal of Network and Systems Management 1999; 7(4):395-423.
[27]Keith Harman, Alex Koohang (2007): Learning Objects 2: Standards, Metadata,
Repositories, and LCMS.
[28]Mark J Rosenberg (2001): E-Learning: Strategies for Delivering Knoledge in the
Digital Age.
[29]Wiley D. (2002): Connecting learning objects to instructional design theory: a
definition, a metaphor, and a taxonomy.
[30] J.Lula, E.Arkaxhiu: Data warehouse and BI on Business decision making,
International conference: Economic & Social challenges and problems 2010, pp 722-
728.
[31] J.Lula How to manage TELCO- KPI with Business Intelligence Solutions, International
Journal of Science, Innovation and New Technology, Vol. 2, No. 5, November 2012,
Printed ISSN: 2223-2257, Online ISSN: 2225-0751, fq 51-56
[32] J.Lula, A.kika Modelimi i nje Datamart-i per CDR, Buletini i Shkencave Natyrore, Nr.
14, Viti 2012, ISSN 2305-882X, fq 230-241
[33] http://www. akep.al
[34] http://www.gartner.com
[35] http://www.spagobi.com
[36] http://www.brandfinance. Com
[37] http://www.weakipedia.com
93
Falenderime
94
Biblografia
Publikime:
3. Modelimi i nje Datamart-i per CDR, Buletini i Shkencave Natyrore, Nr. 14,
Viti 2012, ISSN 2305-882X, fq 230-241
Referime shkencore:
95
Prmbledhje
FjalKye: data warehouse, datamart, telekomunikacion, etl, business intelligence, olap, data
mining, vendimmarrje, analiza
Abstract
As business market in every field is becoming increasingly competitive, the ability to react
quickly and decisively to the market trend and to customize the services and products to clients is
a critical point nowadays. Although the data volumes in every business are extremely increased,
the point is not only the quantity, but how they are using the information. Especially in
telecommunication, it is very important to know the clients behavior and preferences. Designing
a data warehouse system can help on organizing and analyzing a big size of information
generated by the business and helping on generation of more effective business models for
keeping their clients satisfied and profitable. This thesis is a study of Data Warehouse systems
and their application on business, especially telecommunication. Based on problematic and
telecom challenges, it shows the ways data warehouse systems and business intelligence can be
applied in telecommunication. There are mentioned all the challenges and evolutions of
telecommunications market. The most important challenge is that most of the operational
systems are designed and concepted for the strategy of the product, means that these companies
need a system to offer a business management with the best business intelligence solution. It
demonstrates the ways we can design a datamart based on call data records and provide a lot of
analysis. It explains step by step how to design a multi dimensional model for the call data
records of a telecommunication company based on Kimball model. We will use ETL/ELT to
extract, transform and load the data. These are considered as very complex tasks within DWH
design process. It illustrates the analyses that can be obtained from this datamart, in help of
interconnection reports, customer behavior analysis and reconciliation process. The study
continues with presentation of some models that are designed based on billing system data, to
provide KPI results on network usage, revenues, offers performance, etc. It shows the way the
telecom KPI can be mapped with business data sources. It illustrates with answers of the
questions that business might have. Also shows the ways that data mining tools can be applied
for discovering knowledge on telecommunication data covering the some important processes
for these companies like: fraud detection and network faults. Also it summarized the usage of
DWH systems on storing Learning Objects in help of e-learning mechanism.
At the end, there are listed some key points of DWH success, based on studied literatures and my
real experiences with them.