Вы находитесь на странице: 1из 72

WEB BAZE PODATAKA (analiza podataka)

TA SU WEB BAZE PODATAKA ?


Kao i svaki uobiajeni sistem za upravljanje bazama podataka, Web baza podataka je skladite podataka ili nosilac informacija kojem je mogue pristupiti putem jezika upita ili programiranjem API-ja (Application Programming Interface interfejs za programiranje).

Za razliku od konvencionalnog sistema baza podataka, kod Web baza podataka, ovakav pristup se obino ne obavlja korienjem naredbi otkucanih na komandnoj liniji ili pomou interfejsa koji su posebno dizajnirani za korienje na odreenoj raunarskoj platformi.

Web bazama podataka se pristupa kroz druge Web aplikacije specifino, formama koje su razvijene korienjem standardizovanih HTML znakova, ActiveX kontrole i skripti na strani klijenta napisane, na primer, pomou VBScript-a ili JavaScript-a.

Korienjem mogunosti dostupnih u HTMLu, aplikativnim programima na Web serveru se pristupa kroz server-side programe putem CGI (Common Gateway Interface), server-specific interfejsa kao to je Microsoft-ov Internet Information Server (IIS), interfejs za aplikativno programiranje (ISAPI) ili server-side okruenje skripti kao to su IIS-ove Active Server stranice (koje koristi Visual Basic).

HTML forme interfejsa omoguavaju da se kreiraju aplikacije koje sadre funkcionalnost baza podataka i obezbeuju pristup skladitima podataka u korist Web klijenta (tj. korisnik i pretraiva).

Moe se dizajnirati aplikacija samostalno u cilju ispitivanja baze podataka i dobijanja specifine informacije na primer, profil najuspenijih prodavaca u nekoj kompaniji tokom poslednjeg kvartala.

Aplikacija, takoe, moe da iskoristi informacije izvuene iz baze podataka radi kreiranja sloenije baze podataka. Statistika prodaje lanca prodavnica mogu se izvui iz baze podataka, na primer, i iskoristiti za statistiku analizu kako razliite prodaje i promocije utiu na dobitak tokom odreenog vremenskog perioda.

Mogunost da se integrie baza podataka u aplikaciju kojoj mogu pristupiti korisnici upotrebom Web pretraivaa je ono to bazu podataka ini Web bazom podataka.

STATISTIKA ANALIZA POSEENOSTI WEB SAJTA


Najvea tekovina koja je proizala iz poslovne primene Interneta i njegovog multimedijalnog servisa poznatog pod nazivom Web (WWW World Wide Web) jeste potpuno okretanje potrebama korisnika.

Merenje i analiza poseenosti Web sajta imaju veliki znaaj u poboljanju dvosmerne komunikacije na relaciji izmeu uslune kompanije (vlasnika Web sajta) i potroaa (posetioca Web sajta). Statistika poseenosti je veoma bitan elemenat i u analizi kvaliteta Web sajta.

NAINI MERENJA POSEENOSTI WEB SAJTOVA


Postoji nekoliko naina za merenje poseenosti, a izbor metoda zavisi od potreba za takvim informacijama i ozbiljnosti sa kojom se upravlja sajtom.

Najjednostavniji nain merenja poseenosti je postavljanje brojaa na sajt. Svaki posetilac koji kompletno uita stranicu sajta uveava broja za 1.

Tracker radi identino kao broja, beleei posetioce koji su kompletno uitali stranicu sajta. Meutim, ovaj metod daje vie informacija o posetiocu: vreme posete, operativni sistem posetioca, da li je posetilac doao sa nekog drugog sajta ili ukucao URL i slino.

Nedostak ovog metoda je oslanjanje na grafiki segment stranice. Ovaj metod je iroko prihvaen jer je besplatan i lako razumljiv. Jedan od najpopularnijih tracker-a je Web Trends Live.

Za one koji koji ele mnogo vie informacija o poseenosti sajta odlian izvor su log fajlovi. Jedan od najveih problema vezanih za informacije iz log fajla, jeste takozvani problem keiranja.

Ovaj problem nastaje kada se Web prezentacija ili njen deo uva na nekom drugom serveru, na putu izmeu korisnika i stvarnog servera Web sajta. To moe da bude disk samog korisnika na kome se uvaju Web stranice kojima je korisnik poslednji put pristupao.

Zatim, to moe da bude disk na proxy serveru (ovlaenom serveru) velike kompanije imaju po nekoliko desetina ili stotina raunara koji pristupaju Internetu preko jednog proxy servera. U toj situaciji znaajan deo Web prezentacije moe se nalaziti na proxy serveru, veliki broj korisnika e joj pristupati, ali to nee biti registrovano u log fajlu.

Takoe, komercijalni servisi uvaju na svojim serverima veliki broj prezentacija kako bi svojim korisnicima omoguili bri pristup. U svim ovim situacijama moe se desiti da se ostvari pristup Web prezentaciji a da log fajl nema informaciju o tome. Ovo je jedan od problema u merenju pristupa Web sajtu za koji jo uvek ne postoje dovoljno kvalitetna reenja.

Jedna od mogunosti koje se uvode u postupak analize pristupa Web sajtovima jeste upotreba takozvanih kukija (cookies). Cookie je informacija koju Web server belei u browser korisnika, i na osnovu koje prepoznaje korisnika prilikom njegovog novog pojavljivanja.

Osim toga, uz pomo cookie-ja se prate i belee aktivnosti svakog korisnika kao pojedinca, na osnovu ega se mogu dobiti znaajne informacije, naroito o korisnicima koji esto pristupaju.

Postoji vie programskih paketa za statistiku analizu sajtova na osnovu log fajlova. Neke od njih koriste i nai provajderi, na primer, Satto loganalyzer i

Webalizer.

1. Svi ovi programi prikazuju opti pregled aktivnosti na sajtu. 2. Podaci u tabelama i grafikoni pokazuju dinamiku upotrebe sajta. 3. Meutim, za detaljniju statistiku analizu ovi paketi programa nisu dovoljni.

The Webalizer je besplatan program za brzu analizu web server log fajlova. On proizvodi detaljne izvetaje u HTML formatu koji se mogu pregledati pomou standardnih browser-a.

Postoji i domai servis www.radar.co.yu za merenje poseenosti sajta. On je identian, po svrsi, stranom sajtu www.alexa.com i osnovni zadatak mu je praenje poseenosti domaih Web sajtova.

Ovaj sajt daje dnevni i meseni pregled poseenosti domaih Web sajtova uslunih i ostalih kompanija. Takoe, preko ovog sajta se mogu dobiti osnovne informacije o svakom sajtu koji ima domen yu, njegovim konkurentskim sajtovima, utvrditi njegovi komplementarni strani Web sajtovi itd.

INFORMACIJE O POSEENOSTI WEB SAJTOVA


Meu informacijama koje nude Web analizeri programi za analizu pristupa Web sajtu, najee su sledee: broj pogodaka, zahteva ili poseta; duina trajanja sesije, vrste informacija koje se trae, adresa sa koje korisnik pristupa, domeni korisnika; statistika upotrebe po satima, danima i mesecima; prva stranica kojoj korisnik pristupa i slino.

Brojem pogodaka naslovne stranice se smatra broj uspenih uitavanja stranice, ne raunajui grafiku.

Ukupnim brojem pogodaka se smatra svako uspeno uitavanje HTML stranice, slike, forme, skripta ili preuzete datoteke.

Prosean broj pogodaka na dan i broj sesija na dan pokazuju prosene aktivnosti korisnika na sajtu za svaki dan u periodu izvetavanja.

Najposeenije stranice ova grupa podataka identifikuje najpopularnije stranice na sajtu i frekvenciju njihove poseenosti. Takoe, dati su podaci o prosenom vremenu koje posetilac provodi na svakoj od njih. Podaci ne ukljuuju pogotke grafike, audio i video sadraja. Dat je procentualni odnos pogodaka stranice u odnosu na ostali HTML sadaj.

Najmanje poseene stranice ova grupa podataka identifikuje najmanje poseene stranice na sajtu. Broj impresija se odnosi samo na uspeno uitane HTML stranice, ne i na grafiku.

Najee ulazne stranice ova grupa pogodaka identifikuje prve stranice koje su viene kada posetilac ue na sajt. To je najee naslovna strana, ali u nekim sluajevima to moe biti i neka druga strana iju adresu posetilac unese direktno ili upotrebi link.

Procenat se odnosi na ukupni broj sesija zapoetih ispravnim tipom dokumenta. Ako je sesija zapoela drugim tipom sadraja (slika ili zvuk), taj sadraj nee biti uraunat kao ulazni, a sesija se ne ubraja.

Najee izlazne stranice ova grupa podataka identifikuje najee stranice sa kojih su posetioci napustili sajt. Procenat se odnosi na ukupni broj sesija koje su zapoele standardnim tipom dokumenta. Ako je sesija poela nestandardnim tipom podatka (grafika, zvuk), ona nee biti uraunata.

Pristup jednoj strani ova grupa podataka identifikuje stranice sajta kojima su posetioci pristupili direktno i izali bez pregleda bilo koje druge stranice.

Najee putanje kroz sajt ova grupa podataka identifikuje putanje koje posetioci najee prate kada su na sajtu. Putanja poinje ulaznom stranicom i pokazuje sledeih est pregledanih stranica.

Najee koriene forme i skriptovi ova grupa podataka identifikuje najpopularnije forme i skriptove koji se izvravaju na sajtu.

Pregled aktivnosti u nedelji ova grupa podataka podvlai aktivnosti sajta, poredei aktivnosti radnim danom i vikendom. Posebno su navedeni najvie i najmanje aktivni dani u nedelji u periodu izvetaja.

Nivo aktivnosti po danima u nedelji ova grupa podataka prikazuje aktivnosti sajta po danima u nedelji za period izvetavanja. Tabela prikazuje broj pogodaka i procente pogodaka u odnosu na ukupan broj sesija.

Nivo aktivnosti po satima u danu ova grupa podataka prikazuje najaktivniji i najmanje aktivan sat u danu za period izvetavanja i nivo aktivnosti u svakom satu.

Nivo aktivnosti po danima u mesecu ova grupa podataka prikazuje, za period izvetavanja, nivo aktivnosti u svakom danu.

Nivo aktivnosti po mesecima u godini ova grupa podataka prikazuje, za prethodnih 12 meseci, nivo aktivnosti u svakom mesecu.

Tehnike statistike i analize ova grupa podataka ini tehniki presek pouzdanosti sajta. Tabela prikazuje broj uspenih i neuspenih pogodaka na sajtu i izraava procentualni odnos.

Greke klijenata ova grupa podataka identifikuje vrste greaka koje prave posetioci dok pristupaju sajtu. Tabela prikazuje sve uoene greke sortirane po broju pojavljivanja.

Najfrekventniji direktorijumi ova grupa podataka analizira pristupe direktorijumima na sajtu. U tabeli su prikazani najfrekventniji direktorijumi u opadajuem redosledu prema broju pogodaka.

Najei dolazni sajtovi ova grupa podataka identifikuje imena domena ili numerike IP adrese sa linkovima ka sajtu.

Najee dolazne URL adrese ova grupa podataka daje pune URL adrese sajtova koji sadre linkove ka sajtu. Podaci se ne odnose na posetioce koji su direktno ukucali URL sajta.

Najei pretraivai u tabeli su navedeni pretraivai koje su posetioci upotrebili da bi doli do sajta.

Najee kljune rei u pretrazi tabela identifikuje kljune rei koje dovode najvie posetilaca na sajt. Druga tabela identifikuje pretraivae po kljunim reima.

Najee korieni browseri ova grupa podataka identifikuje najpopularnije Web browsere koje koriste posetioci sajta.

Najee koriene platforme ova grupa podataka identifikuje operativne sisteme koje koriste posetioci sajta.

Domen korisnika i podaci o zemlji iz koje korisnik pristupa ovo su podaci koje treba razmatrati sa rezervom, jer postoji veliki broj domena koji ne nose oznaku zemlje iz koje dolaze, nego su pod optim domenima tipa com, edu, org i slino. Takoe, oznaka zemlje ne znai da se korisnik i fiziki nalazi u toj zemlji. Ovi podaci mogu biti korisni uz dodatnu obradu i analizu.

PRISTUPI U PROCESU MERENJA I ANALIZE POSEENOSTI WEB SAJTA


U procesu merenja i analize poseenosti sajta postoje sledea dva pristupa: Korisniki (panel) zasnovano merenje; Server zasnovano merenje.

Osnovna razlika izmeu ova dva pristupa je u merenju pojedinanih posetilaca razliitih korisnika koji su pristupili sajtu.

Dok se kod korisniki orijentisanog pristupa (npr. MediaMetrix) dobija taan i jasan podatak o broju jedinstvenih poseta, kod server orijentisanih pristupa (npr. Alexa) koriste se grube aproksimacije zasnovane na cookie-jima, IP adresama ili registracijama korisnika.

Za razliku od server orijentisanog pristupa, korisniki orijentisani pristup jasno razlikuje pojedinanog posetioca od viestrukog posetioca.

Ovaj pristup razlikuje i jedinstvenu posetu stranici. Znaajna prednost korisniki orijentisanog pristupa je i da se jednom impresijom smatra poseta jednoj stranici bez obzira koliko fajlova ona sadri.

Za razliku od server orijentisanog pristupa u korisniki orijentisanom pristupu terminologija je univerzalna i standardizovana. Mada je Internet elektronski medij koji prua mogunosti za pouzdano i tano merenje poseenosti, ipak, ne postoji metod koji bi sa potpunom sigurnou dao tane podatke o poseenosti.

Trenutno postoje dva metoda koje moemo porediti, ali tanost podataka je i dalje relativna i precizna samo u domenu statistine analize.

Zastupljeniji je server orijentisan metod koji je neosporno loiji za merenje poseenosti u odnosu na korisniki orijentisani metod. Iako je trenutno manje zastupljen, korisniki orijentisan metod, svojim prednostima i reenjima nedostataka server orijentisanog metoda, postaje sve popularniji i sve se vie koristi.

Situacija kod nas je takva da mali broj korisnika zahteva tane podatke o poseenosti, a to je dovelo do toga da se koriste veoma razliiti servisi za istraivanje poseenosti.

I kod naih provajdera popularniji je server orijentisani pristup, ali kao i u svetu izraen je trend rasta popularnosti korisniki orijentisanog pristupa.

MOGUNOST KORIENJA SPSS PAKETA PROGRAMA ZA STATISTIKU ANALIZU POSEENOSTI SAJTA


Za razliku od specijalizovanih paketa programa za statistiku analizu poseenosti sajtova poznati opti paketi programa za statistiku analizu, kao na primer SPSS, sadre alate koji vlasnicima sajtova daju vee mogunosti da sami obave odreene analize.

Ako elimo korienjem, na primer, paketa programa SPSS, detaljnije da analiziramo podatke o aktivnostima na sajtu, prvi problem na koji nailazimo je da u dosadanjim verzijama ovog inae odlinog programa za statistiku analizu ne postoji mogunost direktnog itanja HTML tabela.

Zbog toga je neophodno da podatke iz HTML tabele prebacimo u neki od formata koji ovaj program moe da koristi, na primer, u datoteku programa za tabelarna izraunavanja (Excel), naredbom Export to Microsoft Excel.

Konano, podatke iz ove datoteke moemo da koristimo za neku od analiza u SPSS programu:
Merne skale; Statistike procedure za sumarno prikazivanje podataka; Statistike procedure za poreenje sredina (Means, Independent T-test, Paired-Samples T-test ); Modele analize varijanse (One-Way Analysis of Variance, Simple-Factorial ANOVA); Regresione modele (Regression - Linear, Regression Curve Estimation), itd.

Вам также может понравиться