Академический Документы
Профессиональный Документы
Культура Документы
Miroslav Kapš
tel: 239-3949
e-mail: mkaps@agr.hr
1 OPISNA STATISTIKA................................................................................................................................................. 1
1.1 PODACI I VARIJABLE .................................................................................................................................................. 1
1.2 GRAFIČKE METODE ZA OPIS PODATAKA ..................................................................................................................... 2
1.2.1 Grafičke metode za opis kvalitativnih podataka ............................................................................................... 2
1.2.2 Grafičke metode za opis kvantitativnih podataka ............................................................................................. 3
1.3 NUMERIČKE METODE ZA OPIS KVANTITATIVNIH PODATAKA ...................................................................................... 3
1.3.1 Mjere centralne tendencije ............................................................................................................................... 4
1.3.2 Mjere varijabilnosti .......................................................................................................................................... 5
1.3.3 Mjere relativnog položaja................................................................................................................................. 5
2 VJEROJATNOST ......................................................................................................................................................... 7
2.1 PRAVILA O VJEROJATNOSTI JEDNOSTAVNIH DOGAĐAJA............................................................................................. 7
2.1.1 Prikaz događaja i pripadajućih vjerojatnosti Stablo dijagramom (engl. tree diagram) .................................. 8
2.2 SLOŽENI DOGAĐAJI ................................................................................................................................................... 8
3 SLUČAJNE VARIJABLE I NJIHOVE RASPODJELE ......................................................................................... 11
3.1 RASPODJELE VJEROJATNOSTI ZA DISKRETNE SLUČAJNE VARIJABLE ........................................................................ 12
3.1.1 Očekivanje i varijanca diskretne slučajne varijable....................................................................................... 13
3.1.2 Binomna raspodjela........................................................................................................................................ 13
3.1.3 Multinomna raspodjela................................................................................................................................... 16
3.2 RASPODJELE VJEROJATNOSTI ZA KONTINUIRANE SLUČAJNE VARIJABLE .................................................................. 16
3.2.1 Normalna raspodjela ...................................................................................................................................... 17
3.2.2 Još neke kontinuirane varijable i njihove raspodjele ..................................................................................... 24
4 POPULACIJA I UZORAK ........................................................................................................................................ 25
4.1 RASPODJELE VJEROJATNOSTI STATISTIKA ............................................................................................................... 26
4.1.1 Središnji granični teorem................................................................................................................................ 26
4.1.2 Neke statistike koje nemaju normalnu raspodjelu .......................................................................................... 26
4.2 STUPNJEVI SLOBODE................................................................................................................................................ 27
5 PROCJENA PARAMETARA.................................................................................................................................... 28
5.1 INTERVALNA PROCJENA .......................................................................................................................................... 28
5.2 PROCJENA PROSJEKA POPULACIJE............................................................................................................................ 28
5.3 PROCJENA VARIJANCE U NORMALNOJ POPULACIJI ................................................................................................... 30
6 PROVJERA HIPOTEZA ........................................................................................................................................... 31
6.1 PROVJERA HIPOTEZA O PROSJEKU POPULACIJE. ....................................................................................................... 31
6.1.1 P-vrijednost..................................................................................................................................................... 34
6.1.2 Jednostrana provjera...................................................................................................................................... 35
6.1.3 Provjera hipoteza o prosjeku populacije za mali uzorak (n<30) ................................................................... 35
6.2 PROVJERA HIPOTEZA O RAZLICI PROSJEKA DVIJU POPULACIJA ................................................................................. 36
6.2.1 Provjera za veliki uzorak ................................................................................................................................ 36
6.2.2 Provjera za mali uzorak kada su varijance homogene (približno iste) .......................................................... 38
6.3 PROVJERA HIPOTEZA O PROPORCIJI POPULACIJE ...................................................................................................... 39
6.4 PROVJERA HIPOTEZA RAZLIKA DVIJU PROPORCIJA POPULACIJA ............................................................................... 41
6.5 HI-KVADRAT PROVJERA .......................................................................................................................................... 42
6.6 PROVJERA HIPOTEZA O RAZLICI VARIJANCI DVIJE POPULACIJE ................................................................................ 43
6.7 KORIŠTENJE INTERVALNE PROCIJENE U PROVJERI STATISTIČKIH HIPOTEZA ............................................................. 43
6.8 STATISTIČKA I PRAKTIČNA ZNAČAJNOST ................................................................................................................. 43
6.9 GREŠKE KOD STATISTIČKOG ZAKLJUČIVANJA I SNAGA PROVJERE............................................................................ 44
7 JEDNOSTAVNA LINEARNA REGRESIJA ........................................................................................................... 45
7.1 UVOD ...................................................................................................................................................................... 45
7.2 PROCJENA PARAMETARA Β0 I Β1 ............................................................................................................................... 47
7.3 OSTATAK................................................................................................................................................................. 49
7.4 STUDENTOVA T-PROVJERA ...................................................................................................................................... 50
7.5 INTERVAL POUZDANOSTI ZA Β1 ................................................................................................................................ 51
7.6 RAŠČLANJENJE UKUPNE VARIJABILNOSTI ................................................................................................................ 52
ii
7.6.1 Veza između suma kvadrata............................................................................................................................ 53
7.7 PROVJERA HIPOTEZA - F- PROVJERA ........................................................................................................................ 53
7.8 KOEFICIJENT DETERMINACIJE (R2)........................................................................................................................... 54
8 KORELACIJA ............................................................................................................................................................ 56
9.1 PROCJENA KOEFICIJENTA KORELACIJE I PROVJERA HIPOTEZA .................................................................................. 57
10 JEDNOSTRUKA ANALIZA VARIJANCE ........................................................................................................... 59
10.1 MODEL JEDNOSTRUKE ANALIZE VARIJANCE S FIKSNIM UTJECAJIMA ...................................................................... 60
10.1.1 Raščlanjenje ukupne varijabilnosti na izvore varijabilnosti: ....................................................................... 61
10.1.2 Postavljanje hipoteza i F-provjera ............................................................................................................... 63
10.2 USPOREDBA SREDNJIH VRIJEDNOSTI POJEDINIH GRUPA ......................................................................................... 65
10.2.1 Tukey provjera (HSD)................................................................................................................................... 65
iii
1 Opisna statistika
Varijabla:
- Označava skup podataka
- Poprima različite vrijednosti
• vrijednosti varijable pokazuju varijabilnost
• težina, količina mlijeka, spol, boja očiju
VARIJABLE
KVALITATIVNE KVANTITATIVNE
(ATRIBUTIVNE, KATEGORIČKE). (NUMERIČKE)
VARIJABLE
A) kvantitativne (numeričke)
- čije se vrijednosti prikazuju brojevima, a razlike između brojeva imaju numeričko značenje
- težina životinja, broj mladih u leglu, temperatura, vrijeme
a) diskretne (prekidne)
- poprimaju prebrojive vrijednosti
- vrijednosti se mjere cijelim ili prirodnim brojevima
- broj mladih u leglu, broj jaja
b) kontinuirane (neprekidne)
- poprimaju beskonačno mnogo vrijednosti
- vrijednosti se mjere realnim brojevima
- količina mlijeka, težina
1
B) kvalitativne (atributivne, kategoričke)
- podaci su im opisni
- boja očiju (npr. zelena, plava), te da li je životinja bolesna ili nije
a) nominalne
- ne može se reći da je jedna kategorija veća ili manja od druge
- boja očiju ili kože
b) ordinalne
- kod kojih se kategorije mogu poredati po veličini
- ocjene lakoće telenja
Grafički prikaz:
- stupići (horizontalni ili vertikalni)
- ‘torta’ (engl. pie-chart).
Smeđa 3855
Pasmina
Holstein 15195
Simental 62672
Simental
76%
Smeđa
5% Holstein
19%
2
1.2.2 Grafičke metode za opis kvantitativnih podataka
Histogram:
-raspodjela frekvencija nekog skupa podataka
- podaci se svrstavaju u razrede
- prikazuje broj opažanja u pojedinom razredu
- prava ili relativna frekvencija
Konstrukcija histograma:
1. Izračunaj raspon:
Raspon = Najveće opažanje - najmanje opažanje
2. Podjeli raspon u pet do 20 razreda. Na taj način se dobije širina pojedinog razreda. Širina razreda se
zaokruži na neki odgovarajući broj.
3. Za svaki razred prebroje se opažanja koja ulaze u taj razred. Taj broj se zove (prava) frekvencija pojedinog
razreda.
4. Izračunaj za svaki razred relativnu frekvenciju:
Relativna frekvencija = prava frekvencija / ukupan broj opažanja
5. Histogram je zapravo grafikon gdje su na jednoj osi granice razreda, a na drugoj frekvencije prikazane kao
stupići.
16
16
14 12 12
12
Broj teladi
10 8 8 8
8 7 7
6
6 5 5
4 2 2
2 1 1
0
190 200 210 220 230 240 250 260 270 280 290 300 310 320 330
Sredine razreda
Prije detaljnijeg opisa numeričkih metoda definirajmo simbole koje ćemo često koristiti:
Σ = veliko grčko slovo sigma = oznaka za sumu
i
i = 1 do n
3
Suma n brojeva:
Σ i yi = y1 + y2 +.....+ yn
Primjer:
y y1 y2 y3
2 4 6
x x1 x2 x3
3 6 7
Σ i yi = y1 + y2 + y3 = 2 + 4 +6 = 12
Σy i
2
i = y21 + y22 + y23 = 22 + 42 +62 = 56
Σ xy = x y
i i i 1 1 + x2y2 + x3y3 = (3)(2) + (6)(4) +(7)(6) = 72
y=
∑y i i
n
Mode uzorka od n opažanja y1,y2,...,yn je vrijednost opažanja koje se javlja u najvećoj frekvenciji.
4
1.3.2 Mjere varijabilnosti
Raspon = razlika najvećeg i najmanjeg opažanja.
s 2
=
∑( y i i − y )2
n −1
s 2
=
∑( y − µ)
i i
2
∑( y
i i − y) = ∑ y 2 2
i i
− i i
n
Koeficijent varijabilnosti:
s
Cv = 100%
y
- relativna mjera varijabilnosti.
5
Primjer: Izračunajte aritmetičku srednju vrijednost, varijancu, standardnu devijaciju, koeficijent
varijabilnosti, medijan i mode za slijedeći uzorak težine teladi:
260 260 230 280 290 280 260 270 260 300 280 290 260 250 270 320 320 250 320
220
y= i
∑ yi
n
∑i i 260 + 260 + ... + 220 = 5470
y =
5470
y= = 273.5
20
Varijanca uzorka:
(∑ y )
2
( y − y)2 ∑
i i
y2 −
s 2
=
∑i i
=
i i n
n −1 n −1
∑ y2
i i
= (260 + 260 + ... + 220 2 ) = 1510700
2 2
1510700 −
(5470)2
s2 = 20 = 771.32
19
Standardna devijacija uzorka:
s = s 2 = 771.3158 = 27.77
Koeficijent varijabilnosti:
s 27.77
Cv = 100% = 100% = 10.15%
y 273.5
220 230 250 250 260 260 260 260 260 270 270 280 280 280 290 290 300 320 320
320
Mode je 260 jer je to vrijednost sa najvećom frekvencijom (5 puta). Budući da je n = 20, paran broj, medijan
je prosjek (n+2)/2 = 11-tog i n/2 = 10-tog opažanja kada su opažanja poredana po veličini. Ovdje su vrijednosti
tih opažanja 270 i 270 i njihov prosjek je 270. Dakle medijan je 270.
6
2 Vjerojatnost
Vjerojatnost:
- A-priori – ono što znamo od prije (logičkim razmišljanjem, iskustvom)
- A-posteriori – ono što saznamo iz pokusa (opažanja)
Oznake
Jednostavni (elementarni) događaj Ei
Vjerojatnost jednostavnog događaja P(Ei)
Događaj A, vjerojatnost P(A)
7
Primjer:
Primjer: Imamo tri boksa s životinjama 1,2,3 u prvom boksu, životinjama A, B i C u drugom boksu i
životinjama x i y u trećem boksu.
Boks I: 1,2,3
Boks II: A,B,C
Boks III: x,y
Pokus se sastoji od slučajnog izbora po jedne životinje i svakog boksa. Broj svih mogućih trojki je:
3x3x2=18
A
x B
C
1
A
y B
C
A
x B
C
2
A
y B
C
A
x B
C
3
A
y B
C
Ako se svakom pojedinačnom događaju pridruži njegova vjerojatnost tada se takav dijagram zove stablo
vjerojatnosti (engl. probability tree diagram).
Presjek događaja = A ∩ B
- da se dogode i jedan i drugi događaj
Unija događaja = A ∪ B
- da se dogode jedan ili drugi
Vjerojatnost presjeka = P(A ∩ B)
Vjerojatnost unije = P(A ∪ B).
komplement događaja A = Ac
- događaj da se ne dogodi A
8
Skup A Skup B
2 4 5 4
6 6
A∩B
2 4
5
6
A∪B
Uvjetovana vjerojatnost :
- vjerojatnost da će se neki događaj dogoditi ako su zadovoljeni neki uvjeti
- vjerojatnost da će se dogoditi događaj B ako se zna da se je već dogodio događaj A.
P( A ∩ B )
P (B | A) =
P( A)
Nezavisni događaj
Pretpostavimo dva događaja A i B. Ako su događaji nezavisni tada je:
P(B | A) = P(B) i P(A | B) = P(A)
Vjerojatnost od B ne ovisi o vjerojatnosti od A, i obratno.
Vjerojatnost da se oba događaja dogode:
P(A ∩ B) = P(A) P(B)
Primjer nezavisnih događaja: Dva puta bacimo kocku. Koja je vjerojatnost da dobijemo dvije šestice?
Označimo prvo bacanje kao događaj A i drugo bacanje kao događaj B. Tražimo vjerojatnost P(A ∩ B).
Vjerojatnost svakog događaja za sebe je: P(A) = 1/6 i P(B) = 1/6. Budući da su događaji nezavisni:
Zavisni događaji
Ako su događaji zavisni, na primjer događaj B zavisi o događaju A, tada je:
P( A ∩ B )
P (B | A) =
P( A)
9
Primjer zavisnih događaja: Iz skupa od 52 karte biramo dvije karte. Kolika je vjerojatnost da obje karte budu
asovi?
Označimo prvo uzimanje karte kao događaj A, a drugo uzimanje karte kao događaj B. Podsjetimo se da u
skupu karata ima četiri asa. Tražimo vjerojatnost P(A ∩ B). Događaji su očito zavisni, odnosno biranje druge
karte zavisi koja je karta izvučena prva.
10
3 Slučajne varijable i njihove raspodjele
Slučajna varijabla: matematički pojam, govori kako se opažanju pridružuje numerička vrijednost
• Vrijednost koju varijabla poprima smatra se slučajnim procesom (događajem)
– Na primjer: izmjerimo tele i vidimo da je teško 180 kg. Međutim ne znamo zašto baš ima
180 kg.
– Barem dio te vrijednosti zato smatramo slučajnim
• Slučajna varijabla poprima određenu numeričku vrijednost s određenom vjerojatnosti
Slučajne varijable
Vrijednost varijable y
- numerički događaj
- ima određenu vjerojatnost da se dogodi
Raspodjela vjerojatnosti slučajne varijable y:
- tablica, grafikon ili formula koja pokazuje vjerojatnost da y poprimi određenu vrijednost
11
3.1 Raspodjele vjerojatnosti za diskretne slučajne varijable
- tabelarni ili grafički prikaz ili formula koja daje vjerojatnost p(y) za svaku moguću vrijednost varijable y.
Uvjeti:
1). 0 ≤ p(y) ≤ 1 Vjerojatnost može biti između 0 i 1 (ili 0 i 100%)
2). Σ (svi y) p(y) =1 Zbroj vjerojatnosti svih jednostavnih događaja je jednak 1 (ili 100%)
Primjer: Pogledajmo na jednostavnom primjeru raspodjelu vjerojatnosti i način provjeravanja uvjeta. Pokus
se sastoji od bacanja dva novčića. Neka G i P označavaju glavu i pismo. Slučajna varijabla y definirana je
kao broj glava u jednom bacanju dva novčića. Mogući rezultati su 0, 1, i 2. Koja je raspodjela vjerojatnosti
za varijablu y?
Napišimo radi preglednosti pokus u tablici. Označimo jednostavne događaje sa E1, E2, E3 i E4. Naime imamo
četiri moguća jednostavna događaja GG, GP, PG, i PP.
Iz tablice slijedi:
Vjerojatnost da je y = 0 je p(y = 0) = p(E1) = 1/4 .
Vjerojatnost da je y = 1 je p(y = 1) = p(E2) + p(E3) = 1/4 + 1/4 = 1/2 .
Vjerojatnost da je y = 2 je p(y = 2) = p(E4) = 1/4.
y p(y)
1
0 /4
1
1 /2
1
2 /4
Provjerimo uvjete:
1) Vjerojatnost svake vrijednosti varijable je između 0 i 1,
2) Suma vjerojatnosti svake vrijednosti varijable y je jednaka 1,
tj. p(y = 0) + p(y = 1) + p(y = 2) = 1.
y p(y) F(y)
1
0 1/4 /4
3
1 1/2 /4
4
2 1/4 /4
Kumulativna vjerojatnost F(1) = 3/4, praktično znači koja je vjerojatnost da y bude 0 ili 1, tj. koja je
vjerojatnost da u bacanju dva novčića bude barem jedno pismo.
12
3.1.1 Očekivanje i varijanca diskretne slučajne varijable
Očekivanje (prosjek):
µ =E(y)= Σ p(y ) y .
i i i i = 1 do n
-Suma produkata svih vrijednosti varijable i pripadajućih vjerojatnosti
Varijanca:
Var(y) = σ2 = E(y-E(y))2 = Σ
i p(yi) (yi-E(y))
2
i = 1 do n
-Suma produkata svih kvadriranih odstupanja vrijednosti varijable od prosjeka i pripadajućih
vjerojatnosti
y p(y)
1
0 /4
1
1 /2
1
2 /4
Očekivanje:
µ =E(y)= Σi p(yi) yi = (1/4) (0)+ (1/2) (1) + (1/4) (2) = 1
Očekujemo da u bacanju dva novčića dobijemo jedno pismo i jednu glavu.
Varijanca:
var(y) = σ2 = Σi p(yi) [yi-E(y)]2 = (1/4) (0-1)2 + (1/2) (1-1)2 + (1/4) (2-1)2 = (1/2)
Binarna varijabla
- samo dva moguća rezultata neke pojave u pojedinačnom opažanju (pokušaju)
- DA – NE, 0 - 1, bolestan – zdrav i sl.
Binomna varijabla
-Broj povoljnih pokušaja (y) u ukupno n pokušaja
-broj ženske teladi u 4 telenja
-broj bijelih praščića u leglu
Značajke:
1. Postoji n jednakovrijednih pokušaja, nezavisnih jedan o drugome
2. Postoji samo dva moguća rezultata pojedinačnog pokušaja ( Da ili Ne; 0 ili 1, itd)
3. Vjerojatnost da dobijemo Da je ista iz pokušaja u pokušaj. Označit ćemo ga sa p. Vjerojatnost od Ne
označit ćemo sa q. Vrijednost q = 1 - p
4. Slučajna varijabla y je broj povoljnih rezultata (Da) u ukupno n pokušaja
13
Raspodjela vjerojatnosti prikazana funkcijom:
- određena parametrom p i brojem pokušaja n:
n
p( y ) = p y q n − y
y
(y = 0,1,2,,...., n)
n
Izraz se čita n povrh y i jednak je:
y
n n!
=
y y! ( n − y )!
Također je
n! = 1 ⋅ 2 ⋅ ... ⋅ ( n − 1) ⋅ n , odnosno y! = 1 ⋅ 2 ⋅ ... ⋅ ( y − 1) ⋅ y i (n − y )! = 1 ⋅ 2 ⋅ ... ⋅ ( n − y − 1) ⋅ ( n − y )
Definirano je za nulu: 0! =1
Očekivanje i varijanca:
µ = E(y) = np σ2 = var(y) = npq
A) B)
0.3 0.4
fre 0.25 fre
kve 0.2 kve 0.3
nci nci
0.15 0.2
ja ja
0.1
0.1
0.05
0 0
0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 8
broj povoljnih pokušaja broj povoljnih pokušaja
Primjer: Treba pronaći raspodjelu vjerojatnosti broja ženskih teladi u tri teljenja. Pretpostavimo da će se
oteliti samo jedno tele kod svakog teljenja i da je vjerojatnost u jednom teljenju da bude žensko p = 0.5.
Slučajna varijabla y je definirana kao broj ženskih teladi u tri teljenja. Mogući rezultati su 0, 1, 2 i 3. Očito
da je raspodjela vjerojatnosti binomna s definiranim p = 0.5 i n = 3:
3
p ( y ) = (0.5) y (0.5)3− y
y
(y = 0,1,2,3)
14
Prikažimo u tablici moguće vrijednosti y i pripadajuće vjerojatnosti:
y p(y)
3 1
0 (0.5) 0 (0.5)3 = = 0.125
0 8
3 3
1 (0.5)1 (0.5) 2 = = 0.375
1 8
3 3
2 (0.5) 2 (0.5)1 = = 0.375
2 8
3 1
3 (0.5)3 (0.5) 0 = = 0.125
3 8
Najmanje 2 znači ili 2 ili 3. Znači treba izračunati vjerojatnosti za y = 2 i y = 3 i te vjerojatnosti zbrojiti.
3 3
2 (0.5) 2 (0.5)1 = = 0.375
2 8
3 1
3 (0.5)3 (0.5) 0 = = 0.125
3 8
p(y)
0.375 0.375
0.400
0.300
0.200 0.125 0.125
0.100 0
0.000 1
0 1 2 3 2
y 3
15
3.1.3 Multinomna raspodjela
- Uopćavanje binomne raspodjele.
- Postoji k različitih rezultata pojedinog pokušaja svaki sa svojom vjerojatnosti: p1, p2,...., pk. Pojedinačni
pokušaji su nezavisni.
- Slučajne varijable su broj pojedinih rezultata u n pokušaja, tj., y1 za rezultat 1, y2 za rezultat 2, ...., yk za
rezultat k.
Primjer: Teškoća sa kojom se krava oteli je definirana u tri kategorije: 1 2 3. Koja je vjerojatnost da od 10
krava 8 bude u prvoj kategoriji a po jedna u ostale dvije kategorije, ako se zna da je vjerojatnost jednog
teljenja da bude u kategorijama 1, 2 ili 3 jednaka 0.6, 0.3 i 0.1? Koliki je očekivani broj u pojedinim
kategorijama?
n! y y y
p ( y1 , y2 , y3 ) = p1 1 p 2 2 p3 3
y1! y2! y3!
10 !
p ( y1 = 8, y 2 = 1, y3 = 1) = (0.6) 8 (0.3)1 (0.1)1 = 0.045
8!1!1!
Vjerojatnost da od 10 krava točno 8 bude u kategoriji 1, a po jedan u ostale dvije kategorije je 0.045.
µi = npi
16
VAŽNO:
- promatrati vjerojatnost da varijabla y poprima vrijednosti u nekom intervalu
- vjerojatnost se pridružuje numeričkom događaju koji se odnosi na neki interval
f(y)
µ
Slika 3-2: Normalna (Gaussova) krivulja
Položaj i oblik normalne krivulje je određen sa dva parametra, prosjekom µ i variajncom σ2.
• Prosjek µ je parametar položaja
• Varijanca σ2 je parametar disperzije (raširenosti, varijabilnosti)
17
- Visina i raspršenost krivulje ovisi o varijanci σ2
- Povećanje varijance - krivulja je više raširena.
0.4
σ=1
σ = 1.5
Frr 0.3
ekv
en
cija 0.2
0.1
0
-4 -3 -2 -1 0 1 2 3 4
Vjerojatnost da varijabla y poprima vrijednosti u intervalu (y1, y2) jednaka je površina ispod normalne
krivulje ograničena tim vrijednostima y1 i y2. (Uzima se da je ukupna površina 1 ili 100%)
Ta površina je jednaka proporciji onih opažanja s vrijednosti između y1 i y2 u odnosu na sva opažanja.
Primjer: Koja je vjerojatnost da slučajno izabrana jedinka ima vrijednosti između 170 i 210:
Drugim riječima: Koja je proporcija jedinki s vrijednostima između 170 i 210
Vjerojatnost da y bude između 170 i 210 kg: P(y1 ≤ y ≤ y2) = P(170 ≤ y ≤ 210)
y1 = 170 y2 = 210
µ = 200
Slika 3-4: Površina ispod normalne krivulje ograničena vrijednostima 170 i 210
18
Vjerojatnost da slučajno izabrani y ima vrijednost manju od y0 (Proporcija jedinki koje imaju vrijednost
veću od y0)
Primjer:
Vjerojatnost da y < 230
Iscrtana površina = vrijednost kumulativne
raspodjele za y0 = 230:
F(y0) = P(y ≤ y0) = P(y ≤ 230)
µ = 200 y0 = 230
Primjer:
F(µ) = P(y ≤ µ) = 0.5
(jer je krivulja simetrična)
Standardna normalna je dakle takva normalna krivulja kojoj je prosjek 0 i standardna devijacija je 1
19
z
-1 0 1
Površina ispod standardne normalne krivulje ograničena sa dvije vrijednosti standardne normalne varijable z1
i z2, predstavlja vjerojatnost da varijabla poprima vrijednosti između ta dva broja. (isto kao i za svaku
normalnu krivulju)
Praktična vrijednost standardizacije je u tome što za pronalaženje površine ispod krivulje ograničenu nekim
intervalom koristimo samo jednu krivulju. Podsjetimo se da površina ispod krivulje u nekom intervalu (y1,y2)
odgovara vjerojatnosti da slučajna varijabla y poprima vrijednosti u tom intervalu. Matematički površina
ispod krivulje je jednaka određenom integralu funkcije gustoće. Kako ne postoji eksplicitna formula za taj
integral, služimo se tablicama (bilo iz knjige ili kompjuterskog programa). Pošto je moguće sve normalne
krivulje svesti na standardnu, potrebno je imati samo jednu tablicu. Naime vjerojatnost da y poprima
vrijednosti između y1 i y2 je:
P(y1 ≤ y ≤ y2) = P(z1 ≤ z ≤ z2)
gdje su
y1 − µ y2 − µ
z1 = i z2 =
σ σ
Zadano je:
µ = 200 kg
σ = 20 kg
y0 = 230 kg
20
y
µ = 200 y0 = 230
Prvo treba odrediti kolika je vrijednost standardne normalne varijable, recimo z0, koja odgovara vrijednosti
y0 = 230 kg.
230 − 200
z0 = = 1.5
20
0 z
Z0 = 1.5
Pošto je ukupna površina jednaka jedan tada je vjerojatnost da je y manje od 230 kg jednaka:
Dakle:
y1 = 170 kg
y2 = 210 kg
y1 = 170 y2 = 210
µ = 200
21
170 − 200
z1 = =-1.5
20
210 − 200
z2 = 0.5
20
Dakle, treba naći vjerojatnost da varijabla poprima vrijednosti između -1.5 i 0.5 standardnih devijacija.
z1 = -1.5 z2 = 0.5
z
0
Primjer: Iz normalne raspodjele sa parametrima µ = 200 i σ = 20, treba odabrati 20% najboljih jedinki. Koja
će biti teoretska donja granica sa kojom bi životinja ušla u najboljih 20%.
Definiranjem 20% najboljih jedinki određena je proporcija odnosno površina ispod standardne normalne
krivulje od nekog broja z0 do beskonačnosti:
P(z0 ≤ y ≤ +∞ ) = 0.20
Prvo treba pronaći koliki je z0. U tablici vidimo da z0 koji odgovara površini 0.20 je jednak 0.84. Dakle, z0 =
0.84. Sada treba taj z0 pretvoriti u y0 tj. u prave jedinice koristeći izraz.
y −µ
z0 = 0
σ
odnosno
y0 = µ + z0 σ
22
P
f(z0)
0 z0 zS z
Slika 3-7 Prosjek odabranih z vrijednosti. f(z0) = ordinata krivulje za z = z0, P je površina, odnosno vjerojatnost
P(z>z0) i zS je prosjek vrijednosti većih od z0.
Primjer: Pretpostavimo normalnu raspodjelu sa parametrima µ = 200 kg i σ = 20 kg. Koliki je teoretski prosjek
jedinki koje imaju vrijednost više nego y0 = 230 kg.
2π
f(z0) = 0.129518
23
3.2.2 Još neke kontinuirane varijable i njihove raspodjele
f (χ 2)
0.50
0.45
0.40 v =2
0.35
0.30
0.25
v =6
0.20
0.15 v =10
0.10
0.05
0.00 χ2
0 5 10 15 20
stupanj slobode v = 16
stupanj slobode v = 2
Studentova t raspodjela je po obliku slična normalnoj samo što sa smanjenjem stupnja slobode krivulja postaje
spljoštenija u sredini, a više razvučenija (deblja) prema repovima (Slika 3.13).
Kada stupanj slobode ide prema beskonačnosti t raspodjela prelazi u normalnu.
f(F)
1.0 v1=2; v2=6
0.9
0.8 v1=10; v2=20
0.7
0.6 v1=6; v2=10
0.5
0.4
0.3
0.2
0.1
0.0 F
0 1 2 3 4 5
Slika 3.10 F raspodjele sa stupnjevima slobode: a) v1=2 i v2 = 6; b) v1=6 i v2 = 10; c) v1=10 i v2 =20
24
4 Populacija i uzorak
Populacija:
- skup podataka koji ima neke zajednička svojstva
- definiranjem zajedničkih svojstva => definiramo populaciju
- populacija simentalskog goveda u Hrvatskoj
- populacija junadi u dobi od 1 godine hranjene smjesom A
• Definicija varijable uvjetuje ono što mjerimo (opažamo, brojimo) na populaciji
– Težina, količina mlijeka
Populacija:
- konačna ili beskonačna
– konačna: populacija studenata druge godine na stočarskom smjeru 2000 godine
– beskonačna: populacija nerastova u Hrvatskoj
Matematički model:
- opisan i definiran parametrima
Parametri:
- stalne vrijednosti koje govore o vezi slučajnih varijabli i njihovih frekvencija
- procjenjuju iz uzorka
- obično se označavaju grčkim slovima, na primjer: µ = prosjek (očekivanje), a σ2 = varijanca
populacije
Parametri su često nepoznati i procjenjuju se iz uzorka.
Vjerodostojnost procjene i zaključaka o populaciji je veća ako je uzorak dobar predstavnik populacije. To
znači da uzorak mora biti slučajno izabran iz populacije.
25
4.1 Raspodjele vjerojatnosti statistika
µ y
26
4.2 Stupnjevi slobode
- broj nezavisnih opažanja povezanih sa procjenom varijance, odnosno sa izračunavanjem prosjeka kvadrata
(varijance uzorka)
- ukupan broj opažanja manje broj parametara korištenih u izračunavanju tog prosjeka kvadrata.
27
5 Procjena parametara
Npr. prema centralnom graničnom teoremu za velike uzorke ( n > 30) raspodjela aritmetičkih prosjeka
uzoraka će biti približno normalna, sa srednjom vrijednosti µ i standardnom devijacijom σ / n
Na primjer, ako 95% interval pouzdanosti visine krava temeljen na aritmetičkom prosjeku i varijanci iz
uzorka iznosi 130 do 140 cm, može se reći da postoji 95% pouzdanost da je prosjek visine krava u populaciji
između 130 i 140 cm.
28
y−µ
– Nadalje, standardizirana vrijednost, tj. statistika z = ima standardnu normalnu
σy
raspodjelu
y ± z α/2 σ y
Primjer: Pretpostavimo uzorak od 50 krava sa srednjom vrijednosti količine mlijeka u laktaciji 4000 kg i
standardnom devijacijom 800 kg. Želimo procijeniti prosjek populacije na temelju ovog uzorka. Uzmimo
95% interval pouzdanosti.
Zadano je iz uzorka:
y = 4000 kg
s = 800 kg
n = 50 krava
Za 95% interval pouzdanosti, α = 0.05, jer je (1 - α) 100% = 95%, a to znači daje (1-α) = 0.95, a α = 0.05.
Vrijednost zα/2 = z0.025 iz tablice je 1.96.
s 800
sy = = = 113.14
n 50
29
Interval pouzdanosti za mali uzorak (n < 30)
- koristimo t raspodjelu pa je interval pouzdanosti.
y ± tα/2 s y
Primjer: Pretpostavimo uzorak od 20 krava sa srednjom vrijednosti količine mlijeka u laktaciji 4000 kg i
standardnom devijacijom 800 kg. Želimo procijeniti prosjek populacije na temelju ovog uzorka. Izračunajte
95% interval pouzdanosti.
Zadano je iz uzorka:
y = 4000 kg
s = 800 kg
n = 20 krava
Za 95% interval pouzdanosti, α = 0.05, jer je (1 - α) 100% = 95%, a to znači daje (1-α) = 0.95, a α = 0.05.
Stupanj slobode je n-1 = 19. Vrijednost tα/2 = t0.025 iz tablice je 2.093.
s 800
sy = = = 178.8854
n 20
s 2
=
∑( y
i i − y )2
n −1
30
6 Provjera hipoteza
Istraživačka hipoteza
Statistička hipoteza
Provjera hipoteza:
- provjeravamo hipoteze na temelju opažanja iz uzorka
Provjera rezultira u jednoj od dvije odluke:
1. odluka da se H0 odbaci
2. odluka da se H0 ne odbaci, jer uzorak nije dao dovoljno dokaza da bi se H0 odbacila.
1) Definiramo H0 i H1
2) Odredimo α (razinu značajnosti)
3) Izračunamo procjenu parametra
4) Odredimo statistiku za provjeru i njezinu raspodjelu kada vrijedi H0 i izračunamo njenu vrijednost iz
uzorka
5) Odredimo kritičnu vrijednost, kritično područje
6) Usporedimo izračunatu vrijednost statistike za provjeru sa kritičnim vrijednostima i donosimo zaključak.
31
1) hipoteze
H0: µ = µ0
H1: µ ≠ µ0
2) odredimo α = razina značajnosti
3) procjenitelj: y
4) Statistika za provjeru i raspodjela:
y − µ0
z=
σy
Općenito je z statistika:
procijenitelj − parametar
z=
standardana greška procijenitelja
y
µ0
-zα/2 0 zα/2
y − µ0
Slika 6-1: Raspodjela procjenitelja prosjeka y . Donja crta prikazuje standardiziranu skalu z = .
σy
sy = s / n
pa je:
y − µ0
z=
sy
5) Za α, odredimo kritičnu vrijednost, kritično područje ili P-vrijednost
razina
značajnosti = α
α/2 α/2
-zα/2 0 zα/2
kritično kritična kritično
područje vrijednost područje
Slika 6-2: Prikaz razine značajnosti, kritične vrijednosti i kritičnog područja poznate raspodjele
32
6) Zaključak
- usporedimo izračunatu statistiku za provjeru sa kritičnom vrijednosti
- da li je izračunata z statistika ekstremnija od kritične vrijednosti zα/2 uz α razinu značajnosti
- ako je izračunata statistika ekstremnija od kritične vrijednosti, tj. |z| > zα/2, odbacujemo H0)
- vjerojatnost da izračunati z pripada raspodjeli ako vrijedi H0 je jednaka α
- razina značajnosti je vjerojatnost da da sm o pogrešno odbacili H0
-zα/2 0 zα/2 z
Slika 6-3: Izračunata z statistika unutar kritičnog područja, tj. više je ekstremnija nego kritična vrijednost zα/2,
prihvaća se H1 hipoteza uz α razinu značajnosti. Vjerojatnost da izračunata statistika z pripada hipotetičkoj
nultoj populaciji je manja od vrijednosti α.
-zα/2 0 z zα/2
Slika 6-4: Izračunata z statistika je izvan kritičnog područja, tj. manje je ekstremnija nego kritična vrijednost zα/2,
dakle prihvaća se H0 hipoteza uz α razinu značajnosti. Vjerojatnost da izračunata statistika z pripada
hipotetičkoj nultoj populaciji je veća od vrijednosti α.
Primjer: Pretpostavimo uzorak od 50 krava sa srednjom vrijednosti količine mlijeka u laktaciji 4000 kg.
Želimo provjeriti da li je ovo stado različito od populaciji krava s poznatim prosjekom, µ0 = 3600 kg i
standardnom devijacijom σ = 1000 kg.
Zadano je iz uzorka:
y = 4000
σ = 1000
n = 50 krava
H0: µ = 3600
H1: µ ≠ 3600
33
Razina značajnosti:
α = 0.05
y − µ0
z=
σy
Standardna greška:
σ
σy =
n
σ 1000
σy = = = 141.4214
n 50
4000 − 3600
z= = 2.828
141.4214
Izračunati z (vrijednost statistike za provjeru) je 2.828. Drugim riječima, prosjek uzorka (4000 kg) je 2.828
standardne devijacije udaljen od hipotetskog prosjeka populacije (3600 kg) ako vrijedi H0.
Pitanje je da li je izračunati z = 2.828 dovoljno ekstreman da možemo posumnjati da naš uzorak ne pripada
populaciji s prosjekom 3600.
Definirat ćemo razinu značajnosti α = 0.05. Za nju iz tablice možemo vidjeti da odgovara kritičnoj
vrijednosti zα/2 = 1.96. Izračunati |z| > zα/2 , tj. |2.828| > 1.96. To znači da je izračunati z u kritičnom području,
odnosno nalazi se u intervalu 〈1.96, ∞〉 (slika 7-5). Prema tome, H0 se odbacuje uz 0.05 razinu značajnosti.
Vjerojatnost je manja od 0.05 da naš uzorak ipak pripada populaciji s prosjekom 3600 i standardnom
devijacijom 1000.
y
3600 4000
-1.96 0 1.96 2.83 z
Slika–5: Raspodjela prosjeka uzoraka količine mlijeka sa prosjekom m = 3600 i standardnom devijacijom
σ = 1000. Donja crta predstavlja skalu standardiziranih vrijednosti.
6.1.1 P-vrijednost
Drugi način da se odluči o prihvaćanju ili odbijanju nul hipoteze H0, je da se utvrdi vjerojatnost da izračunata
vrijednost statistike za provjeru pripada distribuciji kada H0 vrijedi. Ta vjerojatnost obično se označava kao
P vrijednost i predstavlja opaženu razinu značajnosti. Mnogi kompjuterski statistički programi daju P
vrijednost i ostavljaju istraživaču da sam odluči o prihvaćanju ili odbijanju H0. Može se reći da se H0
odbacuje uz vjerojatnost pogreške koja je jednaka P vrijednosti. P vrijednost se može koristiti i kada je
34
razina značajnosti unaprijed određena. Za zadanu razinu značajnosti α, ako je P vrijednost manja od α, H0 se
odbacuje uz α razinu značajnosti.
α
α
zα -zα
Statistika za provjeru:
y − µ0
t=
sy
gdje je
s
sy = = standardna greška
n
Općenito je t-statistika:
procijenitelj − parametar
t=
standardana greška procijenitelja
Zaključak slično kao i prije: za dvostranu provjeru odbacujemo H0: µ =µ0 ako je izračunati t ekstremniji od
kritične vrijednosti, tj. ako |t| > tα/2,
Primjer: Da li je aritmetička srednja vrijednost količine mlijeka uzorka y = 3800 kg značajno različita od
4000 kg. Veličina uzorka je 10 krava, a standardna devijacija uzorka je 500 kg. Drugim riječima, da li uzorak
ne pripada populaciji s prosjekom 4000 kg.
s = 500
y = 3800
n = 10
µ0 = 4000 = hipotetski prosjek
35
Hipoteze:
H0: µ = 4000
H1: µ ≠ 4000
Razina značajnosti:
α = 0.05
Statistika za provjeru:
y − µ0
t=
sy
y − µ0 3800 − 4000
= = −1.26
sy 158.1139
Budući da izračunati t = -1.26 nije ekstremniji od kritične vrijednosti tα/2 = 2.262, H0 se ne odbacuje uz 0.05
razinu značajnosti. Aritmetički prosjek našeg uzorka nije značajno različit od 4000 kg.
Definicija statistike za provjeru i daljnja provjera ovisi da li se radi o velikim ili malim uzorcima i da li su
pretpostavljene varijance populacija iste ili različite. Pokazat ćemo to u slijedeća dva podpoglavlja.
Često su varijance σ21 i σ22 nepoznate. Tada se koriste procjene iz uzoraka, s21 i s22, pa je standardan greška:
s12 s22
s( y 1 − y 2 ) = +
n1 n2
s1 i s2 = procijene varijance iz uzoraka.
Primjer: Dvije grupe od 40 krava hranili smo sa dva različita obroka (A i B) da bi utvrdili koji od ta dva
obroka daje veću količinu mlijeka u laktaciji. Na kraju pokusa izračunati su prosjeci i varijance uzoraka (u
000 kg):
Grupa A Grupa B
Prosjek( y ) 5.20 kg 6.50
Varijanca (s2) 0.25 0.36
Broj krava (n) 40 40
Hipoteze:
H0: µ1 - µ2 =0
H1: µ1 - µ2 ≠ 0
Razina značajnosti:
α = 0.05
Procjenitelj:
y1 − y2
Statistika za provjeru:
y − y2
z= 1
s( y1 − y2 )
s12 s22
s( y1 − y2 ) = +
n1 n2
37
s12 s22 0.25 0.36
s( y1 − y2 ) = + = + = 0.123
n1 n2 40 40
y1 − y 2 5.20 − 6.50
z≈ = = −10.569
s ( y1 − y2 ) 0.123
Budući da je izračunati z=-10.569 ekstremniji od -zα/2 = -z0.025 = -1.96, nul hipotezu odbacujemo uz 0.05
razinu značajnosti i zaključujemo da smjesa B daje veću količinu mlijeka
Gdje je:
(n − 1) s12 + (n 2 − 1) s 22
s 2p = 1
n1 + n2 − 2
Dakle, odbacujemo H0 ako je izračunati |t| > tα/2, (izračunati t ekstremniji od kritične vrijednosti)
38
Primjer: Dvije grupe od 18 i 20 krava hranili smo sa dva različita obroka (A i B) da bi utvrdili koji od ta dva
obroka daje veću količinu mlijeka u laktaciji. Na kraju pokusa izračunati su prosjeci, sume kvadrata i
varijance uzoraka (u 000 kg):
Grupa A Grupa B
Prosjek( y ) 6.80 5.50
Varijanca (s2) 0.379 0.206
Broj krava (n) 20 18
Hipoteze:
H0: µ1 - µ2 =0
H1: µ1 - µ2 ≠ 0
Procjenitelj:
y1 − y2
Statistika za provjeru:
( y1 − y2 ) − 0
t=
s y1 − y1
1 1
s y1 − y2 = s 2p +
n1 n2
1 1
s y1 − y2 = 0.297 + = 0.177
20 18
( y1 − y2 ) − 0 (6.80 − 5.50) − 0
t= = = 7.342
s y1 − y1 0.177
Budući da je izračunati t = 7.342 ekstremniji od tα/2 = t0.025 = 2.03, nul hipotezu odbacujemo uz 0.05 razinu
značajnosti i zaključujemo da je smjesa A bolja.
Pitanje:
- da li je proporcija izračunata iz uzorka značajno različita od neke hipotetske vrijednosti
- da li uzorak ne pripada populaciji sa poznatom proporcijom
Provjera o proporciji može koristiti binomnu raspodjelu, međutim, često se koristi normalna aproksimacija
ako p̂ ima približno normalnu raspodjelu p i varijancom pq/n, ako je uzorak dovoljno velik
Statistika za provjeru:
pˆ − p0
z=
sp
gdje je:
q0 = 1 − p0
Zaključak donosimo kao i uvijek, tj. da usporedimo izračunatu z vrijednost s kritičnom vrijednosti.
Primjer: Pojavila se sumnja da uslijed ekoloških promjena u jednom području odnos spolova u populaciji
poljskih miševa nije više 1:1 nego različit. Drugim riječima sumnjamo da proporcija mužjaka, a posljedično i
proporcija ženki je različita od 0.5 (odnosno 50%). Pokus je postavljen tako da se uhvati uzorak od 200
miševa i odredi spol. Uhvaćeno je 110 ženki i 90 mužjaka.
y = 90 broj mužjaka,
n = 200 ukupan broj uhvaćenih miševa.
p0 = 0.5 = hipotetska proporcija mužjaka
q0 = 1 - p0 = 0.5= hipotetska proporcija ženki
p̂ = 90/200 = 0.45 = proporcija uhvaćenih mužjaka
q̂ = 0.55, proporcija uhvaćenih ženki
Hipoteze su:
H0: p = 0.5, H1: p ≠ 0.5
α = 0.05
Procjenitelj:
p̂ = 90/200 = 0.45 = proporcija uhvaćenih mužjaka
Statistika za provjeru:
pˆ − p 0 0.45 − .50
z= = = −1.4
p0 q0 n (0.50)(0.50) 200
40
Uzeli smo α = 0.05 pa je kritična vrijednost ± 1.96.
Budući da izračunati z = -1.4 nije ekstremniji od -1.96 ne možemo zaključiti da je odnos spolova različit od
1:1.
p1q1 p 2 q 2
Varijanca: +
n1 n2
Hipoteze za dvostranu provjeru:
H0: p1 - p2 = 0
H1: p1 - p2 ≠ 0
1 1
Gdje je s pˆ − pˆ 2 = pˆ qˆ + = procjena standardne greške razlike proporcija
n1 n2
1
y1 + y 2
pˆ = = procjena proporcije za oba uzorka
n1 + n2
Ukoliko su zadane proporcije uzoraka tada se procjena proporcije može izračunati i iz:
pˆ n + pˆ 2 n2
pˆ = 1 1
n1 + n2
Primjer: Želimo vidjeti da li je na dvije farme razlika između proporcija krava sa više od 4000 kg mlijeka u
laktaciji značajno različita.
Farma 1 Farma 2
y1 = 40 y2 = 30
n1 = 100 n2 = 100
p1 = 0.4 p2 = 0.3
41
Hipoteze:
H0: p1 – p2 = 0
H1: p1 –p2 ≠ 0
α = 0.05
y1 + y 2 40 + 30 70
p̂ = = = = 0.35
n1 + n 2 100 + 100 200
q̂ = 1 − 0 − 35 = 0.65
(0.40 − 0.30) − 0
z= = 1.48
(0.35)(0.65) 1 + 1
100 100
Za razinu značajnosti α = 0.05, kritična vrijednost je 1.96. Budući da je 1.48 manje od 1.96, nismo utvrdili
značajne razlike između proporcija na dvije farme uz 0.05 razinu značajnosti.
Hipoteze:
H0: pi = p0i za sve kategorije i
H1: pi ≠ p0i za barem jednu kategoriju i
( yi − E [ yi ])
2
χ 2
= ∑i
E [ yi ]
i = 1 do k
• Pozor: za korištenje ove provjere mora biti ispunjen uvjet da ima najmanje 5 opažanja po kategoriji
(grupi)
42
Primjer: Očekivana proporcija bijelih, smeđih i šarenih kunića u populaciji je 0.36, 0.48 i 0.16. U uzorku od 400
kunića, njih 140 je bijelo, 240 ih je smeđe i 20 ih šareno. Da li je možemo reći da je uzorak od 400 životinja proporcija
kunića po boji različita od očekivanog?
χ 2 = ∑i
[y i − E(y i )]2 = [140 − 144]2 + [240 − 192]2 + [20 − 64]2 = 42.361
E(y i ) 144 192 64
Kritična vrijednost hi-kvadrat raspodjele za 2 stupnja slobode i razinu značajnosti 0.05 je 5.991. Pošto je izračunati χ2
veći od kritične vrijednosti možemo zaključiti da se uzorak razlikuje od populacije uz 0.05 razinu značajnosti.
Hipoteze:
H0: σ21 = σ22
H1: σ21 ≠ σ22
Statistika za provjeru:
s2
F = 12 koja ima F raspodjelu
s2
Obično se kvocijent postavi tako da je u brojniku brojnik veća, a u nazivniku manja varijanca
s12 s12
Odbacujemo H0 ako 2 ≥ Fα / 2, n1 −1, n 2 −1 , tj. ako je 2 ekstremniji od kritične vrijednosti.
s2 s2
43
6.9 Greške kod statističkog zaključivanja i snaga provjere
Kod zaključivanja na temelju uzorka moguća su dva pogrešna zaključka:
a) tip I greška = odbacivanje nul hipoteze H0, a da je zapravo H0 istinita
b) tip II greška = ne odbacivanje H0 a da je zapravo H0 lažna.
Istinita (prava) situacija
P = 1-α P=β
provjere
Odluka
1 – β = snaga provjere
44
7 Jednostavna linearna regresija
7.1 Uvod
Kada imamo više varijabli, često pitanje je kakav utjecaj imaju varijable jedna na drugu. Drugim riječima, da
li postoji funkcijska veza između varijabli
Primjer:
- kako promjena vanjske temperature za jedan stupanj utječe na promjenu konverziju hrane
- kako promjena razine proteina u hrani utječe na promjenu dnevnog prirasta.
Regresija
- uključuje skup statističkih procedura kojima se izvode zaključci o vezi između varijabli u nekom
sustavu.
- proučava statističku vezu između varijabli na taj način da se jedna varijabla definira kao zavisna
varijabla, a ostale kao nezavisne varijable
- kako promjena nezavisnih varijabli utječe na promjenu zavisne varijable
Ako imamo jednu nezavisnu i jednu zavisnu varijablu, a utjecaj nezavisne varijable na zavisnu objašnjavamo
pravcem, tada govorimo o jednostavnoj linearnoj regresiji.
Statistički model:
y = β0 + β1x + ε
y zavisna varijabla
x nezavisna varijabla
β0, β1 regresijski parametri
ε slučajna greška; slučajna neprotumačena odstupanja zbog individualnih razlika između
životinja ili različite okoline, greške kod mjerenja i sl.,
Odnosno,
y1 = β0 + β1x1 + ε1
y2 = β0 + β1x2 + ε2
............
yn = β0 + β1xn + εn
Primjer. U populaciji krava pretpostavlja se da se težina može prikazati kao linearna funkcija opsega grudi.
Ako su poznate vrijednosti varijabli, na primjer:
45
• Mjerenja varijable y se mogu prikazati kao:
• 641 = β0 + β1 214 + ε1
• 633 = β0 + β1 215 + ε2
• 651 = β0 + β1 216 + ε3
• …
Očekivanje zavisne varijable y u zavisnoti o vrijednosti nezavisne varijable x se označava E(y|x) i predstavlja
pravac, tj. E(yi| xi) = β0 + β1xi = pravac
y
E(y|x)
*
*
*
* *
*
* εi
*
* * (xi,yi )
Slika 7-1: Pravac linearne regresije. Zvjezdicama su prikazana prava mjerenja (xi,yi), Pravac E(y|x) je očekivanje
zavisne varijable, εi je odstupanje mjerenja od očekivanja
β1 β1
β0
∆x=1 x
Slika 7-2: Objašnjenje parametara obične linearne regresije
46
y
a) b) c)
x
y y
x x
x x
x
x
x
x
Cilj: pronaći pravac koja će ‘najbolje‘ opisati dani skup podataka; pronaći procjenitelje parametara β0 i β1.
Oznake za procjenitelje parametara: β̂ i βˆ ili b0 i b1. 0 1
Ostatak:
ei = yi − yˆ i odstupanja opažanja u uzorku od procijenjenog pravca.
y y$
* *
y$ i *
*
* * ei = yi − yˆi
*
* * yi
*
x
Slika 7-4: Procijenjeni pravac jednostavne linearne regresije.
47
Metoda najmanjih kvadrata:
Jedan od načina procjene parametara regresije je metoda najmanjih kvadrata.
-Cilj je pronaći procjenitelje b0 i b1, tako da vrijedi:
∑i ( yi − yˆ i )2 = ∑i ei2 = min
(drugim riječimna ostaci, odnosno kvadrati ostataka trebaju biti što manji)
Gdje su:
SS xy = ∑ i (x i − x )( y i − y )
= suma produkata y i x
∑ (x − x)
2
SS xx = i i
= suma kvadrata od x
SS xy = ∑ i x i y i −
∑ i xi ( )(∑ y )
i i
SS xx = ∑i xi2 −
(∑ x ) i i
2
n
n = veličina uzorka
Primjer: Izračunajte regresiju težine na opseg grudi krava. Imamo uzorak od 6 krava.
Krava 1 2 3 4 5 6
Težina (y): 641 633 651 666 688 680
Opseg (x): 214 215 216 217 219 221
Težina(y) Opseg(x) x2 xy
641 214 45796 137174
633 215 46225 136095
651 216 46656 140616
666 217 47089 144522
688 219 47961 150672
680 221 48841 150280
Sume 3959 1302 282568 859359
n=6
Σ x = 1302
i i
48
Σ x = 282568
i
2
i
Σ y = 3959
i i
Σ x y = 859359
i i i
SS xy = ∑i xi yi −
(∑ x )(∑ y ) = 859359 − (1302)(3959) = 256
i i i i
n 6
SS xx = ∑i xi2 −
(∑ x )i i
2
= 282568 −
(1302) 2
= 34
n 6
254 SS xy
b1 = = 7.53 =
SS xx 34
b0 = y − b1 x = −974.05
700
690
680
Težina (kg)
670
660
650
640
630
214 216 218 220 222
7.3 Ostatak
Podsjetite se da je greška pravog modela (modela populacije):
εi = yi – β0 + β1x
∑ ( y − yˆ )
2
SSOST = i i i
49
Skraćeni način računanja:
( SS xy ) 2
SSOST = SS yy −
SS xx
(∑ y ) 2
∑y
i
Gdje je SS yy = −
2 i
i = suma kvadrata od y, a SSxx i SSxy suma kvadrata od x i suma produkata x
i
n
i y definirane prije.
Procjenitelj: b1
Statistika za provjeru:
b1 − 0
t=
sb1
s2
Gdje je sb1 = = standardna greška
SS xx
β1 = 0 b1
-tα/2 0 tα/2 t
Slika 7-6: Teoretska distribucija procjenitelja b1 i skala odgovarajuće t statistike
50
Primjer: Provjerimo hipoteze za naš primjer o težini i opsegu krava. Već smo izračunali:
SSOST = 463.304, i procijenjena varijanca je:
SS
s 2 = OST = MS OST = 115.826 .
n−2
Također je bilo SSxx = 34.
s2 115.826
sb = = = 1.845
1
SS xx 34
b1 − 0 7.53
t= = = 4.079
2
s SS xx 1.845
Pošto je izračunati t = 4.079 veći od kritične vrijednosti (2.776) zaključujemo da je procjena nagiba regresije
7.53 značajno različita od nule i da u populaciji regresija postoji.
Primjer: Napravimo 95% interval pouzdanosti za parametar β1, za primjer sa kravama. Imamo već zadano i
izračunato:
α = 0.05
stupanj slobode = 4
t0.025,4 = 2.776
sb1 = 1.846
b1 = 7.529
51
7.6 Raščlanjenje ukupne varijabilnosti
Regresijskim modelom nastoji se objasniti što veći dio varijabilnosti zavisne varijable.
y * raspodjela
* ŷ y i oko yˆ
*
(B)
* *
raspodjela
y *
*
*
y i oko y *
(A) *
*
52
7.6.1 Veza između suma kvadrata
Ukupna suma kvadrata je jednaka sumi kvadrata za regresiju plus suma kvadrata za ostatak.
Dakle, Ukupni stupnjevi slobode = Stupanj slobode za regresiju + Stupnjevi slobode ostatka
Hipoteze:
H0: β1 = 0 nema regresije
H1: β1 ≠ 0 regresija postoji
Statistika za provjeru:
MS REG
F=
MS OST
Ovdje je:
SS REG
MS REG = = prosjek kvadrata za regresiju
1
SS
MSOST = OST = prosjek kvadrata ostatka
n−2
53
f (F 1, n-2 )
F 1,n -2
F α,1,n -2
Slika 7.8 F raspodjela i kritična vrijednost za stupnjeve slobode 1 i (n – 2). Izraz Fα,1,n-2 predstavlja kritičnu
vrijednost F raspodjele
ANOVA tablica
Izvor SS df MS F
Regresija SSREG 1 MSREG F=MSREG / MSOST
Ostatak SSOST n-2 MSOST
Ukupno SSUKUP n-1
Primjer: U našem primjeru sa kravama imali smo SSxy = 256, SSxx = 34. Ukupna suma kvadrata je suma
kvadrata za y.
SS UKUP = SS yy = ∑i y 2
−
(∑ y ) i i
2
= 2390.833
i
n
( SS xy ) 2 ( 256) 2
SS REG = = = 1927.529
SS xx 34
SSOST = SSUKUP - SSREG = 2390.833 -1927.529 = 463.304
ANOVA tablica
Izvor SS df MS F
Regresija 1927.529 1 1927.529 16.642
Ostatak 463.304 4 115.826
Ukupno 2390.833 5
Poprima vrijednosti od 0 do 1:
0 ≤ R2 ≤ 1
54
Koeficijent determinacije je mjera valjanosti modela:
(SS xy ) 2 ( 256) 2
SS REG = = = 1927.529
SS xx 34
ili
SSREG = (7.529)2 (34) = 1927.529
SSUKUP = SSyy = 2390.833
SS REG 1927.529
R2 = = = 0.81
SS UKUP 2390.833
55
8 Korelacija
Korelacija: govori o jakosti linearne veze između dvije varijable x i y. To je relativna mjera veze.
- varijable zajednički variraju, a ne mora nužno postojati uzročno-posljedična veza
Koeficijent korelacije:
σ xy
ρ=
σ x2σ 2y
σ2y = Var(y) = varijanca od y
σ2x =Var(x) = varijanca od x
σxy = Cov(x, y) = kovarijanca između x i y
x i y su slučajne normalne varijable.
Kovarijanca:
- zajedničko variranje dvije slučajne varijable
- apsolutna mjera veze
- ako su varijable nezavisne => Cov(x, y) = 0
Korelacija:
- kovarijanca standardiziranih varijabli x i y
- relativna mjera veze:
- poprima vrijednosti između -1 i 1
x x
x x
x x
y
c) x
y
d) x
x x
x x
Slika 8-1 a) pozitivna korelacija, b) negativna korelacija, c) korelacija ne postoji d) veza između varijabli postoji
ali nije linearna
56
8.1 Procjena koeficijenta korelacije i provjera hipoteza
Procjenitelj koeficijenta korelacije je koeficijent korelacije uzorka:
SS xy
r=
SS xx SS yy
Gdje su:
SSxx = suma kvadrata od x
SS xx = ∑i (xi − x ) = ∑i x
2 2
−
(∑ x ) i i
2
i
n
SSyy = suma kvadrata od y
SS yy = ∑i ( y i − y ) = ∑i y
2 2
−
(∑ y )
i i
2
i
n
SSxy = suma produkata y i x
(∑ x )(∑ y )
∑ (x − x )( y i − y ) = ∑x
i i
SS xy = i i yi − i i
i i
n
n = veličina uzorka
Provjera hipoteza:
Hipoteze:
H0: ρ = 0 (nema korelacije)
H1: ρ ≠ 0 (ima korelacije)
Statistika za provjeru:
r
t=
sr
ima t raspodjelu sa stupnjem slobode (n-2) uz slijedeće uvjete:
1) varijable x i y imaju bivarijatnu normalnu raspodjelu
2) vrijedi nul hipoteza H0: ρ = 0
1 − r2
Ovdje je s r = standardna greška.
n−2
Zaključak se izvodi uobičajeno. Uspoređujemo izračunatu t vrijednost iz uzorka s kritičnom vrijednosti (iz
tablica) za stupnjeve slobode n-2.
Primjer: Vratimo se primjeru sa opsegom i težinama krava i recimo da nas zanima jakost linearne veze
između težine (y) i opsega grudi (x). Ovdje pretpostavljamo da opseg grudi i težina imaju bivarijatnu
normalnu raspodjelu. Već imamo izračunate sume kvadrata i sumu produkata: SSxx = 34, SSxy = 256, SSUKUP
= SSyy = 2390.833. Koeficijent korelacije uzorka (procjena koeficijenta korelacije) je:
SS xy 256
r= = 0.898
SS xx SS yy (34)( 2390.833)
Provjera hipoteza
H0: ρ = 0 (nema korelacije)
H1: ρ ≠ 0 (ima korelacije)
57
Statistika za provjeru:
r n − 2 .898 6 − 2
t= = = 4.08
1− r2 1 − .898 2
Kritična vrijednost za razinu značajnosti α = 0.05, i 4 stupnja slobode je tα/2,4 = t0.25,4 = 2.227.
Budući da je izračunati t = 4.08 ekstremniji od kritične vrijednosti 2.227, nul hipoteza se odbacuje i može se
reći da korelacija u populaciji postoji.
Još jedanput treba naglasiti da, iako je utvrđena jaka korelacija, nije korektno bezuvjetno zaključiti da
promjena jedne varijable uzrokuje promjenu druge varijable. Za takvu analizu potrebno je napraviti regresiju.
58
9 Jednostruka analiza varijance
Definicija analize varijance: Podjela ukupne varijabilnosti na izvore varijabilnosti i analiza značajnosti tih
izvora.
Zavisna varijabla:
- mjerenja ili opažanja
Nezavisna varijabla:
- grupe (ili način klasificiranja), često kažemo tretmani
- kvalitativna, ili kategorička varijabla
- često se takva nezavisna varijabla zove i faktor
Grupe predstavljaju populacije
Primjer:
Utjecaj tri različite hranidbe na prirast u tovu.
Prvo treba definirati sakupljanje podataka, odnosno napraviti plan pokusa:
Izabrat ćemo slučajni uzorak i slučajno primijeniti tretmane na uzorak (definirati grupe)
Izabrali smo 15 junadi i različito ih hranili.(tretirali).
59
Radi preglednosti mogu se životinje i njihova mjerenja napisati po tretmanima:
Tretmani
T1 T2 T3
Pitanja?
1. Procijeniti prosjeke grupa i ukupnu srednju vrijednost,
2. Da li postoji utjecaj grupe, tj. da li su prosjeci pojedinih grupa različiti
(da li su aritmetičke srednje vrijednosti uzoraka grupa značajno različite. Značajna razlika => u
smislu da možemo u velikom broju takvih ponovljenih pokusa očekivati razliku.)
Odgovor na ova pitanja može dati statistička procedura koja se zove analiza varijance.
Analiza varijance:
- podjela ukupne varijabilnosti na izvore varijabilnosti i analiza značajnosti tih izvora.
- da li je protumačena varijabilnost (varijabilnost između prosjeka grupa) značajna u odnosu na
neprotumačenu varijabilnost (unutar grupa)
Model:
yij = µ + τi + εij i = 1,.....,a j = 1,...,n
Nezavisna varijabla τ :
- poprima vrijednosti različitih tretmana
60
- kategorička varijabla, često se zove faktor
- prema modelu faktor ima utjecaj na vrijednosti zavisne varijable y
• II grupa: • I grupa:
y2j = µ + τ2 + ε2j y1j = µ + τ1 + ε1j
311 = 300 + 10 + 1 330 = 300 + 20 + 10
306 = 300 + 10 - 4 340 = 300 + 20 + 20
310 = 300 + 10 - 10 305 = 300 + 20 - 15
• • • • • •
• III grupa:
y3j = µ + τ3 + ε3j
275 = 300 - 30 + 5
245 = 300 - 30 - 25
355 = 300 - 30 - 15
• • •
Grupa
G1 G2 G3
y11 y21 y31
y12 y22 y32
y13 y23 y33
y14 y24 y34
y15 y25 y35
Izvori varijabilnosti:
a) ukupna varijabilnost (varijabilnost opažanja bez obzira u kojoj su grupi); mjeri se ukupnom sumom
kvadrata (SSUKUP)
b) varijabilnost između grupa ili tretmana (varijabilnost između prosjeka grupa); mjeri se sumom
kvadrata između grupa (SSTRT)
c) varijabilnost unutar grupa ili tretmana (varijabilnost između opažanja unutar svake grupe); mjeri se
sumom kvadrata između grupa, odnosno sumom kvadrata za ostatak (SSOST)
Ukupna suma kvadrata se može raščlaniti na sume kvadrata između grupa i sumu kvadrata unutar grupa:
61
Također vrijedi za stupnjeve slobode:
SS OST = ∑i ∑ j ( y ij − y i .) 2
Gdje su:
yi . =
∑ j
yij
= prosjek grupe i
ni
∑∑ i j
y
ij
y.. = = prosjek svih opažanja
N
ni = broj opažanja u grupi i; N = ukupan broj opažanja
C=
(∑ ∑ y )i j ij
2
=
(ukupna suma)2
N ukupni broj opazanja
3) Ukupna (korigirana) suma kvadrata
SSUKUP = ∑i ∑ j yij 2 − C = Suma svih kvadriranih opažanja minus C
4) Suma kvadrata za grupe (tretmane)
SS TRT = ∑i
(∑ y )
j ij
2
− C = Suma
(suma grupe )2 za svaku grupu minus C
ni broj opažanja u grupi
5) Suma kvadrata za ostatak
SSOST = SSUKUP - SSTRT
62
MSOST = SSOST/(N-a)
Statistika za provjeru:
MS TRT
F=
MS OST
Odbacujemo H0 ako F > Fα,(a-1),(N-a), tj. ako je izračunata statistika F iz uzorka veća od kritične vrijednosti
F0 F1 F
Fα,(a-1),(N-a)
Slika 9-1: Provjera hipoteza koristeći F raspodjelu. Ako je F0 izračunati F, tj. F < Fα,a-1,N-a,H0 ne odbacujemo. Ako
je F1 izračunati F, tj. F > Fα,a-1,N-a,H0 odbacujemo uz α razinu značajnosti.
ANOVA tablica:
Izvor SS df MS = SS/df F
Grupa SSTRT a-1 MSTRT MSTRT/MSOST
Ostatak SSOST N-a MSOST
Ukupno SSUKUP N-1
63
Primjer: Zanimalo nas je da li postoji razlika u prirastima tri grupe prasadi kojima su davane tri različite smjese.
Označimo smjese sa TR1, TR2 i TR3. Radi preglednosti napišimo podatke, sume i prosjeke u tablicu:
1) Ukupna suma
ΣΣy
i j ij = y.. = (270 + 300 + ......+ 300) = 4350
C=
( y..) 2
=
(ukupna suma )2 = (4350)2 = 1261500
N ukupni broj opazanja 15
Izvor i SS df MS=SS/df F
Tretman 3640 3-1=2 1820.0 6.13
Ostatak 3560 15-3=12 296.67
Ukupno 7200 15-1=14
MS TRT 1820.0
F= = = 6.13
MS OST 296.67
64
f (F )
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3 α = 0.05
0.2
0.1 F 2,12
0.0
0 1 2 3 4 5 6 7 8
3.89 6.13
Kritična vrijednost za stupnjeve slobode 2 i 12 i razinu značajnosti 0.05 je F.05,2,12 = 3.89. Pošto je izračunati F = 6.13
veći (ekstremniji) od kritične vrijednosti, možemo zaključiti da uz razinu značajnosti α = 0.05 nul hipotezu
odbacujemo, tj. možemo reći da postoji značajna razlika između aritmetičkih sredina grupa (slika 9-2).
Ako se H0 ne odbaci, tj. nismo dokazali da razlike postoje, očito da nije potrebno dublje analizirati problem.
Međutim, moramo biti svjesni mogućnosti greške tipa II)
Treba naglasiti da je vjerojatnost da se napravi greška tipa I je jednaka α, dakle ista kao i kod F provjere.
nt =
1
(N −
∑ n2
i i
)
a −1 N
65
Primjer. Vratimo se našem primjeru sa tri smjese za prasad. Pošto smo u našem primjeru zaključili da
postoji značajna razlika između aritmetičkih sredina grupa zanima nas da vidimo koja je to smjesa za
praščiće najbolja. Upotrijebimo Tukey metodu:
MSOST
HSD = qα ,a , N −a
nt
Razlike između aritmetičkih prosjeka grupa (tretmana). Smjese TR1, TR2 i TR3.
TRT TR1 TR2
280 278
TR3 312 32 34
TR1 280 - 2
TR2 278 - -
Razlike između aritmetičkih sredina grupa TR3 i TR1 , te TR3 i TR2, su 32.0 i 34.0, što je veće od kritične
razlike 29.0. Prema tome zaključujemo da je smjesa TR3 bolja i od smjese TR1 i od smjese TR2 uz 5% razinu
značajnosti.
Često se to grafički može prikazati na slijedeći način. Napišu se simboli grupa po veličini njihovim
aritmetičkih sredina. Vodoravnom crtom ili crtama se spoje one grupe između kojih nije pronađena značajna
razlika.
66
Površina ispod standardne normalne krivulje (z > zα)
zα
zα 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611
1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681
1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064
2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010
3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007
3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.0005 0.0005 0.0005
3.3 0.0005 0.0005 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003
3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002
67
Kritične vrijednosti studentove t-raspodjele (t > tα)
tα
Stupnjevi
t0.1 t0.05 t0.025 t0.01 t0.005 t0.001
slobode
68
Kritične vrijednosti hi-kvadrat raspodjele, χ2 > χ2α,
χα
Stupnjevi
χ20.1 χ20.05 χ20.025 χ20.01 χ20.005 χ20.001
slobode
0.1000 0.0500 0.0250 0.0100 0.0050 0.0010
69
Kritične vrijednosti F raspodjele, F> Fα, α = 0.05
Fα
70
Kritične vrijednosti studentiziranog raspona, q(a,v)
a = broj grupa
v = stupnjevi slobode pokusne greške
α = 0.05
V 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
1 18.00 27.00 32.80 37.20 40.50 43.10 45.40 47.30 49.10 50.60 51.90 53.20 54.30 55.40 56.30
2 6.09 8.33 9.80 10.89 11.73 12.43 13.03 13.54 13.99 14.39 14.75 15.08 15.38 15.65 15.91
3 4.50 5.91 6.83 7.51 8.04 8.47 8.85 9.18 9.46 9.72 9.95 10.16 10.35 10.52 10.69
4 3.93 5.04 5.76 6.29 6.71 7.06 7.35 7.60 7.83 8.03 8.21 8.37 8.52 8.67 8.80
5 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 7.17 7.32 7.47 7.60 7.72 7.83
6 3.46 4.34 4.90 5.31 5.63 5.89 6.12 6.32 6.49 6.65 6.79 6.92 7.04 7.14 7.24
7 3.34 4.16 4.68 5.06 5.35 5.59 5.80 5.99 6.15 6.29 6.42 6.54 6.65 6.75 6.84
8 3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.77 5.92 6.05 6.18 6.29 6.39 6.48 6.57
9 3.20 3.95 4.42 4.76 5.02 5.24 5.43 5.60 5.74 5.87 5.98 6.09 6.19 6.28 6.36
10 3.15 3.88 4.33 4.66 4.91 5.12 5.30 5.46 5.60 5.72 5.83 5.93 6.03 6.12 6.20
11 3.11 3.82 4.26 4.58 4.82 5.03 5.20 5.35 5.49 5.61 5.71 5.81 5.90 5.98 6.06
12 3.08 3.77 4.20 4.51 4.75 4.95 5.12 5.27 5.40 5.51 5.61 5.71 5.80 5.88 5.95
13 3.06 3.73 4.15 4.46 4.69 4.88 5.05 5.19 5.32 5.43 5.53 5.63 5.71 5.79 5.86
14 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25 5.36 5.46 5.56 5.64 5.72 5.79
15 3.01 3.67 4.08 4.37 4.59 4.78 4.94 5.08 5.20 5.31 5.40 5.49 5.57 5.65 5.72
16 3.00 3.65 4.05 4.34 4.56 4.74 4.90 5.03 5.15 5.26 5.35 5.44 5.52 5.59 5.66
17 2.98 3.62 4.02 4.31 4.52 4.70 4.86 4.99 5.11 5.21 5.31 5.39 5.47 5.55 5.61
18 2.97 3.61 4.00 4.28 4.49 4.67 4.83 4.96 5.07 5.17 5.27 5.35 5.43 5.50 5.57
19 2.96 3.59 3.98 4.26 4.47 4.64 4.79 4.92 5.04 5.14 5.23 5.32 5.39 5.46 5.53
20 2.95 3.58 3.96 4.24 4.45 4.62 4.77 4.90 5.01 5.11 5.20 5.28 5.36 5.43 5.50
24 2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92 5.01 5.10 5.18 5.25 5.32 5.38
30 2.89 3.48 3.84 4.11 4.30 4.46 4.60 4.72 4.83 4.92 5.00 5.08 5.15 5.21 5.27
40 2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.74 4.82 4.90 4.98 5.05 5.11 5.17
60 2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 4.73 4.81 4.88 4.94 5.00 5.06
120 2.80 3.36 3.69 3.92 4.10 4.24 4.36 4.47 4.56 4.64 4.71 4.78 4.84 4.90 4.95
∝ 2.77 3.32 3.63 3.86 4.03 4.17 4.29 4.39 4.47 4.55 4.62 4.68 4.74 4.80 4.84
71