Вы находитесь на странице: 1из 5

12.

2 TESTE DE IPOTEZE PENTRU MEDIA U A O POPULAȚIE: CAZ EȘANȚĂ


MARE (N > 30)

După cum se știe, faptul că eșantionul este mare permite, folosind teorema limită centrală,
să se considere că distribuția unor astfel de eșantioane este normală. Prin urmare,
statistica testului este:

X
-H 0
0/Vn

Ca și în intervalele de încredere, în cadrul clasificării eșantionului mare pot fi luate în


considerare două cazuri: 1) în care parametrul populației a este cunoscut și 2) în care a nu
este cunoscut și este estimat folosind abaterea standard a eșantionului s. Deoarece
diferența în ambele cazuri constă numai în utilizarea unui os în statistica de testare, nu
este nevoie să le tratați separat. Ca întotdeauna, un exemplu va fi folosit pentru a ilustra
utilizarea acestuia.

Exemplul 12.2
În umplerea automată a pungilor cu pudră de săpun (vezi Exemplul 10.3), media estimată
a populației pentru pungi de un kilogram este de 1000 grame (g). Pentru a vedea că acest
lucru este adevărat, se prelevează o probă aleatorie de 30 de pungi din când în când și
sunt cântăriți Ultima probă a dat o greutate medie de 1010 g. Cu aceste informatii si cu o
valoare istorica pe care compania o gestioneaza pentru a de 15 g (atunci cand procesul
este sub control), se doreste sa se stie daca procesul de ambalare se desfasoara corect.

Soluţie
În această situație, întrebarea de cercetare se referă la o punere sub semnul întrebării a
controlului procesului de ambalare, astfel încât să poată fi pusă astfel:

Procesul de ambalare este sub control?

Abordarea modelului statistic prin teste de ipoteză este, atunci:

Ho: procesul este sub control (nicio schimbare)


H1: procesul este scăpat de sub control (există schimbare)

Media populației este necunoscută și este reprezentată de u. Pe de altă parte, există o


specificație de umplere constând în a avea o medie de 1000 g, astfel încât u 0 = 1000 g
este valoarea contrastului!

Din motive evidente, compania își dorește o fluctuație „acceptabilă” a mediei în jur de 1000
g; o nepotrivire în ambele direcții poate fi considerată un proces de fugă. Aceasta definește
un test cu două cozi, deci modelul statistic este:

1
H0: u = 1000 g
1

H1: u * 1000g
1

Luând a = 0,05, distribuția normală standardizată arată astfel:

Statistica eșantionului este X = 1 010 g, iar în acest caz avem abaterea standard a
populației a = 15 g.

Înlocuind valorile din expresia 12.1 a statisticii testului, se obține valoarea observată:

X
-u1010 - 1000
0 =
3,65 g
la 7n 15 și 30

Concluzie
Deoarece valoarea observată, 3,65 g, se află într-una dintre regiunile de respingere, testul
se încheie prin respingerea H0 și prin urmare favorizarea H1.

Concluzia exemplului 12.2 înseamnă că procesul trebuie să se oprească, să găsească


cauza fugarului și să o corecteze. Aceasta, însă, este o decizie serioasă care reprezintă
întârziere în producție. Pentru a aduna mai multe informații justificative, se poate face o
estimare pe intervale a parametrului u cu un nivel de încredere y de 95%. Rezultatul este:
1004,6 g < u < 1015,4 g.

Intervalul nici măcar nu conține valoarea confruntată de 1000 g, astfel încât decizia de a
opri procesul este întărită. Este posibilă urmărirea analizei rezultatelor prin intermediul așa-

2
numitei valori p, pentru care este însă necesară definirea și metoda de calcul a acesteia,
care este facilitată cu ajutorul unui program de calculator, precum programul 12.1. Va
începe prin a-l ilustra pe acesta din urmă.

Exemplul 12.3
Doriți să rezolvați Exemplul 12.2 folosind Programul 12.1.

Soluţie
Porniți programul 12.1. În meniul principal, selectați One Sample, apoi Media și Known
Variance. Notați datele solicitate de program (evident, fără unități de greutate) și selectați
Ipoteza Nulă corespunzătoare, cu care se definește automat ipoteza alternativă. Selectați
Nivelul de semnificație (în acest caz 0,05) și faceți clic pe butonul Run. Următoarea
interfață arată rezultatele oferite de program.

În interfața Exemplului 12.3, sub concluzie apare o fereastră cu valoarea 0,00026 și


etichetată p-valoare. Semnificația, utilizarea și calculul valorii p în testarea ipotezelor sunt
discutate mai jos.

valoarea p
Modul tradițional de a încheia un test de ipoteză este prin a spune că ipoteza nulă este
respinsă, sau nu, cu un nivel de semnificație prestabilit a. Acest lucru, totuși, are anumite
dezavantaje pentru analistul care nu a efectuat testul: în primul rând, că valoarea selectată
a lui a a fost decisă de altcineva și i se impune într-un fel; în al doilea rând, că nu are idee
dacă valoarea calculată din statistica testului abia a ajuns în regiunea de respingere sau a
mers mult în ea (mai ales când nu aveți un program ca 12.1.

3
Pentru a depăși aceste dificultăți în practică, abordarea valorii p a fost adoptată pe scară
largă. Valoarea p este probabilitatea ca statistica de test să ia o valoare care este cel puțin
la fel de extremă ca valoarea observată a statisticii atunci când ipoteza nulă este
adevărată. De fapt, valoarea p este un nivel de semnificație, dar calculat pe baza valorii
observate și nu predeterminat ca valorile tipice ale a.
Revenind la situația umplerii pungilor de săpun, avem că valoarea observată z0 = 3,65148
corespunde valorii p = 0,00026. În ceea ce privește distribuția normală standardizată,
aceasta poate fi reprezentată așa cum se arată în Figura 12.6:

Evident, zonele de respingere corespunzătoare valorii p sunt considerabil mai mici decât
cele corespunzătoare nivelului ales de 0,05. O modalitate practică de utilizare a valorii p
este de a o compara cu valoarea lui a (la urma urmei, ambele sunt niveluri de
semnificație), iar dacă valoarea p este mai mică decât a, vor exista mai multe dovezi
pentru a respinge H; în caz contrar, dovezile vor funcționa pentru a accepta H0. În
concluzie:

Dacă valoarea p < a , se respinge H0


Dacă valoarea p > a , acceptați H0

În cazul pungilor de săpun, se confirmă respingerea ipotezei nule, iar procesul poate fi oprit
cu mai multă încredere (dar nu cu certitudine).

O utilizare, poate mai frecventă astăzi (în textele moderne, în reviste științifice și în
articolele de cercetare), este pur și simplu de a raporta valoarea p, astfel încât analistul sau

4
cititorul să poată concluziona cu orice nivel de semnificație specificat.

O definiție precisă a valorii p este:

definiția valorii p Valoarea p este cel mai scăzut nivel de semnificație care ar duce la
respingerea ipotezei nule H0.

Este relativ ușor de calculat valoarea p pentru testele în care este implicată distribuția
normală, ca în cazul ilustrațiilor pe care le-ați văzut. Dacă z este valoarea statisticii testului,
atunci valoarea p este:

F(Zo) pentru un test cu coada stângă H0 : u > u0; H1:u<u0


2[1— F(Zo)] pentru un test cu două cozi H0 : u = u0; H1: u ± u0
1 — F(Zo) pentru un test cu coada dreaptă H0 : u < u0; H1:u>u0

În expresia 12.3, F(Zo) este distribuția normală standard cumulativă, evaluată la Zo

Exemplul 12.4

Folosind expresia (12.3), calculați valoarea p pentru umplerea pungilor de săpun și


discutați rezultatele.

Soluţie

Există un test cu două cozi, iar valoarea observată este 3,65. Conform expresiei (12.3),
avem:

valoarea p = 2[1 -F( 3,65)] =2[1- 0,99987] =0,00026

Estimarea lui F(3.65) a fost făcută cu programul 9.2, dar poate fi folosită și

Excel: STANDARD NORM.DIST(3,65).

Rezultatul anterior este interpretat în sensul că ar fi necesar să existe un nivel de


semnificație mai mic de 0,00026 pentru a accepta ipoteza nulă. Aceasta înseamnă că
pentru a accepta ipoteza nulă ar fi necesară o valoare extrem de mică a lui a (chiar mai
mică decât cea mai mică valoare recomandată: 0,01). Totul pare să indice că procesul de
ambalare este scăpat de sub control și va trebui oprit pentru a face corecțiile necesare.

Вам также может понравиться