CONF.UNIV.DR. ELISABETA R. ROCA UNIVERSITATEA TEFAN CEL MARE SUCEAVA Str. Universitii, Nr. 1, Suceava, RO-720225, ROMANIA Tel: 0230-216147-295, e-mail: rosca@fim.usv.ro
The paper Aspects concerning the Application of Parametric Tests contains a definition of the statistical inference, specifies the content of the two types of inferences: estimation and hypothesis testing. Are presented some examples of practical using of the hypothesis testing and the way in which this theory are applied, generally and in the testing of mean of a sample. So, the hypothesis testing supposes the following steps: the establishing null and alternative hypothesis, the determination of statistical test, the establishing of value of significance levels and select the rejection region, the computing of value of statistic test, the drawing of conclusion concerning the accept or reject the null hypothesis.
n cercetarea statistic exist numeroase cazuri n care se recurge la studierea unei pri din colectivitatea total, ntruct cercetarea colectivitii n ansamblu este prea costisitoare. Cercetarea prin sondaj presupune introducerea conceptului de inferen statistic, reprezentnd, n sens general, deducerea unor informaii privind populaia folosind datele de sondaj. Acest lucru este posibil atta timp ct proprietile populaiei pot fi descrise pe baza parametrilor, iar tehnica inferenei statistice trateaz modul n care se pot obine parametrii populaiei folosind valorile de sondaj [Bij00] 1 .
n foarte multe analize concrete, parametrii populaiei nu sunt cunoscui i calculul lor este dificil, ntruct populaia este prea numeroas. De exemplu, dac se dorete determinarea venitului mediu anual al unui segment al populaiei active este imposibil s se cerceteze populaia total, ntruct ea cuprinde un numr mare de uniti de cercetare (de exemplu, numrul mediu al salariailor din industrie, n Romnia, n anul 2003 a fost de 1.493 mii persoane 144 ). O astfel de cercetare este costisitoare i greu de aplicat i prin urmare, cercettorii vor trebui s se mulumeasc cu un grad de precizie mai sczut dect 100% i vor recurge la inferena statistic pentru a obine o estimare a valorilor cercetate [Kel88] 2 .
n general, n statistic, se utilizeaz dou tipuri de inferen statistic: estimarea i testarea ipotezelor. n mod curent, toat lunea face estimri. Atunci cnd ncercm s trecem strada, estimm viteza mainii care se apropie, distana dintre noi i main i propria noastr vitez de deplasare. Odat fcute aceste estimri rapide, vom decide dac ateptm sau trecem strada mergnd obinuit sau alergnd. Managerii utilizeaz estimrile, ntruct majoritatea deciziilor sunt luate n condiii de incertitudine. De cele mai multe ori sunt pui n situaia de a face estimri rapide, ale cror efecte pot s afecteze organizaiile tot att de serios ca i decizia noastr de a traversa sau nu strada. Conducerile universitilor fac estimri cu privire la promovarea promoiilor de studeni. Potenialii cumprtori de imobile fac estimri, fr a avea n vedere caracterul lor tiinific, dar cu sperana c estimrile vor avea o coresponden n realitate [Lev87] 3 . Obiectul estimrii l constituie
144 * * * Anuarul statistic al Romniei, INS Bucureti, 2004, www.insse.ro 657 determinarea unei valori aproximative a unui parametru al populaiei, pe baza valorilor de sondaj. Un estimator al unui parametru al populaiei este o variabil aleatoare, ce poate fi considerat o funcie a datelor de sondaj. O estimare reprezint determinarea unei valori specifice a acestei variabile aleatoare. Testarea ipotezelor, aceasta este legat de parametrii populaiei totale. Astfel, datele culese printr-un sondaj statistic sunt prelucrate i rezultatele sunt folosite pentru a testa ct de corect sunt calculai parametrii populaiei totale. Altfel spus, se poate presupune c un parametru al populaiei, de exemplu media, are o anumit valoare. A testa valabilitatea acestei presupuneri nseamn a determina diferena dintre valoarea presupus i valoarea determinat a mediei de sondaj. Ulterior se analizeaz dac aceast diferen este semnificativ, lund n studiu fie diferena, fie valoarea probabilitii. Dac diferena este mic i probabilitatea mare nseamn c valoarea medie presupus este corect i invers. Se poate spune, deci c, n esen, testarea ipotezelor, ca parte a inferenei statistice, este folosit pentru a stabili dac datele de sondaj susin o anumit ipotez n legtur cu populaia total.
Exemple privind acest tip de inferen statistic sunt [Kel88] 4 : 1. societate care deine o cot de pia de 10% lanseaz o nou campanie de publicitate, la sfritul creia societatea dorete s tie dac rezultatele unui sondaj aleator indic o cretere a cotei de pia; 2. firm care produce ngrminte vrea s tie dac un nou tip de ngrmnt recent fabricat influeneaz creterea productivitii terenurilor. Un rspuns la aceast problem poate fi obinut comparnd rezultatele unui eantion din producia realizat folosind noul ngrmnt cu un eantion din producia realizat folosind vechiul ngrmnt. 3. un om politic este interesat s stabileasc dac o nou lege este asemntor acceptat de brbai i femei i, n acest caz, cercetarea unui eantion aleator de brbai i femei i poate oferi informaia dorit; 4. un turoperator pe piaa produselor turistice dorete s tie dac un produs turistic mai sofisticat determin o cretere a cererii.
Modul n care se poate rspunde la astfel de ntrebri rezult din teoria statistic a testrii ipotezelor. Testele privind ipotezele statistice sunt numite teste parametrice, ntruct ele testeaz valoarea unui parametru al populaiei.
Presupunem ipoteza c valoarea unui parametru al populaiei totale este 0 , aceasta fiind ipoteza nul, notat H 0 .
Astfel, exist:
H 0 : = 0 (1)
Scopul unui test statistic este acela de a determina dac un sondaj este suficient sau nu pentru a stabili dac ipoteza nul este adevrat. Cnd exist suficiente dovezi n acest sens, atunci poate fi formulat i ipoteza alternativ (contrar), notat H A .
Sunt posibile trei forme pentru ipoteza alternativ:
1. cnd intereseaz s se stabileasc dac valoarea parametrului nu este egal cu valoarea specificat prin ipoteza nul, ipoteza alternativ este: 658
H A : 0 (2)
2. cnd intereseaz s se stabileasc dac datele de sondaj permit concluzia c valoarea parametrului depete valoarea 0 , ipoteza alternativ este:
H A : > 0 (3)
3. cnd intereseaz s se stabileasc dac datele permit concluzia c valoarea parametrului este mai mic dect 0 , ipoteza alternativ este:
H A : < 0 (4)
O alt modalitate de formulare a ipotezelor statistice, ntlnit n literatura de specialitate este [Jab98] 5 :
1. se formuleaz ipoteza nul H 0 , astfel:
H A : = 0 (5)
2. se formuleaz ipoteza alternativ H A , astfel:
H A : 0 pentru un test bilateral
H A : > 0 sau H A : < 0 pentru un test unilateral.
De exemplu, dac parametrul este nivelul mediu al distribuiei unei populaii i x este un estimator al acestuia, respectiv nivelul mediu al distribuiei unui eantion, putem testa ipoteza c o valoare x estimeaz valoarea parametrului , formulnd ipotezele statistice astfel:
1. ipoteza nul H 0 . Conform teoremei limit central (media de selecie poate fi un estimator al mediei populaiei) se admite:
x H = : 0 (6)
2. ipoteza alternativ (contrar) H A : o valoare x obinut n eantion poate fi:
x H A : , pentru un test bilateral
H A : > x sau H A : < x pentru un test unilateral.
n testarea ipotezelor, valoarea pentru parametrul populaiei totale este stabilit sau presupus nainte de efectuarea sondajului.
Se consider c se testeaz ipoteza: media populaiei este egal cu valoarea 1.000, acesta fiind ipoteza nul.
659 Deci,
000 . 1 : 0 = H
Domeniile de aplicare a testrii ipotezelor sunt deosebit de numeroase, regsindu-se n majoritatea activitilor. Astfel, de exemplu, ipoteza nul considerat pentru activitatea agricol, medicin, publicitate etc. poate nsemna c noul ngrmnt, medicamentul, spotul etc. nu are efect asupra terenurilor, pacienilor, clienilor poteniali etc.
Se noteaz media populaiei n ipoteza nul 0 H , aceasta nsemnnd valoarea presupus a mediei populaiei. Dac rezultatele sondajului resping ipoteza nul se trage concluzia c o alt ipotez este adevrat i, prin urmare, se accept ipoteza alternativ (contrar) formulat anterior.
n exemplu considerat dac, ipoteza 000 . 1 : = o H este respins de rezultatele sondajului se poate formula o alt ipotez i anume:
1. ipoteza nul este c media populaiei este egal cu 500:
500 : 0 = H
2. trei variante posibile ale ipotezei alternative:
500 : A H (ipoteza alternativ este c media populaiei nu este egal cu 500);
H A : > 500 (ipoteza alternativ este c media populaiei este mai mare dect 500);
H A : < 500 (ipoteza alternativ este c media populaiei este mai mic dect 500).
Scopul testrii ipotezelor nu este acela de a verifica valorile determinate din datele de sondaj, ci de a face analiza diferenei dintre valorile de sondaj i valorile presupuse ale parametrilor populaiei.
Urmtorul pas, dup stabilirea ipotezelor nul i alternativ, este acela de a determina criteriul ce poate fi folosit pentru a accepta sau respinge ipoteza nul, care se numete test statistic. n cazul testelor parametrice privind ipotezele statistice, acestea se bazeaz pe cel mai bun estimator al parametrilor. Astfel dac, de exemplu, x este un estimator pentru , el va fi, de asemenea, testul statistic n verificarea ipotezelor despre .
n testarea ipotezelor, se poate accepta sau respinge ipoteza nul, n favoarea ipotezei alternative. Decizia n acest sens se bazeaz pe valoarea testului statistic: dac valoarea testului statistic se localizeaz ntr-o zon de acceptare, se accept H 0 . Astfel, pentru a realiza testarea, trebuie s fie stabilit zona de respingere (zona de acceptare cuprinde toate valorile posibile ale testului statistic, care nu se gsesc n zona de respingere). Calcului zonei de respingere depinde de probabilitatea de eroare n formularea concluziilor privind testarea ipotezelor.
660 Atta timp ct concluziile trase se bazeaz pe datele de sondaj, exist ntotdeauna ansa de a face o eroare din dou posibile. Figura 1 prezint modul n care se accept sau se respinge ipoteza nul, dup cum H 0 este adevrat sau fals. Din figur rezult c sunt posibile dou decizii corecte i anume: se accept H 0 cnd este adevrat i se respinge H 0, cnd este fals. De asemenea, sunt posibile dou decizii incorecte i anume: se respinge H 0 cnd este adevrat (aceasta este eroarea de tip I i probabilitatea de a comite o astfel de eroare este ) i se accept H 0 cnd este fals (aceasta este eroarea de tip II i probabilitatea de a comite o astfel de eroare este ). n testarea ipotezelor statistice, probabilitatea este numit nivel de semnificaie, iar probabilitatea 1- este numit puterea testului.
H 0 este adevrat H 0 este fals Se accept H o decizie corect Eroare de tip II P (eroare de tip II) = Se respinge H 0
Eroare de tip I P (eroare de tip I)= decizie corect Figura 1. Rezultatele testrii ipotezelor Sursa: Keller, G., Warrack, B., Bartel, H., Statistics for Mangement and Economics. A Systematic Approach, First Edition, Wadsworth Publishing Company, Belmont, California, p. 233
Cu ct valorile celor dou probabiliti sunt mai mici, cu att erorile sunt mai mici, iar ntre i este o relaie invers. Astfel, pentru un volum dat al sondajului, orice descretere a lui determin o cretere a lui . Valorile lui sunt selectate de cercettor i se dau sub form de procente ntre 1 i 100%.
n concluzie, se poate spune c testarea ipotezelor presupune parcurgerea urmtoarelor etape [Kel88] 6 , [Jab98] 7 : se stabilete ipoteza nul i ipoteza alternativ; se stabilete testul statistic; se stabilete valoarea nivelului de semnificaie i se selecteaz zona de respingere; se calculeaz valoarea testului statistic; se trage concluzia privind acceptarea sau respingerea ipotezei H 0 .
O problem important n teoria testrii ipotezelor statistice o reprezint semnificaia i modalitatea de calcul a erorilor de tip I i II [Lof88] 8 . Apare problema: cum se poate determina combinaia optim ntre erorile de tip I i II ? Dou considerente trebuie avute n vedere, n aceast situaie i anume: caracterul negativ al erorilor i posibilitatea erorilor de a fi msurate.
n concluzie, testarea ipotezelor poate fi caracterizat prin urmtoarele aspecte: este una din procedurile specifice procesului de luare a deciziilor; n situaiile tipice de luare a deciziilor exist patru efecte posibile: dou stri reale posibile, combinate cu dou decizii posibile (dou dintre aceste efecte sunt rspunsuri corecte, iar dou sunt erori) etc. Bibliografie 1. [Bij00] Biji, E. M., Lilea, E., Roca, R. E., Vtui, M., Statistic aplicat n economie, Editura UNIVERSAL DALSI, Bucureti, 2000, p. 241 2. [Kel88]Keller, G., Warrack, B., Bertel, H., Statistics for Management and Economics. A Systematic Approach, First Edition, Wadsworth Publishing Company, Belmont, California, p. 204 3. [Lev87]Levin, I.R., Statistics for Management, Fourth Edition, Practice-Hall, Inc., Englewood Cliffs, New Jersey, p. 320 661 4. [Kel88] Keller, G., Warrack, B., Bertel, H., lucr. cit., p. 232 5. [Jab98]Jaba, E., Statistic, Editura Economic, Bucureti, p. 294 6. [Kell88] Keller, G., Warrack, B., Bertel, H.,lucr. cit., p. 233 7. [Jab98]Jaba, E., lucr. cit., p. 295 8. [Lof88]Loftus, R. G., Loftus, F. E., Essence of statistics, Second Edition, Alfred A. Knopf, Inc., New York, 1988, p. 159