Вы находитесь на странице: 1из 90

1

ELEMENTE DE
BIOSTATISTICA



2
OBIECTIVELE STATISTICII
Statistica este un domeniu tiinific care
permite studiul fenomenelor de masa a cror
proprietate fundamental este variabilitatea.
Obiectivul principal al statisticii este studiul
unei colecii de observaii efectuate asupra
unor entiti (persoane, obiecte, etc.) de
aceiai natur, denumite uniti statistice,
dup una sau mai multe caracteristici
variabile.
3
OBIECTIVELE STATISTICII
Date numerice cu privire la unul sau mai
multe fenomene culese, sistematizate,
centralizate
Activitatea de culegere, prelucrare si
valorificare a informatiilor
Totalitatea metodelor, procedeelor si
tehnicilor statistice = teoria statistica
In raport cu alte stiinte = statistica este o
metoda de cercetare

4
Capitole ale statisticii

Statistica descriptiva

Statistica analitica sau inferentiala

Soft Statistic
5
Statistica descriptiva
Statistica descriptiv se ocup cu:
culegerea datelor statistice,
prezentarea datelor statistice,
reprezentarea (grafica) datelor statistice,
determinarea unor caracteristici numerice
sintetice ale datelor statistice.
6
STATISTICA Analitica
Obinerea de concluzii (inferene) asupra
unei populaii, pornind de la o fraciune
(eantion) a ei, constituie problematica
principal a statisticii inductive sau
infereniale sau analitice.
7
Evaluarea literaturii medicale
Raportul statisticii cu alte stiinte= metoda
de cercetare
Evaluarea rezultatelor stiintifice
8
MULTIMI sau COLECTIVITATI
STATISTICE

Populatia statistica
Populatia tinta

Esantionul
9
MULTIMI STATISTICE
Populatia statistica - o multime de entitati ce
au cel putin o caracteristica comuna vizata
intr-un anumit studiu
volumul (talia) populatiei - numarul elementelor
populatiei
unitate statistica
criterii de incluziune
criterii de excludere

10
MULTIMI STATISTICE
Esantion (selectie) - o submultime finita a
unei populatii statistice
Motivele folosirii esantioanelor
talia esantionului
esantion reprezentativ (prelevare aleatoare, cu
o talie suficient de mare)
esantion nereprezentativ sau cu bias
11
MULTIMI STATISTICE
Motivele folosirii esantioanelor
i. Talia populaiei poate fi foarte mare sau chiar infinit
ii. Eantioanele pot fi studiate mai rapid dect populaiile,
iii. Studiul caracterului pe ntreaga populaie este frecvent
imposibil, deoarece poate distruge populaia.
iv.In anumite situaii nu se mai pot obine informaii dect
despre o parte a populaiei.

12
MULTIMI STATISTICE
Motivele folosirii esantioanelor
v. Rezultatele observaiilor pe eantioane adesea sunt mai
precise dect rezultatele bazate pe observarea populaiei n
totalitate,
vi. Costul i resursele necesare (umane, materiale, etc.)
pentru observarea exhaustiv a unei populaii pot de
asemenea s fie un motiv pentru utilizarea eantioanelor.
13
MULTIMI STATISTICE
Esantionare
Simplu randomizata
Stratificata cu randomizare
cu clusteri randomizati
multistadializata
Esantioane
esantioane independente
esantioane dependente (perechi)
14
MULTIMI STATISTICE
Caracteristica (variabila) - un atribut al unei
populatii (V:P C)
Tipuri de variabile
calitative (sexul, tipul rasial)
cantitative
discrete
continue
Semicantitative sau ordinale
15
MULTIMI STATISTICE
Parametru al unei populatii statistice - un
indicator sintetic relativ la o variabila
frecventa unui caracter (Rh-) in populatie
media taliei la populatia de nou nascuti
Statistica asociata unui esantion
frecventa unui caracter (Rh-) intr-un esantion
media taliei la un esantion de nou nascuti

16
MULTIMI STATISTICE
Date statistice - valorile unei variabile statistice
pe indivizii dintr-o populatie statistica sau
esantion
Tipuri de date statistice
Calitative
Calitative binare (da, nu; adevarat, fals)
cantitative
semicantitative
17
MULTIMI STATISTICE
Date statistice
Scala nominal este o scal pentru msurarea
variabilelor calitative ce pot lua un numr finit de
valori care nu au nici o proprietate aritmetic i nici
nu admit o ordonare a valorilor.
Exemple:
Tipul rasial: alb, negru, alt tip
Sexul : brbtesc, femeiesc (M,F)

18
MULTIMI STATISTICE
Date statistice
Scala ordinal este o scal utilizat n cazul
variabilelor care pot lua valori ntr-o mulime
discret finit de valori, care nu au nici o proprietate
aritmetic, dar care ns posed o ordonare a acestor
valori.
Exemple:
Starea social i economic: sczut, medie, nalt.
Severitatea crampelor la stomac: uoar, moderat,
puternic

19
MULTIMI STATISTICE
Date statistice ordinale
Exemple: Starea unui Pacient poate fi
clasificata:
neameliorata
stabila
ameliorata.


20
MULTIMI STATISTICE
Date statistice
Scala interval (de intervale egale) este o scal
utilizat n cazul variabilelor continue (ce pot lua
valori ntr-un interval) i pentru care diferena ntre
dou valori ai scalei are sens.
Exemple:
Temperatura n grade Celsius n 5 zile consecutive:
Ziua: L M M J V
Temp: 20
0
25
0
18
0
24
0
26
0


Timpul (momentul).
21
MULTIMI STATISTICE
Date statistice
Scala de tip raie este utilizat n cazul variabilelor
continue pentru care att diferena ct i ctul a
oricror dou valori de pe scal au sens. Dispune de
zero absolut si accepta numai valori pozitive.
Exemple:
Greutatea n kilograme
Inlimea
Vrsta
Glicemia.

22
Tipuri de serii STATISTICE
Date statistice brute
De exemplu, valorile succesive ale greutii a 120 de indivizi luai la
ntmplare reprezint o colecie de date brute.
Serie statistic dupa numarul de variabile si tipul lor este:
Univariata (o variabila calitativa)
Sex: F, M, F, F, M, M, M, M, F, F
Bivariata (2 variabile dintre care cel putin o variabila calitativa)
SEX: F, M, F, F, M, M, M, M, F, F
RH: +, +, -, +, -, +, +, +, +, +


23
Tipuri de variabile STATISTICE
Multivariata (mai multe variabile dintre care cel
putin o variabila calitativa)
SEX: F, M, F, F, M, M, M, M, F, F
RH: +, +, -, +, -, +, +, +, +, +
varsta: 2, 4, 5, 3, 7, 8, 9, 4, 7, 9


24
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Seria statistic daca variabilele sunt de masurare poate
fi:
Unidimensionala (o variabila cantitativa)
Varsta: 17, 24, 34, 25, 45, 70, 60, 88, 37, 40, 56,
34,70
Bidimensionala (doua variabile cantitative)
Varsta: 17, 24, 34, 25, 45, 70, 60, 88, 37,
40, 56, 34, 70
TAS: 120, 140, 130, 110, 120, 150, 140, 150,
130, 120, 125, 130, 140

25
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Seria statistic daca variabilele sunt de masurare poate
fi:
Multidimensionala (mai multe variabile
cantitative)
Varsta: 17, 24, 34, 25, 45, 70, 60, 88, 37,
40, 56, 34, 70
TAS: 120, 140, 130, 110, 120, 150, 140, 150,
130, 120, 125, 130, 140
TAD: 90, 80, 70, 60, 75, 85, 90, 100, 80,
75, 70, 80, 90
26
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Printr-o serie statistic unidimensional de
talie n: X
1
, X
2
,..., X
n
se nelege un ir de n
valori numerice ale unei variabile de masurare
definite pe o populaie statistic.
27
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
O serie statistic este de regul asociat unui
eantion de talie n, cum ar fi, de exemplu:
- valorile taliei pentru n indivizi;
- concentraia unei enzime msurate la n
persoane;
- tensiunea arterial sistolic determinat la n
indivizi,
- glicemia determinat pentru n subieci, etc.

28
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
12 10 9 11 4 7 6 8 12 13
10 12 8 9 5 7 9 10 11 12
13 8 9 5 7 11 12 8 9 11
12 7 9 11 12 7 8 9 10 10
8 9 5 4 6 9 10 11 12 10
13 10 9 6 7 9 11 10 11 10
10 9 10 12 8 10 12 11 6 7
8 10 9 11 11 9 10 8 9 10
12 8 7 12 10 8 11 12 11 8
10 12 6 8 9 10 12 13 10 9
Tabelul 1. Tabelul valorilor brute ale presiunii arteriale diastolice
29
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Inconveniente ale seriei statistice:
- Ansamblul informaiei cuprinse n seria statistica este,
n general, cu att mai neclar cu ct numrul datelor
este mai mare. Este frecvent preferabil organizarea
acestor date i reprezentarea lor ntr-o form mai
concis.
- Ansamblul datelor seriei se preteaz destul de greu la
la comparri directe, n acest scop fiind necesar o
transformare a lor.
30
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Aceste inconveniente parial pot fi remediate,
n dou moduri:
i) organiznd i reprezentnd datele
ii) calculnd anumii indicatori statistici sintetici
ai seriei (sau distribuiei) de date brute
31
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
i) Organizarea i reprezentarea datelor se
poate face prin:
- serii ordonate
- distribuii de efective (frecvente)
- tabele de clase de frecvene
- histograme i poligoane de frecvene
32
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
ii) Calcularea unor indicatori statistici
sintetici ai seriei (sau distribuiei) de date
cum sunt:
- indicatori de centralitate
- indicatori de dispersie
- indicatori de localizare
- msuri de asimetrie (skewness),
- msuri de boltire (kurtosis).
33
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Serii ordonate (crescator, descrescator)
Tabelele se clasifica dupa:
i) continut
cu distributii de frecvente
de clase de frecvente
de contingenta
ii) structura
cu doua coloane
cu subclasificari
master
34
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE

Tabelul -1
Clasificarea nscuilor vii dup educaia tatlui i tipul de asisten
la natere, n statul x, 1968
EDUCATI
A
ASISTATI DE: TOTAL
TATALUI MEDIC
IN
SPITAL
MEDIC,
DAR NU
IN
SPITAL
MOASA ALTE/
NESPECI
FICAT
Absolvent
liceu
46.606 3.014 910 154 50.684
Sub 12
clase
14.334 3.094 13.930 416 31.774
TOTAL 60.940 6.108 14.840 570 82.458
Sursa: Statistica Sanitar a Statelor Unite ale Americii, 1968, vol.1,
pg.81.
35
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Tabelul -1
Cauzele deceselor neonatale n Romnia n 1994
CAUZE DE DECES
(1)
Nr.
decese
(2)
Procentaj
%
(3)
Asfixia la natere 527 26.1
Traumatisme
obstreticale
92 4.6
Stare septic 7 0.3
Pneumonie 181 9.0
Diaree 8 0.4
Malformaii
congenitale
598 29.6
Alte cauze 606 30.0
Total 2019 100.0
36
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Principii generale pentru construirea tabelelor:
A. Tabelele trebuie s fie ct mai simple posibil.
Sunt preferate dou sau trei tabele mici unui singur tabel
mare care s conin multe detalii sau variabile.
Pot fi citite cu uurin valorile a maximum trei
variabile.
B. Tabelele trebuie s se explice singure.
Codurile, abrevierile sau simbolurile utilizate trebuie
explicate clar n nota de subsol
Fiecare rnd i fiecare coloan a tabelului trebuie
etichetat concis i clar.
37
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Trebuie menionate unitile de msur pentru
datele incluse n tabel
Titlul tabelului trebuie s fie clar, concis i la subiect.
El trebuie s rspund la ntrebrile: ce ? cnd ?
unde ?
Totalul trebuie s apar n orice tabel (sau linii ori
coloane de sintez ).
C. Titlul este de obicei separat de corpul tabelului
prin linii i spaii.
D. Dac datele nu sunt originale trebuie s se
menioneze sursa lor ntr-o not de subsol.
38
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Tabele ce conin distribuii de frecvene
O modalitate comod de a prezenta o mulime de
date brute este:
i) se ordoneaza datele in ordine crescatoare,
ii) se determine frecvena fiecrei valori,
iii) se includ valorile distincte si frecventele intr-un
tabel pe dou coloane.
39
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
TAD n mm Hg Nr. bolnavi (frecvena absolut)
4 2
5 3
6 5
7 8
8 13
9 17
10 20
11 13
12 15
13 4
Total 100
40
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
FRECVENTE
Frecventa absoluta u(x) a unei valori x
Frecvena relativ f(x) a unei valori x este
raportul dintre frecvena absolut u(x) i
efectivul total al seriei n: f(x) = u(x)/n.
Frecvena relativ se prezint uneori n procente.
Alte tipuri de frecvene
41
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Alte tipuri de frecvene:
- frecvena absolut cumulat cresctoare asociat
unei valori x - suma frecvenelor absolute ale tuturor
valorilor seriei care sunt mai mici sau egale dect x
- frecvena absolut cumulat descresctoare
asociat unei valori x - suma frecvenelor absolute
ale tuturor valorilor seriei care sunt mai mari sau egale
dect x.
Analog se definesc i frecvenele relative
cumulate.
42
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Se pot alctui tabele de frecvene cu mai multe coloane care
s cuprind:
valorile distincte
frecventele absolute
frecvenele relative
frecvenele relative cumulate.
Programul statistic EPIINFO, prin comanda FREQ din
componenta ANALYSIS.
Programul Excel,
functia FREQUENCY
Tabele Pivot

43
METODE DE PREZENTARE SI
INTERPRETARE A DATELOR STATISTICE
44
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Tabelul claselor de frecvene
se descompune seria n clase prin mprirea
ntinderii ei n intervale de clas
se determina numrul de valori care intr n
fiecare clas

45
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Tabelul claselor de frecvene
Presiunea
arterial
diastolic n
mm Hg
(intervalele de
clas)
Nr.
bolnavi
(frecvena
absolut)
Frecvena
relativ
Frecvena
relativ
cumulat
[4 , 6) 5 5% 5%
[6 , 8) 13 13% 18%
[8 , 10) 30 30% 48%
[10 , 12) 33 33% 82%
[12 , 14) 19 19% 100%
Total 100 100%
46

47
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Tabelul frecvenelor permite o apreciere global asupra
seriei statistice ct i realizarea unor seciuni n seria
statistic, respectiv gsirea rapid a unor rspunsuri la
ntrebri de genul:
Care este cea mai numeroas clas?
Ce populaie se afl n toate clasele care preced o
clasa data sau care urmeaz dup o clasa data ?
Tabelul frecvenelor absolute ofer o distribuie a efectivelor
claselor, denumit i distribuie de frecvene.

48
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Tabele de contingen
O alt modalitate de prezentare a frecvenelor
(absolute sau relative) dup dou caracteristici
este cea a tabelelor de contingen.
Fiecare dintre cele dou caracteristici au mai
multe valori, tabelul coninnd frecvenele de
apariie a combinaiilor de perechi ordonate de
valori

49
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Fumat
Stare
da nu Total
Bolnav 241 446 687
Sntos 302 511 813
Total 543 957 1500

50
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Tabel de contingen de tipul 2 x 2, arata legatura
intre:
un factor de risc si
starea de sanatate.
Astfel de tabele de contingen intervin frecvent n
analiza statistic a datelor medicale (testul Hi-patrat).
Determinarea nivelului de asociere a doua variabile
calitative binare
51
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Grafice pentru reprezentarea datelor cantitative
cu scale aritmetice
cu scale semilogaritmice
Diagrame
histograma
poligonul de frecvente
52
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
53
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Histograma TAS
Margini superioare ale claselor (x < marginea)
N
r
.

d
e

o
b
s
e
r
v
a
t
i
i
0
1
2
3
4
5
6
7
8
60 80 100 120 140 160 180
Distributia
Normala asteptata

54
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE
Reprezentarea grafica a datelor cantitative
perechi.
Diagrama Scatter (diagrama de dispersie)
Diagrame pentru reprezentarea datelor
calitative
cu bare, cu segmente, pie
pictograme
cartograme
55
METODE DE PREZENTARE SI
INTERPRETARE A DATELOR STATISTICE
56
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE

Regression
95% confid.
IMC vs. GLICEMIE
GLICEMIE = 64.762 + .90119 * IMC
Coeficientul de corelation: r = .16196
Indicele de masa corporala (IMC)
G
L
I
C
E
M
I
E
0
50
100
150
200
250
300
350
400
450
15 20 25 30 35 40 45 50 55
57
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE

Regression
95% confid.
Categorized Scatterplot
IMC vs.GLICEMIE
IMC
G
L
I
C
E
M
I
E
F
SEX:
0
50
100
150
200
250
300
350
400
450
15 20 25 30 35 40 45 50 55
M
SEX:
15 20 25 30 35 40 45 50 55
58
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE

Mean+SD
Mean-SD
Mean+SE
Mean-SE
Mean
Box Plot (CARDIO.STA 67v*799c)
SEX
U
R
I
C
E
M
I
E
2
3
4
5
6
7
8
9
10
11
F M
59
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE

Pie Chart (CARDIO.STA 67v*799c)
DIABET
n
u
O
B
E
Z
:
da, 8.9 %
nu, 91.1 %
da, 6.3 %
nu, 93.7 %
F
SEX:
d
a
O
B
E
Z
:
da, 20.7 %
nu, 79.3 %
M
SEX:
da, 23.6 %
nu, 76.4 %
60
METODE DE PREZENTARE SI INTERPRETARE A
DATELOR STATISTICE

99%
1%
75%
25%
Median
Box Plot (CARDIO.STA 67v*799c)
SEX
U
R
I
C
E
M
I
E
2
3
4
5
6
7
8
9
10
11
F M
61
Parametri epidemiologici
Raportul
Un raport sau o raie este o expresie de forma:
x:y sau x/y * k .
Sex ratio
Proporia
O proporie este un raport n care numrtorul face
parte din numitor. Astfel o proporie are forma:
x/(x+y) * 100,
Ea se exprima n general n procente.

62
Parametri epidemiologici
O rat calculat din date epidemiologice reflect
riscul de a surveni n timp un anumit eveniment.
Rate de morbiditate
prevalenta
incidenta
rata de atac
Rate de mortalitate
Rate de natalitate
63
Parametri epidemiologici
rata =
= baza
a specificat perioada in evenimente aceste la risc sub Populatia
a specificat perioada o intr evenimente de Numarul

.
Prevalena =
totala populatia
(perioada) dat moment un la e imbolnavir de cazuri de Numarul
64
Parametri epidemiologici
Rata de atac=
=
riscului supuse persoane de Numarul
bolnave persoane de Numarul
Rata de incidenta =
=
riscului supusa populatia
e imbolnavir de noi cazuri de Numarul
.
Rata bruta de mortalitate=
=
1000
perioadei mijlocul la Populatia
perioada o dintr Decesele
-

65
Parametri epidemiologici
Masuri ale riscului
relativ
absolut
atribuabil
66
Parametri epidemiologici
Riscul relativ =
neexpusi cei pentru incidenta de Rata
expusi cei pentru incidenta de Rata
- Rata de
incidenta pentru cei neexpusi.
Riscul atribuabil = Rata de incidenta pentru cei expusi
67
Parametri epidemiologici
Rate de natalitate
Rata de natalitate msoar frecvena naterilor
ntr-o populaie specific
Rata de fertilitate este o probabilitate a
naterilor ntr-o populaie specific
68
MSURI DE TENDINA CENTRALA, DE DISPERSIE,
LOCALIZARE, SIMETRIE
Media aritmetica, Mediana, Modul, Media geometrica,
Media armonica, Valoarea centrala
Dispersia, Abaterea standard, Coeficientul de variatie,
Eroarea standard, Amplitudinea
Cvartile, Percentile
Asimetria
Boltirea
69
MSURI ALE TENDINEI CENTRALE
Media aritmetica
n
n
i
i
X
X

=
=
1

70
MSURI ALE TENDINEI CENTRALE
Media aritmetica
Proprieti ale mediei aritmetice:
Orice valoare a seriei este luat n considerare n
calculul mediei.
Valorile extreme pot influena media aritmetic
distrugndu-i reprezentativitatea.
Media aritmetic se situiaz printre valorile seriei de
date.
Suma diferenelor dintre valorile individuale din serie
i medie este zero.
71
MSURI DE TENDINA CENTRALA
Proprieti ale mediei aritmetice:
Schimbarea originii scalei de msur a variabilei X
din care provine seria de date are influen asupra
mediei.
Transformarea scalei de msur a variabilei X
influeneaz media aritmetic.
Suma ptratelor abaterilor valorilor seriei de la media
aritmetic este minimul sumei ptratelor abaterilor
valorilor seriei de la o valoare X a dreptei reale.
Acest proprietate mai este numit i principiul sau criteriul celor
mai mici ptrate.
72
MSURI DE TENDINA CENTRALA

Media aritmetica
modificata

media aritmetica a seriei
fara p% (p=5) dintre
valorile extreme
Media aritmetica
ponderata

=
=
n
i
i
W
n
i
i
X
i
W
X
1
1

.


73
MSURI DE TENDINA CENTRALA
Mediana
Mediana este o valoare astfel nct jumtate dintre observaii i
sunt inferioare (sau egale) i cealalt jumtate superioare (sau
egale).
Mediana poate fi determinata si pentru o serie univariata cu date
ordinale
Procedura de calcul a medianei urmeaz urmtorii pai:
Se ordoneaz datele seriei n ordine cresctoare.
Se localizeaz poziia medianei n acest ir i se determin
valoarea ei.
74
MSURI DE TENDINA CENTRALA - mediana
Mediana
Procedura de calcul a
medianei:
Se ordoneaz datele
seriei n ordine
cresctoare.
Se localizeaz poziia
medianei n acest ir i
se determin valoarea
ei.
Me =
2
1 + n
X
.
Me =
2
1
2 2
+
+
n
X
n
X
.
75
MSURI DE TENDINA CENTRALA - mediala
Mediala
Procedura de calcul a
medianei:
Se ordoneaz datele
seriei n ordine
cresctoare.
Se localizeaz poziia
medianei n acest ir i
se determin valoarea
ei.
Mediala este rangul
valorii din seria
ordonata >= decit
mediana
ML =
2
1 + n
, daca n
este impar
ML =
1
2
+
n
.
daca n este par
76
MSURI DE TENDINA CENTRALA - modul
Modul (sau valoarea modal) sau dominanta unei serii
statistice este o valoare care are cea mai mare frecven din
serie.
Modul poate fi determinat si pentru o serie univariata
Dac seria statistic este prezentat sub forma unei tabele de
clase frecvene, modul corespunde centrului clasei de
frecven maxim.
Se vorbete de o distribuie de frecvene unimodal dac
tabela de frecvene are un singur maxim i de o distribuie de
frecvene multimodal dac are mai multe maxime.
77
MSURI DE TENDINA CENTRALA
Alte masuri de tendinta centrala:


Media geometrica
n
n
X ...
2
X
1
X
Media armonica
n
X X X
n
1
...
2
1
1
1
+ + +
Valoarea centrala
2
min
max
X X +
78
MSURI LOCALIZARE
Indicatori de localizare sau amplasare
Cvartilele
Percentilele
Decilele

79
Software
Epiinfo , Analysis Means
Media aritmetica,
Cvartilele
Mediana
Modul
Excel
Average, Geomean, Harmean, Percentile
Statistica
Descriptive statistics
80
MSURI DE DISPERSIE
Msuri de dispersie
Amplitudinea
Media deviaiei
Variaia (dispersia)
Abaterea standard (ecartul tip)
Eroarea standard
Coeficientul de variaie.
81
MSURI DE DISPERSIE
Amplitudinea
A = X
max
- X
min
.
X
max
=max{X
1
,,X
n
}
X
min
= min {X
1
,,X
n
}
82
MSURI DE DISPERSIE
Media deviaiei
de la medie
AD
X
=
n
n
i
X
i
X

=

1
,
- Media deviaiei
de la mediana
AD
Me
=
n
n
i
Me
i
X

=

1
.
83
MSURI DE DISPERSIE

Variaia (dispersia)
n
n
i
X
i
X
s

=

=
1
2
) (
2
,
S
2
=
1 n
n
s
2
.
Abaterea standard
(ecartul tip)
S =
2
S
.
Eroarea standard
n
s
ES =
.
Coeficientul de variaie
CV =
X
S
.
84
MSURI DE DE DISPERSIE - aplicatii
intervalul S X 1 conine circa 68.3 % din observaii
intervalul S X 2 conine circa 95.5 % din observaii
intervalul S X 3 conine circa 99.7 % din observaii.
85
MSURI DE DE DISPERSIE

Coeficientul de variaie.
- dac CV este sub 10% atunci populaia poate fi
considerat omogen;
- dac CV este ntre 10%-20% atunci populaia poate fi
considerat relativ omogen;
- dac CV este ntre 20%-30% atunci populaia poate fi
considerat relativ eterogen;
dac CV este peste 30% atunci populaia poate fi
considerat eterogen.
86
MSURI DE ASIMETRIE (Skewness)
n
S X X
n
i
i
3
1
3
] / ) [(
=

=
o
87
MSURI DE BOLTIRE (Kurtosis)
3
4
1
4
) (
1
4

=

=
S
n
i
X
i
X
n
o
88
Software statistic
Programul EPIINFO calculeaz, pentru seriile statistice
analizate, cu ajutorul comenzii MEANS din componenta
ANALYSIS,
statisticile de tendin central: mediana, media aritmetic,
valoarea modal,
statisticile de localizare: cvartilele, i valorile extreme
statisticile de dispersie: variaia, abaterea standard, eroarea
standard.
Nu are funcii predefinite pentru calculul coeficientului de variaie,
a abaterii medii de la medie i respectiv a abaterii medii de la
median.
Nu are funcii predefinite pentru calculul mediei geometrice i
respectiv a mediei armonice, ca i pentru indicatorii de simetrie i
boltire.
89
Software statistic
Programul Excel posed funcii predefinite pentru:
calculul mediei aritmetice (Average), mediei geometrice
(Geomean), mediei armonice (Harmean),
medianei (Median),
valorii modale (Mode),
media aritmetic corectat (Trimmean),
valorilor extreme (Max, Min),
dispersiei (Var), abaterii standard (Stdev), a abaterii medii de la
medie (AVEDEV),
a asimetriei (Skew), a boltirii (Kurt).
De asemenea, statistici descriptive de tendin central, dispersie,
localizare, simetrie i boltire se obin cu opiunea Descriptive statistics
a comenzii Data Analysis din Meniul Tools.

90
Software statistic
Programul STATISTICA posed o component
Descriptive statistics pentru calculul statisticilor
descriptive. In tabelele urmtoare sunt prezentate
statisticile descriptive pentru o serie VARSTA,
reprezentnd vrstele a 36 de pacieni.

Valid N
Mean
Confid.
-95%
Confid.
95%
Median Sum Minimum Maximum
VARSTA
36
36.6111
1
31.2257
9
41.9964
3
34.0000
0
1318.00
0
16.0000
0
76.0000
0
Lower
Quartile
Upper
Quartile
Range Variance Std.Dev Standard
Error
Skewness Kurtosis
VARSTA 23.5000 45.50000 60.000 253.3302 15.91635 2.652725 .789826 -.032274