Вы находитесь на странице: 1из 11

Fundamentos y Tcnicas de Anlisis Bioqumico

Bloque repaso UD 5

UD 5- ESTADSTICA BSICA
NDICE
1-INTRODUCCIN
2-CONCEPTOS BSICOS
3-REPRESENTACIN DE LOS DATOS
3.1-TABLAS DE DISTRIBUCIN DE FRECUENCIAS
3.2-GRFICAS
4-MEDIDAS DE TENDENCIA CENTRAL
4.1-MEDIA
4.2-MEDIANA
4.3-MODA
5-CUARTILES Y PERCENTILES
6-MEDIDAS DE DISPERSIN
6.1-VARIANZA
6.2-DESVIACIN TIPICA O ESTNDAR
6.3-AMPLITUD DEL INTERVALO
6.4-COEFICIENTE DE VARIACIN
7-DISTRIBUCION DE VARIABLES CONTNUAS
8-LA CURVA NORMAL (Gaussiana)
9-LA DISTRIBUCION NORMAL ESTANDAR (TIPIFICACIN)
9.1-INTERPRETACION DE LAS AREAS DE LA CURVA NORMAL
9.2-USO DE LA TABLA DE AREAS BAJO LA CURVA NORMAL
10-ESTUDIO CONJUNTO DE DOS VARIABLES CUANTITATIVAS: CORRELACION Y
REGRESIN
10.1-DIAGRAMA DE DISPERSION
10.2-COEFICIENTE DE CORRELACION DE PEARSON
10.2.1-INTERPRETACIN DEL COEFICIENTE DE CORRELACION DE
PEARSON
10.2.2-FACTORES DE LOS QUE DEPENDE EL COEFICIENTE DE
CORRELACION DE PEARSON
10.3-REGRESION: ECUACIN DE LA RECTA
10.3.1-CLCULO DE LA ECUACIN DE REGRESIN POR EL MTODO
DE LOS MNIMOS CUADRADOS
10.4-ERROR DE ESTIMACIN O ERROR MUESTRAL
10.4.1-CLCULO DEL ERROR DE ESTIMACIN O ERROR MUESTRAL
EN DISTRIBUCIONES NORMALES (GAUSIANAS), N>30
10.4.2-CLCULO DEL ERROR DE ESTIMACIN O ERROR MUESTRAL
PARA
DISTRIBUCIONES
PEQUEAS
(N<30
DATOS)

DISTRIBUCIONES DE STUDENT
11-PRUEBA DEL JI (CHI) AL CUADRADO (2): PRUEBA DE INDEPENDENCIA ENTRE
DOS VARIABLES CUALITATIVAS
12-DETERMINACIN DEL TAMAO DE UNA MUESTRA
1

Fundamentos y Tcnicas de Anlisis Bioqumico

Bloque repaso UD 5

1-INTRODUCCIN
La Estadstica es la ciencia cuyo objetivo es recopilar, organizar y analizar una serie de
datos sobre individuos, grupos, series de hechos, etc. para deducir unos significados
precisos (ej. porcentaje de nios que nacern con una determinada enfermedad en una
determinada poblacin), o para decidir la aceptacin o rechazo de una hiptesis
previamente planteada (ej: fumar cigarrillos de tabaco puede provocar cncer de
pulmn?).
2-CONCEPTOS BSICOS
Poblacin es el conjunto de todos los individuos que tienen en comn alguna
caracterstica que puede ser observada y en los que se desea estudiar un
determinado fenmeno.
Tambin puede definirse como el grupo de individuos a los que se desea extrapolar o
aplicar los resultados obtenidos en una investigacin.
Ej: si se desea saber si el fumar cigarrillos de tabaco provoca cncer de pulmn, la
poblacin es todos los hombres o mujeres que fuman cigarrillos de tabaco.
La poblacin puede ser finita o infinita. Por ejemplo, si se desea saber el porcentaje de
enfermos hospitalizados en la Comunidad Valenciana que contraen una enfermedad
nosocomial (enfermedad infecciosa diferente del motivo del ingreso) la poblacin es
finita (suma de todos los pacientes de los hospitales de la red valenciana de salud).
Mientras que si se desea saber el porcentaje de nios que nacern con sndrome de
Down en madres mayores de 35 a. la poblacin es infinita ya que comprende todas las
mujeres del mundo mayores de 35 a.
Como la poblacin normalmente est formada por un n tan grande de individuos (que
es imposible procesar y analizar todos los datos posibles), la recopilacin de datos y su
anlisis posterior se efecta sobre una muestra de la poblacin objeto de estudio.
Muestra una parte de la poblacin en la cual se observa un fenmeno y del que se
recopilan los datos, se organizan y se analizan para, a partir de los resultados obtenidos,
aplicarlos al total de la poblacin.
Ej. para la poblacin mujeres mayores de 35 a. la muestra puede ser 2000 mujeres
mayores de 35 a. que han tenido un nio en el ltimo ao. Es obvio que sera imposible
recoger el resultado de todos los nacimientos de todas las mujeres del mundo aunque
solo fuera en el ltimo ao.
Estadstica descriptiva es la parte de la Estadstica dedicada a describir las
caractersticas de un conjunto de individuos (muestra) sobre los que se efectuar el
estudio estadstico.
Estadstica inferencial es la parte de la Estadstica dedicada a sacar conclusiones de
las caractersticas de la poblacin a partir del anlisis de los datos recopilados y
analizados en una muestra de esa poblacin.
Variable es cada una de las caractersticas que se estudian en una poblacin (o
muestra). Por ejemplo: estado civil, n de hijos, sexo, tipo de enfermedad, nivel de
colesterol, etc. A cada una de las posibles formas que puede adoptar la variable que se
estudie se le llama modalidad o categora.
2

Fundamentos y Tcnicas de Anlisis Bioqumico

Bloque repaso UD 5

Las variables pueden ser cualitativas, cuasicuantitativa (o semicuantitativa) o


cuantitativa (discreta o continua):
TIPO DE VARIABLE
Cualitativa

Semicuantitativa o
cuasicuantitativa

Cuantitativa discreta

Cuantitativa continua

CARACTERSTICAS
Son cualidades o atributos de la
muestra (y poblacin).
Estas cualidades no pueden ser
ordenadas de mayor a menor.
Son cualidades o atributos que
pueden ser ordenados de mayor
a menor (o viceversa)
Son atributos o caractersticas
que pueden ser contados, pero
entre dos valores no hay
valores intermedios.
Se llama discreta porque hay
vacios o interrupciones entre
dos valores.
Son atributos o caractersticas
que pueden ser contados, y
adems entre dos valores
puede haber infinitos valores
intermedios.

EJEMPLOS
Sexo, estado civil, tipo de
enfermedad
Grado de mejora en un
tratamiento:
nula,
leve,
moderada o mxima.
N de hijos: 1,2, 3, (no
puede ser 1,43 hijos)
N de infartos.
N de partos.
Etc.
Nivel de glucosa en sangre:
90/ 90,1/90,2/o
90,10/ 90,11/90,12
90,100/
90,101/90,102,

3-REPRESENTACIN DE LOS DATOS: TABLAS Y GRFICAS


Los datos que se van recogiendo en los estudios estadsticos pueden ser ordenados y
presentados de dos formas: en tablas de distribucin de frecuencias o en grficas.
3.1-TABLAS DE DISTRIBUCIN DE FRECUENCIAS
En un estudio estadstico, cuando se recogen los datos de una determinada variable de
una muestra (perteneciente a una poblacin objeto del estudio), los datos se pueden
presentar de esta forma:
Modalidades o
categoras de la
variable
m1
m2
m3
.
.
.
mj
Total =

Frecuencia absoluta
Xi
X1
X2
X3
.
.
.
Xi
N
(n
individuos
estudiados)

Frecuencia relativa
(o proporcin o tanto
por uno)

p1
p2
p3
.
.
.
pj

Porcentaje %

P1
P2
P3
.
.
.
Pi

Es condicin de la variable estudiada que cada caso (fenmeno o individuo) est solo
representado en una modalidad, por ejemplo, si la variable es el n de hijos, las
3

Fundamentos y Tcnicas de Anlisis Bioqumico

Bloque repaso UD 5

modalidades sern 1,2,3n. y cada mujer estudiada solo puede estar contemplada en
una modalidad (1 hijo, o dos hijos, o.., etc.).
La frecuencia absoluta es el n de casos (fenmeno o individuos) observados en el
estudio.
La frecuencia relativa es el cociente entre la frecuencia absoluta y el n total de casos
observados (N)
El porcentaje es la frecuencia relativa multiplicada por 100.
Las tablas difieren un poco segn el tipo de variable estudiada:
Tablas de distribucin de frecuencias para variables cualitativas.
Tablas de distribucin de frecuencias para variables cuasicuantitativas.
Tablas de distribucin de frecuencias para variables cuantitativas discretas.
Tablas de distribucin de frecuencias para variables cuantitativas continuas.
A continuacin se ver un ejemplo de cada tabla.

3.1.1-EJEMPLO DE TABLAS
VARIABLES CUALITATIVAS

DE

DISTRIBUCIN

DE

FRECUENCIAS

PARA

Se estudia la variable razn de ingreso en la unidad de Ginecologa del hospital H.


Es una variable cualitativa puesto que no se cuentan valores. La modalidades de la
variable son: postparto, preparto, preoperatorio y postoperatorio.
El n de camas estudiadas son 200 = N
Despus de recoger los datos de este hospital H, la tabla de distribucin de frecuencias
queda de la siguiente forma.

Modalidades de la
variable
Postparto
Preparto
Preoperatorio
Postoperatorio
Total =

Frecuencia absoluta

Frecuencia relativa
(o proporcin o tanto
por uno)

Porcentaje %

Xi
60
50
30
60
200
(N= camas estudiadas
con
pacientes
ingresadas)

3.1.2-EJEMPLO DE TABLAS DE
VARIABLES CUASICUANTITATIVAS

0,30
0,25
0,15
0,30
1
(como es tanto por
uno la suma debe dar
siempre 1)

DISTRIBUCIN

DE

30 %
25 %
15 %
30 %
100 %

FRECUENCIAS

PARA

En estos casos, adems de la frecuencia absoluta y la relativa, se puede calcular tambin


la frecuencia acumulada, la proporcin acumulada y el porcentaje acumulado.
Ejemplo: Se ha administrado un nuevo medicamento a 622 pacientes con trastornos
digestivos. De acuerdo con los criterios mdicos adoptados, se ha clasificado la variable
mejora en cuatro modalidades o categoras: mxima, moderada, leve o nula.
Despus de recoger los datos, la tabla de distribucin de frecuencias queda de la
siguiente forma:
4

Fundamentos y Tcnicas de Anlisis Bioqumico

Modalidades
de la variable

Frecuencia
absoluta

Bloque repaso UD 5

Frecuencia
relativa/proporci
n

Xi

Nula
Leve
Moderada
Mxima
TOTAL

147
129
212
134
622 = N
pacientes
estudiados

0,236
0,207
0,341
0,216

23,6 %
20,7 %
34,1 %
21,6 %

100 %

Frecuenci
a absoluta
acumulad
a
na

Frecuenci
a relativa
acumulad
a
pa

Porcentaj
e
acumulad
o

147
276
488
622

0,236
0,443
0,784
1

23,6 %
44,3 %
78,4 %
100%

La frecuencia absoluta acumulada se calcula:

Como norma antes de comenzar con los clculos, y para facilitar la interpretacin de
las frecuencias acumuladas, es mejor que se site la modalidad ms baja o
pequea arriba del todo y abajo la mayor.
Se comienza calculando la frecuencia acumulada para la modalidad ms inferior (en
este caso nula), anotando su frecuencia absoluta como acumulada (147).
Se sigue calculando la frecuencia acumulada de la modalidad siguiente (leve)
sumando a su frecuencia absoluta (129) la frecuencia acumulada de antes (147)
147 + 129 = 276
La frecuencia acumulada de la tercera modalidad (moderada) es su frecuencia
absoluta ms las dos anteriores 147 + 129 + 212= 488
Y as sucesivamente hasta llegar a la ltima modalidad (en este caso es mxima)
donde su frecuencia acumulada es su frecuencia absoluta ms las tres anteriores
147 + 129 + 212 + 134= 622 (que debe coincidir con N)
De forma semejante se calcula la frecuencia relativa acumulada y el porcentaje
acumulado siempre partiendo de la modalidad ms inferior y sumando cada vez
las siguientes modalidades superiores.

3.1.3-EJEMPLO DE TABLAS DE DISTRIBUCIN


VARIABLES CUANTITATIVAS DISCRETAS

DE

FRECUENCIAS

PARA

Son iguales que las tablas para variables cuasicuantitativas pero con valores numricos
en la columna de modalidades/categoras.
Ejemplo: se estudia el n de hijos en una muestra de 107 familias:
Modalidades
de la variable

Frecuencia
absoluta

Frecuencia
relativa
pi
Pi =

Xi

0
1
2
3
4
5
6
7
9
12
TOTAL

5
7
10
18
16
14
13
12
10
2
107

0,047
0,065
0,093
0,168
0,149
0,131
0,122
0,112
0,094
0,019
1

4,7 %
6,5 %
9,3 %
16,8 %
14,9 %
13,1 %
12,2 %
11,2 %
9,4 %
1,9 %
100 %

Frecuencia
absoluta
acumulada
na

Frecuencia
relativa
acumulada
pa

Porcentaje
acumulado
Pa

5
12
22
40
56
70
83
95
105
107

0,047
0,112
0,205
0,373
0,522
0,653
0,775
0,887
0,981
1

4,7 %
11,2 %
20,5 %
37,3 %
52,2 %
65,3 %
77,5 %
88,7 %
98,1 %
100 %
5

Fundamentos y Tcnicas de Anlisis Bioqumico

Bloque repaso UD 5

Como aqu la modalidad ms inferior es 0 hijos, se comienza a calcular la frecuencia


acumulada por ella y se van sumando las siguientes frecuencias.

3.1.4-EJEMPLO DE TABLAS DE DISTRIBUCIN


VARIABLES CUANTITATIVAS CONTINUAS

DE

FRECUENCIAS

PARA

Las tablas de distribucin de frecuencias para variables cuantitativas se realizan con los
datos agrupados en intervalos.
Ya hemos comentado que en estos casos, entre dos valores (de n enteros), puede haber
infinitos valores decimales. Por ello, para facilitar los clculos y la interpretacin, se
recurre a agruparlos por intervalos. Para ello se sigue el siguiente proceso:
1- Se determina la amplitud de la distribucin (A) el intervalo dentro del cual se
encuentran todos los valores de la variable. Se calcula restando al valor mximo el valor
mnimo:
A = X mx. X mn.
2-Se fija o elige el n de intervalos que queremos en la representacin de resultados
depende del tamao de la muestra.
Teniendo en cuenta que si hay pocos intervalos se perder parte de la informacin y si
hay muchos la tabla ser excesivamente larga.
Algunos autores recomiendan que el n de intervalos sea la raz de N ( ) (n de datos),
por tanto se seguir este criterio.
3-Se calcula la amplitud de los intervalos (i) se calcula dividiendo la amplitud de la
distribucin (A) por el n de intervalos:

El valor que salga de esta frmula puede redondearse.


4-Se determina el lmite inferior del 1 intervalo: no hay una regla fija para este valor,
puede ser el valor ms pequeo observado en la variable o un mltiplo de la amplitud de
intervalo.
5-Con estos datos se construye ya la tabla de distribucin de frecuencias.
Ejemplo: se han obtenido en gramos las siguientes medidas de albmina total en el suero
de 30 varones de edades entre los 25 -35 aos:
124
110
132
142

116
123
140
124

144
115
121
122

133
123
139

109
138
126

120
127
130

146
111
139

114
125
131

112
137
125

Como es una variable cuantitativa continua suponemos que cada valor discreto (entero)
representa a todos los infinitos valores comprendidos entre media unidad a su izquierda y
media unidad a su derecha ej, el valor discreto 112 representa a todos los valores
comprendidos entre 111,5 y 112,5
Se construye la tabla siguiendo el protocolo anterior:

Fundamentos y Tcnicas de Anlisis Bioqumico

Bloque repaso UD 5

Se podran restar los valores mx. y mn. observados: 146 109 =


37
Pero es mejor restar 0,5 unidades de estos valores mx. y mn.
146,5 108,5 = 38
Esto es debido a que se supone que el valor mximo observado,
(146) representa todos los valores comprendidos entre media unidad
a su izquierda (146,5) y media unidad a su derecha (145,5) es decir ,
Amplitud de la
que representa a todos los valores comprendidos entre 146,5
distribucin
145,5 por tanto el mx. valor es 146,5
(A)
Y por otro lado se supone que el valor mnimo observado (109)
representa a todos los valores comprendidos entre media unidad a
su izquierda (109,5) y media unidad a su derecha (108,5) es decir ,
que representa a todos los valores comprendidos entre 109,5
108,5 por tanto el mn. valor es 108,5.
En resumen:
A = (Valor mx. observado + 0,5) (Valor mn. observado - 0,5)
Se recomienda que sea:
n de intervalos
Amplitud de los =
38 /5 = 7,6 8
intervalos (i)
Se aconseja redondear para facilitar la interpretacin de la tabla.
No hay reglas fijas.
Se aconseja tomar valores visualmente agradables.
Se aconseja que todos los intervalos sean iguales.
Puede ser el mnimo valor observado = 109
Lmite inferior Puede ser un n donde el valor mnimo observado (109) se halle en
el centro del intervalo en el caso anterior, como el intervalo se fija
del 1 intervalo
en 8 unidades, para que el 109 est en el centro sera 105 el lmite
inferior.
Cuando las modalidades son n con varios decimales a veces es
necesario realizar varios ajustes antes de tener los intervalos
apropiados.
Ahora se construye la tabla de distribucin de frecuencias, en este caso se ha elegido
como valor lmite inferior 105.
Recordemos que es mejor situar los intervalos de menor a mayor:
Porcentaje

Intervalos

Recuento

Frecuencia
absoluta

Frecuencia
relativa

%
Pi

Frecuencia
absoluta
acumulada

na

Xi

105-113
114-122
123-131
132-140
141-149
TOTAL

////
//// /
//// ////
//// //
///

4
6
10
7
3
30

0,13
0,20
0,34
0,23
0,10
1

13 %
20 %
34 %
23 %
10 %
100 %

4
10
20
27
30

Frecuencia
relativa
acumulada

Porcentaje
acumulado

Pa

pa

0,13
0,33
0,67
0,90
1

13
33
67
90
100

Fundamentos y Tcnicas de Anlisis Bioqumico

Bloque repaso UD 5

Se llaman lmites aparentes de la variable a los valores que marcan los extremos de
los intervalos en este caso son los nmeros 105, 113, 114, 122, 123, 131, 132, 140,
141 y 149.

Sin embargo, como la variable es continua, es decir con infinitos valores entre un valor
discreto y otro, se definen otros lmites, los lmites reales o exactos de la variable
que comprenden media unidad por arriba y por debajo de cada lmite aparente en
este caso seran 104,5; 113,5; 122,5; 131,5; 140,5 y 149,5. Estos valores tambin se
pueden utilizar para marcar los lmites de los intervalos. Si esto lo vemos representado
en una tabla sera:
Lmites
Lmites reales o
Marca de clase o Punto medio del intervalo
aparentes
exactos
Xj
105 113
114 122
123 - 131
132 140
141 - 149

104,5 - 113,5
113,5 - 122,5
122,5 - 131,5
131,5 - 140,5
140,5 - 149,5

109
118
127
136
145

La marca de clase es el punto medio del intervalo representa al intervalo y es la


semisuma de los lmites del intervalo. Es til para representar los polgonos de
frecuencias. Da igual sumar los lmites aparentes o los exactos porque da el mismo
resultado:

Por otro lado, al establecer dos intervalos consecutivos, por ejemplo de 113,5 a 122,5 y
de 122,5 a 131,5, hemos de decidir si el valor 122,5 (final de uno e inicio del siguiente)
pertenece al primer intervalo o al segundo. Para ello empleamos los smbolos [ y
Si empleamos [ (delante del intervalo) o ] (detrs del intervalo) el valor
situado junto a l pertenece al intervalo.
Si empleamos (delante del intervalo) o [ (detrs del intervalo) el valor
situado junto a l no pertenece al intervalo.
Por ejemplo se pueden anotar los intervalos de la siguiente forma:
Lmites reales o
exactos

Significado

[104,5 - 113,5[
[113,5 - 122,5[
[122,5 - 131,5[
[131,5 - 140,5[
[140,5 - 149,5[

El valor 113,5 pertenecer al 2 intervalo y no al1 porque queda excluido


del 1 al colocar el smbolo [

3.2-REPRESENTACIONES GRFICAS
Es otra forma de ofrecer los resultados de un estudio estadstico. Pueden ser:
Diagramas de barras
Diagramas de sectores
Histogramas
Polgonos de frecuencias.
8

Fundamentos y Tcnicas de Anlisis Bioqumico

Tipo de
grfica

Diagramas de
barras

Se emplea para
representar

Variables
cualitativas,
cuasicuantitativas o
cuantitativas
discretas

Variables
cualitativas,
Diagramas de
cuasicuantitatisectores
vas o
cuantitativas
discretas

Pictogramas

Variables
cualitativas,
cuasicuantitativas o
cuantitativas
discretas

Caractersticas

Bloque repaso UD 5

Aspecto

Conjunto de barras
separadas sobre un eje
de
coordenadas:
la
altura de la barra es la
frecuencia
de
la
modalidad
(absolutas,
relativas o %).
La base de las barras
es la misma para todas
ellas.
Si
la
variable
es
cuantitativa el orden
de las barras es
indiferente.
Si
es
cuasicuantitativa
o
cuantitativa discreta se
respeta el orden de
menos a ms.
Crculo con sectores de
diferentes colores.
Cada sector representa
una modalidad.
El tamao del cada
sector es proporcional
a cada frecuencia el
tamao se calcula con
una regla de tres
sabiendo que la suma
de todas las frecuencias
debe corresponder con
los 360 del crculo.

Un dibujo representa la
variable estudiada.
El tamao del dibujo o
en n de dibujos que se
incluyan en el grfico es
proporcional
a
la
frecuencia.

Fundamentos y Tcnicas de Anlisis Bioqumico

Bloque repaso UD 5

Intervalos diferentes

Variables
cuantitativas
continuas

Conjunto
de
rectngulos adosados
unos a otros.
La
base
de
los
rectngulos
es
la
amplitud del intervalo.
Puede ser la misma o
diferente.
La altura de cada
rectngulo
es
proporcional
a
la
frecuencia
(absoluta,
relativa o al %)

Variables
Polgonos de
cuantitativas
frecuencias
continuas

Se obtiene a partir del


histograma
de
frecuencias
uniendo
mediante
una
lnea
poligonal las alturas de
cada una de las marcas
de clase de los distintos
rectngulos.
La lnea poligonal corta
por ambos extremos en
las abscisas en los
puntos medios de los
intervalos anterior y
posterior al histograma.

Histogramas

Intervalos iguales

EJEMPLO DE REPRESENTACIN DE DIAGRAMA DE BARRAS


En el eje de ordenadas puede representarse la frecuencia absoluta o el %. En este caso
lo representamos con los %:
Modalidades de la variable

Frecuencia
absoluta
Xi

Nula
Leve
Moderada
Mxima

147
129
212
134

TOTAL =N pacientes
estudiados

622

23,6 %
20,7 %
34,1 %
21,6 %

10

Fundamentos y Tcnicas de Anlisis Bioqumico

EJEMPLO DE
FRECUENCIAS

REPRESENTACIN

Bloque repaso UD 5

DE

HISTOGRAMA

POLGONO

DE

Se han estudiado los niveles de albmina en el suero de 30 varones entre 25 35 aos


con los siguientes resultados:
Intervalos
aparentes

105-113
114-122
123-131
132-140
141-149

Intervalos
reales

Frecuencia absoluta

Xi

104,5 -113,5
113,5-122,5
122,5-131,5
131,5-140,5
140,5-149,5

TOTAL

En este caso en las ordenadas se


han representado las frecuencias
absolutas

4
6
10
7
3

30

11

Вам также может понравиться