Вы находитесь на странице: 1из 49

Eduardo Vergara Wekselman

Mdico Epidemilogo RNE # 20215


INFERENCIA ESTADISTICA
INFERENCIA ESTADISTICA
Muestra
Poblacin Objetivo
Inferencia
estadstica
Muestreo
Investigador
La inferencia estadstica se refiere a los mtodos y/o procesos para obtener
conclusiones acerca de poblaciones, basados en la informacin muestral.



POBLACION
MUESTRA
X
1
,...........,X
N

X
1
....,X
n

Antes de realizar cualquier inferencia estadstica es necesario identificar la
distribucin de probabilidad de la variable aleatoria que se pretende analizar.
Algunos instrumentos para ello son:
Histograma, rango de la variable.
Grficos de caja
Pruebas de ajuste a una distribucin (Test de Kolmogorov-Smirnoff).
Para llevar a cabo estos contrates en SPSS seguiremos:
Analizar la opcin Pruebas no parametricas K-S de una muestra donde se
debe seleccionar como distribucin de prueba: Normal
INTRODUCCIN
La media muestral (X) y la desviacin estndar (S) son buenos estimadores
puntuales de la media () y la desviacin estndar de la poblacin () .

Dado que los datos son las observaciones de una variable aleatoria, estos
estimadores son a la vez variables aleatorias.

Por lo tanto tienen una determinada distribucin, que en el caso de la media es
Normal.

As pues podemos calcular un intervalo de valores [a,b] tales que
) ( b X a P s s
= C
Grficamente: para una normal tipificada, un intervalo de confianza del 95% se
puede representar como:
95%
2.5%
2.5%
La probabilidad de que una
variable normal tipificada
tome valores en el
intervalo
[-1.96,1.96] es del 95%.
GRFICA DE UN INTERVALO DE CONFIANZA
INTERVALO DE CONFIANZA:
Intervalo construido bajo condiciones tales que con una cierta probabilidad
(usualmente 95%) contenga al parmetro deseado

Intervalo calculado de acuerdo a principios tales que 95 de cada 100
intervalos similarmente construidos contendrn el valor del parmetro

Uno puede tener 95% de confianza en afirmar que ese intervalo contiene el
valor real del parmetro
INFERENCIA ESTADISTICA
Definicin de Inferencia de Estadstica:

Es un proceso por medio del cul se elaboran conclusiones probabilsticas
en relacin a una poblacin, valindose de la informacin proporcionada
por una muestra de esa poblacin.


PROBLEMAS A RESOLVER MEDIANTE LA INFERENCIA
ESTADSTICA
1. Conocer la proporcin de estudiantes que fuman cigarrillos de la Facultad de
Medicina de la USMP
2. Un investigador esta interesado en comparar la efectividad de dos medicamentos en
el tratamiento de la Malaria
AREAS DE LA INFERENCIA ESTADISTICA
1. Estimacin de parmetros (Resuelve Problema 1)
2. Prueba de Hiptesis (Resuelve problema 2)
TIPOS DE ESTIMACIN POR PARAMETROS
La estimacin por parmetros es de dos tipos
1. Estimacin por punto
2. Estimacin por intervalo


ESTIMACIN POR PUNTO DE PARMETROS
Lo proporcionan sus respectivos estadsticos que se calculan en base a la
Muestra, es decir:
Parmetros Estadsticos
_ n
x = E x
i

i=1 n
n _
o
2
s
2
= E (x
i
- x)
2

i=1 n - 1
_ _

1
-
2
x
1
- x
2


P p = a/n,
donde a es el nmero de unidades que poseen el atributo de inters en la muestra
P
1
- P
2
p
1
- p
2
.

ESTIMACIN:
Puntual: Determina que posible valor del parmetro de la poblacin es ms
consistente con los datos observados en la muestra.
Ejemplo: el clculo de una tasa de incidencia, un RR o un promedio

Por intervalo: Cuantifica la incertidumbre o variabilidad que tiene una
estimacin.
Ejemplo: el clculo de un intervalo de confianza
Ejemplo 1 Estimacin de una media aritmtica
Se tiene inters en estimar la estatura media de los alumnos de la Facultad
de Medicina de la USMP. Para tal efecto se recurre a una muestra aleatoria
de 36 alumnos y se obtienen los siguientes resultados:
_
x = 170 cm y s = 20cm.
La estatura media de los alumnos est representado por (que es el
parmetro de la poblacin) y la estimacin por punto de este parmetro
est dado por :
_
x = 170 cm.

En relacin al ejemplo 1, construiremos un intervalo de confianza del 95% para la
estatura promedio () de los estudiantes de medicina.
Grado de confianza del 95% le corresponde un Z=1.96
_ __
Error estndar ES (x) = 20/\36 = 3.33
Por consiguiente:
L1= 170 1.96 *3.33 = 163.5 (6.52)
L2= 170 + 1.96 *3.33 = 176.5
e [163.5 , 176.5]
La estatura promedio de los estudiantes de la Facultad de Medicina de la USMP
est oscilando entre 163.5 y 176.5 cm con grado de confianza 95%

Ejemplo 2 Estimacin de una proporcin P
Inters: Estimar la proporcin de nios desnutridos menores de 5 aos de una
determinada comunidad.
Seleccionamos una muestra de 100 nios menores de 5 aos y se determina que 45 estn
desnutridos.
Se quiere estimar una proporcin de poblacin P = A/N, donde, A: n de nios menores
de 5 aos desnutridos en la poblacin y N: n de nios menores de 5 aos en la poblacin.
El estimador es: p = a/n donde a es el nmero de nios desnutridos en la muestra y n es
el tamao de muestra. Por consiguiente, p = 45/100 = 0.45. proporcin estimada de nios
desnutridos menores de 5 aos en la comunidad es de 0.45
ESTIMACIN POR INTERVALO
Consiste en determinar dos valores numricos L1 y L2 y que con un cierto
grado de confianza se espera que el valor del parmetro est comprendida
entre dichos valores.
Intervalo de confianza para la media
En este caso los valores L1 y L2 seran:
_ _
L1 = x - Z ES (x)
_ _
L2 = x + Z ES (x)
Donde:
Donde t
n-1
es el coeficiente de confiabilidad, cuyo valor se obtiene de la tabla
de distribucin t de Student con n-1 grados de libertad para el nivel de
confianza deseado.
Algunas caractersticas de la distribucin t de Student son:
La distribucin tiene forma acampanada.
Es simtrica respecto al punto t=0
Forma cola rpidamente a la derecha e izquierda; por lo tanto t es ms
variable que Z
La forma de la distribucin cambia conforme el valor de n. Es decir, para cada
grado de libertad (n-1) existe una curva simtrica.
A medida que n aumenta, t se aproxima a la normal Z.

Ejemplo 2
Se desea estimar el tiempo promedio de estancia hospitalaria para cierto tipo de
pacientes. Se toma una muestra de 25 historias clnicas y se calcula x =5,7 y s =
4,5 das.
Estimar con 95% de confianza.

Solucin: En este caso no se conoce luego el modelo de estimacin, ser:
L.S
= x t
n-1

s


\n

L.I.

Z : Es un coeficiente de confianza y cuyo valor depende del grado de
confianza (G.C.) que se establece, es decir:
G.C. : 90% 95% 99%
Z : 1.64 1.96 2.57
_ _
ES(x) : es el error estndar de x y se define como:
_ _
ES(x) = s/\n , donde s es la desviacin estndar de la muestra
Nota El coeficiente Z se utiliza cuando tamao de muestra n > 30.


Luego de la tabla t se obtiene para un nivel de significacin de 0,05
bilateral: t
24
= 2,064

= 5,7 2,064 4,5
\25
Interpretacin:
La probabilidad de que el tiempo promedio de estancia hospitalaria, en la
poblacin de pacientes, se encuentre entre 3.84 y 7.56, es de 0,95.

7,56 das
3,84 das
INTERVALO DE CONFIANZA PARA LA PROPORCIN P
L
1
= p - z \pq/n
L
2
= p + z\pq/n
donde q = 1 - p.
\pq/n = ES(p), nos indica el estimador del error estndar de la proporcin
de la muestra p
Segn la informacin que se dispone, se construye un intervalo del 95% para P:
Para una confianza del 95%, Z = 1.96
Reemplazando valores se tiene:
____________
L1 = 0.45 - 1.96 *\ 0.45(0.55)/100 = 0.352
____________
L2 = 0.45 + 1.96 *\ 0.45(0.55)/100 = 0.548.
La proporcin de nios menores de 5 aos desnutridos en dicha comunidad
est entre 0.352 y 0.548 con una confianza del 95%.
Nota Se utiliza el coeficiente de confianza Z
/2
si np y n(1-p) >5.

PRUEBA DE HIPTESIS
Es una tcnica estadstica que se sigue para decidir si rechazamos o no una
hiptesis estadstica en base a la informacin de una muestra.
Hiptesis estadstica:
Es una afirmacin de lo que creemos sobre una poblacin. Por lo general,
est hiptesis se refiere a los parmetros de la poblacin acerca de los
cuales se quiere hacer la afirmacin. (En la practica, se tiene idea de la
distribucin de la variable que se est estudiando)
Ejemplo 1: Un investigador pretende estudiar en forma comparativa la
eficacia de dos tratamientos (o procedimientos experimentales) para
determinar cul es el mejor

CARACTERSTICA DE LA HIPTESIS
Plantearse conceptual y operativamente.


Ser claras y precisas.

Ser especficas

Referirse a situaciones empricas y objetivas (no juicios de valor)

HIPTESIS DE INVESTIGACIN
Es una respuesta tentativa al problema planteado. Ella est basado
en la Observacin o en algn sistema terico.

TIPOS DE HIPTESIS ESTADSTICA
Hiptesis nula (H
o
) tambin se le denomina hiptesis de la no diferencia y se
establece para ser rechazada o desacreditada.
Considerando el ejemplo establecido en la hiptesis estadstica , las hiptesis nula
que les corresponde es:
H
o
:
A
-
B
= 0 (Tratamiento A no difiere de B)
Hiptesis alterna (H
1
) son todas las dems suposiciones o alternativas al problema
para contrastar H
o
.
La hiptesis alterna H
1
puede ser uni o bilateral.
Con respecto al ejemplo, se tiene:
H
1
:
A
-
B
> 0, (indica que tratamiento A es mejor que el tratamiento B. Ha
unilateral a la derecha)
H
o
verdadero H
o
Falso
Rechazar H
o
Error tipo I (o)
Decisin
correcta
(1-)
Decisin
estadstica
No rechazar H
o

Decisin correcta
(1-o)
Error tipo II ()

Nivel de significancia: o
En realidad
Cuando se toma una decisin estadstica, podemos cometer el error tipo I o
tipo II.
o = P(error tipo I) = P( Rechazar Ho / Ho es verdadero)
o puede ser manejada por el investigador, por consiguiente puede establecer
su valor, es decir, o=0.001, 0.01 , 0.05
o nos indica el nivel de significacin de la prueba, porque permite diferenciar
la regin de rechazo y no rechazo de la prueba.
1- o indica el grado de confianza de la prueba.
= P(error tipo II) = P(No rechazar Ho / Ho falso)
no se maneja directamente por el investigador.
o y estn relacionados y ambos disminuyen su valor si incrementamos el
tamao de muestra o si mejoremos el diseo del estudio.
1-= P(rechazar Ho/Ho es falso), tambin se denomina potencia de prueba.
Valor mnimo que puede tomar es del 80%.

Mostraremos estas cuatro probabilidades utilizando la
distribucin de medias y una prueba unilateral.

(1-o)
(1- |)
H
0
H
1

_
x
c

1

|
o
_
x
i

Zona de no rechazo de H
0
Zona de rechazo de H
0
|
o
IDENTIFICACIN DE HIPTESIS ESTADSTICAS
Hiptesis nula H
o
Hiptesis de Igual

La que contrastamos

Hiptesis Alternativa H
1
Hiptesis de Diferencia

Niega a H
0
(y creemos que es
mejor).

: H
: H
1
0
% 50 = p
% 50 = p
> s = , ,
> < = , ,
Bilateral Unilateral
CONTRASTES: UNILATERAL Y BILATERAL
Unilateral
Unilateral
Bilateral
H
1
: <70 H
1
: >70
H
1
: =70
REGIN CRTICA Y NIVEL DE SIGNIFICACIN
Regin crtica
Valores menos probables

Nivel de significacin: a
Nmero pequeo: 1% , 5%
Fijado de antemano por el investigador
Es la probabilidad de rechazar H
0
cuando es cierta

No rechazo H0

Reg. Crit.
Reg. Crit.
o=5%
H
0
: =70
SIGNIFICACIN : P
P
o
P o
85 = X
Se rechaza H
0
: =40

Se acepta H
1
: >40
El contraste es estadsticamente significativo cuando p<o
Decisin
Hiptesis Nula
H
0
cierta H
0
falsa
No Rechazar H
0
(1-)
Nivel de confianza

Error Tipo II
Rechazar H
0


Error Tipo I
(1- )
Potencia
ERROR TIPO I y ERROR TIPO II
Fuente.- Schefler. Bioestadstica.
Decisin
Realidad
Ninguna
Diferencia
Diferencia
Ninguna
Diferencia
(1-)
Diferencia
(1- )
Fuente.- Norman y Streiner. Bioestadstica.
Decisin
Realidad
H
0
cierta H
0
Falsa
No Rechazo H
0
Correcto
El tratamiento no tiene
efecto y as se decide.
Error de tipo II
El tratamiento si tiene efecto pero no
lo percibimos.
Probabilidad
Rechazo H
0

(Acepto H
1
)
Error de tipo I
El tratamiento no tiene
efecto pero se decide
que s.
Probabilidad
Correcto
El tratamiento tiene efecto y el
experimento lo confirma.
Fuente.- F. J . Barn Lpez. Universidad de Mlaga.
PASOS DE UNA PRUEBA DE HIPTESIS
a. Planteamiento de Hiptesis: H
0
y H
1

b. Nivel de Significacin ( = 0.05 = 0.01)

c. Contraste estadstico (segn escalas de medicin y diseo)

d. Significacin (resultado de p)

e. Decisin (Rechazar H
0
No Rechazar H
0
)

f. Conclusin (conduce a la decisin clnica terica)
RESUMEN: , p Y CRITERIO DE RECHAZO
Sobre el criterio de rechazo
Contraste significativo = p menor que a
Estadsticos de contraste
a
259753,500
462319,500
-2,317
,021
U de Mann-Whitney
W de Wi l coxon
Z
Si g. asi ntt. (bi l ateral )
Edad del
encuestado
Vari abl e de agrupaci n: Sexo del encuestado
a.
a. Estudio sobre nivel de hemoglobina en sangre y exposicin a la baja presin
de oxigeno en la altura.

b. Se tiene que en la poblacin general la media es 15.80 g /100 ml y con una
desviacin de 5 g/100 ml. En los hallazgos muestrales se hallo una media de
15.96 g/100 ml.

c. Planteando una hiptesis Bilateral: H
0
=
m
=
p

d. Nivel de Significancia al 5%


e. Estadsticos: EE = 0.05; Z = x / EE = 3.20

f. P es altamente significativo

g. Rechazar la H
0


h. Conclusin (conduce a la decisin clnica terica)
NIVEL CRITICO DE UNA PRUEBA ESTADISTICA
NIVEL CRITICO INTERPRETACION CONCLUSION
p > 0.05
Indica que la diferencia encontrada
es NO SIGNIFICATIVA y puede
deberse al azar del muestreo
No rechazar Ho
No hay evidencia suficiente para
rechazar
0.01 < p 0.05
Indica que la diferencia encontrada
ES SIGNIFICATIVA y que
probablemente no se deba al azar
Rechazar Ho a favor de Ha
hay evidencia suficiente para
rechazar
0.001 < p 0.01
Indica que la diferencia encontrada
es MUY SIGNIFICATIVA y
probablemente se deba a que hay
diferencias en la poblacin
Rechazar Ho a favor de Ha
hay evidencia suficiente para
rechazar
p 0.001
Indica que la diferencia encontrada
es ALTAMENTE SIGNIFICATIVA y
probablemente se deba a que hay
diferencias en la poblacin
Rechazar Ho a favor de Ha
hay evidencia suficiente para
rechazar

S p > , entonces No se puede rechazar la Hiptesis al nivel establecido
S p entonces se rechaza la Hiptesis al nivel establecido
ESQUEMA DE SELECCIN DE PRUEBAS ESTADSTICAS
Nmero
de grupos
1 grupo
2 grupos
3 grupos
n > = 30
Si
Prueba Z para la media
No
Distribucin
normal
Prueba T para la media
Prueba del signo
para la mediana
Si
No
Independientes
Independientes
Si
n > = 30
Prueba Z para la media
Si
No
Distribucin
normal
Distribucin
Normal c/varianzas
semejantes No
Si
ANVA Comparacin de Ttos0
Prueba de krustal-Wallis-Comp Ttos
Si
No
Distribucin
Normal c/varianzas
semejantes
No
Si
ANVA en bloque Comparacin de Ttos
Prueba de Friedman -Comp Ttos
Si
No
Varianzas
iguales
Prueba T
para de medias
Prueba T
Con ajustes de
g de libertad
Si
No
Prueba de Mann Whitney
para comparacin de poblac
No
n > = 30
Si
No
Prueba Z para la media
de la en datos apareados
Distribucin
normal
Si
No
Prueba T para la media de
La en datos apareados
Prueba del signo de
Wilcoxon para datos apareados
ESQUEMA DE SELECCIN DE PRUEBAS ESTADSTICAS CUANDO LA VARIABLE
DEPENDIENTE ES NOMINAL
Nmero
de grupos
1 grupo
2 grupos
3 grupos
Muestra grande
nP y n (1-P) > 5
Si
No
Independientes
Independientes
Si
Frecuencias
Esperadas
pequeas
Si
No
Frecuencias
Esperadas
pequeas
Si
No
No

Prueba Z para la proporcin poblacional


Prueba binomial p/ proporcin poblacional


Prueba exacta de Fisher
Comparacin de proporciones


Prueba Z o Prueba JI Cuadrado para
Comparacin de proporciones

Si
No

Prueba de McNemar
Comparacin de proporciones


Prueba JI Cuadrado (reunir categoras)
para comparacin de proporciones


Prueba JI Cuadrado para
Comparacin de proporciones

Prueba Q de Cochran
comparacin de tratamientos

ESQUEMAS DE SELECCIN DE PRUEBAS ESTADSTICAS PARA
MEDIR RELACIN ENTRE VARIABLES
Escala de
Medicin
para
ambas
variables
Continua
Ordinal y/ nmerica
Nominal
Coeficiente de correlacin lineal de Pearson
Cada variable
Tiene dos
Categoras
(tabla de 2x2)
Coeficiente de correlacin por rangos de Spearman
Prueba JI Cuadrado (Coeficiente )
Riesgo relativo (Estudios de cohorte)
Odds ratio (Estudios de casos-control)
Coeficiente de concordancia Kappa
(Comparacin de mtodos)
Prueba de JI Cuadrado para independencia
de variables (Coeficiente de contingencia)
CHI CUADRADO
Variables cualitativas
Dos o ms categoras excluyentes
Tablas de contingencia
Peso del nio al nacer. Estudio de seguimiento de 2000
gestantes.
Recin nacido de bajo peso
Gestante S No Total
Fumadora 43 (a) 207 (b) 250 (a+b)
No fumadora 105 (c) 1645 (d) 1750 (c+d)
Total 148 (a+c) 1852 (b+d) 2000
Para hallar los valores esperados
E = (a+b) x (a+c) = 250 x 148 = 18.5 (a)
n 2000
CHI CUADRADO
Peso del nio al nacer. Estudio de seguimiento de 2000
gestantes. (valores esperados)
Recin nacido de bajo peso
Gestante S No Total
Fumadora 18.5 (a) 231.5 (b) 250
No fumadora 129.5 (c) 1620.5 (d) 1750
Total 148 1852 2000
E = (a+b) x (b+d) = 250 x 1852 = 231.5 (b)
n 2000
E = (c+d) x (a+c) = 1750 x 148 = 129.5 (c)
n 2000
E = (c+d) x (b+d) = 1750 x 1852 = 1620.5 (d)
n 2000
X
2
= (43 - 18.5)
2
+ (207 - 231.5)
2
+ (105 - 129.5)
2
+ (1645 - 1620.5)
2

18.5 231.5 129.5 1620.5

X
2
= (24.5)
2
+ (-24.5)
2
+ (-24.5)
2
+ (24.5)
2
18.5 231.5 129.5 1620.5

X
2
= 600.25 + 600.25 + 600.25 + 600.25 = 32.44 + 2.59 + 4.6 + 0.37
18.5 231.5 129.5 1620.5
X
2
= 40.04



Para una seguridad del 95% ( =0.05) el valor terico de una distribucin ji-
cuadrado con un grado de libertad es 3,84.
Para =0.01 es de 6,63 y para =0.005 es de 7,88. Como quiera que en el
clculo del
2
en el ejemplo obtuvimos un valor de 40,04, que supera al valor
para =0.005.
Concluimos que las dos variables no son independientes, sino que estn
asociadas (p<0.005).
Por lo tanto, a la vista de los resultados, rechazamos la hiptesis nula (H
0
) y
aceptamos la hiptesis alternativa (H
a
) como probablemente cierta.

Вам также может понравиться