Inferencia Estadistica. Estimacion

INFERENCIA ESTADÍSTICA
ESTIMACIÓN
Conjunto de métodos que permiten obtener
conclusiones acerca de una población, a
través de la información proporcionada
por una muestra.
Utiliza un procedimiento inductivo que va de
lo particular (la muestra) a lo general (la
población)
INTRODUCCIÓN:
• Comienzo: Pregunta/s o hipótesis a investigar en una población
• Población o universo: Conjunto de individuos o elementos en los que se desea

estudiar alguna/s característica/s.
• Muestra: Parte o subconjunto representativo de una población.
• Errores aleatorios (imposible de controlar) y errores sistemáticos (asociados al

proceso de medición: elección, instrumento,…)
• Objetivo fundamental de la Inferencia Estadística clásica:

Responder a la/s pregunta/s a investigar sobre la población a partir de la información
obtenida en la muestra, tratando de disminuir en lo posible los errores que no sean
aleatorios.
INTRODUCCIÓN:
• Diseño experimental: Conjunto de procedimientos necesarios para llevar a

cabo el objetivo anterior. Se compone de
-Determinación de la población
-Determinación de las variables y forma de medirlas
-Elección de la muestra: Técnicas de muestreo
-Utilización de técnicas estadísticas inferenciales:
Estimación puntual
Estimación por intervalos de confianza
Contrastes de hipótesis
-Conclusión
• Tipos de inferencia:
-Paramétrica
-No paramétrica
EL PROCESO DE LA INFERENCIA ESTADÍSTICA

Pregunta/hipótesis
Variables
Técnicas muestreo Estadística

descriptiva
Respuesta
μ
Técnicas inferenciales
TÉCNICAS DE MUESTREO
Conjunto de técnicas que permiten obtener muestras representativas de la población
tratando de evitar los errores no producidos por el azar (errores sistemáticos o
sesgos).
Muestreo probabilístico :
Cada individuo de la población tiene una probabilidad específica de ser seleccionado.
Proporciona muestras con una base rigurosa para asegurar la representatividad de la
población, que pueden utilizarse en la construcción de intervalos de confianza o en los
contrastes de hipótesis.
Ej.:Muestreos aleatorios simples, sistemático, estratificado, por conglomerados.
Muestreo no probabilístico :
Cada individuo de la población no tiene una probabilidad específica de ser seleccionado.
Proporciona muestras lo más parecidas posible a una muestra probabilística de la
población, con la ventaja de ser menos costosas.
Ej.: Muestreo por cuotas, muestreo de casos consecutivos.
TÉCNICAS DE MUESTREO : Probabilísticas

Muestreo aleatorio simple:
Es el proceso de enumerar cada unidad de la población accesible y, a continuación,
seleccionar la muestra al azar. En este tipo de muestreo se garantiza que todos los
elementos de la población tienen la misma probabilidad de ser incluidos en la muestra.
Muestreo sistemático:
Ordenadas las unidades en una lista, consiste en una selección según un proceso
periódico, eligiendo el punto de partida al azar.
Muestreo estratificado:
Consiste en dividir la población en subgrupos, de acuerdo con ciertas características
(sexo, edad, …) y luego extraer una muestra al azar a partir de cada uno de los “estratos”
Muestreo por conglomerados:

Consiste en extraer una muestra al azar a partir de agrupaciones (conglomerados)
naturales de individuos dentro de la población. Resulta muy práctico cuando la población
está muy dispersa y es muy costoso confeccionar una lista de todos sus elementos.
TÉCNICAS DE MUESTREO : No Probabilísticas
Muestreo por cuotas:

Se utiliza mucho en sondeos de opinión y estudios de mercado. Se divide a la población
en estratos, y se asigna un número de individuos a elegir en cada estrato, proporcional a
al peso del estrato, para configurar una muestra de tamaño n con el total de estratos. Se
diferencia del muestreo estratificado en que el investigador es libre de elegir a los sujetos
de la muestra dentro de cada estrato
Muestreo de casos consecutivos:

Consiste en elegir a cada individuo que cumpla con unos criterios de selección y dentro de
un intervalo de tiempo, hasta alcanzar un número definido de antemano. En muchos
casos, es la técnica más factible en Medicina
ESTIMACIÓN DE PARÁMETROS
Estadístico:
Cualquier función de los valores muestrales que puede utilizarse para
estimar parámetros o para ayudarnos a decidir ante las posibles
respuestas a una pregunta o hipótesis sobre la población.
Ejemplos:
n
x  20
n
 ( xi  x )
n 2
 xi  ( xi  x )
2
i 1
x  i 1 S
i 1 s s
n n n 1 n
Estimador :
Parámetro de los valores muestrales obtenido para dar una idea acerca del parámetro
de la población de la que se tomó la muestra.
El valor de un estimador depende de la muestra.
POBLACIÓN
☺☺☺☺☺☺☺☺
☺☺☺☺☺☺
☺☺☺☺☺☺☺☺
☺☺☺☺☺☺☺☺ Parámetros muestrales
 Modelo de probabilidad Estimadores : p, x , S ó s
 Parámetros poblacionales: , , 
Ejemplo :
Un anatómico quiere conocer la longitud media (en cm.) del brazo derecho en la
población de varones adultos.
Toma una muestra de

100 individuos con mas Mide en cada uno
Calcula
x  58.17 cm.
el brazo derecho
de 25 años s  30.9 cm.
• Ha utilizado un muestreo no probabilístico de casos consecutivos
• Ha estimado :
Con x  La media poblacional

de La población de varones adultos.
Con s  La desv. típica pobl.
Distribución en el muestreo de un estadístico:
Los estadísticos y estimadores son variables aleatorias que tendrán una

distribución de probabilidad con una media y una desviación típica.
Ejemplo:
Si llamamos X a la variable aleatoria cuyos valores resultan de obtener

las medias de muestras del mismo tamaño (n), X será una variable
aleatoria y, por tanto, tendrá una media y una varianza (y desv. típica):
μX σ  EE(X)
X
Y si fuera posible saber cómo se distribuye (con qué modelo), podríamos

calcular probabilidades de que X se encuentre en el intervalo que nos interese
Ejemplo: Distribución de valores de la media muestral

Puede demostrarse que:
La desviación típica de x
ó
Error estándar de la media :
s
EE ( x ) 
n
siendo s la desviación
típica de la muestra
(en nuestro ejemplo)

cm 30.9
EE( x )   3.09
Distribución de la longitud media del brazo de varones adultos 100
en base a 200 muestras de 100 individuos de una población
de varones adultos.
CARACTERÍSTICAS DESEABLES DE LAS ESTIMACIONES

(ó valor de la información que nos proporciona nuestra muestra)
• Nuestra muestra nos proporciona uno de los posibles valores que nos permite
estimar a un parámetro de la población.
• Cuando la media de los posibles valores que pueden estimar al parámetro de la
población coincide con tal parámetro, se dice que el estimador es insesgado.
Ej: E( x) =  , E(S2) = n  1 σ 2 , E(s2) = 2

n
• Para medir cuánto de fiable es el valor de la estimación de nuestra muestra, se tiene
el error estándar del estimador, que trata de captar la variabilidad que tienen los
valores del estimador en todas las posibles muestras de un tamaño determinado.
s p(1  p )
EE ( x )  EE ( p ) 
n n
• Generalmente, en el error estándar de cualquier estimador, el tamaño de la muestra
figura en el denominador, lo que significa que cuanto mayor sea el tamaño, menor
será el error estándar
Algunas distribuciones en el muestreo:
RESULTADO 1 (Teorema Central del Límite): Si x1, x2, x3, ..., xn es una
muestra aleatoria procedente de una población cualquiera con media  y
desviación típica , puede deducirse que cuando n crece
xμ
•Z= σ tiende a tener una distribución parecida a la N(0, 1)
n
ó también
• x tiene una distribución parecida a la N(; n )

Si x1, x2, x3, ..., xn es una muestra aleatoria procedente de una población
N  ,  , y siendo n n
 i  ( xi  x )
2
x
x  i 1 , s 2  i 1
n n 1
pueden deducirse los siguientes resultados:
x
• (RESULTADO 2): Z  se distribuye con una distribución N(0, 1).

n
x
• (RESULTADO 3): T  se distribuye con una distribución T-Student
s
n
con (n-1) grados de libertad: t(n-1).
• (RESULTADO 4): X  (2n  1)  s 2

se distribuye con una distribución
2

Chi-cuadrado con (n –1) grados de libertad: 2(n-1)
Distribución t-Student:
Función densidad de distribuciuones t-Student
0,4
0,3
0,2
0,1
0
-6 -4 -2 0 2 4 6
x
Cuando n tiende a , la distribución t(n) se aproxima a N(0,1)

Distribución Chi-cuadrado:
Función densidad de distribuciones Chi-cuadrado

0,1
0,08
0,06
0,04
0,02
0
0 20 40 60 80
x
Sólo toma valores positivos

ESTIMACIÓN
INTERVALOS DE CONFIANZA
• Los estimadores proporcionan una estimación puntual de los parámetros de la

población, pero no proporcionan ninguna idea de la precisión de tal estimación ni de la
probabilidad de que tal estimación sea la correcta.
• Los intervalos de confianza son un medio de conocer el valor de un parámetro en

una población, midiendo el grado de error debido al azar que lleva implícito el proceso.
Definición:
• Un intervalo de confianza es un método de estimación que permite estimar un

parámetro poblacional a partir de un intervalo aleatorio (L 1, L 2) del que se tiene
una cierta confianza, medida en probabilidad, de que contiene al verdadero valor
del parámetro poblacional.
•Su construcción se basa en obtener los extremos L1 y L2 (estadísticos) a partir de las

distribuciones en el muestreo.
ESTIMACIÓN
Intervalo de Confianza para  de N(,) con  conocida :

Por ejemplo, si x1, x2, x3, ..., xn es una muestra aleatoria procedente de una
población N(, ) con  conocida, utilizando el resultado 2, se distribuye x
como una N(0,1), y utilizando el percentil z1 de la N(0,1) se tendrá que:
  2
x 
P  z    z    1
 1 2  1 
 n 2

   
De la expresión anterior se deduce que: P  x  z    xz     1
 1
2
n 1
2
n 
indicando que hay una probabilidad de (1-) de que el verdadero valor de la
media  de la población se encuentre entre las cantidades L1 y L2.
 , xz

I.C.() = ( x  z     )
1 n 1 n
2 2
INTERVALO AL 100·(1-)% DE CONFIANZA PARA 
CUANDO SE CONOCE 
ESTIMACIÓN
Ejemplo:
Si queremos construir un IC al 95% para la media de pulsaciones por
minuto de una población Normalmente distribuida con  = 10, y hemos
obtenido con una muestra de 49 individuos que x =90:
10 10
( 90  z 0.975  , 90  z 0.975  )
49 49
(90 – 1.96·1.43, 90+1.96·1.43)
(87.20, 92.80) al 95% de confianza

ESTIMACIÓN
Intervalo de Confianza para  de N(,) con  desconocida :

x
Utilizando el resultado 3, T  tiene una distribución t-Student con n-1
s
n
grados de libertad.
Utilizando el percentil t1 ( n  1) de la t-Student se tendrá que:

2
I.C.() = ( x  t
s , s )
 ( n  1)  x  t  ( n  1) 
1 n 1 n
2 2
INTERVALO AL 100·(1-)% DE CONFIANZA PARA 
CUANDO SE DESCONOCE 
ESTIMACIÓN
Ejemplo:
Si queremos construir un IC al 95% para la media de IMC en
Hipertensos, y hemos obtenido con una muestra de 20 individuos una
media de x = 31.85 y una desviación típica de s = 5.21, se tendrá:
5.21 5.21
( 31.85  t 0.975 (20  1)  , 31.85  t 0.975 (20  1)  )
20 20
(31.85 – 2.44, 31.85+2.44)


(29.41, 34.29) al 95% de confianza

ESTIMACIÓN
• En general, si el estimador muestral sigue una distribución Normal, un intervalo de

confianza para el parámetro de la población viene dado por
estimador ± z • EE
donde EE es el error estándar del estimador y z es un percentil de N(0;1), que

depende del nivel de confianza (1-) con que se quiera obtener el intervalo:
(para niveles de 0.90, 0.95 y 0.99 los valores de z son 1.64, 1.96 y 2.58 respect.).
• Al valor  se le denomina nivel de error.
• Al desvío z• EE que se suma y resta al estimador se le denomina error de estimación

ó precisión del IC.
• Este tipo de intervalos puede utilizarse incluso en los casos en que la población no
sea Normal para tamaños de muestra grandes (n>50), gracias al Teorema Central del
Límite (Resultado 1)
MODELOS Y TÉCNICAS INFERENCIALES
Interpretación de los intervalos de confianza
Que la confianza de un intervalo es del 95% significa que, por término medio, de cada
100 de los intervalos que podemos construir con muestras de este tamaño, 95 de ellos
contendrán en su interior el valor del parámetro de la población.
Ejemplo (continuación)
En el caso del anatómico :x  58.17 cm. s  30.9 cm.
s 1- = 0.90  z1-/2=1.64
I.C.( )  x  z1- 1- = 0.95  z1-/2=1.96
2 n
1- = 0.99  z1-/2=2.58
30.9
I.C.0.95 ( )  58.17  1.96  (52.11 , 64.23 )
100
I.C.0.90 ( )  58.17  .......... .....  ( , )
I.C.0.99 () 
Ejercicio :
Construir un IC al 99% para la media de IMC en Hipertensos, a partir de una muestra
de 20 individuos en los que la media de IMC es = 31.85 y la desviación típica s = 5.21
Tamaño de muestra para la media  con una confianza dada
El número de observaciones que debe tomarse para que el error de estimación z•EE
no supere un valor ε dado con una confianza (1-) viene dado por :
2
z   s
1
n  2  donde s es la d.t. de una muestra piloto
   (Si se conociera , se utilizaría en lugar de s)
 
Ej.: El tamaño de muestra para un IC99%() del IMC con una precisión  = 1, siendo
s = 5.21 de una muestra piloto, es:
2
z   s 2
 1 2   2.56  5.21  n = 178
n   177.89
   1 

 
 
ESTIMACIÓN
Intervalo de confianza para 2 de N(,) con  desconocida :

( n  1)  s 2
Utilizando el resultado 4,X  2
tiene una distribución chi-cuadrado
 2 ( n  1) con n -1 g.l.  2
Utilizando los percentiles   ( n  1) y   ( n  1) se tendrá que:

2 2
1
2 2
 2 (n 1)  s2 
P  (n 1)    2
 ( n  1)  1
 2  2 1
2 
y de la expresión anterior se puede deducir que:
 
 2
I.C.(2) =  ( n  1)  s , ( n  1)  s 
2
   ( n  1)   ( n  1) 
2 2
 1 2 2 
INTERVALO AL 100·(1-)% DE CONFIANZA PARA 2
CUANDO SE DESCONOCE 
ESTIMACIÓN
Ejemplo:
Si queremos construir un IC al 99% para  de IMC en Hipertensos,x y

hemos obtenido con una muestra de 20 individuos una media de =
31.85 y una desviación típica de s = 5.21, se tendrá:
 19  5.212 19  5.212   515 .74 515 .74 
2   2
 (19 )
, 2
 (19 )
  
38 . 632
,
6 . 825
  (13.35 , 75.57 )
 0.995 0.005   
( 13.35 , 75.57 )  (3.65 , 8.69 )

ESTIMACIÓN
Intervalo de confianza para una proporción aproximado por la Normal:

Si x1, x2, x3, ..., xn es una muestra aleatoria procedente de una población donde los
individuos pueden presentar o no una característica con probabilidad  (proporción
poblacional), y x es el número de los que la presentan entre los n elegidos, entonces si
llamamos p = x/n (proporción muestral)
x  N ( n , n (1   ) )  p  x / n  N (  ,  (1   ) / n )
siempre que : x = n·p > 5 ; p > 0.05
n – x = n·(1-p) > 5 ; (1-p) > 0.05
El resultado anterior obtenido en el muestreo, nos permite construir un intervalo de

confianza para la proporción poblacional , dado por
 p  (1  p ) 1 p  (1  p ) 1 
  p  z   , pz  
 1 n 2 n 1 n 2n
 2 2 
INTERVALO AL 100·(1-)% DE CONFIANZA PARA 

válido si n·p > 5 ; n·(1-p) > 5 ; p > 0.05 ; (1-p) > 0.05
ESTIMACIÓN
Ejemplo:
En el caso de querer estimar mediante un IC al 99 % la proporción de
fumadores en una población, a partir de una muestra de 80 individuos,
de los cuales 37 fumaban, se tendrá:
p  37  0.46 1  p  0.54 z 0.995  2.576

80
 0.46  0.54 1 0.46  0.54 1 
   0.46  2.576  , 0.46  2.576  
 80 2  80 80 2  80 
  (0.31, 0.61) al 99% de confianza
Tamaño de muestra para una proporción 

El número de observaciones que debe tomarse para que el error de estimación z•EE
no supere un valor  dado con una confianza (1-) viene dado por :
z2   p  (1  p) donde p es una estimación de una muestra piloto

1
2
n (Si no se conociera p, se utilizaría p=1/2)
2

Inferencia Estadistica. Estimacion

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Inferencia Estadistica. Estimacion

Загружено:

Авторское право:

Доступные форматы

INFERENCIA ESTADÍSTICA

• Comienzo: Pregunta/s o hipótesis a investigar en una población

• Población o universo: Conjunto de individuos o elementos en los que se desea

• Muestra: Parte o subconjunto representativo de una población.

• Errores aleatorios (imposible de controlar) y errores sistemáticos (asociados al

• Objetivo fundamental de la Inferencia Estadística clásica:

• Diseño experimental: Conjunto de procedimientos necesarios para llevar a

EL PROCESO DE LA INFERENCIA ESTADÍSTICA

Técnicas muestreo Estadística

TÉCNICAS DE MUESTREO : Probabilísticas

Muestreo por conglomerados:

TÉCNICAS DE MUESTREO : No Probabilísticas

Muestreo por cuotas:

Muestreo de casos consecutivos:

Toma una muestra de

Con x  La media poblacional

Distribución en el muestreo de un estadístico:

Los estadísticos y estimadores son variables aleatorias que tendrán una

Si llamamos X a la variable aleatoria cuyos valores resultan de obtener

Y si fuera posible saber cómo se distribuye (con qué modelo), podríamos

Ejemplo: Distribución de valores de la media muestral

(en nuestro ejemplo)

CARACTERÍSTICAS DESEABLES DE LAS ESTIMACIONES

Ej: E( x) =  , E(S2) = n  1 σ 2 , E(s2) = 2

Algunas distribuciones en el muestreo:

• x tiene una distribución parecida a la N(; n )

• (RESULTADO 4): X  (2n  1)  s 2

Cuando n tiende a , la distribución t(n) se aproxima a N(0,1)

Algunas distribuciones en el muestreo:

Función densidad de distribuciones Chi-cuadrado

Sólo toma valores positivos

• Los estimadores proporcionan una estimación puntual de los parámetros de la

• Los intervalos de confianza son un medio de conocer el valor de un parámetro en

• Un intervalo de confianza es un método de estimación que permite estimar un

•Su construcción se basa en obtener los extremos L1 y L2 (estadísticos) a partir de las

Intervalo de Confianza para  de N(,) con  conocida :

(90 – 1.96·1.43, 90+1.96·1.43)

(87.20, 92.80) al 95% de confianza

Intervalo de Confianza para  de N(,) con  desconocida :

Utilizando el percentil t1 ( n  1) de la t-Student se tendrá que:

(31.85 – 2.44, 31.85+2.44)

(29.41, 34.29) al 95% de confianza

• En general, si el estimador muestral sigue una distribución Normal, un intervalo de

donde EE es el error estándar del estimador y z es un percentil de N(0;1), que

• Al valor  se le denomina nivel de error.

• Al desvío z• EE que se suma y resta al estimador se le denomina error de estimación

Tamaño de muestra para la media  con una confianza dada

Intervalo de confianza para 2 de N(,) con  desconocida :

Utilizando los percentiles   ( n  1) y   ( n  1) se tendrá que:

Si queremos construir un IC al 99% para  de IMC en Hipertensos,x y

( 13.35 , 75.57 )  (3.65 , 8.69 )

Intervalo de confianza para una proporción aproximado por la Normal:

El resultado anterior obtenido en el muestreo, nos permite construir un intervalo de

INTERVALO AL 100·(1-)% DE CONFIANZA PARA 

p  37  0.46 1  p  0.54 z 0.995  2.576

  (0.31, 0.61) al 99% de confianza

Tamaño de muestra para una proporción 

z2   p  (1  p) donde p es una estimación de una muestra piloto

Вам также может понравиться