Вы находитесь на странице: 1из 40

UNIVERSIDAD NACIONAL

JOSE FAUSTINO SANCHEZ CARRION


FACULTAD DE INGENIERIA INDUSTRIAL, SISTEMAS E INFORMATICA
Escuela Profesional de Ingeniería Industrial

Curso:

ESTADISTICA APLICADA I

CAPITULO 04:
INFERENCIA ESTADISTICA
Tema:

ESTIMACION

HUACHO-PERU

1
Mg. Víctor Silva Toledo
ESTADISTICA APLICADA I

1. INFERENCIA ESTADÍSTICA
La investigación va unida a la
experimentación: el investigador
realiza un experimento y obtiene varios
datos; sobre la base de estos datos se
sacan ciertas conclusiones, y estas
operaciones suelen ir más allá de los
materiales y operaciones del
experimento particular realizado.
En otras palabras, puede ocurrir que el
investigador generalice ciertas
conclusiones del experimento
particular a todas las clases de
experimentos semejantes.
ESTADISTICA APLICADA I

Tal tipo de extensión de lo particular a


lo general se denomina inferencia
inductiva y es un procedimiento para
hallar nuevo conocimiento científico.

Una de las misiones de la estadística


consiste en conseguir técnicas para
efectuar inferencias inductivas y para Muestreo
medir el grado de incertidumbre de tales
inferencias, haciendo uso de las
probabilidades. Esto se hace a partir de
una muestra tomada de la población que Muestra
se está investigando.
Población
ESTADISTICA APLICADA I

Error de muestreo y sesgo


Es prácticamente imposible que una muestra proporcione información
que reproduzca exactamente las características de la población de
origen. Los motivos se tipifican en los dos grupos siguientes:
a. Error en el muestreo (EE)
El error de muestreo es el error aleatorio (al azar) que ocurre cuando
tomamos una muestra en lugar de estudiar a toda la población.
El error de muestreo depende de:
• El tipo de muestra elegido
EEMuestreo < EEMuestreo < EEMuestreo
Estratificado Aleatorio Por Conglomerados

• El tamaño de la muestra
Mientras más pequeña sea la muestra mayor será el error
b. Sesgo
El sesgo es el error causal, generado en forma consciente o
inconsciente, por deficiencias en el diseño de la muestra.
Capítulo 04: Estimación

POBLACION-MUESTRA-MUESTREO m1
P X1
X1
Muestra X2
X2 Representativa X3
X3 1. Sus elementos deben ser
.
.
. elegidos en forma aleatoria Xn
. 2. Debe ser estratificada; y
. 3. Debe ser tomada en forma m2
Sistemática
. X1
. X2
XN X3
.
.
Xn

CONCLUSIÓN:

µ X
Estima
µ X S S2
Estima
PARAMETROS S ESTADISTICOS
Estima
S2
5
Mg. Víctor Silva Toledo
Capítulo 04: Estimación

Introducción
La inferencia estadística comprende dos tipos de procesos:
Estimación y Pruebas de Hipótesis
Estimación es el procedimiento mediante el cual obtenemos
conclusiones respecto a parámetros o características de la población,
a través de la muestra.
En investigación, generalmente se obtiene una muestra de la
población a estudiar y con ésta se calculan los estadísticos de interés.
Como estos estadísticos son aleatorios (solo se tomó una muestra) se
debe realizar un proceso llamado Inferencia Estadística para obtener
una estimación de los (estadísticos) parámetros de la población. Este
ultimo proceso es llamado Estimación Paramétrica.

En el caso en que la distribución poblacional no es conocida, o


no se puede suponer un modelo de distribución adecuado, se hace uso
de la Estimación No-paramétrica para las inferencias estadísticas.

6
Capítulo 04: Estimación

CONTENIDO
ESTIMACION DE PARAMETROS

1. Estimación Puntual y por Intervalos


2. Características deseables de un Estimador
3. Cálculo de los intervalos de confianza para
los principales parámetros

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

Métodos de estimación:

Estimación puntual: Estimación por intervalo:


Es la utilización de Ofrece un intervalo de
datos de la muestra valores razonables dentro
para calcular un solo del cual se pretende que
número para estimar el esté el parámetro de
parámetro de interés. interés, en este caso la
media poblacional, con un
cierto grado de confianza

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

¿CÓMO FUNCIONA?
Descripción
POBLACIÓN PARÁMETROS
Realiza

Muestreo Inferencias
aleatorio
Extrae una:

MUESTRA ESTIMADORES ESTIMACIONES

(x1, x2,…..,xn) Se calculan (Estadísticos) (Valores


concretos)

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

¿CÓMO FUNCIONA?
ESTIMADORES

  xi
n
2

  
  Xi    n  1
 

ESTIMACIONES
_
X S2
Valores concretos

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

Ejemplo:
Distribución de diámetros de troncos


Valores desconocidos de

 2 los parámetros: media y


variancia del diámetro de
la población
2

    X i   
  
   xi n n  1 Estimadores
 

46;48;51;52;52 Muestra

 46  49  51  52  52 Estimación puntual de
x  50
5 

s2 
46  50 2
 .......  52  50 2
 6,5
Estimación puntual de

5 1 2

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

Estimación: puntual y por intervalos


A partir de los estadísticos que, hemos obtenido en la/s
muestra/s, podemos obtener una idea de los valores de los
parámetros en la población.
Se trata de emplear los estadísticos para estimar los
parámetros.
Veremos DOS tipos de estimadores:
1) Estimación puntual. Se obtiene un punto, un valor, como
estimación del parámetro.
2) Estimación por intervalos. Se obtiene un intervalo dentro
del cual estimamos (bajo cierta probabilidad) estará el
parámetro.

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

ESTIMACIÓN PUNTUAL DE PARÁMETROS


Un estimador puntual es simplemente un estadístico (media
aritmética, varianza, etc.) que se emplea para estimar parámetros
(media poblacional, varianza poblacional, etc.).
Es decir, cuando obtenemos una media aritmética a partir de una
muestra, tal valor puede ser empleado como un estimador para el
valor de la media poblacional.
(Algunos autores comparan los estimadores con los lanzamientos
en una diana; el círculo central sería el valor real del parámetro.)
PROPIEDADES DESEABLES
Son Cuatro (04) propiedades:
1. Ser insesgado (ausente de sesgo)
2. Consistencia
3. Eficiencia; y
4. Suficiencia
Mg. Víctor Silva Toledo
Capítulo 04: Estimación

PROPIEDADES DESEABLES
1. Ser insesgado. Diremos que  es un estimador insesgado de 
si la esperanza de  es  . Es decir, E( )  
La media muestral es un estimador insesgado de la media
poblacional.
Pero la varianza muestral NO es un estimador insesgado de la
varianza poblacional, pero sí lo es en cambio la cuasivarianza.
2. Consistencia. Se dice que un estimador es consistente si se cumple que


lim P       0
n 

Esta expresión indica que a medida que se incrementa el tamaño muestral, la diferencia
entre el estimador y el parámetro será menos que cualquier número ().
A diferencia de la “ausencia de sesgo” que se define para valores finitos de n, la
“consistencia” es una propiedad asintótica.
Tanto la media muestral como la cuasivarianza son estimadores consistentes.
Nota: la varianza muestral es un estimador consistente de la varianza poblacional, dado
que a medida que el tamaño muestral se incrementa, el sesgo disminuye.

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

PROPIEDADES DESEABLES
3. Eficiencia. Se emplea para COMPARAR estimadores.

Si tenemos dos estimadores  1 y  2 de un mismo parámetro , diremos que  1


es más eficiente que  2 si tenemos que var (  1)< var( 2 )
Se puede comprobar que la varianza muestral es más eficiente que la
cuasivarianza muestral a la hora de estimar la varianza poblacional. (Aún
así, se prefiere la cuasivarianza muestral como estimador de la varianza
poblacional por  ser un estimador insesgado.)
2

4. Suficiencia. Diremos que  es un estimador suficiente del parámetro 


si dicho estimador basta por sí solo para estimar 

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

Comparación de Propiedades de los estimadores

Cuatro tiradores han efectuado 10 disparos sobre una carta. Si traducimos cada disparo
en una estimación, efectuada por un determinado estimador, sobre una muestra,
podemos interpretar las propiedades de los estimadores de la siguiente forma:

Estimador insesgado Estimador sesgado Estimador sesgado Estimador insesgado


y no eficiente y no eficiente y eficiente y eficiente

Mg. Víctor Silva Toledo


CUADRO RESUMEN ESTIMADORES PUNTUALES
Distribución Parám- Estima- Propiedades Otras
Población etro a estimador propie-
dor
estimar dades
Poisson
 X
insesgado, eficiente,
consistente
EMV
XPo()
Bernoulli insesgado, eficiente,
XBe(p)
p p̂ = x consistente
EMV

Normal  X
insesgado, eficiente,
EMV
X N(, 2 ) consistente
Normal 2 S2 asint. insesgado, menor
ECM que cuasi-var S 2
EMV
X N(, 2 )
Exponencial:
 X
insesgado, eficiente,
consistente
EMV
X Exp(1/ )
Sin  X insesgado, consistente
especificar
Sin 2 S2 asint. insesgado
especificar S 2 insesgado
EMV= Estimador máximo-verosímil
Capítulo 04: Estimación

INTERVALOS DE CONFIANZA PARA PARÁMETROS


El caso de la media (1)

En este caso, en lugar de indicar simplemente un único valor como


estimación del parámetro, lo que haremos es ofrecer un intervalo de
valores que sea asumible con cierta probabilidad por el parámetro que
queremos estimar.
-Intervalo de confianza: Es el intervalo de las estimaciones (probables)
sobre el parámetro.
-Límites de los intervalos de confianza: Son los dos valores extremos
del intervalo de confianza

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

INTERVALOS DE CONFIANZA PARA PARÁMETROS


El caso de la media (2)

Ahora bien, ¿cuán grande habrá de ser el intervalo de confianza?


Evidentemente, si decimos que el intervalo de confianza va de menos infinito a
más infinito, seguro que acertamos...pero eso no es muy útil. Por su parte, el
extremo es la estimación puntual, en la que lo usual es que no demos con el valor
del parámetro...
La idea es crear unos intervalos de confianza de manera que sepamos en qué
porcentaje de casos el parámetro estará dentro del intervalo crítico.
¿Y cómo fijamos tal porcentaje de casos? Usualmente se asume un porcentaje
del 95%. Al calcular un intervalo de confianza sobre la media al 95% ello quiere
decir que el 95% de las veces que repitamos el proceso de muestreo (y
calculemos la media muestral), la media poblacional estará dentro de tal intervalo.

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

INTERVALOS DE CONFIANZA PARA PARÁMETROS


El caso de la media (3)

Pero, ¿cómo calculamos estos dos límites?

Sabemos que la distribución subyacente es normal, lo cual nos ayuda


enormemente.
En una distribución normal tipificada, es muy fácil saber qué puntuación típica (z)
deja a la izquierda el 2.5% de los datos (yendo a las tablas es -1.96) y cuál deja a
la izquierda el 97.5% de los datos (o a la derecha el 2.5% de los datos: 1.96).
Ahora habrá que pasar esos datos a puntuaciones directas....

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

INTERVALOS DE CONFIANZA PARA PARÁMETROS


El caso de la media (4)

Pero, ¿cómo calculamos estos dos límites?

Vamos a ver DOS casos.


Primero, veremos el caso de que conozcamos la varianza poblacional.
Segundo, veremos el caso de que NO conozcamos la varianza poblacional

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

INTERVALOS DE CONFIANZA PARA PARÁMETROS


El caso de la media (5)

Conocemos 2

Nuestra distribución es normal, pero con cierta media y cierta desviación típica, las
cuales sabemos por el tema anterior:
1) La media de la distribución muestral de medias es la media poblacional 
2) La varianza de la distribución muestral de medias es 2/n
O lo que es lo mismo, la desviación típica de la dist.muestral de medias es 
n

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

INTERVALOS DE CONFIANZA PARA PARÁMETROS


El caso de la media (6)

Conocemos 2

Y para pasar directas-típicas:


Estimador de  es X Xi  X
Recordar que: zi 
/ n


O lo que es análogo X i  zi  X
n
Mg. Víctor Silva Toledo
Capítulo 04: Estimación

INTERVALOS DE CONFIANZA PARA PARÁMETROS


El caso de la media (7)
Conocemos 2

En Punt.típicas z 0’025 z 0’975

Aplicando la lógica
de pasar de
puntuaciones típicas
 
X  z0.025  a directas X  z0.975 
n n
En Punt.directas
   
En definitiva 
P X  z 0.025     X  z 0.975    0.95
n n

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

INTERVALOS DE CONFIANZA PARA LA MEDIA


Cuando se desconoce la 2

DESCONOCEMOS 2

Para la media (cuando conocemos la varianza poblacional), tenemos la


expresión
   
P  X  z0.025     X  z0.975    0.95
 n n
2
Pero si no conocemos la varianza poblacional, no podemos emplear
n

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

INTERVALOS DE CONFIANZA PARA LA MEDIA


Cuando se desconoce la 2

En su lugar hemos de emplear s2


n
Ahora la distribución ya no es exactamente una distribución normal...
Por el tema anterior sabemos que la distribución muestral de
no es una distribución normal, sino una distribución t de X 
Student con n-1 grados de libertad.
s/ n
Recordar, en el caso de Xi  
zi 
varianza conocida teníamos: / n

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

INTERVALOS DE CONFIANZA PARA LA MEDIA


Cuando se desconoce la 2
En definitiva, para la media (cuando conocemos la varianza poblacional),
tenemos la expresión:

   
P  X  z0.025     X  z0.975    0.95
 n n

Pero si no conocemos la varianza poblacional (realidad), tenemos la


expresión:

 s s 
P  X  0.025 tn 1     X  0.975 tn 1    0.95
 n n
En todo caso, recordar que si "n" es grande, la distribución t de Student será
virtualmente una distribución normal N(0,1). En otras palabras, si "n" es grande,
ambas fórmulas dan unos intervalos virtualmente idéntico, y emplear la
distribución normal es lo correcto.

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

INTERVALOS DE CONFIANZA PARA LA MEDIA


Cuando se desconoce la 2
¿Qué quiere decir la expresión siguiente?

   
P  X  z0.025     X  z0.975    0.95
 n n

Quiere decir que cada vez que extraigamos una muestra y


hallemos la media, el parámetro desconocido  estará entre los
límites de dicho intervalo el 95% de las veces. (O el 99% si
hubiéramos elegido un intervalo al 99%, etc.)

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

INTERVALOS DE CONFIANZA PARA PARÁMETROS


Tamaño de la muestra y la amplitud del intervalo
Para el caso de la media hemos visto que:

   
P  X  z0.025     X  z0.975    0.95
 n n
Es claro que a medida que el tamaño muestral aumente, la amplitud del intervalo
disminuye. (Evidentemente, esto es general, no sólo para la media.) Veamos, en
todo caso un ejemplo:
Caso A1. Media muestral=10, varianza pobl=4, tamaño muestral=12
 2 2 
P 10  (1.96)     10  1.96    P 8.87    11.13  0.95
 12 12 

Caso A2. Media muestral=10, varianza pobl=4, tamaño muestral=20


 2 2 
P 10  (1.96)     10  1.96    P  9.12    10.88  0.95
 20 20 

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

INTERVALOS DE CONFIANZA PARA PARÁMETROS


Amplitud del intervalo de confianza y el valor del índice
de confianza
El caso "usual" (por defecto) es emplear intervalos al 95%.

   
P  X  z0.025     X  z0.975    0.95
 n n
Pero evidentemente es posible emplear intervalos a, digamos, el 99%. En tal caso,
tendremos más seguridad de que el parámetro de interés se halle en los límites
del intervalo. El problema es que incrementar tal índice aumenta así mismo la
amplitud del intervalo.
Caso A1. Media muestral=10, varianza pobl.=4, tamaño muestral=12. Intervalo al 95%
 2 2 
P 10  (1.96)     10  1.96    P 8.87    11.13  0.95
 12 12 

Caso A2. Media muestral=10, varianza pobl=4, tamaño muestral=12. Intervalo al 99%
 2 2 
P 10  (2.57)     10  2.57    P 8.52    11.48   0.99
 12 12 

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

INTERVALOS DE CONFIANZA PARA OTROS PARÁMETROS


El caso de las proporciones

Caso de muestras grandes

 P(1  P)   P(1  P)  
P  P  z.025      P  z.975    0.95
 n   n  

El caso de las Varianzas

 n  S 2   n  S 2

P  2 
 
2
2 
 0.95
 .975  n 1   .025  n 1  

Mg. Víctor Silva Toledo


ESTADISTICA APLICADA II

Tipos de errores
Realidad
H0 cierta H0 Falsa

Correcto Error de tipo II


El tratamiento no El tratamiento si tiene
tiene efecto y así se efecto pero no lo
No Rechazo H0 decide. percibimos.

Probabilidad β

Error de tipo I Correcto


El tratamiento no El tratamiento tiene
Rechazo H0 tiene efecto pero se efecto y el experimento
decide que sí. lo confirma.
Acepto H1 Probabilidad α

Mg. Víctor Silva Toledo


ESTADISTICA APLICADA II

Niveles de Significación a:

NIVEL DE SIGNIFICACIÓN
0.10 0.05 0.01 0.005 0.002
a
Valores críticos de Z
para -1.28 ó -1.645 ó -2.33 ó -2.58 ó -2.88 ó

ensayos de una cola 1.28 1.645 2.33 2.58 2.88

Valores críticos de Z
para -1.645 ó -1.96 ó -2.58 ó -2.58 ó -3.08 ó

ensayos de dos colas 1.645 1.96 2.58 2.58 3.08

Mg. Víctor Silva Toledo


“… Preguntas, dudas e
intercambio de experiencias …”

Mg. Víctor Silva Toledo 34


Capítulo 04: Estimación

APLICACION
Cálculo de valores críticos
Capítulo 04: Estimación

Cálculo de valores críticos


Capítulo 04: Estimación

Cálculo de valores críticos


“… Preguntas, dudas e
intercambio de experiencias …”

Mg. Víctor Silva Toledo 38


Capítulo 04: Estimación

APLICACION
1. Si X ~ N (40,10),
(a) Calcular P(39 ≤ X ≤ 41) para n=10.
(b) ¿En qué intervalo se obtendrán el 95% de los resultados?
Solución:
(a) P (39 ≤ X ≤41) = P (39-40) ≤ X -40 ≤ (41 – 40) = P(- 0,31623 ≤ X ≤ 0,31623)
√10 √10 √10
Z = X -40
N (0,1)
√10

P (39 ≤ X ≤41) = P (Z ≤ 0,31623) - P (Z ≤ - 0,31623) = 2 P (Z ≤ 0,31623)


Por lo tanto:P (39 ≤ X ≤41) = 2 (0.6241−1) = 0.02482
(b) P (μ-ε ≤ X ≤ μ+ε)= 0.95

P (μ-ε ≤ X ≤ μ+ε) = 2 P(Z ≤ ε ) -1


√10
P(Z ≤ ε ) = 1 – 0,95 = 0,975 Z0.975 ε = 1,96 (√10) = 6,1981
√10 2
Por lo tanto, el intervalo, es: 33,802; 46,198

Mg. Víctor Silva Toledo


Capítulo 04: Estimación

APLICACION
2. Si el contenido en gr. de un determinado medicamento X sigue una distribución
N(7.5,0.3). Calcular la probabilidad de que para una muestra de tamaño n=5, se
obtenga una media menor que 7, P ( X ≤ 7).

Solución:
A partir de una muestra de tamaño n=5 de una población normal N(μ=7.5,σ=0.3), tenemos que:

P ( X ≤ 7) =

Mg. Víctor Silva Toledo

Вам также может понравиться