Вы находитесь на странице: 1из 21

II UNIDAD

INFERENCIA ESTADISTICA

USO DEL STATGRAPHICS

EJERCICIOS Y PROBLEMAS

2008

  • 9.0.- INFERENCIA ESTADISTICA

La Teoría de la Inferencia Estadística puede definirse como

aquellos métodos que permiten hacer inferencias o

generalizaciones sobre una población a partir de una muestra. Existen dos métodos para estimar parámetros de la población :

El Método Clásico y Método Bayesiano.

El Método Clásico .- Se basa estrictamente en la información obtenida en una muestra aleatoria tomada de una población.

El Método Bayesiano.- Utiliza el conocimiento subjetivo

previo acerca de la distribución de probabilidades de los parámetros desconocidos junto con la información

proporcionada por los datos de la

muestra.

La Inferencia Estadística puede dividirse en dos áreas

principales :

Estimación y Prueba de Hipótesis.

9.1

ESTIMACION

La Estimación se ocupa del estudio de parámetros de la población y consiste en encontrar o determinar una estadística que constituya una buena estimación del valor de un parámetro desconocido . A esta estadística se le llama estimador del parámetro desconocido .

Estudiaremos la estimación puntual y la estimación por intervalos .

3.1.1 ESTIMACIÓN PUNTUAL

La Estimación Puntual de algún parámetro de la población es un valor simple de una estadística tomada de la muestra.

Por ejemplo, si el valor de x es la estadística calculada a partir de una muestra de tamaño n,

entonces x

es una estimación ˆ puntual de media

= x

y

=.

población, es decir

La Estadística que se emplea para obtener una estimación puntual recibe el nombre de “Estimador “.

3.1.2

6.1.2 ESTIMACION POR INTERVALOS

E n vez de estimar el parámetro a partir de un valor de ( estimación puntual ) ahora se trata de estimar un intervalo [ a, b ] llamado intervalo de confianza q ue debe contener al parámetro con una probabilidad dada 1 - llamado nivel de confianza , en base a una muestra aleatoria y la correspondiente estadística ; esto es

P ( a    b) = 1 -
P ( a 
  b)
= 1 -
  • A) INTERVALOS CONFIDENCIALES PARA LA MEDIA POBLACIONAL

a1 )

Cuando

es conocida 0 n >

30

Sea

x   ( , 2 n ) Entonces

Z = (x - ) / (  n )

P ( - Z 2 <

( (x - ) / (  n )

<

Z 2 ) = 1 -

P

(

x

Z  n < < x + Z  n ) = 1 -

Por lo tanto

 [x Z  n ]

x

Donde :

: media muestral

Z 

: se encuentra en la tabla

Z

n.

: tamaño de la muestra

: desviación estándar conocida

: nivel de significación

Ejemplo

Se ha calculado que la media y desviación estándar para las puntuaciones de una muestra aleatoria de 36 estudiantes son respectivamente 2.6 y 0.3 .

¿Encuentre el intervalo de confianza al 95% y al 99% para la media de todo

el grupo de estudiantes?.

Solución:

x = 2.6

= /2 = 0.025

s

0.3

Z 

=

1.96

P ( 2.6 1.96 (0.3/36)

  

2.6 + 1.96 (0.3/36) ) = 95%

De donde P(

2.5 < < 2.7 ) =

95%

La probabilidad de que la puntuación promedio de cualquier estudiante

se encuentre ntre

2.5 y 2.7 es de

95% .

a2) Cuando es desconocido n 30

Cuando no se conoce la varianza poblacional 2 y es imposible obtener una muestra n30 pues el costo es un factor que limita el mayor tamaño de muestra. En la medida que la población se distribuye normalmente entonces

podemos usar la distribución t.

t = (x - )/ ( s/ n)

El procedimiento es el mismo que en el caso anterior excepto que se usa la distribución T en lugar de la normal, luego se puede afirmar:

P ( - t /2 < t < t /2 ) = 1 -

P (

x -

t/2 s/ n

< <

x +

t/2 s/ n

) = 1 -

Por lo tanto

 x

t/2 s/ n

donde t/2

es el valor de t con

n 1

grados de libertad

Ejemplo

Los contenidos de ácido sulfúrico en siete recipientes similares son : 9.8 , 10.2 , 10.4 , 9.8 , 10.0 , 10.2 y 9.6 litros. Encuentre un intervalo de confianza al 95% para la media del contenido de todos los recipientes. Suponiendo una distribución aproximadamente normal.

Solución:

x = 10

;

s = 0.283 ; t /2 = t (0.025) (6) = 2.447

luego :

  x

 

t/2 s/ n



10.0 ( 2.447 ) ( 0.283)/ 7

 10.0 P ( 9.74

<

0.26 < 10.26 ) = 95 %

  • B) INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS

Si se tiene una población con medias

1

,

2

y varianzas

1 2

,

2

2

respectivamente y si se toma muestras n 1 y n 2 respectivamente, entonces se

puede obtener intervalos confidenciales para la diferencia de medias.

b1)

Si

1 2 , 2 2

son conocidas y n 1 30 y

n 2

30

entonces un intervalo confidencial para 1 - 2

es:

 

P [( x 1 -- x 2 ) - Z   (1 2 / n 1 + 2 2 /n 2 )

1 - 2

(x 1 - x 2 ) +Z  

(1 2 / n 1 +

2 2 /n 2 ) ]

=

1 -

por lo tanto

(

1 - 2 )

[( x1 -- x 2 ) Z   (1 2 / n 1 + 2 2 /n 2 )]

Donde x 1 , x 2

son las medias muestras aleatorias independientes de tamaño

n 1

,

n 2

, tomadas de poblaciones con varianzas conocidas

1 2

,

2

2

respectivamente, y - Z 

es el valor de la distribución normal estándar.

Ejemplo :

50 Mujeres y 30 hombres se presentaron a un examen de admisión para ocupar un cargo :

las mujeres obtienen una calificación promedio de 76 puntos con una desviación estándar de 6 , mientras que los hombres obtienen una calificación promedio de 82 puntos con una desviación estándar de 8. Encuentre un intervalo de confianza del 96% para la diferencia de medias.

SOLUCI0N

n 1 = 50

n 2 =

75 ,

x 1 = 76

y

x 2 = 82

,

s 1 = 6 y

s 2 =

8

Como

n 1 ,

n 2

> 30

s 1 = 1

y

s 2 =

2

Se aplica

P [( x 1 -- x 2 ) - Z   (1 2 / n 1 + 2 2 /n 2 )

1 - 2

(x 1 - x 2 ) + Z   (1 2 / n 1 +

2 2 /n 2 ) ]

=

1 -

Remplazando datos se obtiene :

P ( 3.42 )   1 - 2 8.58 ) = 95 %

b 2 ) Si 1 2 , 2 2 son desconocidas y n 1 y n 2 30

Donde las medias y varianzas de muestras independientes pequeñas de tamaños n 1 y n 2 son tomadas de distribuciones aproximadamente normales y t  es el valor de la distribución t con n 1 - n 2 - 2 grados de libertad:

P [( x 1 -- x 2 ) -t   (s 1 2 / n 1 + s 2 2 /n 2 )

1 - 2

(x 1 - x 2

) + t   (s 1 2 / n 1 +

s 2 2 /n 2 ) ]

=

por

lo tanto

(

1 -

1 - 2 )

[( x1 -- x 2 ) t   (s 1 2 / n 1 + s 2 2 /n 2

)]

Ejemplo:

Los registros de los últimos 15 años muestran que la precipitación fluvial promedio. durante el mes de mayo es de 4.93 cm. con una desviación estándar 1.14 cm. en Perú, en Chile la precipitación fluvial promedio fue de 2.64 con una desviación estándar de 0.66 durante los 10 años pasados. Encuentre un intervalo confidencial del 95% para la

diferencia verdadera de las precipitaciones fluviales promedio en estos países, suponiendo

que las muestras se han tomado de poblaciones normales con variancias diferentes.

Solución:

Perú

x = 4.93

Chile

x = 2.64

.t ( 0.025 )

( 15+10 2 )

=

s =

1.14

n = 15

s = 0.66

n = 10

2.069.

Remplazando en la fórmula se tiene :

P [(

0.29 2.069

) (1.14 2 / 15 + 0.66 2 /10

+

0.66 2 /10 ) ]

=

) 1 -

2.069 (1.14 2 / 15

1 - 2

2.29 +

P(

2.02

1 - 2

2.56 )

= 0 95 %

Significa que se tiene una confianza del 95% de que el intervalo de 2.02 a 2.56 contenga el verdadero valor promedio de la precipitación fluvial .

  • C) I NTERVALOS CONFIDENCIALES PARA LAS PROPORCIONES

Si la estadística p = x /n es la proporción de éxitos en una muestra de tamaño n extraída de. una distribución binomial en la que P es la proporción de éxitos en la población los límites de confianza para P, cuando n   se tiene que :

E(p) = P , V(p) = PQ /n por lo tanto también se tiene:

P ( - Z 2 <

Z <

Z 2 ) = 1 -

Z = (p P)/ ( PQ /n )

por lo tanto

P [ p - Z 2 ( PQ /n )

<

P <

p +Z 2 ( PQ /n ) ] = 1 -

Luego

P [ p Z 2 ( PQ /n ) ]

Ejemplo:

En una muestra aleatoria de n = 500 familias de cierta ciudad que poseen televisores, se observó que 340 poseían TV a color. Encuentre un intervalo de confianza del 95% para la proporción real de las familias en dicha ciudad con TV a color.

Solución:
Solución:

p = 340/500

= 0.68

Z ( 0.025) = 1.96

Usando la fórmula :

P [ p - Z 2 ( PQ /n ) < P < p +Z 2 ( PQ /n ) ] = 1 -

P[ 0.68 1.96 ( 0.68*0.32) /500 < P < 0.68 + 1.96 ( 0.68*0.32) /500 ] = 95%

Por lo tanto

P ( 0.64 < P < 0.72 ) = 95 %

D) INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES

Dada dos poblaciones binomiales de las cuales se extrae dos muestras aleatorias independientes de tamaños n 1 , n2 se puede encontrar un intervalo de confianza para la verdadera diferencia de proporciones, es decir P 1 , P 2 mediante :

P [( p 1 -

p 2 )

-

Z /2 ( p 1 q 1 /n 1 +

p 2 q 2 /n 2 ) <

P 1 P 2 < ( p 1 -

p 2 )

+

Z /2 ( p 1 q 1 /n 1 +

p 2 q 2 /n 2 )]

Por lo tanto (P 1 P 2 )[( p 1 -

p 2 )

Z /2 ( p 1 q 1 /n 1 +

p 2 q 2 /n 2 ) ]

Ejemplo:

En el proceso de fabricación de cierto componente se considera un cambio con el objeto de determinar si el nuevo procedimiento es mejor. Se toma muestras del procedimiento

existente y del nuevo si se detecta que 75 de 1500 componentes tomados del procedimiento

existente fueron defectuosos, así como 80 de 2000 del nuevo procedimiento fueron defectuosos. Encuentre un intervalo de confianza al 90% para la diferencia real de proporción de componentes defectuosos.

Solución:

p 1 = 75/1500 = 0.05

n 1 = 1500

p 2 = 80/200

=

0.04

n 2 = 2000

Z /2 = 1.645

Según fórmula :

  • 0.01 1.645 ( 0.05*0.95/1500 + 0.04*0.96/2000 )

P ( -0-0017

<

P1 P 2

< 0.0217 ) = 90 %

Como el intervalo contiene el valor 0 no hay razones, que el nuevo

componente produzca una disminución significativa en

la proporción de componentes defectuosos con respecto al método existente.

  • E) INTERVALOS CONFIDENCIALES PARA LA VARIANZA

Supongamos que tenemos una muestra aleatoria x 1 ,x 2 , x 3 ,

x n de

... una distribución de media y una varianza 2 , ambas desconocidas luego:

n

( x i - x ) 2

E ) INTERVALOS CONFIDENCIALES PARA LA VARIANZA Supongamos que tenemos una muestra aleatoria x ,x ,

i=1

2

=

(n 1 ) s 2 2

Tiene una distribución 2 con n-1 grados de libertad cuando las muestras se escogen de una población normal entonces :

P

( 2 /2

2

( 2 1- /2

) =

P (2 /2

(n 1 ) s 2

2

P(

( n 1 ) s 2 2 1- /2

2

(n 1 ) s 2 ) =

2 /2

1 -

( 2 1- /2

) =

1 -

Donde s 2 es la varianza de la muestra aleatoria n,

2

  • 2 2

/2 y 1- /2

son valores de la distribución

con n 1 grados de libertad hacia la derecha.

Ejemplo

Un experimentador quiere verificar la variabilidad de un equipo diseñado para medir el volumen de una fuente de audio frecuencia. Tres mediciones independientes registraron con este equipo fueron 4.1 , 5.2 y 10.2. Estime 2 con un coeficiente de confianza de 0.9.

Solución

Si se supone normalidad en las mediciones registradas por este equipo, se puede

aplicar el intervalos de confianza desarrollado anteriormente ofrecidos, s 2 = 10.57 con

/2

cuadrado nos da

2 /2

= 0.103 y

Para

los

datos

.

= 0.05 y n- 1 = 2 grados de libertad , en la tabla de la distribución Chi

2 1- /2

=

5.959

por lo tanto el intervalo de confianza para 2

es

P (

2*10.57 /

5.991 2

2*10.57 / 0.103

) =

0.90

P (

3.53

  2

205.24

) =

0.90

Obsérvese que este intervalo para pequeño .

2

es muy amplio, básicamente porque n es muy

Ejemplo propuesto:

Los siguientes valores son los pesos en decigramos de 10 paquetes de semilla distribuidos por cierta compañia : 46.4 ,

46.1 , 45.8 , 47.0 , 46.1 , 45.9 , 45.8 , 46.8 , 45.2

y 46.0.

Encuentre un intervalo de confianza al 95% para la varianza

de dichos paquetes de semilla distribuidos por esta compañia.