Вы находитесь на странице: 1из 25

Estimacin Puntual

Unidad 3

Parmetro.

Es una constante correspondiente a una distribucin de probabilidad o a una poblacin.


Ejemplo. Para la distribucin binomial; n, p. Para la distribucin geomtrica; p. Para la
distribucin poisson . Para la distribucin exponencial; . Para la distribucin normal;
y . Los parmetros tpicos que se desean conocer de una poblacin son; la media, la
varianza o una proporcin.

Estadstico.

Es una funcin de una muestra. Por ejemplo; , , S2, S, Rango, etc.


Estimador Puntual.

Es un estadstico utilizado para estimar el valor de un parmetro desconocido a partir de


una muestra aleatoria. Por ejemplo, el mejor estimador puntual de la media de una
poblacin es , el mejor estimador puntual de la varianza es S2, El mejor estimador
puntual de una proporcin es , donde X es el nmero de xitos en una muestra
aleatoria de tamao n.

Estimacin por intervalo


Una estimacin por intervalo de un parmetro , consiste en construir un
intervalo de la forma , donde los extremos del intervalo se obtienen de
acuerdo a la distribucin del estimador del parmetro, donde 1 - es la
probabilidad de que el intervalo contenga al valor del parmetro (0 < < 1)
y se le llama nivel de confianza. A un intervalo obtenido de esta manera se le
llama intervalo de confianza (IC) de , con un nivel de confianza de 1 - .
IC para la media con varianza conocida. Suponer una muestra aleatoria de
una v.a. X con distribucin normal y varianza conocida. El IC para la media
con un nivel de confianza de 1- est dado por:



X z / 2
X z / 2

n
n

donde es el valor de z tal que

P( z z / 2 ) / 2

NOTA: SI ES UNA MUESTRA GRANDE (N 30), SE PUEDE SUSTITUIR POR S SIN


IMPORTAR LA DISTRIBUCIN DE PROBABILIDAD QUE TENGA X.
EJEMPLO. SE TOM UN MUESTRA ALEATORIA DE 40 FOCOS ANOTANDO EL TIEMPO EN
HORAS QUE FUNCION CADA FOCO. CONSTRUIR UN IC PARA EL TIEMPO PROMEDIO
DE VIDA DEL FOCO CON UN NIVEL DE CONFIANZA DEL 95%.
328, 17, 176, 165, 137, 940, 133, 413, 587, 767, 763, 212, 302, 1072, 66, 192, 128,
825, 383, 392, 1012, 715, 1691, 267, 441, 757, 116, 9, 185, 779, 63, 1524, 529, 127,
1089, 128, 304, 441, 764, 182.
EL P-VALOR.
ES EL MNIMO VALOR DE PARA RECHAZAR H0. SE OBTIENE CALCULANDO LA
PROBABILIDAD DE LA REGIN DE RECHAZO CONSIDERANDO COMO VALOR CRTICO
EL VALOR DEL ESTADSTICO DE PRUEBA.

EJEMPLO. OBTENER EL P-VALOR DEL EJERCICIO ANTERIOR.

IC para la media con varianza desconocida. Suponer una


muestra aleatoria de una v.a. X con distribucin normal y
varianza desconocida. El IC para la media con un nivel de
confianza de 1- est dado por:
S

X t / 2, n1

X t / 2, n1

Donde t /es
2 , n 1el valor de la variable alteatoria con
distribucin t de student con n-1 grados de libertad tal P(t t / 2, n1 ) / 2
que,

NOTA: Si es una muestra grande (n 30), se puede aplicar el procedimiento anterior.

Ejemplo. Se tom un muestra aleatoria de 15 focos anotando el tiempo en horas que


funcion cada foco. Construir un IC para el tiempo promedio de vida del foco con un nivel
de confianza del 95%.

17, 165, 940, 413, 767, 763, 66, 128, 825, 1012, 715, 757, 9, 185, 182.

IC para la varianza. Suponer una muestra aleatoria de una poblacin normal de tamao n.
Luego, el IC para la varianza de la poblacin
con nivel de confianza 1- est dado por:
(n 1) S 2
(n 1) S 2
2
2
2
/ 2, n1
1- / 2, n1

2
2 21 / 2, n1
con n-1 grados de libertad tal que P( >2
) = 1 - /2.

NOTA: Para valores grandes de n, el valor de


se 3puede aproximar mediante la frmula;

2
2
2

, 1
z
9
9

Ejemplo. Construir un IC para la varianza de las hora de vida de


un foco utilizando las 40 observaciones anteriores.

IC para una proporcin para muestras grandes. Suponer una


muestra aleatoria de tamao n donde se observaron X xitos.
El IC para la proporcin de xitos en la poblacin con un nivel
de confianza de 1- est
dado por; p(1 p)
p(1 p)
p z / 2

X
p

Donde
.
n

p p z / 2

Ejemplo.
Construir un IC para la proporcin de focos que duran ms de
500 horas funcionando, utilizando las 40 observaciones
anteriores.
2
z / 2
n

error

Determinar el tamaoz de2 la muestra. Para ;


.

Para p; Donde

/2

n p (1 p )

error

error = (longitud total)/2

PRUEBAS DE HIPTESIS
Hiptesis estadstica. Es una afirmacin hecha acerca de un parmetro de una
poblacin.
Una prueba de hiptesis es un procedimiento estadstico donde se pone en
competencia dos hiptesis para decidir cual es la verdadera, de acuerdo a la
evidencia estadstica contenida en una muestra aleatoria de la poblacin.
Hiptesis nula (H0). Es la hiptesis que afirma una verdad ya establecida.
Hiptesis alternativa (H1). Es la hiptesis que se desea sustituya a la hiptesis
nula.

Error tipo I y error tipo II. Son los tipos de errores que se pueden cometer en
Estado de la
Se acepta H0
Se rechaza H0
una prueba de hiptesis.
naturaleza

H0 es verdadera

No hay error

Error tipo I

H0 es falsa

Error tipo II

No hay error

Nivel de significancia. Es la probabilidad de cometer un error tipo I, y se


denota por . A la probabilidad de cometer un error tipo II se le denota
por .

La realizacin de una prueba de hiptesis se puede dividir en 4 pasos


que se indican a continuacin.
1. Establecer la hiptesis nula.
2. Establecer la hiptesis alternativa.
3. Calcular un estadstico de prueba.
4. Aplicar una regla de decisin.
Tipos de pruebas de hiptesis. Pruebe bilateral y prueba unilateral.
Hiptesis nula;
H 0: = 0
vs

H1 : 0 Prueba bilateral
H :
0
1
Prueba unilateral
H1 : 0
Hiptesis alternativa

Prueba de hiptesis para la media de una poblacin (varianza conocida).


Suponer una muestra aleatoria de tamao n que proviene de una poblacin
normal con varianza
Conocida , 2y seaX la media muestral.
Prueba bilateral. Sea H0: = 0 vs H1:

X 0
z

0. Estadstico de prueba;
/ n

Regla de decisin; se rechaza H0 con un nivel de significancia z siz / 2 ,


z
Donde / 2 es el valor de la variable con distribucin normal estndar z tal que
P( z z / 2 ) / 2

Prueba unilateral. A) Sea H0: = 0 vs H1: > 0. Se rechaza H0 con un nivel


de significancia si , donde es el valor de la variable con distribucin normal
P( z z )
estndar z tal
que
.
B) Sea H0: = 0 vs H1: < 0. Se rechaza H0 con un nivel de significancia si
z z
z
donde esel valor de la variable con distribucin normal estndar z tal
P( z z )
que
.

NOTA: Si es una muestra grande (n 30), se puede sustituir por S sin


importar la distribucin de probabilidad que tenga X.

Ejemplo.
El dueo de un negocio de comidas rpidas afirma que en promedio, el
nmero de rdenes por hora que se piden por telfono es 35 rdenes por
hora. Aplicar una prueba de hiptesis para verificar lo que afirma el dueo,
usar un nivel de significancia del 5%. A continuacin aparece el nmero de
rdenes que se pidieron en una hora durante 35 das.

27, 27, 32, 30, 29, 28, 22, 26, 25, 27, 31, 26, 29, 35, 30, 31, 31, 32, 33, 30,
31, 40, 29, 29, 19, 32, 37, 31, 41, 22, 30, 26, 33, 27, 23.

Prueba de hiptesis para la media de una poblacin (varianza


desconocida).
Suponer una muestra aleatoria de tamao n que proviene de una
poblacin normal. Sea la media muestral y la varianza muestral.

Prueba bilateral. Sea H0: = 0 vs H1: 0. Estadstico de prueba;

X 0
S/ n

/ 2, n 1
Regla de decisin; se rechaza H0 con un nivel de significancia t tsi
, n 1 el valor de la variable t con distribucin t de student
donde t / 2es
P(t t / 2, n 1 ) ./ 2
con n-1 grados de libertad, tal que

Prueba unilateral. A) Sea H0: = 0 vs H1: > 0. Se rechaza H0 con un nivel


de significancia t sit , n1 , dondet , n1 es el valor de la variable t con distribucin t
(t t , n1 ) .
de student tal Pque
B) Sea H0: = 0 vs H1: < 0. Se rechaza H0 con un nivel de significancia si
t tdonde,
tes
, n 1
, nel
1 valor de la variable t con distribucin t de student tal que
P(t t , n .1 )

NOTA: Si es una muestra grande (n 30), se puede aplicar el procedimiento


anterior.

Ejemplo.
El vendedor de una franquicia afirma que su negocio tiene un promedio de
ventas diarias de $ 150,000.00. Se registraron las ventas diarias durante 15
das, aplicar una prueba de hiptesis para verificar lo dicho por el vendedor de
la franquicia. Usar un 10% de nivel de significancia.

229315, 320742, 73590, 306161, 10768, 71334, 26286, 115407, 338578,


37356, 29562, 199865, 360205, 344462, 51308.

Prueba de hiptesis para la varianza de una poblacin normal.


Suponer una muestra
S 2 aleatoria de tamao n que proviene de una poblacin
normal con varianza muestral

Prueba bilateral. Sea H0:

02

vs H1:
2

. Estadstico de prueba;

02

2 / 2,n1

2 12( / 2),n1

2 / 2,n 1

(n 1) S 2

02

Regla de decisin; se rechazar H0 si


, o si
. Donde
2
2
2

1
/ 2 ,n 1
/ 2 ,n 1
es el valor de la distribucin 2 con n-1 g.l. tal que P[
] = /2
y 2
2

1 / 2 ,n 1
es el valor de la distribucin 2 con n-1 g.l. tal que P[
] ] = 1-(/2).
2 02

Prueba unilateral. A)
Sea
H 0:
vs2 H1: .0Se rechaza H0 con un nivel de
2
2
,n1
,n 1
significancia si 2 , donde
, donde es el valor de la distribucin 2
2
,n 1
con n-1 g.l. tal que P[
] = .
2 02
2 02
B) 2Sea2H0:
vs H12:
. Se rechaza H0 con un nivel de significancia si
1 ,n1
1 ,n 1
,donde
es el valor de la distribucin 2 con n-1 g.l. tal que
2 21 ,n1

P[

] = 1 - .

Ejemplo.
Para el ejemplo anterior, el vendedor de la franquicia afirma que las ventas
diarias tienen una desviacin estndar de $150,000.00. Aplicar una prueba de
hiptesis para verificar esta afirmacin, usar un nivel de significancia del 10%.

Prueba de hiptesis para una proporcin (muestra grande).


Suponer una muestra aleatoria de tamao n, donde se observaron X xitos.
Prueba bilateral. Sea H0: p = p0 vs H1: p p0. Estadstico de

X np0
z

prueba;
np0 (1 p0 )

Regla de decisin; se rechaza H0 con un nivel de significancia zsiz / 2 , donde


z / 2
P( z z / 2 ) / 2
es el valor de la variable con distribucin normal estndar z tal que

Prueba unilateral.
A) Sea H0: p = p0 vs H1: p > p0. Se rechaza H0 con un nivel de significancia
z si
z
z
P( z donde
z ) es el valor de la variable con distribucin normal estndar z tal
que
.
z z

P( z
B) Sea
H0z: p) =p0 vs H1: p < p0. Se rechaza H0 con un nivel de significancia
si
, donde es el valor de la variable con distribucin normal estndar z tal
que
.
Ejemplo.
Se desea probar la hiptesis de que el 60% de los clientes que entran a un
negocio hacen una compra. Para ello se observaron 300 clientes al azar y se
observ que 170 hicieron una compra. Probar la hiptesis anterior con un 5%
de nivel de significancia.

Pruebas de bondad de ajuste Jicuadrada


Esta prueba trata de verificar que una muestra aleatoria proviene de una
distribucin en particular, es decir que sigue una distribucin de probabilidad
especfica. Luego,

H0: La muestra aleatoria proviene de una poblacin f(x). vs


H1: La muestra aleatoria NO proviene de una poblacin f(x).

Esta prueba se aplica de la siguiente manera. Suponer una muestra aleatoria de


tamao n.

Intervalo de
Frecuencia
Frecuencia
observada
esperada
1. Organizar los valores clase
de la muestra
aleatoria en
la siguiente tabla de
1
FO1
FE1
frecuencias.
2
3
4

FO2
FO3
FO4

FOk

FE2
FE3
FE4

FEk

(FO i FE i ) 2
2. Calcular
FE i
i 1
2

2
2

, k r ,donde
1
3. Rechazar H0 con un nivel de significancia si
k es el
2

nmero de sumandos en

, r es el nmero de parmetros

independientes estimados.

Ejemplo. La siguiente tabla de frecuencias son ventas diarias en miles de


pesos de un vendedor. Se desea probar la hiptesis de que sigue una
distribucin normal. Se registraron las ventas diarias deX35 das, adems
= 36.67 y S = 11.76. Usar un nivel de significancia del 5%.
VENTAS
Menos de
25
25-35
35-45
45-55
55-65
Ms de

FO
6

FE

12
9
4
3
1

Q-Q plots

Las grficas llamadas Q-Q plots (grficas Q-Q) se utilizan para verificar que los
datos de una muestra aleatoria proviene de una distribucin determinada. Se
construyen de la siguiente manera.

1.- Suponer que se tiene una muestra aleatoria de tamao n. Primero se ordenan
x(1) , x( 2) , , x( n )
los valores de la muestra en forma creciente;

x(k ) se le estima su probabilidad acumulada mediante la


2.- A cada observacin
k 0.5
frmula
n

x(k )

k 0.5
3.- A cada observacin se le asocia con el percentil terico
(de acuerdo a lay (k )
x(k ) y(k )
distribucin de probabilidad determinada)
correspondientena
denotado por
. Formndose n pares ordenados ( , ).

x(k )( y (k,) ). Si los puntos estn alineados


4.- Se grafican en el plano los puntos
en el plano, entonces se puede afirmar que la muestra proviene de una
poblacin con la distribucin determinada.

Ejemplo.
Construir la grfica Q-Q de los siguientes datos para verificar si provienen de
X que 44.096 y S = 37.703)
una distribucin normal. (observe

k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

x
1.1
3.5
3.8
9.8
13.7
14.7
16.5
16.8
17.1
21.5
22.4
28.6
29.3
31.0
35.6
36.6
53.9
68.0
72.1
83.9
91.2
92.2
105.4
108.4
125.3

Prob. acumulada Percentil terico (y)


(x, y)
0.02
-33.3
(1.1, -33.3)
0.06
-14.5
(3.5, -14.5)
0.10
-4.2
(3.8, -4.2)
0.14
3.4
(9.8, 3.4)
0.18
9.6
(13.7, 9.6)
0.22
15.0
(14.7, 15.0)
0.26
19.8
(16.5, 19.8)
0.30
24.3
(16.8, 24.3)
0.34
28.5
(17.1, 28.5)
0.38
32.6
(21.5, 32.6)
0.42
36.5
(22.4, 36.5)
0.46
40.3
(28.6, 40.3)
0.50
44.1
(29.3, 44.1)
0.54
47.9
(31.0, 47.9)
0.58
51.7
(35.6, 51.7)
0.62
55.6
(36.6, 55.6)
0.66
59.6
(53.9, 59.6)
0.70
63.9
(68.0, 63.9)
0.74
68.4
(72.1, 68.4)
0.78
73.2
(83.9, 73.2)
0.82
78.6
(91.2, 78.6)
0.86
84.8
(92.2, 84.8)
0.90
92.4
(105.4, 92.4)
0.94
102.7
(108.4, 102.7)
0.98
121.5
(125.3, 121.5)

y (percentiles tericos)

150
100
y
recta a 45

50
0
-50

50

100

150

x (valores de la muestra)

Ejemplo. Hacer una grfica Q-Q para los datos del ejemplo anterior ajustndolos
a una distribucin exponencial.
k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

x
1.1
3.5
3.8
9.8
13.7
14.7
16.5
16.8
17.1
21.5
22.4
28.6
29.3
31.0
35.6
36.6
53.9
68.0
72.1
83.9
91.2
92.2
105.4
108.4
125.3

Prob. acumulada
0.02
0.06
0.10
0.14
0.18
0.22
0.26
0.30
0.34
0.38
0.42
0.46
0.50
0.54
0.58
0.62
0.66
0.70
0.74
0.78
0.82
0.86
0.90
0.94
0.98

Percentil terico (y)


0.9
2.7
4.6
6.7
8.8
11.0
13.3
15.7
18.3
21.1
24.0
27.2
30.6
34.2
38.3
42.7
47.6
53.1
59.4
66.8
75.6
86.7
101.5
124.1
172.5

(x, y)
(1.1, 0.9)
(3.5, 2.7)
(3.8, 4.6)
(9.8, 6.7)
(13.7, 8.8)
(14.7, 11.0)
(16.5, 13.3)
(16.8, 15.7)
(17.1, 18.3)
(21.5, 21.1)
(22.4, 24.0)
(28.6, 27.2)
(29.3, 30.6)
(31.0, 34.2)
(35.6, 38.3)
(36.6, 42.7)
(53.9, 47.6)
(68.0, 53.1)
(72.1, 59.4)
(83.9, 66.8)
(91.2, 75.6)
(92.2, 86.7)
(105.4, 101.5)
(108.4, 124.1)
(125.3, 172.5)

y (percentiles tericos)

200
150
y

100

recta a 45

50
0
0

50

100

x (valores de la muestra)

150