Вы находитесь на странице: 1из 31

1

1
1
PROFESOR: JUAN ZAMBRANO CHALLAPA PROFESOR: JUAN ZAMBRANO CHALLAPA
PROFESOR DE ESTADO EN MATEMATICA PROFESOR DE ESTADO EN MATEMATICA
MASTER EN ESTADISTICA MATEMATICA MASTER EN ESTADISTICA MATEMATICA
Tema 3
Inferencia Estadstica
FACULTAD DE INGENIERIA Y ARQUITECTURA
UNIVERSIDAD ARTURO PRAT
IQUIQUE - CHILE
2014
2
VARIABLE ALEATORIA; es una funcin que le asigna un nmero real a
cada elemento del Espacio Muestral .
----- 2
----- 3
----- 4
----- 5
----- 6
----- 7
----- 8
----- 9
----- 10
----- 11
----- 12
Se lanzan dos dados no cargados, sea:
X la variable aleatoria: SUMA DE LOS NUMEROS DE LAS CARAS SUPERIORES

f(x)
D
1
/ D
2
1 2 3 4 5 6
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
1/36
2/36
3/36
4/36
5/36
6/36
5/36
4/36
3/36
2/36
1/36
2
3

=
<
<
<
<
<
<
<
<
<
<
<
=
12 1 36 / 36
12 11 36 / 35
11 10 36 / 33
10 9 36 / 30
9 8 36 / 26
8 7 36 / 21
7 6 36 / 15
6 5 36 / 10
5 4 36 / 6
4 3 36 / 3
3 2 36 / 1
2 0
) (
x si
x si
x si
x si
x si
x si
x si
x si
x si
x si
x si
x si
x F

=
=
=
=
=
=
=
=
=
=
=
=
12 36 1
11 36 2
10 36 3
9 36 4
8 36 5
7 36 6
6 36 5
5 36 4
4 36 3
3 36 2
2 36 1
x si /
x si /
x si /
x si /
x si /
x si /
x si /
x si /
x si /
x si /
x si /
) x ( f
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
1 2 3 4 5 6 7 8 9 10 11
( )
x 1
si 2 x 7
36
f x
13 x
si 8 x 12
36

2 3 4 5 6 7 8 9 10 11 12
0 2 3 4 5 6 7 8 9 10 11 12
1
1/36
( ) , , ,...,
6 7 x
f x x 2 3 12
36

= =

4
Propiedades de F(x)
1. 0 F(x) 1
2. F(x) es una funcin escalonada creciente, con
lmite superior en 1
3. F(-) = 0 y F(+) = 1
4. P(a < X b) = F(b) - F(a)
3
5
Variables aleatorias discretas
Se dice que una variable aleatoria X es discreta si
existe una funcin f(x) llamada de probabilidad (o de
cuanta) tal que:
( )
( ) ( ) x X P x f iii
x f ii
x x f i
x
= =
=

)
1 )
; 0 ) ( )
6
ESPERANZA Sea X una variable aleatoria discreta, la
esperanza matemtica se define por:

=
= =
1
) ( ) (
i
i i
x X P x X E
) ( 7
36
1
12
36
2
11
36
3
10
36
4
9
36
5
8
36
6
7
36
5
6
36
4
5
36
3
4
36
2
3
36
1
2 ) ( u X E = + + + + + + + + + + =
Para el ejemplo de los dos dados
VARIANZA Sea X una variable aleatoria discreta, la
varianza se define por:
[ ]
2 2
) ( ) ( ) ( X E X E X V =
2 2 2 2 2 2
) ( 8333 , 5 ) 7 (
36
1
12
36
2
11 ...
36
2
3
36
1
2 ) ( u X V = + + + + =
( ) ( ) u X S 4152 , 2 8333 , 5 = = estndar Desviacin
4
7
Propiedades de la Esperanza
1) E(a) = a; a = constante
2) E(aX) = aE(X)
3) E(X + a)=E(X) + a
4) E[X - E(X)] = 0
5) E(XY) = E(X)E(Y) si X e Y son variables
aleatorias independientes
6)

= =
=
|
|

\
|
n
1 i
i
n
1 i
i
) X ( E X E
8
Propiedades de la Varianza
1) V(a) = 0; a = constante
2) V(aX) = a
2
V(X)
3) V(X + a) = V(X)
4) V(X + Y) = V(X) + V(Y) + 2Cov(X,Y)
5
9
DISTRIBUCIN DE BERNOULLI
Dado un experimento dicotmico con resultados E: xito o
F: fracaso, que ocurren con probabilidades p y q
respectivamente, tal que p + q = 1, se define la variable
aleatoria:

=
fracaso resulta si
xito resulta si
X
0
1
la funcin de probabilidad se define por:

=
=
=
0
1
) (
x si q
x si p
x f
q p X V p X E = = ) ( ; ) (
10
DISTRIBUCIN BINOMIAL
Una variable aleatoria discreta se distribuye Binomial si su funcin de
probabilidad est dado por:
p = probabilidad de xito
n = tamao muestral o n de veces que se repite el experimento en
forma independiente
Ejercicio 1. De acuerdo a la informacin registrada durante 10 aos, se
sabe que en una gran ciudad el nmero de accidentes con causa de
muerte tiene una probabilidad de 30%. a) Calcule la probabilidad que haya
un muerto. b) Calcule la probabilidad que haya dos muertos.
1211 , 0 7 , 0 3 , 0 ) 1 (
9 1
1 10
= = C X P 2335 , 0 7 , 0 3 , 0 ) 2 (
8 2
2 10
= = C X P
( ) ( ) ( )
( ) ( ) ( ) p np X Var np X E
n x
p p C x X P x f
x n x
x n
= =
=
= = =

1 ;
,..., 3 , 2 , 1 , 0
1
6
11
DISTRIBUCIN DE POISSON
Una variable aleatoria discreta se distribuye Poisson si su funcin de
probabilidad est dado por :
= t = valor promedio de eventos durante un intervalo t
: nmero de eventos que ocurren por unidad de tiempo t
Ejercicio 1. De acuerdo a la informacin registrada durante varios aos,
se sabe que en una gran ciudad el nmero de accidentes con causa de
muerte tiene una frecuencia de 30 casos al mes. a) Calcule la
probabilidad que haya un muerto en un lapso de 2 das. b) Calcule la
probabilidad que haya dos muertos en un lapso de 5 das.
2706 . 0
! 1
2
) 1 (
1 2
= = =

e
X P 0842 . 0
! 2
5
) 2 (
2 5
= = =

e
X P
( ) ( )
( ) ( )

= =
=

= = =

X Var X E
x
x
e
x X P x f
x
;
,..., 3 , 2 , 1 , 0
!
12
Ejercicio 2. Se sabe que el nmero de vehculos que
pasa por una plaza de peaje tiene una frecuencia de 120
veh/hora. a) Cul es la probabilidad que 10 vehculos
pasen en un lapso de 4 minutos? b) Qu 9 vehculos
pasen en 5 minutos?
09926 . 0
! 10
8
) 10 (
10 8
= = =

e
X P
1251 . 0
! 9
10
) 9 (
9 10
= = =

e
X P
7
13
Variables aleatorias continuas
Se dice que una variable aleatoria X es continua si
existe una funcin f(x) llamada de densidad de
probabilidad tal que:
( )
( ) ( ) ( ) ( ) b a IR b a a F b F dx x f b X a P iii
dx x f ii
x x f i
b
a
< = =
=

+

; , ; )
1 )
; 0 ) ( )
14
/
/
/
/
) ) ( ) ,
) ) ( ) ( ) ( )
( ) ( )
) ( ) ( ) .
) ( ) ( )
1
2 2
0
1
2 4
0
1 2
2 4
1 3
1 2
2 4
1 2
1 a f x 0 x
1 b f x dx 4x 1 x dx 4x 1 x dx
2x x 2 1 1
1 1
2 P x 2x x 0 227623
3 2
1
3 P x 2x x 0
2
+ +


= =
= = =
= =
= = =

1. Demostrar que f(x) es funcin de densidad
2. Calcular P(1/3 X 1/2)
3. P(X = 1/2)
Solucin:
Ejercicio
( ) ( ) 1 0 1 4
2
= x si x x x f Sea
8
15
( )
2 4
0 si x 0
F x 2x x si 0 x 1
1 si x 1
<

ble diferencia es F donde x x F


dx
d
x f = , )] ( [ ) (
Funcin de distribucin F(x)
Para el ejemplo:
Observaciones:
1. Para una variable aleatoria continua la funcin de
distribucin es continua
2. F(x) es creciente con lmite superior en 1
3. F(-) = 0 y F(+) = 1
4. Si F(x) es la funcin de distribucin que tiene funcin de
densidad f(x), entonces:
( ) ( ) ( ) IR x dt t f x X P x F
x
= =


,
16
Ejercicios:
1.- Sea X una variable aleatoria continua con funcin de
densidad dada por f(x) = C(x
2
- x
3
); si -1 < x < 1.
a) Determine el valor de la constante C
b) Determine y grafique F(x)
2.- Sea X una variable aleatoria continua con funcin de
densidad dada por f(x) = C(1-x
2
); si -1 < x <1.
a) Determine el valor de la constante C
b) Determine y grafique F(x)
c) Calcular:
i) P(X < 1/2)
ii) P(1/4 < X < 1/3)
iii) P(X < /0 < X < 3/4)
9
17
Esperanza y varianza de una variable aleatoria continua
Sea X una variable aleatoria continua:
dx x f x X E donde X E X E X Var ii
dx x f x X E i

+

+

= =
=
) ( ) ( )] ( [ ) ( ) ( )
) ( ) ( )
2 2 2 2
18
DISTRIBUCION UNIFORME
Una variable aleatoria continua de recorrido [a,b] se distribuye
uniforme si su funcin de probabilidad es :

=
caso otro en
b x a si
a b
x f
0
1
) (
Ejercicio 2: Una sustancia qumica contaminante se distribuye
uniformemente en el rango de 10 a 20 partes por milln (ppm). No se
considera nociva para la salud si la concentracin es menor que 10,5
ppm. Cul es la probabilidad que no sea nociva?

>

<
=
b x si
b x a si
a b
a x
a x si
x F
1
0
) (
.
( . ) .
10 5 10 2
F 10 5 0 05
10 10

= = =

>

<
=
20 1
20 10
10
10
10 0
) (
x si
x si
x
x si
x F
Ejercicio 1: Demuestre que: ( ) ( )
( )
12 2
2
a b
X Var y
b a
X E

=
+
=
10
19
Distribucin exponencial
Sea X una variable aleatoria con recorrido R
+
, X tiene
distribucin exponencial si:

caso otro en 0
0 x si e
) x ( f
x

( )
x
1 e si x 0
F x
0 si x 0


=

<

Ejercicio.
a) Demuestre que f(x) es funcin de densidad
b) A partir de f(x) obtenga F(x)
20
Dada una variable aleatoria con distribucin exponencial su
esperanza y varianza est dada por:
i) ii)
1 0
( )
0 0
x
e si x
F x
si x


=

<

La funcin de probabilidad acumulativa est dada por:


( )

1
= X E
( )
2
1

= X Var
11
21
Ejercicio 1
Sea X una variable aleatoria con distribucin exponencial.
Demuestre que:
.
.
( )
0 00125x
0 00125e si x 0
f x
0 en otro caso

.
( ) ( ) ( ) .
0 00125 20
P t 20 1 P t 20 1 1 e 0 3771

= < = =
Ejercicio 2
El tiempo de espera de los denunciantes en el Sernac
para realizar una denuncia tiene una distribucin
exponencial de parmetro =0.00125 (t en minutos).
Qu porcentaje de las personas espera ms de 20
minutos para realizar una denuncia?
( )

1
) = X E i ( )
2
1
)

= X Var ii
22
DISTRIBUCION NORMAL
Sea X una variable aleatoria continua con recorrido , la
variable X tiene distribucin normal de parmetros y
2
si
su funcin de probabilidad es:
0 , , ;
2
1
) (
2
2
) (
2
2
2
> =

x e x f
x

0,6826
-3 -2 - + +2 +3
12
23
-3 -2 - + +2 +3
0,9544
0,9974
-3 -2 - + +2 +3
24
Distribucin de Weibull
Esta distribucin se utiliza para modelar el tiempo entre fallas
de maquinarias o componentes electrnicos.
Una variable aleatoria tiene distribucin de Weibull si su
funcin de probabilidad est dada por:
x
1
x e
f(x, , ) x 0, 0, 0
0 en otro caso

| |

|

\

= > > >

Esta distribucin es una familia de distribuciones que


dependen de dos parmetros: el de forma y el de escala .
Si =1, sta distribucin es la distribucin exponencial con = 1/
13
25
La funcin de probabilidad acumulada est dada por:
x
F(x, , ) 1 e

| |

\
=
En la figura se muestras las distintas curvas
resultantes para:
=0.8 ,=1; =2 ,=1; =2 ,=2; =2, =3
x
1
x e
f(x, , ) x 0, 0, 0
0 en otro caso

| |
|
\

= > > >


Dada la funcin de probabilidad de Weibull:


26
Distribucin triangular
Una variable aleatoria tiene distribucin triangular si su
funcin de probabilidad est dada por:
x 0 x 1
f(x) 2 x 1 x 2
0 en otro caso

= <

Esta distribucin se denomina distribucin triangular con


extremos (0,2) y moda en 1. La funcin de probabilidad
acumulada es:
2
2
0 x 0
x
0 x 1
2
F(x)
(2 x)
1 1 x 2
2
1 x 2

<

<

>

0 0.4 0.8 1.2 1.6 2


0
0.2
0.4
0.6
0.8
1
14
27
Estimacin de parmetros de una distribucin
Los dos mtodos ms usados para estimar los
parmetros de estas distribuciones es el de mnimos
cuadrados y el de mxima verosimilitud
1. Binomial
2. Binomial negativa
3. Poisson
4. Normal
5. Lognormal
6. Exponencial
7. Gamma
8. Beta
9. Erlang
10. Weibull
11. Uniforme continua y discreta:
12. Triangular
13. Emprica
28
Sea x
1
, x
2
, x
3
,,x
n
una muestra aleatoria de tamao n,
proveniente de una distribucin, los estimadores
mximo verosmiles son:
Poisson:
Exponencial:
Uniforme [0, ]: X
mx
(n + 1)/n
Normal: y
n
i
i 1
x
x
n
=
=

n
i
i 1
n
1/ x
x
=
=

n
i
i 1
x
m x
n
=
= =

n
2
i
2 2 i 1
*
(x x)
S
n 1
=

15
29
Ejemplo
Se tienen los tiempos de atencin de 10 personas de
personas en estaban en una fila de espera, se cree que el
tiempo de atencin tiene distribucin exponencial.
i Entrada r
i
1 0.684
2 0.408
3 1.568
4 0.633
5 0.328
6 1.199
7 0.014
8 1.433
9 0.343
10 1.183
; por lo tanto, 1,2832.
x 0.7793 =
30
Grfico q-q
Una alternativa al empleo de histogramas para identificar la
distribucin de los datos es el grfico
Quantile -quantile.
ste tipo de grfico puede utilizarse an cuando los datos
son escasos (menos que 30), y al no depender de
parmetros arbitrarios, como el nmero de clases y el ancho
de los intervalos, facilita la evaluacin del grado de ajuste de
la distribucin propuesta al conjunto de datos analizados.
16
31
Si X es una variable aleatoria con distribucin acumulada
F(x), el q-quantile de X es el valor g tal que:
F() = P(X ) = q para 0 < q < 1.
Cuando F(x) tiene inversa, el quantile es igual a = F
-1
(q).
Sea {x
i
, i = 1, 2, ..., n} una muestra de X.
Dicha lista ordenada de menor a mayor origina la nueva
lista {y
j
, j = 1, 2, ..., n} donde y
1
y
2
... y
n
El grfico q - q se basa en que y
j
es una estimacin del
(j-0,5)/n quantile de X, con n tamao de la muestra
32
Suponga que se est probando una distribucin con funcin
de probabilidad acumulada F(x) para representar los datos en
estudio.
Si F(x) es de la familia de distribuciones adecuada; entonces,
el grfico y
j
vs F
-1
((j-0,5)/n) ser aproximadamente una lnea
recta.
Si adems, los parmetros de F(x) tienen los valores
adecuados; entonces, la lnea recta tendr pendiente
prxima a 1.
Si F(x) no es la funcin adecuada, los puntos no estarn
alineados.
17
33
La verificacin de la distribucin exponencial que se ajust
en la seccin anterior con = 1,2833 se muestra en la Tabla,
Figura 6 y Figura 7.
j
1.2832 y
j
F( y ) 1 e

=
1
j j
1
F ( q ) ln(1 q )
1, 2832

=
j y
j
q
j
=(j-0,5)/10 F(Y
j
) F
-1
(q
j
)
1 0,014 0,05 0,01780 0,03997
2 0,328 0,15 0,34354 0,12665
3 0,343 0,25 0,35605 0,22419
4 0,408 0,35 0,40758 0,33571
5 0,633 0,45 0,55615 0,46590
6 0,684 0,55 0,58427 0,62228
7 1,183 0,65 0,78086 0,81813
8 1,199 0,75 0,78531 1,08034
9 1,433 0,85 0,84100 1,47843
10 1,568 0,95 0,86629 2,33458
34
Figura 6: Grfico q-q
18
35 Figura 7: Grfico q-q modificado
36
Para el mismo ejemplo, el estimador mnimo cuadrtico de
una distribucin exponencial es = 0,83, luego:
j
0,83 y
j
F( y ) 1 e

=
1
j j
1
F ( q ) ln (1 q )
0, 8 3

=
j y
j
q
j
=(j-0,5)/10 F(y
j
) F
-1
q
j
)
1 0,014 0,05 0,01155 0,06180
2 0,328 0,15 0,23833 0,19581
3 0,343 0,25 0,24775 0,34660
4 0,408 0,35 0,28726 0,51902
5 0,633 0,45 0,40868 0,72029
6 0,684 0,55 0,43318 0,96206
7 1,183 0,65 0,62540 1,26485
8 1,199 0,75 0,63034 1,67023
9 1,433 0,85 0,69559 2,28569
10 1,568 0,95 0,72786 3,60932
Se puede verificar que los grficos tienen pendientes cercanas a 1, luego se
verifica que los datos son exponenciales de parmetro = 0,83
19
37
Ejemplo
Verificar si los datos tienen distribucin aproximada normal.
El valor medio es 99,99 y desviacin estndar 0,5322
Estos valores pueden utilizarse como estimaciones de los
correspondientes parmetros de una distribucin normal.
38
La tabla muestra los datos ordenados y los clculos
realizados para comprobar si pueden ser representados por
una distribucin normal.
20
39
Los puntos estn alineados a lo largo de una recta con pendiente
prxima a 1; por lo tanto, se puede concluir que los datos tienen
una distribucin normal con valor medio 99.99 y desviacin
estndar 0,5322.
Notar que es posible realizar un grfico equivalente que no
emplee la funcin inversa de la distribucin acumulada, la cual
puede no existir; para ello, se grafica F(y
j
) vs q
j
.
40
21
41
INFERENCIA
Parmetro: es la caracterizacin numrica de una poblacin, que
describe parcialmente o en forma completa la funcin
de densidad (o de probabilidad) de la caracterstica
en estudio
Estadgrafo o Estadstico: es una funcin de las variables
aleatorias que se observan en una muestra.
Ejemplos:
La distribucin de probabilidad de un estadstico recibe el nombre
de distribucin muestral.
2
*
1
2
2
1
1
1
) (
) ( ) ( s
n
x x
x f x
n
x
x f
n
i
i
n
i
i
=

= = =

= =
42
Distribucin muestral de un estadstico
Al extraer de una poblacin todas las muestras de un determinado tamao
y calculando en cada una de ellas el parmetro de inters, se obtendrn
muchos valores diferentes de ese estadstico muestral, lo que se conoce
como la variabilidad natural del muestreo, todos estos valores posibles de
un estadstico generan lo que se denomina su distribucin muestral.
Si se tiene una poblacin de tamao 1000 y se quiere tomar una muestra
aleatoria de tamao 100, existen por tanto 1000 sobre 100 combinaciones
posibles de realizar esta eleccin
139
!
6,3850511926305130236698511142022 10
! !
| |
= =
|

\
1000 1000
100 900 100
que es el nmero total de muestras distintas de tamao 100 que se
pueden escoger. Si a cada una de estas muestras se le calcula el
estadstico de inters, se tendrn igual nmero de resultados de este
estadstico, con ellos se puede obtener la distribucin muestral del mismo
22
43
muestras distintas.
Para explicar este concepto, se considera un universo de
tamao N=5, integrado por los elementos
en kilos.
Luego:
Si se toman muestras de tamao 3, existen:
Muestra Valores en la muestra Promedio de la muestra
1 25 26 27 26,000
2 25 26 28 26,333
3 25 26 29 26,667
4 25 27 28 26,667
5 25 27 29 27,000
6 25 28 29 27,333
7 26 27 28 27,000
8 26 27 29 27,333
9 26 28 29 27,667
10 27 28 29 28,000
{ } 29 28, 27, 26, 25, P =
2
kilos 2 y kilos 27
2
= =
10
3! 2!
5!
3
5
=

=
|
|

\
|
44
Luego, la distribucin muestral de la media est dada por:
Promedio de la muestra Frecuencia Probabilidad de la media
26 1 0,10
26,333 1 0,10
26,667 2 0.20
27 2 0,20
27,333 2 0,20
27,667 1 0,10
28 1 0,10
se puede verificar que :
( ) . . . .
1 1 2 2 2 1 1
E x 26 26 333 26 667 27 27 333 27 667 28 27 kg
10 10 10 10 10 10 10
= + + + + + + = =
y
. . . . 26 26 333 26 667 2 27 27 333 2 27 667 28
y X 27 kg
10
+ + + + + +
= =
23
45
DISTRIBUCIN MUESTRAL DE LA MEDIA
Teorema central del lmite : Sean x
1
, x
2
,..., x
n
una muestra aleatoria de
tamao n, con distribucin de probabilidad no especificada, que tiene
media y varianza
2
finita.
El promedio muestral
Tiene una distribucin con media y varianza finita
2
/n,
Que tiende a una distribucin normal cuando n tiende a infinito, es decir la
variable aleatoria
n
x x x
x
n
__
+ + +
=
2 1
Si n es grande, sin importar cual sea la distribucin de probabilidad a
partir de la cual se obtuvo la muestra.
) 1 , 0 ( N
n
X

( )
|
|

\
|

n
X X
2
2
; N ~ ; N ~


46
DISTRIBUCIN MUESTRAL DE P
Sea x una v.a con distribucin de Bernoulli de parmetro P.
Se toma una muestra aleatoria de tamao n, se estima p, por:
luego
n
x
P
n
i
i
=
=
1

N(0,1) ~

n
Q P
P P
z

=
24
47
DISTRIBUCIN MUESTRAL DE (n-1)S
2
/
2
Si S
2
es la varianza de una muestra aleatoria de tamao n
tomada de una poblacin normal que tiene varianza
2
,
entonces el estadstico:
Se distribuye
2
con =n-1 grados de libertad, con
( )
1
1
2
2

=
n
x x
S
n
i
i
( )
2
1
2
2
~
1


n
S n

48
La inferencia estadstica consiste en tomar una decisin respecto de una
o ms poblaciones tomando como referencia los datos proporcionados
por una muestra de ella. se deben buscar mtodos para transferir los
resultados de la muestra a la poblacin con el mnimo de error y la
mxima seguridad.
La inferencia estadstica se puede realizar mediante estimacin de
parmetros o por dcimas (pruebas de hiptesis)
ESTIMACIN DE PARMETROS
A partir de una muestra aleatoria de tamao n de una poblacin, la
estimacin de una caracterstica de ella se puede realizar a travs de
Estimacin Puntual o mediante Estimacin por Intervalos de Confianza.
Estimacin Puntual
Un estimador puntual debe tener las siguientes propiedades:
1) Estimador Insesgado
Se dice que un estimador es insesgado si su esperanza matemtica es
igual al parmetro:
Un estimador es insesgado, es equivalente a decir que su sesgo es nulo
INFERENCIA ESTADSTICA
) E( =

25
49
Proposicin
Dada una muestra aleatoria x
1
, x
2
,...,x
n
proveniente de una
poblacin, la varianza de los x
i
definida por:
Es un estimador insesgado de
2
, en efecto:
( ) ( ) [ ]
( ) ( )( ) ( )
( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( )
2
2
2
2
2
1
2
2
1
2
2
1
2
1
2
1 1
2
1
2
2
1
2
1
2
1
2 2
1
1
1
1
1
1
1
1
1
2
1
1
2
1
1
2
1
1
) (
1
1
) (
1
1
) (
1
1

=
|
|

\
|

=
|
|

\
|

=
|
|

\
|

=
|
|

\
|
+

=
|
|

\
|
+

=
|
|

\
|
(

=
|
|

\
|

=
|
|

\
|

=
|
|

\
|


=
= =
= = =
=
= = =
n
n n
n n
n
x nE x E
n
x n x E
n
x n x n x x E
n
x x x x E
n
x x x x E
n
x x E
n
x x E
n
x x
n
E S E
n
i
i
n
i
i i
n
i
i
n
i
n
i
i
n
i
i
n
i
i i
n
i
i
n
i
i
n
i
i
( )
1
1
2
2

=
n
x x
S
n
i
i
50
2) Estimador Consistente
Es razonable esperar que un buen estimador de un
parmetro sea cada vez mejor si el tamao de la muestra
aumenta.
0 )

( lim , )

( lim = =

V E
n n

( ) ( ) ( ) ( )
n n n
i i i
n n n n n
i 1 i 1 i 1
n n
1 1 1
lmE lmE x lmE x lm E x lm E x
n n n
1
lm n lm
n



= = =

| |
= = = =
|
\
= = =

( ) ( ) ( ) ( )
n n n
i i i 2 2
n n n n n
i 1 i 1 i 1
2
n n
1 1 1
lm V lm V x lm V x lm V x lm V x
n n n
1
lm n lm 0
n n


= = =

| |
= = = =
|
\
= = =

para el ejemplo de la distribucin de Poisson, se tiene:
26
51
3) Estimador Eficiente
Un estimador es eficiente si la varianza del estimador es la menor
posible
Un estimador puntual es eficiente si la varianza del estimador es la
menor posible. Si E
1
y E
2
son dos estimadores insesgados con
varianzas V(E
1
) y V(E
2
), respectivamente, con V(E
1
) < V(E
2
), se dice
que el estimador E
1
es ms eficiente que E
2
.
Sea x
1
, x
2
, ..., x
n
una muestra aleatoria de tamao n. Se ha probado
que y x
1
son estimadores insesgados de .
es ms eficiente que x
1
para estimar puesto que
x
x
Pero,
( ) ( )
2
1
2

= < = x V
n
X V
52
Estimadores de Mxima Verosimilitud
Sea x
1
, x
2
,...,x
n
es una muestra aleatoria de tamao n proveniente de
una poblacin con funcin de densidad f( x , ). La funcin de
densidad conjunta o funcin de verosimilitud est dada por :
1 2 n
L( ) f(x , ) f(x , ) f(x , ) =
Si se encuentra una funcin de x
1
, x
2
,.., x
n
, definida por g(x
1
, x
2
, ..., x
n
)
tal que cuando es reemplazado por g(x
1
, x
2
,.., x
n
) la funcin de
verosimilitud es mxima. Entonces el estadstico:
= g(x
1
, x
2
, ,.., x
n
) se llama Estimador Mximo Verosmil de

Ejemplo: Sea x
1
, x
2
,..., x
n
es una muestra aleatoria de tamao n
proveniente de una poblacin con funcin de Poisson de parmetro
, luego la funcin de verosimilitud est dada por
1 2 n
x x x
1 2 n
e e e
L( ) f(x , ) f(x , ) f(x , )
x ! x ! x !
1 2 n


= =
27
53
Es decir,
Aplicando logartmo natural a esta expresin, se tiene :
Derivando respecto de e igualando a cero se tiene:
Por lo tanto, el estimador mximo verosmil de es:
x =

.
x x
x
n
n
i
i
n
i
i
= = = +

=
=
1
1

( )

=
n
i
i
x
n
x
e
L
n
i
i
1
!
1

( ) ( ) ( )
|
|

\
|
+ =

= =
n
i
i
n
i
i
x Ln Ln x n L Ln
1 1
!
54
Ejemplo
Sea x
1
, x
2
, ..., x
n
es una muestra aleatoria de tamao n
proveniente de una poblacin normal con funcin de
densidad
La funcin de densidad conjunta est dada por :
2
2
( )
2
2
2
1
( , , ) ,
2
x
f x e x R

= =

| |
=
|
\
2 2 2
1 2
2 2 2
2
1
2
( ) ( ) ( )
2 2 2 2
2 2 2
( )
2
2
1 1 1
( , ) ( ) ( )
1
2 2 2
1
2
n
n
i
i
x x x
x
n
L f x f x e e e
n
e
Esta funcin conjunta es una funcin de y
2
, que
denotamos por L( ,
2
) se llama funcin de verosimilitud

| |
=
|
\
2
1
2
( )
2
2
2
1
( , )
2
n
i
i
x
n
L e
28
55
Se deben encontrar los valores de y de
2
que hagan mxima la
probabilidad L(,
2
).
El valor de que maximiza L(,
2
) ser un buen estimador de , en
muchos casos tanto L(,
2
) como Ln(L(,
2
)) son maximizados por el
mismo valor de , luego:

=

| |
=
|
\
2
2 1
2
2
( )
1
ln( ( , )) ln
2
2
n
i
i
x
L n



=

=

2 1
2
2 ( )
ln( ( , ))
2
n
i
i
x
L

= =
= =

= = = =


1 1
2
1 1
2 ( )
0 ( ) 0 0
2
n n
i i n n
i i
i i
i i
x x
x x n
n
x =
Por lo tanto, la derivada parcial respecto de
Igualando a cero, se tiene:
Luego, el valor que maximiza a L(,
2
) es
Y se denomina estimador mximo verosmil del parmetro .
56
A) Intervalo de Confianza para la media de una poblacin normal
i) Cuando es conocida
Sea x
1
, x
2
,...,x
n
es una muestra aleatoria de tamao n proveniente
de una poblacin con distribucin donde es conocida,
luego:
2

( )
2
, N

2
por lo tanto,
|
|

\
|

n
, N x
2
) , ( N
n
x
z 1 0


=
Definiendo el Nivel de Confianza por 1-, y el percentil , se tiene:
z

2
( )% 1
2


z z

2
1
2

=
|
|

\
|
< <

=
|
|

\
|
<


<

1 1
2
1
2 2
1
2
n
z x
n
z P z
n
x
z P
(

n
z x ;
n
z x
2
1
2
1
Intervalo de confianza
para del (1-)%
2 2
1

= z z
29
57
Ejercicio. En un municipio se desea estimar cual es el gasto promedio
diario en combustible, para limpiar las calles. Para ello, se selecciona una
muestra aleatoria de 20 das de un mes. Los gastos diarios fueron :107361,
112055, 111362, 112756, 116055, 101562, 112304, 111795, 112656,
108011, 105062, 112395, 112307, 111976, 112757, 111361, 109422,
111806, 111307, 108100. Supngase que los gastos diarios se distribuyen
aproximadamente normal con desviacin estndar $3200. Construir un
intervalo de confianza estimado del 95% para el valor promedio del gasto
diario.
z
0.025
= -1.96 z
0.975
=1.96 z
0.025
= z
0.975
=1.96
(

+ < <
(


+ < <

20
3200
96 1 5 110620
20
3200
96 1 5 110620
2
1
2
1
. . . .
n
z x
n
z x
[ ] 96 112022 04 109218 . ; ,
025 0
2
. =

025 0
2
. =

975 , 0
2
1 025 , 0
2
05 , 0 5 , 620 . 110 = = = =

x
58
ii) Cuando es desconocida
Sea x
1
,x
2
,...,x
n
es una muestra aleatoria de tamao n proveniente de
una poblacin con distribucin
a) b) c)
( )
2
, N
) 1 , 0 ( N
n
X

1
2
2
2

n
nS

=

2
1 0 ) , ( N
T
Donde son los grados de libertad de un distribucin 1 = n
2
1
*

=
n
t
n S
X
T

Luego
El intervalo de confianza del 100(1- )% para cuando es
desconocida est dado por :

2
* *
(n 1),1 (n 1),1
2 2
S S
x t ; x t
n n


(
+
(

2
30
59
Ejercicio. La Oficina de Personal est interesada en estimar la cantidad
promedio de dinero que se gasta en personal por concepto de comisiones de
servicio, para realizar mediciones en terreno. De las distintas comisiones de
servicio que se han efectuado se seleccion una muestra aleatoria de 15
funcionarios, obteniendo los siguientes valores de gastos rendidos por da (en
miles) : 22.5 , 28.2 , 29.5 , 22.2 , 24.8 , 25.4 , 23.7 , 22.5, 24.3 , 22.9 , 22.4 ,
28.7 , 26.5 , 28.2 y 20.5. Si se supone que la cantidad de dinero que se gasta
diariamente se distribuye aproximadamente normal. Obtener un intervalo de
confianza del 95% para el gasto promedio real.
975 , 0
2
1 025 , 0
2
05 , 0 80718466 . 2 82 . 24 = = = = =

s x
t
0.025, 14
= -2.145 t
0.975, 14
= 2.145 t
0.025
= t
0.975
(


(
(

+ < <

15
80718466 . 2
145 . 2 82 . 24
2
1
2
1
n
s
t x
n
s
t x


[ ] 3747 . 26 ; 2652 . 23
60
B) Intervalo de Confianza para una proporcin
Para construir un intervalo de confianza para el parmetro p desconocido de una
distribucin binomial con n conocido, se considera una muestra aleatoria x
1
,
x
2
,...,x
n
, donde:
Sea el estimador puntual, luego:
por lo tanto
el intervalo aproximadamente del (1- )% para una muestra grande est dado por:
:

=
=
P q ad probabilid con
P ad probabilid con
x
i
1 0
1

=
= =
n
i
i
x
n
x P
1
1

( ) ( ) ( )
n
P P
x V P V P x E P E
) 1 (
) (


= = = =
( )
) 1 , 0 (

N
n
P P
P P

( ) ( )
(
(



n
P P
Z P
n
P P
Z P

2
1
2
1

31
61
z
0.025
= -1.96 z
0.975
=1.96 |z
0.025
| = | z
0.975
| =1.96
Ejercicio. Se recibe un gran cargamento de radio transmisores y se sabe
que algunos son defectuosos. Se selecciona una muestra aleatoria de
tamao 1000 de este envo, y se realiza una prueba de funcionamiento,
encontrndose que 5 de ellos eran defectuosos. Determine un intervalo de
confianza aproximado del 95% para la proporcin de radiotransmisores que
funcionan correctamente.
975 , 0
2
1 025 , 0
2
05 , 0 995 . 0

005 , 0
1000
5

= = = = = =

P Q
2 2
p (1 p ) p (1 p )

P Z ; P Z
n n

(

+
(
(

(


1000
005 , 0 995 , 0
96 , 1 995 , 0 ;
1000
005 , 0 995 , 0
96 , 1 995 , 0
[ ] 99937 0 99063 0 , ; ,
La proporcin est entre con una certeza del 95%
62
C) Intevalo de confianza para

2
Para desconocida
Sea x
1
, x
2
,...,x
n
es una muestra aleatoria de tamao n proveniente
de una poblacin con distribucin ,
si es desconocida se sabe que :
( )
2
, N
( )
) 1 (
2
2
2
1

n
S n

2 ,
) (
) 1 (
2
2
1
2

n
x x
n
n
i
i

luego, el intervalo de confianza del (1-)% para est dado por

2
n n
2 2
i i
i 1 i 1
2 2
(n 1) , 1 (n 1) ,
2 2
(x x) (x x)
;
= =


(

(
(

(
(

2 2
* *
2 2
( n 1) , 1 ( n 1) ,
2 2
(n 1)S (n 1)S
;


(
(
(

(

bien
32
63
Ejercicio
Para el problema de gastos del personal en comisiones de servicio,
determine el intervalo de confianza del 95% para
2
975 . 0
2
1 025 . 0
2
05 . 0 80718466 . 2 82 . 24
*
= = = = =

S x
(
(


2
1
2
2
2
1 1
2
2
1 1
, ) n (
*
, ) n (
* S ) n (
;
S ) n (
324 . 110 ) 1 ( 880285715 . 7 *
2
*
2
= = S n S
13 26 975 0 14
2
. . , = 62 5 025 0 14
2
. . , =
[ ] 6306 . 19 ; 2221 . 4
62 . 5
324 . 110
;
13 . 26
324 . 110
=
(

[ ] 6306 . 19 ; 2221 . 4
2

[ ] 430643 . 4 ; 05477 . 2
64
Dcimas (o Pruebas) de Hiptesis
Introduccin: los problemas a los que se enfrenta un
investigador, no se refieren slo a la estimacin de un
parmetro poblacional, sino, a la formulacin de un
procedimiento de decisin basado en los datos que
puedan producir una conclusin acerca de un problema.
Por ejemplo, un investigador puede decidir, en base a
la informacin que dispone, que el consumo de alcohol
de los conductores aumenta el riesgo de producir
accidentes de trnsito. Para verificar esta hiptesis debe
obtener informacin a partir de datos experimentales y
tomar una decisin en base a ellos. Esta conjetura se
puede exponer como una Hiptesis Estadstica.
33
65
Definicin
Una Hiptesis Estadstica es una afirmacin o conjetura
acerca de las caractersticas de una o ms poblaciones.
El problema de una hiptesis estadstica, es que nunca se
sabe con absoluta certeza la verdad o falsedad de ella, a no
ser que se examine toda la poblacin. En la prctica slo se
toma una muestra aleatoria de esta poblacin de inters y se
utilizan estos datos para confirmar o no dicha hiptesis.
Definicin
Una Dcima o Prueba de Hiptesis es una regla o
procedimiento que nos indica cuando aceptar o rechazar
una hiptesis en funcin de los datos experimentales de
una muestra aleatoria.
66
Hiptesis Nula y Alternativa
La estructura de la prueba de hiptesis se formular utilizando el trmino
Hiptesis Nula, para cualquier afirmacin que involucre el no cambio en la
poblacin, la que se denota por H
0
. El Rechazo de H
0
da como resultado la
aceptacin de una Hiptesis Alternativa H
1
.
Al probar cualquier hiptesis estadstica se pueden presentar las
siguientes situaciones:
Aceptar H
0
Rechazar H
0
H
0
Verdadera Decisin correcta
Error tipo II
H
0
Falsa
Error tipo I
Decisin correcta
) / (
0 0
falsa es H H Aceptar P =
) / (Re
0 0
verdadera es H H chazar P =
34
67
Dcima para una proporcin
Ejercicio
Supongamos que para pegar las etiquetas de identificacin
de cierto producto se usa un adhesivo A, que es el
tradicional y que tiene una efectividad del 96% para cierto
perodo. Suponga que aparece un nuevo adhesivo B el cual
se desea comparar con el pegamento tradicional. El
adhesivo B se prueba en 1500 productos en ese perodo y
se encuentran 20 de ellos con la etiqueta parcialmente
despegada y 25 sin etiqueta. Se tiene informacin que el
nuevo adhesivo ha tenido mejor eficiencia en otra empresa.
Es el nuevo adhesivo ms eficaz que el tradicional?
68
Planteamiento de la hiptesis
Hiptesis de Nulidad
H
0
: El pegamento B en cuanto a efectividad es igual al pegamento A
Sea p: la proporcin de efectividad en la poblacin con el adhesivo B
p
0
: la proporcin de efectividad en la poblacin con el adhesivo A;
luego H
0
: p = p
0
= 96%
Enunciada la hiptesis de nulidad, se debe plantear una hiptesis
alternativa, que es la que considera el cambio.
Este cambio se puede presentar de distintas formas, por lo que la
formulacin correcta de esta hiptesis es otro de los aspectos importantes
en la dcima, ya que orientar para la construccin de la regla de
decisin..
35
69
Hiptesis Alternativa H
1
Dependiendo del conocimiento que se disponga, se pueden plantear las
siguientes hiptesis alternativas :
H
1
: p > p
0
, es decir, H
1
: p > 96% La proporcin de eficacia con el
adhesivo B es mayor que la del adhesivo tradicional (prueba unilateral)
H
1
: p < p
0
, es decir, H
1
: p < 96% La proporcin de eficacia con el
adhesivo B es menor que la del adhesivo tradicional (prueba unilateral)
H
1
: p p
0
, es decir, H
1
: p 96% La proporcin de eficacia con el
adhesivo B es distinta que la del adhesivo tradicional (prueba bilateral).
Esta prueba es recomendada cuando no hay un conocimiento anterior
del problema que permita enunciar pruebas unilaterales.
70
Determinacin de la Regin de Rechazo de la
Hiptesis
Para = 0.05
a) Para H
1
: p > p
0
, es decir, H
1
: p > 96%
z
crt
= 1.64
Regin de rechazo de H
0
Con esta rea = 0.05, se busca en la tabla normal aquel valor que deja un
rea bajo l de 0.95, encontrando z = 1.64. Este valor de z se llama z
crtico
.
Si el valor calculado en la muestra es mayor que este z crtico, se debe
rechazar H
0
, en cambio si el valor calculado es menor, se dice que no existe
evidencia para rechazar H
0
, y que las diferencias observadas son producto
del azar del muestreo
36
71
b) Para H
1
: p < p
0
, es decir, H
1
: p < 96%
z
crt
= -1.64
Regin de rechazo de H
0
Con esta rea = 0.05, se busca en la tabla normal aquel valor que deja
bajo l de 0.05, encontrando z = -1.64. Si el valor calculado en la muestra
es menor que este z crtico, se debe rechazar H
0
, en cambio si el valor
calculado es mayor, se dice que no existe evidencia para rechazar H
0
, y
que las diferencias observadas son producto del azar del muestreo
72
c) Para H
1
: p p
0
, es decir, H
1
: p 96%
z
crt
= -1.96 z
crt
= 1.96
Regiones de rechazo de H
0
como = 0.05 /2 = 0.025, se busca en la tabla normal aquellos
valores que dejan un rea bajo l de 0.025, y un rea bajo l de 0.975.
Los valores crticos son z = -1.96 y z =1.96, si el valor calculado se
encuentra entre -1.96 y 1.96, se dice que no existe evidencia para
rechazar H0.
para el ejemplo del adhesivo, se usar la opcin a), dado que se
tiene informacin previa que indica que al parecer es ms eficiente.
37
73
Requisito de similitud
Qu requisitos debe cumplir la muestra que se ha de escoger?.
La muestra debe ser aleatoria, lo que garantiza independencia en la
seleccin de las variables y representatividad de la poblacin, puesto que
los errores que se pueden producir son slo a consecuencia del azar.
Deben estar representados todos los factores que involucren la eficacia del
adhesivo.
Clculo del estadstico a usar
Un estadstico corresponde a un valor calculado que obtenemos a partir de
una muestra.
cal
p p
z
p q
n

donde p : es la proporcin de eficacia del adhesivo B en la muestra, p


0
: es la
proporcin de eficacia del adhesivo tradicional (90%), y n es el tamao de la
muestra.
74
Conclusin
Como z
cal
> z
crit
, se rechaza H
0
, o sea, el adhesivo B es
significativamente ms eficaz que el pegamento tradicional.
Luego, en el ejemplo
9764 . 1
1500
4 96
) 96 97 ( =

=
cal
z
Supongamos que la proporcin anual promedio de nios con
daos orgnicos por contaminacin por arsnico en
Antofagasta hasta el 2002 fue de un 4%. De la informacin del
ao 2003, se toma una muestra aleatoria de 1500 nios y en
75 de ellos se constata daos orgnicos por contaminacin
por arsnico. Se puede afirmar que ha habido un aumento
en la proporcin de nios con daos orgnicos?
38
75
Dcima para un promedio
a) Varianza conocida
Sea x
1
, x
2
, ... , x
n
una muestra aleatoria de tamao n
proveniente de una distribucin normal N(,
2
) donde
2
es conocida,
luego el estadstico
) , ( N
n /
x
z 1 0
0


=
Se sabe que en proceso industrial de llenado de bolsas de fertilizantes tiene
distribucin aproximada normal con media 35 kg y desviacin estndar de 3
kg, se ha detectado que las bolsas tienen un peso menor al valor
especificado. El productor quiere que las bolsas tengan un peso un poco
mayor al indicado para compensar a sus clientes. Se recalibra la vlvula de
regulacin. Posterior a ello, se toma una muestra aleatoriamente de 50
bolsas encontrando un peso promedio de 35.8 kg. Se puede concluir que
la recalibracin logr aumentar el contenido de fertilizante por bolsa?
Use = 0.05
Requisito de similitud : La muestra es aleatoria y representativa de la
poblacin
76
Hiptesis de trabajo H
0
: = 35 kg
H
1
: > 35 kg
Nivel de significacin = 0,05

Determinacin de la regin de rechazo de H


0
z
0.95
= 1.64
Regin de rechazo de H
0
=0.05
Clculo del estadstico a usar
El estadstico calculado se define por
0
cal
x
z
/ n

=

Con los datos de la muestra se tiene


8856 . 1
50 / 3
35 8 . 35
/
0
=

=
n
x
z
cal

Como z
cal
> z
crit
, se rechaza H
0
, es decir, la recalibracin logr un
aumento del peso promedio de cada bolsa, p-value<0,0301
39
77
Ejemplo
Un empresa tiene prdidas promedio de 45.7 M$ semanal. Despus de
aplicar un procedimiento para disminuir las prdidas, se analizaron los
resultados de 24 semanas, encontrando una prdida promedio de 44.25
M$, con una desviacin estndar de 2.6 M$. Para un nivel de
significacin de = 0,01, Suponiendo que las prdidas tienen una
distribucin aproximada normal, qu puede concluir respecto de si se
logr reducir las prdidas?
Requisito de similitud : Se supone que la muestra es aleatoria y
representativa de la poblacin.
Hiptesis de trabajo H
0
: 45,7 M$
H
1
: < 45,7 M$
Nivel de significacin : = 0,01
b) Varianza desconocida
Sea x
1
, x
2
, ... , x
n
una muestra aleatoria de tamao n proveniente de una
distribucin normal N(,
2
) donde
2
es desconocida, luego el estadstico
) 1 (
*

=
n cal
t
n S
x
t

78
t
0.01 , 23
= -2.5
Regin de rechazo de H
0
Prueba de hiptesis
El estadstico de prueba es
Conclusin : Como z
cal
< z
crt
, se rechaza H
0
, el procedimiento
logr disminuir las prdidas.

=
n S
x
t
cal
*

cal
*
x 44.25 45.7
t 2.732
S n 2.6/ 24

= = =
40
79
Ejercicios
1) Se toma una muestra aleatoria de 10 terrenos agrcolas, encontrando
que el promedio de concentracin de plomo es 56.017 mg/kg d.m, con
una desviacin estndar de 2.115 mg/kg d.m. Suponiendo que la
concentracin de plomo se distribuye aproximadamente normal,
parecera indicar que la concentracin es superior a 55.4 mg/kg d.m.
que es el mximo permitido?
2) Un fabricante de bateras para sensores de radiacin afirma que ellas
tienen una carga til media de 148 horas. El departamento de
adquisiciones se interesa en comprar esta bateras siempre que la
carga til media no sea inferior a lo afirmado por el fabricante. Para
tomar una decisin el departamento compra en forma annima 25
bateras y las utiliz en forma experimental hasta que se agot su
carga til, obteniendo una carga til media de 147.2 horas con una
desviacin estndar S*=2.5 horas. Suponiendo que la duracin de la
carga tiene una distribucin aproximadamente normal, Qu decisin
debe tomar el departamento de adquisiciones si utiliza un nivel de
significacin del 5%?
80
DCIMA PARA DOS PROPORCIONES
Dadas dos poblaciones de tamaos n
1
y n
2
, con E
1
xitos la
primera, y E
2
xitos la segunda
0 : :
2 1 0 2 1 0
= = p p H o p p H
0 : :
2 1 1 2 1 1
< < p p H o p p H
0 : :
2 1 1 2 1 1
> > p p H o p p H
0 : :
2 1 1 2 1 1
p p H o p p H
1 2
calculado
1 1 2 2
1 2
p p
z
p q p q
n n

=

+
Donde
2
2
2
1
1
1

n
E
p
n
E
p = =
2 1
2 1

n n
E E
p
+
+
=
41
81
0.025 0.95 0.025
z
0.025
=-1.96 z
0.975
=1.96
Ejercicio. Una empresa tiene dos plantas A y B para producir un mismo
tipo de polines. En la planta A, 131 de 468 polines tienen una pequea
deformacin, en cambio, en la planta B 57 de 237 polines tienen el
mismo problema.
Se puede concluir que existe una diferencia en la produccin de polines
con ese defecto en las plantas?. Use =0.05
0 A B
H : p p =
1 A B
H : p p
-
0.
calculado
131 57
468 237
z 1.13695
0.2799 0.7201 0.2405 7595
468 237
= =

+
A B
1 2
1 2
D D 131 57
p p
n 468 n 237
= = = =
A B
D
1 2
D D 131 57
p 0.267
n n 468 237
+ +
= = =
+ +
No existe evidencia estadsticamente significativa para rechazar H
0
82
DCIMA PARA DOS MEDIAS
Dcima para igualdad de medias
i) Varianzas iguales conocidas
Sean X
1
y X
2
dos muestras aleatorias independientes de tamaos n
1
y n
2
provenientes de dos poblaciones normales con medias
1
y
2
, y
varianzas
1
2
=
2
2
=
2
conocidas. La hiptesis para la igualdad de dos
medias se expresa por :
0
2 1 0 2 1 0
= = : H o : H
y las hiptesis alternativas por:
0
2 1 1 2 1 1
< < : H o : H
0
2 1 1 2 1 1
> > : H o : H
0
2 1 1 2 1 1
: H o : H
el estadstico a calcular est dado por:
2 1
2 1
1 1
n n
x x
z
cal
+

42
83
Ejercicio: Se sabe que el tiempo medio que demora un
ejecutivo de cuentas de un banco en realizar cierta
transaccin se distribuye normal con desviacin estndar
conocida = 4 minutos. Se realiz un experimento para
comparar los tiempos medios que demoran ejecutivo de
cuentas antiguos (A) respecto ejecutivo de cuentas nuevos
(B), para ello, se toma una muestra aleatoria de 10 antiguos y
una muestra de 8 nuevos, midiendo el tiempo en minutos que
demoran en efectuar la transaccin, obteniendo los siguientes
resultados :
Tiempo antiguos 5,5 4,8 5,4 4,9 5,1 5,0 5,3 5,2 5,0 4,9
Tiempo nuevos 5,9 4,9 5,5 4,8 5,2 5,0 5,1 5,0
Para un nivel de significacin del 5%, se puede afirmar que los
ejecutivos de cuentas antiguos en promedio demoran menos tiempo en
efectuar el procedimiento que los nuevos?
84
ii) Varianzas iguales desconocidas
Sean X
1
y X
2
dos muestras aleatorias independientes de tamaos
n
1
y n
2
provenientes de dos poblaciones normales con medias
1
y
2
, y
varianzas
1
2
=
2
2
=
2
desconocidas.
La hiptesis para la igualdad de dos medias se expresa por:
Las hiptesis alternativas por :
El estadstico a calcular est dado por:
1 2
cal
com
1 2
x x
t
1 1
S
n n

=
+
Y tiene distribucin t con = n
1
+ n
2
- 2
grados de libertad, donde:
2
1 1
2 1
2
2 2
2
1 1
+
+
=
n n
S ) n ( S ) n (
S
com
0
2 1 0 2 1 0
= = : H o : H
0
2 1 1 2 1 1
< < : H o : H
0
2 1 1 2 1 1
> > : H o : H
0
2 1 1 2 1 1
: H o : H
43
85
Tcnica 1 3,5 3,6 3,3 3,4 3,1 3,2 3,4 3,6 3,8 3,0 2,8 3,3
Tcnica 2 3,7 3,5 3,4 2,7 3,2 3,8 3,3 3,1
Ejemplo: Se desea comparar la eficiencia de dos tcnicas en cuanto al
tiempo que demoran en dar el resultado. Para ello se selecciona una
muestra aleatoria, a 12 de ellas se les aplica la tcnica 1 y a otras 8 se les
aplica la tcnica 2. El tiempo en minutos de obtener el resultado de cada
tcnica se muestra en la siguiente tabla :
Suponiendo que el tiempo de demora se distribuye aproximadamente
normal, habra evidencia para afirmar que existe diferencia entre el tiempo
medio para obtener el resultado dependiendo de la tcnica? Use =0.05
0 : :
2 1 0 2 1 0
= = H o H
0 : :
2 1 1 2 1 1
H o H
122678571 , 0 , 3375 , 3 ; 0787878 , 0 , 3333 , 3
2
2
2
2
1 1
= = = = s x s x
309606978 , 0
18
122678571 . 0 , 7 0787878 , 0 11
=
+
=
com
S
02948 , 0
8
1
12
1
309606978 , 0
3375 , 3 333333 , 3
=
+

=
cal
t
Como t
critico
< t
cal
< t
critico
no existe evidencia estadsticamente
significativa para rechazar H
0
2,101
025 . 0 ; 18
= = t t
critico
86
Ejercicio: Una empresa ha realizado una campaa publicitaria para
comercializar un producto. Para probar la eficiencia de la campaa se
entrevist a 10 clientes antes del inicio de la campaa que indicaran la
cantidad de unidades que compraban de este producto semanalmente, y
a otros 10 clientes despus de finalizada la campaa. En la tabla se
muestra la cantidad de artculos comprados por semana :
Antes de la campaa 1 2 1 3 2 3 1 2 1 2
Despus de la campaa 2 2 3 4 3 3 2 2 3 3
Para un nivel de significacin del 5%, existe evidencia estadstica para
afirmar que la campaa consigui incrementar las ventas?
44
87
iii) Varianzas distintas desconocidas
Sean X
1
y X
2
dos muestras aleatorias independientes de tamaos
n
1
y n
2
provenientes de dos poblaciones normales con medias
1
y
2
, y
varianzas
1
2
y
2
2
desconocidas. La hiptesis para la igualdad de dos
medias se expresa por:
y las hiptesis alternativas por :
2
2
2
1
1
2
* 2 1
) (
n
S
n
S
t x x +
donde
es el intervalo de confianza del (1-)%
para
1
-
2
. Si n>30 se puede usar una aproximacin normal
0
2 1 0 2 1 0
= = : H o : H
0
2 1 1 2 1 1
< < : H o : H
0
2 1 1 2 1 1
> > : H o : H
0
2 1 1 2 1 1
: H o : H
gdl
n
n
S
n
n
S
n
S
n
S
=

(
(

(
(

(
(

+
=
1 1
2
2
2
2
2
1
2
1
1
2
2
2
2
2
1
1
2

No se conoce la distribucin exacta


y se aproxima a una t-student con
88
Ejemplo. Los estadsticos medio ambientales de la Florida Fish Game
Comission realizaron un estudio para determinar si hay alguna diferencia
en el tonelaje medio de camarones capturados por barcos que utilizan
redes de arrastre en comparacin con los que utilizan redes de fondo. Las
redes de arrastre se han utilizado tradicionalmente en el golfo de Mxico y
siempre se ha sostenido que este mtodo produce mayores capturas. La
informacin se obtuvo con 12 barcos para cada mtodo
[ ] 3198 , 0 ; 3198 , 0 -
12
) 41 , 0 (
12
) 34 , 0 (
08 , 2 0
2 2
=
(
(

+
0 : :
2 1 0 2 1 0
H o H
0 : :
2 1 1 2 1 1
> > H o H
08 , 2
21 2715 , 21
11
12
) 41 , 0 (
11
12
) 34 , 0 (
12
) 41 . 0 (
12
) 34 . 0 (
21 ; 975 , 0
2
2
2
2
2
2 2
= =
=
(
(

+
(
(

(
(

+
=
t t
crit

Redes arrastre Redes de fondo


S
1
=0,34 ton S
2
=0,41
. 2 , 3
1
ton x =
. 87 , 2
2
ton x =
Como la diferencia entre las medias es 0,33 y ste valor est
fuera del intervalo de confianza, se rechaza H
0
45
89
Prueba para una varianza
Sea x
1
, x
2
, ... , x
n
una muestra aleatoria de tamao n proveniente
de una distribucin normal N(,
2
) donde
2
es desconocida.
Al igual que en las pruebas de hiptesis para una media o una
proporcin, existen varias opciones para plantear la prueba:
i) Si H
0
:
2
=
2
0
se tiene tres posibles hiptesis alternativas,
90
46
91
Ejemplo.
Un fabricante de envases para bebidas asegura que sus botellas tienen un
volumen con distribucin normal N(=1000 cc,
2
=0,09 (cc)
2
). Se toma
una muestra aleatoria de tamao 30 de estos envases y se obtiene un
promedio de 999,87 cc, con desviacin estndar *S=0.45 cc. Qu se
puede concluir respecto de lo afirmado por el fabricante? Use =0,05.
Si lo afirmado por el fabricante fuera correcto respecto a que el volumen se
distribuye normal, se tiene que la distribucin del volumen promedio de
cada botella ser:
( ) 003 , 0 , 1000
30
09 , 0
, 1000 , N ~
2
N N
n
X = |

\
|
=
|
|

\
|

92
Para verificar la veracidad de lo afirmado por el fabricante respecto de la
media, primero se debe realizar una prueba de hiptesis respecto de si la
varianza es conocida o no, ya que de ello depender si se debe usar una
distribucin normal o una t-Student.
Sea H
0
:
2
=
2
0
=0.09 (cc)
2
versus H
1
:
2

2
0
=0.09 (cc)
2
El estadstico de esta prueba est dado por:
Para un nivel de significacin del 5%, se tiene que la regin de
rechazo de H
0
est dada por:
( )
( )
2
1 - n
2
2
~
1

S n
47
93
Luego
2 2
2 *
calculado 2
(n 1) S 29 (0.45)
65.25
0.09


= = =
2
calculado
65.25 =
2
0.975, 29
45.74 = Como
>
Se rechaza H
0
, por tanto, el valor de la varianza dada por el fabricante no
es vlida, por lo cual, para verificar la veracidad respecto de la media, se
debe realizar la prueba para una muestra de una distribucin normal de
varianza desconocida, lo que queda como ejercicio.
94
Ejemplo. Suponga que el espesor de una placa de un circuito es una
dimensin crtica. El proceso de produccin de ellas se distribuye normal
con una desviacin estndar de 0,5 mm. Para controlar el proceso se
toman muestras de tamao 20, se define un lmite de control con base a
una probabilidad de 0,01 que la varianza muestral exceda de este lmite,
si el proceso est bajo control.
Qu se puede concluir si para una muestra dada de tamao 20 la
desviacin estndar es 0,87 mm? Use =0,01.
Como la variable aleatoria es:
Si se denota por LCS al lmite de control superior, se debe verificar que:
2 2 2 2 2
P( LCS) P (n 1)S / LCS 0.01 P (n 1)S / LCS 0.99 ( ( > = > = =


( )
2
2
2
1

S n
=
48
95
Sea H
0
:
2
=
2
0
=0,25 (mm)
2
versus H
1
:
2
>
2
0
=0,25 (mm)
2
2 2
crtico 19, 0.99
36,19 = =
2 2
2
19, 0.99 2 2
19, 0.99 2
(n 1)S
36,19 S
n 1

este valor
, debe satisfacer la desigualdad:
96
El criterio de decisin se puede expresar de dos formas:
2 2
2 *
calculado 2 2
(n 1) S 19 (0.87)
57,5244
0.5


= = =
2
calculado
57,5244 =
2
crtico
36,19 =
2 2
19, 0.99 2
36.19 0.25
S 0.47618
n 1 19


= =

a) Obtener el valor de
Como >
La muestra no proviene de un proceso con una desviacin
estndar de 0,5 mm (o varianza
2
=0,25 mm
2
).
b) O bien, verificar si
Pero como *S
2
= (0.87)
2
= 0.7569 > 0.47618, se llega a la misma
conclusin, que la muestra tomada no proviene de una poblacin
normal con desviacin estndar de 0,5 mm.
49
97
Ejercicio.
Un fabricante de bateras para telfonos mviles afirma que sus
bateras duran, en promedio 4 das con una desviacin estndar de 0.5
das.
Si diez de sus bateras tienen duraciones de 3.8, 3.9, 3.7, 4.3, 3.6, 4.1,
4.2, 4.5, 3.9 y 4.2 das, puede asegurar que las bateras tiene una
duracin con desviacin estndar de medio da?. Suponga que la
duracin de las bateras sigue una distribucin normal. Use =0.05.
98
Prueba para dos varianzas
Sean x
1
, x
2
, ... , x
n
; y
1
, y
2
, ... , y
m
dos muestras aleatorias de
tamao n y m provenientes de dos distribuciones normales
con medias
x
y
y
y varianzas desconocidas
2
x
y
2
y
.
1 2
1 2 2 1
2 2 2
1 2 2
1 , , 2 2 2
2 1 1 , , 1 , ,
S S S 1 1
P F P 1 y P 1
S S F S F

| | | |
| |
= = = | |
|
| |
\
\ \



Igualando los trminos se tiene que
2 1
1 2
, ,
1 , ,
1
F
F


=
50
99
2
x
2
x
(n 1) S


2
y
2
y
(m 1) S


La hiptesis que permita determinar si las varianzas de
ambas muestras son iguales est dada por:
H
0
:
2
x
=
2
y
Con las hiptesis alternativas
a) H
1
:
2
x
<
2
y
, b) H
1
:
2
x
>
2
y
, c) H
1
:
2
x

2
y
Si las varianzas muestrales son S
2
x
y S
2
y
, las expresiones
y
Son variables aleatorias independientes distribuidas
2

con (n-1) y (m-1) grados de libertad respectivamente


100
2 2
x x
2 2
y y
S /
F
S /

=
2
x
2
y
S
F
S
=
Luego la variable aleatoria:
Tiene distribucin F con (n-1) y (m-1) grados de libertad,
pero bajo la hiptesis nula
2
x
=
2
y
, este estadstico F se
reduce a:
51
101
Ejemplo. Un ingeniero de produccin afirma que existe
diferencia en la variabilidad de una pieza dependiendo si se
fabrica en la planta A o en la planta B. Para verificar esta
suposicin, se toman muestras aleatorias de 16 piezas de la
planta A y 13 piezas de la planta B, obteniendo los siguientes
resultados respecto de las varianzas:
2 2
A B
S 31.2 y S 36.5 = =
Suponiendo que los procesos tienen distribucin
aproximadamente normal, para un nivel de significacin del
5%, qu se puede concluir respecto de lo afirmado por el
ingeniero de produccin?
La hiptesis de nulidad y alternativa son:
H
0
:
2
A
=
2
B
; H
1
:
2
A

2
B
102
Las regiones de rechazo de H
0
estn dadas por:
2
A
calculado 2
B
S 31.2
F 0.8547
S 36.5
= = =
2
0.025;9;12
0.314 =
calculado
F 0.8547 =
2
0.975;12;9
3.18 =
Como
<
No existe evidencia estadsticamente significativa para
rechazar H
0
, luego, lo afirmado por el ingeniero no es
verdadero.
<
0.025;12;15
0.975;15;12
1
F 0.314
F
= =
0.975;15;12
F 3.18 =
52
103
iii) Muestras pareadas
Existen muchas situaciones prcticas, en la que se requiere
conocer ms de una caracterstica por unidad de observacin, esto
significa que por cada unidad de observacin se obtendr un vector de
variables. En particular cuando se observa dos caractersticas por cada
unidad de estudio, se obtiene una muestra pareada. El anlisis de esta
informacin requiere de una metodologa diferente a la anteriormente
tratada, puesto que en esos casos las muestras eran independientes.
Por ejemplo, se realiza un estudio para determinar el grado en que
el consumo de alcohol entorpece la habilidad para conducir. Se disea
un experimento seleccionando al azar 10 voluntarios de distintas
caractersticas que conducirn en un simulador con un programa
estndar para todos. Sin consumir alcohol, el voluntario conduce en el
simulador y se cuenta en un lapso de tiempo t , el nmero de colisiones
con los obstculos. Si se ha ingerido alcohol (todos misma cantidad),
conducen en el simulador y se cuentan las colisiones producidas en el
mismo lapso de tiempo t.
104
Al realizar este experimento se obtienen un vector con la informacin del
nmero de colisiones bajo y sin influencia del alcohol, que muestran en la
siguiente tabla:
Voluntario 1 2 3 4 5 6 7 8 9 10
Sin consumo de alcohol x 10 12 17 11 10 14 16 15 13 12
Con consumo de alcohol y 11 12 18 13 11 15 16 17 14 14
-1 0 -1 -2 -1 -1 0 -2 -1 -2
Para un nivel de significacin del 5%, existe evidencia estadstica para
afirmar que el consumo de alcohol incrementa el nmero de colisiones?
0 =
y x H
0
:
H
1
: 0 <
y x
Si = 0,05, con = n-1 = 9 grados de libertad t
crtico
=-1.833
Para realizar esta dcima se utiliza el estadstico
t crt = -1.833
Regin de rechazo de H0
) n (
t
n / S
d
t
d
* cal
1
=
737865 , 0
1 , 1
*
=
=
d S
d
Luego se tiene que :
714 4
10 737865 0
1 1
.
/ .
.
t
cal
=

=
Por tanto como t
cal
< t
crit
, se rechaza H
0
, es decir, el consumo de alcohol
de los conductores favorece el aumento de colisiones, p-value<0.0001
i i i
d x y =
53
105
MODELOS DE REGRESIN LINEAL
Grficos de correlacin
Permiten obtener una impresin visual del grado de dependencia
lineal existente entre dos variables
Tiempo(x) Crecimiento(y)
1,8 9,5
2,5 11,2
3,2 12,7
3,9 14,5
4,6 16,1
5,3 17,9
6 19,7
6,7 21,2
7,6 23,4
8,1 24,7
0 2 4 6 8 10
9
13
17
21
25
Plot of Peso vs Edad Grfico de Tiempo versus Crecimiento
106
El coeficiente de correlacin permite determinar el grado de
asociacin lineal existente entre dos variables cuantitativas
( ) ( )


= =
=


=
n
i
i
n
i
i
n
i
i i
xy
y n y x n x
y x n y x
r
1
2
2
1
2
2
1
( ) ( )
99988 , 0
09 , 17 10 03 , 3162 97 , 4 10 45 , 288
09 , 17 97 , 4 10 37 , 949
2 2
=


=
xy
r
Caractersticas
1) -1 r
xy
1
2) Valores prximos a cero indican que no existe asociacin lineal entre las variables
3) Valores prximos a uno o menos uno indican que existe asociacin lineal entre las variables
Coeficiente de
Determinacin
9997656 , 0
2
=
xy
r
03 , 316
45 , 288
37 , 949
09 , 17 , 97 , 4
10
1
2
1
2
1
=
=
=
= =
=

=
=
=
n
i
i
n
i
i
n
i
i i
y
x
y x
y x
n
x
i
y
i
1,8 9,5
2,5 11,2
3,2 12,7
3,9 14,5
4,6 16,1
5,3 17,9
6 19,7
6,7 21,2
7,6 23,4
8,1 24,7
El 99,97656% de la variacin de y es explicada por x
54
107
Regresin lineal
Introduccin
El nombre genrico de modelos de regresin, proviene de los trabajos
de Galton en biologa a finales del siglo XIX. Galton estudi la
dependencia de la estatura de los hijos (y) respecto a la de sus padres
(x), encontrando lo que denomin una regresin a la media : los padres
altos tienen, en general, hijos altos, pero, en promedio, no tan altos
como sus padres; los padres bajos tienen hijos bajos, pero, en
promedio, ms altos que sus padres. Desde entonces, los modelos
estadsticos que explican la dependencia de una variable y respecto de
una o varias variables cuantitativas x se denominan modelos de
regresin Daniel Pea 1989.
Segn Daniel Pea, 1989, se debe admitir que todos los factores o
causas que influyen en una variables respuesta (y) pueden dividirse en
dos grupos : el primero contiene una variable (x), conocida al observar
(y), que tiene una influencia lineal en la respuesta; el segundo incluye
un conjunto muy grande de factores, cada uno de los cuales influye en
la respuesta slo en una pequea magnitud, que se engloba dentro del
nombre comn de error aleatorio.
108
i i i
e x y + + =
1 0
La hiptesis bsica del modelo:
Donde y
i
y e
i
son variables aleatorias, bajo los siguientes supuestos:
1. Los errores tiene esperanza cero
2. La varianza de los errores es constante
3. Los errores tiene distribucin normal
4. Los errores e
i
son independientes entre s
[ ] 0 =
i
e E
2
) ( =
i
e Var
) , 0 ( ~
2
N e
i
j i e e E
j i
=0 ) , (
5. La variable respuesta se distribuye normal ) , ( ~
2
N y
i
55
109
Test de Normalidad
datos de nmero k
k
i
p
i
,
5 , 0
=
Frmula de Yates con correccin de continuidad
10
5 , 0
=
i
p
i
Para muestras pequeas, se ordenan los valores de menor a mayor y se
les asigna el valor de probabilidad acumulada (Yates)
Se puede apreciar que los puntos estn
bastante bien alineados, por lo que se
acepta normalidad
Normal Probabi l i ty Pl ot of A (l 1111 5v*10c)
8 10 12 14 16 18 20 22 24 26
Observed Val ue
-2,0
-1,5
-1,0
-0,5
0,0
0,5
1,0
1,5
2,0
E
x
p
e
c
te
d
N
o
rm
a
l V
a
lu
e
i yi pi
1 9,5 0,05
2 11,2 0,15
3 12,7 0,25
4 14,5 0,35
5 16,1 0,45
6 17,9 0,55
7 19,7 0,65
8 21,2 0,75
9 23,4 0,85
10 24,7 0,95
110
Model fitting results for: Peso
--------------------------------------------------------------------------------------------------
Independent variable coefficient std. error t-value sig.level
--------------------------------------------------------------------------------------------------
Constant 5.097406 0.07015 72.6641 0.0000
Tiempo 2.412997 0.013062 184.7406 0.0000
--------------------------------------------------------------------------------------------------
R-SQ. (ADJ.) = 0.9997 SE= 0.084083 MAE= 0.064989
10 observations fitted, forecast(s) computed for 0 missing val. of dep. var.
Tiempo o Crecimient * 412997 , 2 097406 , 5 + =
Analysis of Variance for the Full Regression
--------------------------------------------------------------------------------------------------------
Source Sum of Squares DF Mean Square F-Ratio P-value
--------------------------------------------------------------------------------------------------------
Model 241.292 1 241.292 34129.1 0.0000
Error 0.0565599 8 0.00706999
-------------------------------------------------------------------------------------------------------
Total (Corr.) 241.349 9
R-squared = 0.999766
56
111
Crecimiento Fitted Standardized
Number Tiempo Observed Values Residual Residual
1 1,8 9,5 9,4408 0,00592 0.85341
2 2,5 11,2 11,1299 0,0701 0.95570
3 3,2 12,7 12,819 -0,119 -1,74724
4 3,9 14,5 14,5081 -0,00809 -0.09646
5 4,6 16,1 16,1972 -0,09719 -1,26577
6 5,3 17,9 17,8863 0,01371 0.16132
7 6 19,7 19,5754 0,12461 1,78994
8 6,7 21,2 21,2645 -0,06448 -0.82602
9 7,6 23,4 23,4362 -0,03618 -0.47772
10 8,1 24,7 24,6427 0,05732 0.81949

9 13 17 21 25
Predicted
-0.12
-0.07
-0.02
0.03
0.08
0.13
R
e
s
id
u
a
ls
Residual Plot for Peso
-0.12 -0.07 -0.02 0.03 0.08 0.13
Residuals
Normal Probability Plot
0.1
1
5
20
50
80
95
99
99.9
c
u
m
u
l a
t i v
e
p
e
r
c
e
n
t
0 2 4 6 8 10
Edad
9
13
17
21
25
P
e
s
o
Plot of Peso vs Edad
Tiempo o Crecimient * 412997 , 2 097406 , 5 + =
Tiempo
C
r
e
c
i
m
i
e
n
t
o
112
Linealizacin de modelos
En muchas situaciones experimentales no se conoce el tipo
de modelo que es posible ajustar para relacionar una variable
dependiente con una independiente, slo se dispone de un
pequeo nmero de pares ordenados correspondientes a los
resultados del estudio, que al graficarlos muestran una nube
de puntos y se quiere ajustar un modelo por lo que se
necesita obtener los parmetros que lo determinan, a
continuacin se analizan distintos tipos de modelos y el
procedimiento que permite estimar sus parmetros.
Modelo exponencial
Un modelo exponencial es de la forma:
=
bx
y a e
57
113
114
Se aplica logartmo natural a esta expresin obteniendo:
= + ln ln y a bx
= +
0 1
Y X
Designado por Y a ln y, por
0
= ln a, por
1
= b y X=x, se tiene un
modelo lineal de la forma:
Que es la ecuacin de una recta en un sistema semilogartmico. Para
obtener los valores estimados de
0
y
1
se utiliza el mtodo de
mnimos cuadrados, donde:
=
bx
y a e

1
= b y a = antilogaritmo(
0
)
Se puede afirmar que si el coeficiente de correlacin lineal de estos
puntos dibujados en este sistema semilogartmico, en valor absoluto
es prximo a 1, se debera ajustar un modelo exponencial a los
datos obtenidos.
58
115
Ejemplo
Se intenta obtener la ecuacin que permita estimar a la carga que tiene
un condensador de un radiotransmisor operando en forma continua, en un
instante dado, para ello, se midi el voltaje del condensador cada 15
minutos obteniendo:
Tiempo 1 2 3 4 5 6 7 8 9
Voltaje 7,08 5,35 4,26 3,19 2,53 1,98 1,62 1,21 1,00
En la figura, se aprecia que podra existir un modelo exponencial que
ajuste estos valores, luego se aplica logartmo natural a los valores de
voltaje, obteniendo:
116
Tiempo 1 2 3 4 5 6 7 8 9
ln Voltaje 1,96 1,68 1,45 1,16 0,93 0,68 0,48 0,19 0,00
El coeficiente de correlacin lineal de los datos en
este sistema semilogartmico es r
xy
=-0,999305, por
tanto, la variacin explicada por el modelo es de
un 99.86%, el modelo que permite estimar la carga
en cada instante de tiempo est dado por:
Tiempo 1 2 3 4 5 6 7 8 9
Voltaje 7,08 5,35 4,26 3,19 2,53 1,98 1,62 1,21 1,00
Voltaje estimado 6,87 5,38 4,21 3,30 2,58 2,02 1,58 1,24 0,97
e
i
0,21 -0,03 0,05 -0,11 -0,05 -0,04 0,04 -0,03 0,03
Aplicando mnimos cuadrado se obtiene:

1
=b=-0,2449856 a = antilogaritmo(2,17248599)=8,780084
x
e y
2449856 , 0
780084 , 8

=
59
117
Modelo Potencial
Dado un modelo potencial de la forma:
b
y a x =
118
b
y a x =
ln ln ln y a b x = +
= +
0 1
Y X
Para obtener los parmetros a y b del modelo:
Se aplica logartmo natural a esta expresin obteniendo:
Designado por Y a ln y, por
0
= ln a, por
1
=b y X = ln x, se tiene un
modelo lineal de la forma:
Que es la ecuacin de una recta en un sistema bilogartmico. Para
obtener los valores estimados de
0
y
1
se utiliza el mtodo de
mnimos cuadrados, donde:

1
= m = b y a = antilogaritmo(
0
)
Se puede afirmar que si el coeficiente de correlacin lineal de estos
puntos dibujados en este sistema bilogartmico, en valor absoluto es
prximo a 1, se debera ajustar un modelo potencial a los datos
obtenidos.
60
119
Ejemplo. Se obtienen los valores del aumento de la presin de una
caldera a medida que aumenta la temperatura
Temperatura 0,1 0,5 0,9 1 1,25 2 2,3 2,8 3,2
Presin 0,58 1,63 2,34 2,5 2,86 3,84 4,15 4,6 5,21
En el grfico de correlaciones se puede apreciar que existe una
curvatura que podra suponer la existencia de un modelo potencial.
ln(Temperatura) -2,3026 -0,6931 -0,1054 0,0000 0,2231 0,6931 0,8329 1,0296 1,1632
ln(presin) 0,6259 0,8329 0,9002 0,9163 0,9478 1,0043 1,0152 1,0473 1,0647

1
= m =0.125744135 = b y a = antilogaritmo(0.916546185) = 2.5006
Aplicando logartmo natural a la tabla de observaciones medidas se tiene:
120
El coeficiente de correlacin lineal de los datos en este sistema
bilogartmico es r
xy
= 0,999743553, por lo tanto, la variacin explicada
por el modelo es de un 99,95% (r
2
).
El modelo de la presin en funcin de la temperatura est dado por:
0.125744135
2.5006 y x =
Temperatura 0,1 0,5 0,9 1 1,25 2 2,3 2,8 3,2
Presin 0,58 1,63 2,34 2,5 2,86 3,84 4,15 4,6 5,21
Presin estimada 1,8720 2,2919 2,4677 2,5006 2,5718 2,7283 2,7767 2,8462 2,8944
e
i
-0,0020 0,0081 -0,0077 -0,0006 0,0082 0,0017 -0,0167 0,0038 0,0056
61
121
Modelo Hiperblico
ax
y
bx c
=
+
Considerando a, b y c positivos, la curva tiene la siguiente forma:
Para linealizar este modelo, se
requiere tomar el recproco de
la expresin
1 1 1 ax bx c b c
y
bx c y ax y a a x
+
= = = +
+
Que es una recta en un sistema 1/x versus 1/y.
Luego
0 1
b
=
a
c
y
a
=
Determinados
0
y
1
basta fijar a en 1 y obtener los valores de b y c.
Para un modelo hiperblico de la forma
122
Ejemplo. En un proceso de reaccin qumica, la velocidad de
reaccin est dada en funcin de la concentracin de sustrato que
intervenga. En la tabla de muestran diferentes velocidades de reaccin
en funcin de las concentraciones que se ocupen.
Concentracin 0,2 0,8 1,2 1,6 2,5 3,1 3,5
Velocidad 0,48 1,075 1,235 1,34 1,458 1,505 1,53
Concentracin 4,2 5,1 6,3 7,2 8,6 10
Velocidad 1,56 1,589 1,613 1,634 1,651 1,665
62
123
Los valores de los recprocos se muestran en la tabla:
Rec(Concentracin) 5 1,25 0,833 0,625 0,4 0,323 0,286
Rec(Velocidad) 2,083 0,93 0,81 0,746 0,686 0,664 0,654
Rec(Concentracin) 0,238 0,196 0,159 0,139 0,116 0,1
Rec(Velocidad) 0,641 0,629 0,62 0,612 0,606 0,601
La grfica de estos recprocos esta dada por:
124
0 1
b
= 0,56610657 0,302408524
a
c
y
a
= = =

0.55610657 0.302408524
i
x
y
x
=
+
Si a=1, b=0.56610657 y c=0.302408524, luego el modelo es:
El coeficiente de correlacin r
xy
=0,999874212, luego la variacin
explicada por el modelo es de un 99,97%.
Concentracin 0,2 0,8 1,2 1,6 2,5 3,1 3,5
Velocidad 0,480 1,075 1,235 1,340 1,458 1,505 1,530
Velocidad
estimada
0,484 1,071 1,237 1,342 1,477 1,530 1,556
e
i
-0,004 0,004 -0,002 -0,002 -0,019 -0,025 -0,026
Concentracin 4,2 5,1 6,3 7,2 8,6 10
Velocidad 1,560 1,589 1,613 1,634 1,651 1,665
Velocidad
estimada
1,592 1,625 1,655 1,672 1,691 1,705
e
i
-0,032 -0,036 -0,042 -0,038 -0,040 -0,040

Вам также может понравиться