Академический Документы
Профессиональный Документы
Культура Документы
=
8
3
8
1
3
2
1
4
1
1 2
3
2 1 2 1 2 1 2 3
2 3 2
2 3
= = = = = = =
* * *
! !
!
) / ( ) / ( C ) / p , x , n ( p
08789 0 015625 0 5625 0 10 25 0 75 0 75 0 5 2
2 5 2
2 5
. ) . )( . )( ( ) . ( ) . ( C ) . p , n , x ( p = = = = = =
+ = = + = = = = =
0 5 0
0 5
25 0 75 0 1 0 75 0 5 1 0 ) . ( ) . ( C ) x ( p ) x ( p ) . p , n , , x ( p
Pgina 53 de 132
c) En este caso cambiaremos el valor de p;
n =5
x = variable que nos define el nmero de accidentes que no se deben a
errores de tipo humano
x = 0, 1, 2,...,5 accidentes debidos a errores humanos
p = p(probabilidad de que un accidente no se deba a errores humanos) =
0.25
q = p(probabilidad de que un accidente se deba a errores humanos) = 1-p
= 0.75
- Distribucin Hipergeomtrica
La manera ms simple de ver la diferencia con la distribucin binomial est
en la forma en que se realiza el muestreo. La variable aleatoria es el nmero de
observaciones que caen en una categora particular como xito y fracaso. En el caso
de la binomial, se requiere la independencia entre las pruebas porque el muestreo
es con reemplazo de cada artculo despus de que se observe; la distribucin
Hipergeomtrica no requiere independencia y se basa en el muestreo sin
reemplazo.
Aplicacin Experi-
mento
Valores o
resultados
Prob (X = X0)
Es adecuado en cualquier caso
en que se sienta inters en
seleccionar x xitos de los k
artculos considerados como
xitos y n-x fracasos de los
N k artculos que se
Se repite
n veces
0, 1, 2, 3,
<<..n. La
variable
toma n+1
valores
h(x,N,n,k)
=(
k
x) (
N-k
n-x)/(
N
n)
015624 0 014648 0 000976 0 25 0 75 0
1 5 1
1 5
. . . ) . ( ) . ( C = + =
Pgina 54 de 132
consideran como fracasos
cuando se selecciona una
muestra aleatoria de tamao n
de N artculos. Sin
reemplazamiento.
Variable aleatoria X
Numero de xitos en n ensayos sin
reemplazamiento
Esperanza o Media (X) = nk/N
Desviacin Estndar (X) = Raz de {[(N-n)/(N-1)](1-k/N)nk/N}
Ejemplo: Lotes de 40 componentes cada uno se denominan aceptables si no
contienen ms de 3 defectuosos. El procedimiento para muestrear el lote es la
seleccin de 5 componentes al azar y rechazar el lote si se encuentra un
componente defectuoso. Cul es la probabilidad de que se encuentre exactamente
un defectuoso en la muestra si hay 3 defectuosos en todo el lote? Encuentre la
media y la desviacin estndar de la variable aleatoria del ejemplo.
Solucin:
N = 40 (Tamao de la poblacin) n = 5 (Tamao de la muestra)
k = 3 (defectuosos en la poblacin) x = 1 (defectuosos en la muestra)
h(x,N,n,k) = (
k
x) (
N-k
n-x)/(
N
n) = h(1,40,5,3) = (
3
1) (
40-3
5-1)/(
40
5) = 0.3011
La media es igual a nk/N = 5*3/40 = 0.3750
La desviacin estndar es igual a Raz de {[(N-n)/(N-1)](1-k/N)nk/N}
= Raz {[(40-5)/(40-1)](1-3/40)5*3/40} = Raz (0.3113) = 0.5579
Pgina 55 de 132
- Distribucin Multinomial
El experimento binomial se convierte en experimento Multinomial si cada prueba
tiene ms de dos resultados posibles. En general, si una prueba dada puede tener
como consecuencia de los k resultados posibles E1, E2 ,<<..Ek con probabilidades
p1 , p2 , <<<.pk entonces la distribucin Multinomial dar la probabilidad de que
E1 ocurra x1veces, E2 ocurra x2 veces <<.y Ek ocurra xk veces en n pruebas
independientes, donde x1 + x2 + <..xk = n
Aplicacin Experi-
mento
Valores o
resultados
Prob (X = X0)
Es adecuado en cualquier caso
en que se tenga ms de dos
resultados posibles con
reemplazamiento.
Denotaremos esta distribucin
de probabilidad conjunta
como
Se repite
n veces
0, 1, 2, 3,
<<..n. La
variable
toma n+1
valores
h(x1, x2,.. xk,, p1 ,
p2 ,.. pk , n)
=(
n
x1, x2,.. xk) p1
x
1
p2
x
2.. pk
x
k = [n!/( x1
! x2 !.. xk !)] p1
x
1
p2
x
2.. pk
x
k
Ejemplo: Si se lanza seis veces un par de dados. Cul es la probabilidad de obtener
un total de 7 u 11 dos veces, un par igual una vez y cualquiera otra combinacin
tres veces?
Solucin: Listamos los siguientes eventos posibles,
E1 : Ocurre un total de 7 u 11 Prob (E1) = 8/36 = 2/9
E2 :Ocurre un par igual Prob (E2) = 6/36 = 1/6
E3 : Cualquier otra combinacin Prob (E3) = 22/36 = 11/18
Suma 1 2 3 4 5 6
1 2 7
Pgina 56 de 132
2 4 7
3 6 7
4 7 8
5 7 10 11
6 7 11 12
h(x1, x2,.. xk,, p1 , p2 ,.. pk , n) =(
n
x1, x2,.. xk) p1
x
1 p2
x
2.. pk
x
k = [n!/( x1 ! x2 !.. xk !)] p1
x
1 p2
x
2..
pk
x
k = h(2,1,3,, 2/9, 1/6,11/18 , 6) =(
6
2,1,3)( 2/9)
2
(1/6)
1
(11/18)
3
= [6!/( 2 ! 1! 3! )( 2/9)
2
(1/6)
1
(11/18)
3
= 0.1127
- Distribucin Geomtrica
Variable aleatoria X
Numero de ensayos requeridos hasta
alcanzar el primer xito
Esperanza o Media (X) = 1/p
Desviacin Est{ndar (X) =( 1/p)Raz de (1-p)
Aplicacin Experimento Valores o
resulta-
dos
Prob (X = X0)
Se relaciona con una secuencia
de ensayos de Bernoulli, de
hecho la variable aleatoria de
interes denotada por X es el
numero de ensayos requeridos
para alcanzar el primer xito.
El numero de
experimentos
o ensayos no
es fijo
1, 2, 3,
<<..
Prob (X = X0)
=(1-p)
(x-1)
p
Pgina 57 de 132
- Distribucin de Pascal o Binomial Negativa
Aplicacin Experimento Valores o
resulta-
dos
Prob (X = X0)
Se relaciona con una
secuencia de ensayos de
Bernoulli y es una extensin
lgica de la distribucin
geomtrica, de hecho la
variable aleatoria de interes
denotada por X es el
nmero de ensayos
requeridos para alcanzar el
r-esimo xito.
El numero
de
experimen-
tos o
ensayos no
es fijo
r, r+1, r+2,
r+3, <<
Prob (X = X0) =
(
x-1
r-1)(1-p)
(x-r)
p
r
Variable aleatoria X
Numero de ensayos requeridos hasta
alcanzar el r-esimo xito
Esperanza o Media (X) = r/p
Desviacin Est{ndar (X) =( 1/p)Raz de [r(1-p)]
- Distribucin de Poisson
Los experimentos que dan valores numricos a una variable aleatoria X, el
nmero de resultados que ocurren durante un intervalo dado o en una regin
especifica, se llaman experimentos de Poisson. El intervalo dado puede ser de
cualquier longitud como un minuto, un da, una semana, un mes e incluso un ao.
Debe cumplirse estas condiciones:
Pgina 58 de 132
- El nmero de resultados que ocurren en un intervalo o regin especfica
es independiente del nmero que ocurre en cualquier otro intervalo o
regin del espacio disjunto.
- La probabilidad de que ocurra un solo resultado durante un intervalo
muy corto o en una regin pequea es proporcional a la longitud del
intervalo o al tamao de la regin y no depende del nmero de
resultados que ocurran fuera de ese intervalo o regin.
- La probabilidad de que ocurran ms de un resultado en tal intervalo
corto o que caiga en tal regin pequea es insignificante.
Aplicacin Experi-
mento
Valores o
resultados
Prob (X = X0)
Es adecuado en cualquier caso
en que se sienta inters por el
nmero de resultados o
registros por unidad de tiempo
o espacio.
Se fija
un
tiempo o
espacio
para
medir la
frecuenc
ia.
0, 1, 2, 3,
<<..
Donde es
el nmero
promedio de
resultados
por unidad y
e = 2.71828..
p(x,t) =
(e
-t
)( t)
X
/X!
Variable aleatoria X
Numero de resultados que ocurren en un
intervalo dado o regin especifica que se
denota por t
Esperanza o Media (X)
= t
Desviacin Est{ndar (X) =Raz de t
Pgina 59 de 132
- Mas sobre la DISTRIBUCION DE POISSON
Se dice que existe un proceso de Poisson si podemos observar eventos discretos en
un rea de oportunidad un intervalo continuo (de tiempo, longitud, superficie,
etc.) de tal manera que si se reduce lo suficiente el rea de oportunidad o el
intervalo,
1. La probabilidad de observar exactamente un xito en el intervalo es
constante.
2. La probabilidad de obtener ms de un xito en el intervalo es 0.
3. La probabilidad de observar un xito en cualquier intervalo es
estadsticamente independiente de la de cualquier otro intervalo.
Para determinar la probabilidad de que ocurran x xitos por unidad de tiempo,
rea, o producto, la frmula a utilizar sera:
donde:
p(x, ) = probabilidad de que ocurran x xitos, cuando el nmero promedio de
ocurrencia de ellos es
= media o promedio de xitos por unidad de tiempo, rea o producto
c = 2.718
x = variable que denota el nmero de xitos que se desea que ocurra
Hay que hacer notar que en esta distribucin el nmero de xitos que ocurren por
unidad de tiempo, rea o producto es totalmente al azar y que cada intervalo de
tiempo es independiente de otro intervalo dado, as como cada rea es
independiente de otra rea dada y cada producto es independiente de otro
producto dado.
Esta distribucin se aplica en situaciones como:
- El numero de pacientes que llegan al servicio de emergencia de un hospital
en un intervalo de tiempo.
! x
) , x ( p
x
c
=
Pgina 60 de 132
- El numero de radiaciones radiactivas que se recibe en un lapso de tiempo,
- El numero de glbulos blancos que se cuentan en una muestra dada.
- El numero de partos triples por ao
- # de defectos de una tela por m
2
- # de aviones que aterrizan en un aeropuerto por da, hora, minuto, etc, etc.
- # de bacterias por cm
2
de cultivo
- # de llamadas telefnicas a un conmutador por hora, minuto, etc, etc.
- # de llegadas de embarcaciones a un puerto por da, mes, etc, etc.
Su utilidad en el rea de la salud es muy amplia.
La expresin matemtica para la distribucin de Poisson para obtener X xitos,
dado que se esperan xitos es:
Donde: P(X) = probabilidad de X xitos dado el valor de
= esperanza del nmero de xitos.
e = constante matemtica, con valor aproximado 2.711828
X = nmero de xitos por unidad
La distribucin de Poisson se considera una buena aproximacin a la distribucin
binomial, en el caso que np < 5 y p < 0.1 n > 100 y p < 0.05 y en ese caso = np. El
inters por sustituir la distribucin Binomial por una distribucin de Poisson se
debe a que esta ultima depende nicamente de un solo par{metro, , y la binomial
de dos, n y p.
Ejemplo 1:
Pgina 61 de 132
Si un banco recibe en promedio 6 cheques sin fondo por da, cules son las
probabilidades de que reciba, a) cuatro cheques sin fondo en un da dado, b)
10 cheques sin fondos en cualquiera de dos das consecutivos?
Solucin:
a) a) x = variable que nos define el nmero de cheques sin fondo que
llegan al banco en un da cualquiera = 0, 1, 2, 3, ....., etc, etc.
= 6 cheques sin fondo por da
c = 2.718
b) x= variable que nos define el nmero de cheques sin fondo que llegan
al banco en dos das consecutivos = 0, 1, 2, 3, ......, etc., etc.
= 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos
das consecutivos
Nota: siempre debe estar en funcin de x o dicho de otra forma, debe
hablar de lo mismo que x.
Ejercicios de Distribuciones de Probabilidad de variables discretas.
1. En cierto distrito de la ciudad la necesidad de dinero para comprar drogas se
establece como la razn del 75% de los robos. Encuentre la probabilidad de entre
los siguientes 5 casos de robo que se reporten en ese distrito,
a) Exactamente 2 resulten de la necesidad de dinero para comprar drogas.
b) Al menos 3 resulten de la necesidad de dinero para comprar drogas.
2. Un prominente medico afirma que 70% de las personas con cncer de pulmn
son fumadores empedernidos. Si su aseveracin es correcta:
13392 0
24
00248 0 1296
4
718 2 6
6 4
6 4
.
) . )( (
!
) . ( ) (
) , x ( p = = = = =
104953 0
3628800
000006151 0 10 1917364 6
10
718 2 12
12 10
12 10
.
) . )( . (
!
) . ( ) (
) , x ( p =
E
= = = =
Pgina 62 de 132
a) Encuentre la probabilidad de que 10 de tales pacientes admitidos
recientemente en un hospital, menos de la mitad sean fumadores
empedernidos.
3. Al probar cierta clase de neumticos para camin en un terreno escabroso, se
encuentra que 25% de los camiones no completaban la prueba sin espichaduras. De
los siguientes 15 camiones probados, encuentre la probabilidad de que:
a) De 3 a 6 tengan problemas.
b) Menos de 4 tengan problemas
c) Ms de 5 tengan problemas.
4. Se sabe que el porcentaje de victorias del equipo de beisbol de su preferencia
pasara a las finales de esta temporada fue 62.5%, es decir tuvo que ganar 10 de 16
juegos.
a) Cul es la probabilidad de que sean campeones?
5. Cul es la probabilidad de que un mesonero de un bar se rehuse a servir bebidas
alcohlicas a solo 2 menores si verifica al azar las identificaciones de 5 estudiantes
de entre 9 estudiantes de los cuales 4 no tienen la edad legal?
6. El estudio de un inventario determina que, en promedio, las demandas de un
artculo en particular en un almacn se realizan 5 veces al da. Cul es la
probabilidad de que en un da dado se pida este artculo:
a) Ms de 5 veces
b) Ninguna vez
c) Exactamente 2 veces
d) Menos de 2 veces
7. Las llamadas de servicio llegan a un centro de mantenimiento de acuerdo con un
proceso de POISSON con un promedio de 2.7 llamadas por minutos. Encuentre la
probabilidad de que:
a) Lleguen no ms de 4 llamadas en cualquier minuto
b) Lleguen menos de 2 llamadas en cualquier minuto
c) Lleguen ms de 10 llamadas en un periodo de 5 minutos
8. Se dice que el 75% de los accidentes de una planta se atribuyen a errores
humanos. Si en un perodo de tiempo dado, se suscitan 5 accidentes, determine la
probabilidad de que:
Pgina 63 de 132
a) dos de los accidentes se atribuyan a errores humanos
b) como mximo 1 de los accidentes se atribuya a errores de tipo humano
Resp. 0,08789 0,01464
9. Si un banco recibe en promedio 6 cheques sin fondo por da, cules son las
probabilidades de que reciba, a) cuatro cheques sin fondo en un da dado, b) 10
cheques sin fondos en cualquiera de dos das consecutivos?
Resp. 0,13385 0,04130
10. Cul es la probabilidad de obtener un total de nueve al lanzar dos dados seis
veces. A) Dos veces b) Al menos dos veces
11. Calcular la probabilidad de que una familia de cuatro hijos tres de ellos sean
Varones.
Resp.
12. El nmero de pacientes que llega a un hospital sigue una distribucin de
Poisson. Si el nmero promedio es de 120 por hora, cul es la probabilidad de que
en un minuto lleguen por lo menos 3 pacientes? Resp. 0,3233
13. Diez por 100 de los radios producidos en la compaa A son defectuosos. Si se
extrae una muestra aleatoria de 5 tems del total de cierto dia de produccin (que
es ms de 100,000 unidades), Cul es la probabilidad de que haya: a) 0
defectuosos, b) 5 defectuosos, y c) por lo menos 3 defectuosos en la muestra?
14. Ocurren diversos accidentes en forma aleatoria en cierta carretera, a un
promedio de 20 por mes. Cul es la probabilidad de que ocurra al menos un
accidente en un intervalo dado de 15 dias? Resp.
15. La ltima novela de un autor ha tenido un gran xito, hasta el punto de que el
80% de los lectores ya la han leido. Un grupo de 4 amigos son aficionados a la
lectura:
a) Cul es la probabilidad de que en el grupo hayan leido la novela 2 personas?
b) al menos 2?
Pgina 64 de 132
16. Un agente de seguros vende plizas a cinco personas de la misma edad y que
disfrutan de buena salud. Segn las tablas actuales, la probabilidad de que una
persona en estas condiciones viva 30 aos o ms es 2/3. Hllese la probabilidad de
que, transcurridos 30 aos, vivan:
a) Las cinco personas.
b) Al menos tres personas.
c) Exactamente dos personas.
17. Si de seis a siete de la tarde se admite que un nmero de telfono de cada cinco
est comunicando, cul es la probabilidad de que, cuando se marquen 10 nmeros
de telfono elegidos al azar, slo comuniquen dos?
18. La probabilidad de que un hombre acierte en el blanco es 1/4. Si dispara 10
veces cul es la probabilidad de que acierte exactamente en tres ocasiones? Cul
es la probabilidad de que acierte por lo menos en una ocasin?
19. La produccin de televisores en SAMSUNG trae asociada una probabilidad de
defecto del 2%, si se toma un lote o muestra de 85 televisores , obtener la
probabilidad de que existan 4 televisores con defectos. Resp. 0,0635746
20. En una jaula con 100 pericos 15 de ellos hablan ruso calcular la probabilidad de
que si tomamos 20 pericos al azar 3 de ellos hablen ruso. Resp. 0,2240418
21. Se calcula que en la ciudad el 20% de las personas tienen defecto de la vista si
tomamos una muestra de 50 personas al azar Calcular la probabilidad de que 10
de ellos tengan defecto en la vista. Resp. 0,12511
22. Una mquina fabrica una determinada pieza y se sabe que produce un 7 por
1000 de piezas defectuosas. Hallar la probabilidad de que al examinar 50 piezas
slo haya una defectuosa. Resp.
23. La probabilidad de xito de una determinada vacuna es 0,72. Calcula la
probabilidad de a que una vez administrada a 15 pacientes:
a) Ninguno sufra la enfermedad
Pgina 65 de 132
b) Todos sufran la enfermedad
c) Dos de ellos contraigan la enfermedad
24. La probabilidad de que un alumno de primer ao de bachillerato repita el
curso es de 0,3, elegimos 20 alumnos al azar, Cual es la probabilidad de que haya
exactamente 4 alumnos repetidores?
25. En una fbrica de partes de automviles se sabe que de los productos
elaborados el 12% tienen algn defecto, se toma una muestra al azar de 20 piezas,
cual es la probabilidad de: a) Exactamente tres defectuosos b) Ninguno defectuoso
c) Menos de cinco defectuosos d) Como mnimo cuatro no defectuosos
e) Valor esperado de no defectuoso f) Varianza g) Riesgo
26. Un transportista de pasajeros se tarda en recorrer de Caracas a Valencia tres (3)
horas, si reduce la velocidad, sugerencia de los pasajeros y por algunos
inconvenientes en la autopista regional del centro (ARC), cul es la probabilidad
que tarde cuatro (4) horas? Resp. 0,1680
27. La probabilidad de que un estudiante nuevo se gradu es 0,4. Determinar la
probabilidad de que 5 estudiantes nuevos a) ninguno, b) uno, c) al menos uno se
gradu.
Resp. 0,08 0,26 0,92
28. Un 10% de los utensilios producidos en un cierto proceso de fabricacin resulta
ser defectuoso. Hallar la probabilidad de que de una muestra de 10 utensilios
elegidos al azar sean exactamente 2 los defectuosos mediante (a) la distribucin
binomial, (b) la aproximacin de Poisson a la distribucin binomial.
29. Si un 10 % de los remaches producidos por una maquina son defectuosos. Cual
es la probabilidad de que de 5 remaches elegidos al azar:
a) Ninguno sea defectuoso
b) Uno sea defectuoso
c) Al menos 4 sean defectuosos
Pgina 66 de 132
d) Menos de 2 sean defectuosos
30. Se sabe de que la probabilidad de que en una interseccin de vas de trnsito
ocurra un accidente es p = 0,001. Cul ser la probabilidad de que por cada 2.000
vehculos ocurran exactamente dos o ms accidentes?
31. La probabilidad de que un jugador de golf haga hoyo en un lanzamiento a una
cierta distancia es 0,3. Si lo intenta 5 veces, calcular la probabilidad de que:
a) no acierte ninguna
b) b) acierte alguna
c) c) acierte 2.
4.2. Distribuciones de Probabilidad de variables continuas.
- Distribucin Uniforme Continua
Es una de las distribuciones continuas ms simples de la estadstica. Esta
distribucin se caracteriza por una funcin de densidad que es plana, y por ello
la probabilidad es uniforme en un intervalo cerrado, digamos [a,b]. Aunque las
aplicaciones de esta distribucin continua no son muy abundantes, es apropiado
para el principiante comenzar esta introduccin a las distribuciones continuas con
la distribucin uniforme.
Aplicacin Experi-
mento
Valores o
resultados
Prob (X = X0)
Esta densidad surge de un
modo natural en la seleccin
aleatoria de nmeros. Si X =
numero seleccionado
aleatoriamente entre 0 y 1,
entonces la densidad de
probabilidad de X es plana
sobre el intervalo [0,1]: ningn
Seleccin
aleatoria
de
nmeros.
Valores
comprendi
do en el
intervalo.
f(x; a,b) = 1/(b-a)
para a<=X<=b
= 0 en cualquier
otro caso
Pgina 67 de 132
nmero tiene una
probabilidad ms alta que
otro.
Variable aleatoria X
Cualquier valor en el intervalo cerrado
[a,b]
Esperanza o Media (X)
= (a +b) / 2
Desviacin Est{ndar (X) =Raz de [ (b a)
2
/ 12 ]
Se debe recalcar que la funcin de densidad forma un rectngulo con base
(b-a) y altura constante 1/(b-a). Como resultado, la distribucin uniforme a
menudo se llama Distribucin Rectangular.
Ejemplo Suponga que se puede reservar una sala de conferencia grande para
cierta compaa por no ms de 4 horas. Sin embargo, el uso de la sala de
conferencia es tal que muy a menudo tienen lugar conferencias largas y cortas. De
hecho, se puede suponer que la duracin X de una conferencia tiene una
distribucin uniforme en el intervalo [0 , 4]
a) Cul es la funcin de densidad?
b) Cul es la probabilidad de que cualquier conferencia dada dure al menos 3
horas?
c) Cul es la duracin promedio y la desviacin estndar?
Respuesta: el intervalo [a , b] es [0 , 4]
a) f(x; a,b) = 1/(4)
b) Prob *X >= 3+ = 3
4
(1/4) dx =
Pgina 68 de 132
c) (X) = (a +b) / 2= 2 (X) = Raz de [ (b a)
2
/ 12 ]= 1.15
- Distribucin Exponencial
- Distribucin de Gamma
- Distribucin de Weibull
- Distribucin Normal o de Gauss
Es la distribucin continua de probabilidad ms importante en todo el campo de la
estadstica. Su grfica se denomina curva normal y tiene forma de campana. La
ecuacin matemtica para la distribucin de probabilidad de la variable normal
depende de 2 parmetros , la media y , la desviacin estndar. De aqu,
denotamos a esta distribucin a menudo denominada gaussiana con N(X; , )
Aplicacin Experi-mento Valores o
resultado
s
Prob (X = X0)
Esta funcin de densidad es
aplicable a mucho fenmenos
que ocurren en la naturaleza,
la industria, la educacin, la
economa, finanzas, anlisis
de mercado, investigacin,
etc. basado en la suposicin
de que la poblacin es normal
Es la distribucin
limite de todas las
distribuciones
Valores
compren
dido
entre -,
N(X; , )
= 1/raz(2 ) * e
-
(1/2)[(x-
u)/
]2
para - <=X<=
donde =
3.14159 y e =
2.71828
Pgina 69 de 132
Variable aleatoria X
Cualquier valor en el intervalo de
menos infinito a infinito
Esperanza o Media (X)
= la media
Desviacin Est{ndar (X) =la Desviacin est{ndar
Una vez que se especifican y la curva normal queda determinada por
completo. A continuacin listamos las siguientes propiedades de la curva normal;
a) La moda, que es el punto sobre el eje horizontal donde la curva es un
mximo, ocurre en X =
b) La curva es simtrica respecto de un eje vertical a travs de la media
c) La curva tiene sus puntos de inflexin en X = +- , es cncava hacia abajo
si < X < + , y es cncava hacia arriba en cualquier otro punto
d) La curva normal se aproxima al eje horizontal de manera asinttica
conforme nos alejamos de la media en cualquier direccin
e) El rea total bajo la curva y sobre el eje horizontal es igual a 1
La distribucin de una variable aleatoria normal con media 0 y desviacin estndar
1 se denomina Distribucin Normal Estndar y se denota como N(X; 0, 1)
Cualquier variable aleatoria normal X se puede transformar en una variable
aleatoria normal tipificada o estandarizada Z sustrayendo el valor esperado y
dividiendo el resultado entre la desviacin estndar . De aqu tenemos que
Z = ( X - ) /
- Mas sobre la DISTRIBUCION DE NORMAL
Esta distribucin es frecuentemente utilizada en las aplicaciones estadsticas. Su
propio nombre indica su extendida utilizacin, justificada por la frecuencia o
normalidad con la que ciertos fenmenos tienden a parecerse en su
Pgina 70 de 132
comportamiento a esta distribucin.
Muchas variables aleatorias continuas presentan una funcin de densidad cuya
grfica tiene forma de campana.
En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un
mismo valor de p y valores de n cada vez mayores, se ve que sus polgonos de
frecuencias se aproximan a una curva en "forma de campana".
En resumen, la importancia de la distribucin normal se debe principalmente a que
hay muchas variables asociadas a fenmenos naturales que siguen el modelo de la
normal.
- Caracteres morfolgicos de individuos (personas, animales, plantas,<) de
una especie, p. ejm. Tallas, pesos, envergaduras, di{metros, permetros<
- Caracteres fisiolgicos, por ejemplo; efecto de una misma dosis de un
frmaco, o de una misma cantidad de abono.
- Caracteres sociolgicos, por ejemplo: consumo de cierto producto por un
mismo grupo de individuos, puntuaciones de examen.
- Caracteres psicolgicos, por ejemplo: cociente intelectual, grado de
adaptacin a un medio<<
- Errores cometidos al medir ciertas magnitudes.
- Valores estadsticos muestrales, por ejemplo: la media.
- Otras distribuciones como la binomial o la de Poisson son aproximaciones
normales<
Una distribucin normal con media y desviacin tpica se designa por N(, ).
Su grfica es la campana de Gauss:
El rea del recinto determinado por la funcin y el eje de abscisas es igual a la
unidad.
Pgina 71 de 132
Al ser simtrica respecto al eje que pasa por x = , deja un rea igual a 0.5 a la
izquierda y otra igual a 0.5 a la derecha.
La probabilidad equivale al rea encerrada bajo la curva.
- Distribucin Normal Estndar N(0, 1)
La distribucin normal estndar, o tipificada o reducida, es aquella que tiene por
media el valor cero, =0, y por desviacin tpica la unidad, =1.
La probabilidad de la variable X depender del rea del recinto sombreado en la
figura. Y para calcularla utilizaremos una tabla.
- Tipificacin de la variable
Para poder utilizar la tabla tenemos que transformar la variable X que sigue una
distribucin N(, ) en otra variable Z que siga una distribucin N(0, 1).
DISTRIBUCIN NORMAL.
Caractersticas:
a) Es generada por una variable de tipo continuo, denominada x;
-< x <
b) La funcin que nos define esta distribucin es:
Pgina 72 de 132
-< x <
Al dar a la funcin los valores de , o
2
y valores a x, obtendremos la
distribucin en cuestin, la que tiene forma de campana, por lo que
tambin se le conoce como campana de Gauss. Hay un nmero
infinito de funciones de densidad Normal, una para cada
combinacin de y o. La media mide la ubicacin de la
distribucin y la desviacin estndar o mide su dispersin.
c) Es simtrica con respecto a su eje vertical.
d) Es asinttica con respecto a su eje horizontal; esto quiere decir que jams va a
tocar el eje de las equis.
e) El rea total bajo la curva es 1.
f) S sumamos a o, se observar que aproximadamente el 68.26% de los
datos se encuentran bajo la curva; si sumamos a 2o, el 95.44% de los datos
estar entre esos lmites y si sumamos a 3o, entonces el 99.74% de los datos
caer dentro de esos lmites.
Esta caracterstica es a la vez una forma emprica y rpida de demostrar si los datos
que se analizan tienen una distribucin Normal; ya que para trabajar los datos con
esta distribucin, debe verificarse que efectivamente as se distribuyen, ya que de
no hacerlo, las decisiones que en un momento dado se tomaran de un anlisis de
los datos con la distribucin Normal, seran errneas.
- Clculo de probabilidades con la distribucin Normal.
Para calcular lo ms lgico es que la funcin f(x, , o
2
), se integre entre
los lmites de la variable x; esto es,
2 2
2 2
2
1
o
c
t o
o
/ ) x (
) , , x ( f
=
}
= < >
b
a
dx ) , , x ( f ) b x a ( p
2
o
Pgina 73 de 132
La integral anterior nos dara el rea bajo la curva de la funcin, desde a
hasta b, que corresponde o es igual a la probabilidad buscada.
Debido a la dificultad que se presenta para integrar esta funcin cada
vez que sea necesario, lo que se hace es tipificar el valor de la variable x,
esto es, x se transforma en un valor de z, de la siguiente manera:
Este valor de z es buscado en una tabla donde vienen reas asociadas a
este valor, y haciendo uso de los valores tabulados, se determina la
probabilidad requerida. La tabla que es usada para calcular las
probabilidades es la que nos da el rea que se muestra a continuacin:
El acero que se utiliza para tuberas de agua a menudo se recubre
internamente con un mortero de cemento para evitar la corrosin. En un estudio
de los recubrimientos de mortero de una tubera empleada en un proyecto de
transmisin de agua en California (Transportation Engineering Journal,
Noviembre de 1979) se especific un espesor de 7/16 pulgadas para el mortero.
Un gran nmero de mediciones de espesor dieron una media de 0.635 pulgadas
y una desviacin estndar de 0.082 pulgadas. S las mediciones de espesor,
tenan una distribucin Normal, qu porcentaje aproximado fue inferior a 7/16
de pulgada?
Solucin: x = variable que nos define el espesor del mortero en pulgadas
= 0.635 pulgadas o = 0.082 pulgadas
valor
x
z =
=
o
0
Z
Pgina 74 de 132
p(x < 7/16 pulgadas) = 0.5- p(0 <= z =< -2.41) = 0.5-0.492 = 0.008
Por tanto, 0.008 x 100% = 0.8% de los recubrimientos de mortero tienen un espesor
menor de 7/16 pulgadas
- Tabla de la Normal Estandarizada N(X; 0, 1)
Distribucin Normal Tipificada o estandarizada: P(0 < = Z <= Zo)
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
41 2 4085 2
082 0
635 0 4375 0
082 0
635 0 16 7
. .
.
. .
.
. /
Z ~ =
=
X = 7/16
=0.635
Z
Pgina 75 de 132
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
Pgina 76 de 132
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
Z 1,2820 1,6450 1,9600 2,3260 2,5750 3,0900 3,2910 3,8910 4,4710
F(Z) 0,900 0,950 0,975 0,990 0,995 0,999 0,9995 1,0000 1,0000
2(1-
F(Z)) 0,200 0,100 0,050 0,020 0,010 0,002 0,001 1E-04 7,8E-06
Ejercicios de Distribucin Normal
1. Sea Z una variable aleatoria normal estandarizada, encuentre:
a) Prob (0 <= Z <= 1.96)
b) Prob (Z > = 1.96)
Pgina 77 de 132
c) Prob (- 1.96 <= Z <= 1.96)
d) Prob (- 1 <= Z <= 1.96)
e) Prob (- 1 <= Z <= 2)
f) Prob ( Z < = 0.70)
2. Sea X una variable aleatoria normal con media igual a 500 y desviacin estndar
igual a 100, encuentre:
a) Prob (500 <= X <= 696)
b) Prob (X >= 696)
c) Prob (304 <= X <= 696)
d) Prob (400 <= X <= 696)
e) Prob (600 <= X <= 696)
3. Obtenga el valor de Z0 en las siguientes ecuaciones para la variable aleatoria
normal estandarizada.
a) Prob (- Z0 <= Z <= Z0) = 0.98
b) Prob ( Z >= Z0) =0.01
c) Prob ( Z <= - Z0) = 0.01
d) Prob (- Z0 <= Z <= Z0) = 0.6826
e) Prob (- Z0 <= Z <= Z0) = 0.9544
f) Prob (Z >= Z0) = 0.95
4. Sea X una variable aleatoria normal con media igual a 100 y desviacin estndar
igual a 15, encuentre X0
a) Prob (100 <= X <= 100 + X0) = 0.45
b) Prob (100 X0 <= X <= 100 + X0) = 0.90
Pgina 78 de 132
c) Prob (X >= X0) = 0.20
d) Prob (X <= X0) = 0.30
e) Prob (X <= X0) = 0.80
f) Prob (X >= X0) = 0.70
5. Un analista financiero seala que (conforme a su probabilidad subjetiva) el
precio X de los bonos del gobierno a largo plazo, con un valor de Bs.F 1000,00
tendr al cabo de un ano una distribucin normal con valor esperado de Bs.F
980,00 y desviacin estndar de Bs.F 40,00 . Encuentre
a) Prob (X >= 1000)
b) Prob (X <= 940)
c) Prob (960 <= X <= 1060)
d) Encuentre el valor de X0 que satisface Prob (X >= X0) = 0.90
e) Encuentre el valor de X0 tal que la probabilidad de que el precio de los
bonos (un ao despus) exceda a X0 sea de 0.60
6. Suponga que el salario por hora de un profesor en una universidad (que se basa
en un sistema de pago a destajo) tiene una distribucin normal con media Bs.F
30,00 y desviacin estndar Bs.F 5,00
a) Encuentre la probabilidad de que el salario por hora de un profesor sea
superior a Bs.F 37,50
b) Encuentre la probabilidad de que el salario por hora de un profesor se
ubique entre 25 y 35 bolvares fuertes
c) Encuentre la probabilidad de que el salario por hora de un profesor sea
superior al salario mnimo contratado de Bs.F 20,00
d) Encuentre la probabilidad de que el salario por hora de un profesor sea
superior al salario mximo contratado Bs.F 40,00
Pgina 79 de 132
7. Se calcul que el promedio de enfriamiento de todas las neveras para una lnea
de cierta compaa, emplean una temperatura de -4C con una desviacin tpica de
1.2C.
a. Cul es la probabilidad de que una nevera salga con una temperatura superior
a -3C?
b. Cul es la probabilidad de que una nevera salga con una temperatura menor a -
5.5C?
8. De los 31 productos cul es la probabilidad de que 20 salgan defectuosos, si el
50% de los productos normalmente sale defectuoso.
9. Los sueldos de 65 empleados de una empresa se distribuyen normalmente con
una x = 2300 bolivares y una =150 bolivares se pide :
Hallar la probabilidad de que un empleado obtenga un sueldos inferior a Bs 2400
10. La vida media de los habitantes de un pas es de 68 aos. Con una varianza de
25. Se hace un estudio en una pequea ciudad de 10000 habitantes:
a) Cuntas personas superarn previsiblemente los 75 aos?
b) Cuntos vivirn menos de 60?
11. Supongamos que la estatura masculinos adultos de chile estn normalmente
distribuida con = 70 pulgadas y = 9 pulgadas; de que longitud deberan ser
los colchones para que ellos cupiera por lo menos 99 por 100 de los individuos?
12. En una ciudad se estima que la temperatura mxima en el mes de junio si una
distribucin normal, con media 23 y desviacin tpica 5. Calcular el nmero de
das del mes en los que se espera alcanzar mximas entre 21 y 27.
13. Las calificaciones de los 500 aspirantes presentados a un examen para
contratacin laboral, se distribuye normalmente con media 6'5 y varianza 4.
a) Calcule la probabilidad de que un aspirante obtenga ms de 8 puntos.
b) Determine la proporcin de aspirantes con calificaciones inferiores a 5 puntos.
Pgina 80 de 132
c) Cuntos aspirantes obtuvieron calificaciones comprendidas entre 5 y 7'5
puntos ?.
14. Se sabe que los 5200 estudiantes que han inscrito Estadstica aplicada por
primera vez en la Universidad Nacional Experimental Simn Rodrguez tienen un
promedio de 4,25 puntos, con una varianza de 0,06 puntos, Cul es la
probabilidad de escoger un estudiante al azar y?
a) No apruebe b) Entre 4 y 4.5 puntos c) Al menos 4.5 puntos
d) Entre 3 y 4 puntos e) Cantidad de aprobados
f) Entre que calificaciones esta el 50% central
g) Calificacin mxima del 15% de las notas mas bajas
h) Calificacin minima del 10% de las notas mas altas
15. las estaturas de cierta poblacin se distribuyen segn una normal de media 1.68
y desviacin tpica 8. Calcula la probabilidad de que elegida una persona al azar su
altura sea 1.70cm como mximo.
- Distribucin Log Normal
- Distribucin de Ji- Cuadrado
- Distribucin T-Student
- Distribucin F
5. Distribucin Muestral.
La formulacin de los procedimientos de decisin depende de nuestro
conocimiento de las consecuencias que pueden resultar de las diferentes acciones
tomadas en una situacin dada y del estado natural predominante en el momento
de llevar a la prctica la decisin. En este caso, estado natural se refiere a los
modelos de poblacin o a los fenmenos aleatorios. Sin embargo a menudo
encontramos que las propiedades precisas del modelo, o del estado natural, no se
conocen.
Pgina 81 de 132
El anlisis estadstico es el mtodo matemtico empleado para obtener una misma
informacin, con la menor cantidad de datos. Una de sus aplicaciones ms
conocidas es el control estadstico de calidad en el rea de produccin. Los
mtodos estadsticos permiten producir el mximo de informacin a partir de los
datos disponibles. El anlisis estadstico provee los medios para la eleccin de
muestras y sus caractersticas para que sean representativos del universo de datos,
as como del riesgo relacionado con la decisin de aceptar o rechazar un lote de
producciones en funcin de la informacin proporcionada por el anlisis de la
muestra.
Un mtodo de aproximarnos a los conocimientos de las caractersticas de la
poblacin es por el muestreo directo de la misma. Los mtodos estadsticos que
nos permiten inferir a partir de datos limitados (muestras) los comportamientos
(poblaciones) a largo plazo que se esperan se llaman Estadstica Inductiva o
Inferencial. Rama de la estadstica que estudia el comportamiento y propiedades
de las muestras, y la posibilidad y lmites de la generalizacin de los resultados
obtenidos a partir de aquellas a las poblaciones que representan. Esta
generalizacin de tipo inductivo, se basa en la probabilidad. Tambin se le llama
tambin estadstica matemtica, por su complejidad matemtica en relacin a la
estadstica descriptiva.
Tiene como objetivo generalizar las propiedades de la poblacin bajo estudio,
basado en los resultados de una muestra representativa de la poblacin.
En el proceso podemos cometer errores pero debemos apreciar esos errores para
tener una medida de confianza en nuestras conclusiones inductivas.
La distribucin de probabilidad de una estadstica muestral, dado que es una
variable aleatoria, es comnmente llamada Distribucin Muestral. A partir de las
propiedades de la distribucin del estadstico podemos calcular los riesgos
(errores) que se corren al hacer generalizaciones de la poblacin con base en la
muestra.
En este curso desarrollaremos la distribuciones muestrales para la media, la
diferencia de medias, la proporcin, y la diferencia de proporciones.
Pgina 82 de 132
Pero antes de introducirnos de plano en el tema de las distribuciones muestrales,
mencionaremos a ttulo informativo y somero algunas de las actividades que se
realizan en una investigacin por muestreo en forma sistemtica.
5.1. Algunas de las actividades que se realizan en una investigacin
por muestreo en forma sistemtica
Se llama muestra a una parte de la poblacin a estudiar qu sirve para
representarla.
El determinar el tamao de una muestra representa una parte esencial del mtodo
cientfico para poder llevar a cabo una investigacin. Al muestreo lo podemos
definir como el conjunto de observaciones necesarias para estudiar la distribucin
de determinadas caractersticas en la totalidad de una poblacin, a partir de la
observacin de una parte o subconjunto de una poblacin, denominada muestra.
El clculo del tamao de la muestra es uno de los aspectos a concretar en las fases
previas de la investigacin comercial y determina el grado de credibilidad que
concederemos a los resultados obtenidos.
Al definir el tamao de la muestra, nosotros deberemos procurar que sta
informacin sea representativa, vlida y confiable y al mismo tiempo nos
represente un mnimo costo. Por lo tanto, el tamao de la muestra estar
delimitado por los objetivos del estudio y las caractersticas de la poblacin,
adems de los recursos y el tiempo de que se dispone.
En Estadstica el tamao de la muestra es el nmero de sujetos que componen la
muestra extrada de una poblacin, necesarios para que los datos obtenidos sean
representativos de la poblacin. Para calcular el tamao de una muestra hay que
tomar en cuenta tres factores: El porcentaje de confianza con el cual se quiere
generalizar los datos desde la muestra hacia la poblacin total. El porcentaje de
error que se pretende aceptar al momento de hacer la generalizacin. El nivel de
variabilidad que se calcula para comprobar la hiptesis. La confianza o el
porcentaje de confianza es el porcentaje de seguridad que existe para generalizar
los resultados obtenidos
Pgina 83 de 132
Una poblacin se precisa como un conjunto finito o infinito de personas u objetos
que presentan caractersticas comunes.
- Planteamiento de la investigacin
- Definir objetivos
- Definir cobertura y periodo de referencia
- Definir las variables en estudio
- Definiciones y relaciones bsicas
- Antecedentes
- Recursos
- Asignacin de responsabilidades
- Elaboracin de los instrumentos bsicos
- Plan de tabulacin
- Cuestionario estadstico
- Prueba y ajuste del cuestionario
- Instructivos
- Entrevistas
- Diseo de la encuesta
- Universo estadstico
- Poblacin estadstica
- Mtodo de recoleccin
- Marco muestral
- Tipo de muestreo
- Diseo y tamao de la muestra
- Organizacin y ejecucin de las operaciones de campo
- Diseo de los controles de operacin
- Encuesta piloto
- Preparacin del personal de campo
- Codificacin de preguntas abiertas
Pgina 84 de 132
- Ejecucin de la encuesta
- Procesamiento de datos
- Entrada o captura de los datos
- Salidas o reportes
- Anlisis estadstico de la informacin
- Anlisis de los resultados
- Confiabilidad de la informacin
- Estudio de comportamiento
- Anlisis econmico social
- Plan de difusin
- Medios de comunicacin
- Medios informativos
- Publicaciones
- Limitaciones legales
Extrado del libro:
Investigacin por Muestreo del Profesor Flix Serijas, segunda edicin,
Caracas , 1993
5.2. Distribucin de la media muestral
Si se extrae una muestra aleatoria de tamao n de una poblacin con media y
desviacion estandar , las observaciones muestrales son Independiente y las
variables aleatrias estn distribudas em forma identicas, entonces la distribucion
muestral de la media es como sigue:
Variable aleatoria X Media muestral X
Esperanza o Media (X) =
Desviacin Est{ndar (X) = [/n +* *(N-n )/(N-1)]
Pgina 85 de 132
5.3. Distribucin de la diferencia de medias muestrales
En muchos campos de la investigacion cientfica deseamos a menudo comparar las
medias de dos variables aleatorias, como por ejemplo, el efecto de dos condiciones
o tratamientos o mtodos de produccin.
Variable aleatoria X1-X2 Medias muestrales X1-X2
Esperanza o Media (X1-X2) = 1- 2
Desviacin Estndar (X1-X2) = (
2
1/n1 +
2
2/n2 )
5.4. Distribucin de la proporcin muestral
Recordemos que una proporcin poblacional se define como P = X / N, en donde X
es el numero de elementos que poseen una cierta caracterstica y N es el numero
total de elementos de la poblacin o tamao de la poblacin.
Recordemos igualmente que una proporcin muestral se define como p = x / n, en
donde x es el numero de elementos de la muestra que poseen cierta caracterstica y
n es el tamao de la muestra.
Variable aleatoria X Proporcion muestral p
Esperanza o Media (X) = P
Desviacin Est{ndar (X) = (P*Q/n)* *(N-n )/(N-1)]
5.5. Distribucin de la diferencia de proporciones muestrales
Cuando se comparan dos muestras aleatorias extraidas de dos variables
binomiales, es posible trabajar solo con la proporcin de xitos, no con el numero
Pgina 86 de 132
de xitos, a menos que ambas muestras sean del mismo tamao. Por ejemplo,
durante una eleccin presidencial , toma una muestra de 100 votantes de un estado
y se halla que 40 estan a favor del candidato A; se toma otra muestra de 150
votantes de otro estado y se encuentra que 50 estan a favor del candidato A. Sin
duda, estos dos conjuntos de nmeros no se pueden evaluar a menos que se
reduzcan a proporciones. Mas especficamente, lo que aqu necesitamos es un
modelo de probabilidad de la diferencia de dos proporciones.
Variable aleatoria p1-p2 Proporciones muestrales p1-p2
Esperanza o Media (p1-p2) = P1- P2
Desviacin Estndar (p1-p2) = (P1 * Q1/n1 + P2 * Q2/n2 )
Ejercicios de Distribucin de Muestreo
1. Si la vida media de operacin de una pila de linterna es de 24 horas y est
distribuida normalmente con una desviacin de 3 horas. Cul es la probabilidad
de que una muestra aleatoria de 100 pilas tenga una media que se desve por ms
de 30 minutos del promedio?
Resp. La probabilidad de que el promedio de la vida til de las pilas supere las
24.5 Horas es de 4.75%. P (X > 24.5horas) = 4.75%
Z = (24.5 24)/(3/100) = 1.67 P (Z > 1.67) = 4.75%
2. En un estudio para comparar los pesos promedios de nios y nias de sexto
grado en una escuela primaria se usar una muestra aleatoria de 20 nios y otra de
25 nias. Se sabe que tanto para nios como para nias los pesos siguen una
distribucin normal. El promedio de los pesos de todos los nios de sexto grado de
Pgina 87 de 132
esa escuela es de 100 libras y su desviacin estndar es de 14.142 libras, mientras
que el promedio de los pesos de todas las nias de sexto grado de esa escuela es de
85 libras y su desviacin estndar es de 12.247 libras. Cul de la probabilidad de
que el promedio de los pesos de los 20 nios sea al menos 20 libras ms mayor que
el de las 25 nias?.
Resp. P (X1 X2 >= 20) = 0.1056 Por lo tanto, la probabilidad de que el peso
promedio de los nios sea al menos 20 libras mayor que el peso promedio de las
nias es 10.56%.
Z = (20-15) / (199,9962/20 + 149,989/25 ) = 5/3.9999 = 1,25
P (X1 X2 >= 20) = P ( Z >= 1,25 ) = 10,56%
3. Previo a una eleccin la senadora X contrata los servicios de la compaa Y para
f ijar la contienda establecida con los electores. Ella percibe con respecto a este
punto que si tiene el 45% de los votos ser nominada de acuerdo con su estrategia
de campaa. Suponiendo que la compaa contratada selecciona una muestra
aleatoria simple de 1600 electores registrados. Cul es la probabilidad de que la
muestra pueda producir una proporcin de 45% ms dado que la verdadera
proporcin es del 40%?
Resp. P (p >= 0,45) = P (Z>= 4,09) = 0 La probabilidad es de casi el 0%.
Pgina 88 de 132
4. Hallar la probabilidad de que en 120 lanzamientos de una moneda el nmero de
caras (a) est comprendido entre el 40% y el 60%, (b) sea 5/8 o ms del nmero de
lanzamientos.
5. Si X N (40,10), calcular Pr (39 X 41) para n=10 En que intervalo se obtendr{
el 95% de los resultados?
6. Al medir el tiempo de reaccin, un psiclogo estima que la desviacin tpica del
mismo es de 0,05 segundos, Cul es el tamao de la muestra mas adecuada para
estimar la media, con una confianza del 95% y un error que no exceda a 0,01?
n= Z* / e n= 1,96*0,05 / 0,01 =96 sujetos
7. El porcentaje de votantes de un Distrito dado que estn a favor de determinado
candidato es el 55%. Hallar el tamao de la muestra con un nivel de confianza del
99% si se quiere un error mximo de 2%, para la proporcin de todos los votantes
que estn a favor de ese candidato.
n= Z*P*Q / e n= 2,58*0,55*0,45 / 0,02 = 4119 electores
8. Cul es la probabilidad de que el candidato 1 supere al candidato 2?
Porcentaje de
Votantes
Candidato 1 30%
Candidato 2 40%
Candidato 3 30%
Pgina 89 de 132
Resp. Prob[ (p1 p2 > = 0] = Prob (Z >= 1,49) = 6,81 % La probabilidad de
que el candidato 1 supere al candidato 2 es del 6.81%
9. Un fabricante de focos afirma que su producto durar un promedio de 500 horas
de trabajo. Para conservar este promedio esta persona verifica 25 focos cada mes. Si
el valor y calculado cae entre t = -0.05 y t = 0.05, l se encuentra satisfecho con esta
afirmacin.
Qu conclusin deber l sacar de una muestra de 25 focos cuya duracin fue?:
520 521 511 512 510 = 500 h
513 522 500 521 495 n = 25
496 488 500 502 512 Nc = 90%
510 510 475 505 521 X = 505.36
506 503 487 493 500 S =12.07
Pgina 90 de 132
gl = n -1 = 24 t = 2.22
Se puede concluir que la media poblacional no es 500, porque la muestra
Poblacional est por encima de esta, y por lo tanto debera estar por encima de
500.
10. Un proceso manufacturero usado por una fabrica durante los ultimos 10 aos,
tiene una distribucin normal con la desviacin estndar de 8 unidades por hora,
se desea estimar un intervalo de confianza de 90% para el promedio de unidades
por hora producido con dicho proceso. Para tal efecto, se toma una muestra
aleatoria de la produccin por hora y se obtiene un promedio de 160 unidades.
Resp. 157.376 < < 162.624
11. En un estudio de prevalencia de factores de riesgo en una cohorte de 412
mujeres mayores de 15 aos de la regin metropolitana se encontr que el 17.6% de
ellas era hipertensas. Determinar un intervalo para la proporcin de mujeres
hipertensas en la regin metropolitana con un nivel de confianza del 95%.
Resp. 0.14268< P < 0.20932
12. Que tan grande debe seleccionarse una muestra para tener un intervalo de
95% de confianza con un margen de error de 10 unidades? Suponga que la
desviacin estndar poblacional es 40. Resp. n= 61.46
13. Cuntas personas tendramos que estudiar para conocer la prevalencia al
diabetes? Con un nivel de confianza 95%, un error 3%, proporcin esperada
asumamos que pueda ser aproxima al 5%.
Pgina 91 de 132
14. Una poblacin se compone de tres nmeros 3, 6,8, Considerar todas las
muestras posibles de tamao dos que puedan extraerse. Hallar:
a. Media de la Poblacin =5,6667
b. Desviacin tpica de la poblacin = 2,0548
c. Media de la distribucin media con reemplazo= 5,67
d. Media de la distribucin media sin reemplazo = 5,67
e. Desviacin tpica de la distribucin muestra de media con reemplazo
/ n = 1,45
f. Desviacin tpica de la distribucin muestra de media sin reemplazo
/ n *[(N-n)/(N-1)] = 1,02
15. Si la sumatoria de la edades de diez estudiantes es de 126,45 Cul es el
promedio de las edades? Media X= 12,645 aos
16. De los 56 estudiantes en las dos secciones de estadstica aplicada, que cursan la
carrera de Informtica solo aprobaron 32. Cual es la proporcin de aprobados?
P= 32/56= 0,5714
17. Las medidas de los dimetros de una muestra al azar de 200 cojinetes de bolas
hechas por una determinada mquina durante una semana dieron una media de
0,824 pulgadas y una desviacin tpica de 0,042 pulgadas. Hallar los lmites de
confianza del 95% para el dimetro medio de todos los cojinetes.
IC= Med X Z* x IC= [0,8182; 0,8298]
Los intervalos de confianza para estimar el dimetros de cojinetes de bolas hechas
por una determinada mquina se encuentra entre [0,8182; 0,8298], con una
confianza del 95%
18. Una muestra de 100 votantes elegidos al azar entre todos los de un Distrito
dado, indic que el 55% estaban a favor de un determinado candidato. Hallar los
lmites de confianza del 99% para la proporcin de todos los votantes que estaban
a favor de ese candidato
IC= p Z* p IC= [0,46; 0,64]
Pgina 92 de 132
Los intervalos de confianza para estimar la proporcin de todos los votantes
que estaban a favor de ese candidato se encuentra entre [0,46; 0,64], con una
confianza del 99%
19. Una compaa que fabrica pastelitos desea estimar la proporcin de
consumidores que prefieran su marca. Los agentes de la compaa observan a 450
compradores, del nmero total observado 300 compraron los pastelitos. Calcule un
intervalo de confianza del 95% para la proporcin de compradores que prefieren
la marca de esta compaa.
Resp.
71,02%
p =
62,31%
La demanda del producto flucta entre 62,31% que seria el mnimo y 71,02% que
seria lo mximo.
20. Calcule el tamao muestral de una encuesta realizada por CIS sobre la Unin
Europea que inclua todas las provincias excepto Ceuta y Melilla. El error terico
era de + 2, con un intervalo de confianza de 95,5% y P=Q en el supuesto de un
muestreo aleatorio simple.
Resp. n = 2500
Pgina 93 de 132
21. Una fbrica desea saber la proporcin de amas de casa que preferiran una
aspiradora de su marca. Se toma al azar una muestra de 100 amas de casa y 20
dicen que les gustara la mquina. Calcule e interprete un intervalo del 95% de
confianza para la verdadera proporcin de amas de casa que preferiran dicha
aspiradora.
Interpretacin: se tiene una certeza del 95% de que la verdadera proporcin de
amas de casa que preferiran la aspiradora est entre 122% y 278%.
22. Se desea medir la diferencia entre dos categoras de empleados en la actividad
de seguros. Una est formada por personas con ttulo superior y la otra por
personas que slo tienen estudios secundarios. Tomamos una muestra de 45
empleados entre los primeros y la media de ventas resulta ser 32. Tomamos 60
empleados del segundo grupo y la media es 25. Suponga que las ventas de los dos
grupos se distribuyen normalmente con varianzas de 48 para los titulados
superiores y 56 para los de estudios secundarios.
Calcule e interprete un intervalo del 90% de confianza para la verdadera diferencia
de las medias.
De acuerdo con el intervalo hallado, hay evidencia de que las medias sean
iguales?
I.
Interpretacin: La verdadera diferencia de medias se halla entre 467 y 933 con
una certeza del 90%.
Si las dos medias son iguales, la diferencia entre ambas es cero. Por lo tanto
para que la igualdad entre las medias no pueda descartarse el cero debe
estar en el intervalo calculado. Como en este caso no sucede, no hay
evidencia de la igualdad entre las medias.
Pgina 94 de 132
5.6. Conceptos bsicos para la determinacin del tamao de
muestra: variable cualitativa Sexo y variable cuantitativa Edad.
- Notacin o Simbologa utilizada en el Muestreo.
Variable: Edad Smbolo Variable: Sexo Smbolo
Parmetro
Media
poblacional
Parmetro
Proporcin
poblacional
P
Estimador
media
muestral
X media Estimador
Proporcin
muestral
p
Parmetro
Desviacin
estndar
poblacional
(X) Parmetro
Desviacin
estndar
poblacional
(X)
Estimador
Desviacin
estndar
muestral
S Estimador
Desviacin
estndar
muestral
S
Poblacin
Tamao de la
Poblacin
N Poblacin
Tamao de la
Poblacin
N
Muestra
Tamao de la
Muestra
n Muestra
Tamao de la
Muestra
n
Desviacin
estndar del
estimador
(X
media)
Desviacin
estndar del
estimador
(p)
Error mximo
admisible
e
Error mximo
admisible
e
Nivel de
confianza
(Probabilidad)
Z = f (Alfa)
Nivel de
confianza
(Probabilidad)
Z = f (Alfa)
Tipo de
muestreo
Probabilstico
Tipo de
muestreo
Probabilstico
Clase de
muestreo
Muestreo
aleatorio
simple
mas
Clase de
muestreo
Muestreo
aleatorio
simple
mas
Pgina 95 de 132
- Marco Muestral de 1200 personas, Nmero identificador
y variables: Sexo y Edad.
Nmero Sexo Edad Nmero Sexo Edad Nmero Sexo Edad
1 Masculino 26 401 Femenino 80 801 Femenino 30
2 Masculino 33 402 Femenino 72 802 Femenino 48
3 Femenino 28 403 Femenino 37 803 Masculino 49
4 Femenino 55 404 Femenino 57 804 Masculino 80
5 Femenino 36 405 Femenino 25 805 Femenino 75
6 Masculino 60 406 Masculino 49 806 Femenino 18
7 Femenino 68 407 Masculino 58 807 Masculino 20
8 Masculino 49 408 Femenino 71 808 Femenino 31
9 Femenino 47 409 Femenino 37 809 Masculino 42
10 Masculino 54 410 Masculino 27 810 Femenino 55
11 Masculino 30 411 Femenino 21 811 Femenino 27
12 Femenino 69 412 Masculino 22 812 Masculino 72
13 Femenino 32 413 Masculino 61 813 Masculino 65
14 Femenino 64 414 Femenino 67 814 Masculino 19
15 Masculino 46 415 Femenino 46 815 Femenino 73
16 Femenino 28 416 Masculino 88 816 Masculino 50
17 Femenino 23 417 Femenino 59 817 Femenino 77
18 Masculino 24 418 Masculino 30 818 Femenino 39
19 Masculino 32 419 Masculino 45 819 Femenino 24
20 Femenino 33 420 Femenino 25 820 Femenino 64
21 Masculino 48 421 Femenino 54 821 Masculino 39
22 Femenino 60 422 Masculino 18 822 Masculino 67
23 Femenino 77 423 Masculino 51 823 Masculino 24
24 Masculino 50 424 Masculino 38 824 Femenino 39
25 Masculino 64 425 Femenino 43 825 Femenino 63
26 Masculino 35 426 Masculino 71 826 Masculino 68
27 Femenino 52 427 Femenino 48 827 Masculino 42
28 Femenino 25 428 Femenino 25 828 Femenino 29
29 Masculino 18 429 Masculino 62 829 Masculino 64
30 Femenino 69 430 Femenino 61 830 Femenino 38
31 Femenino 70 431 Femenino 72 831 Femenino 47
32 Femenino 24 432 Femenino 36 832 Femenino 52
33 Masculino 59 433 Masculino 37 833 Femenino 27
34 Femenino 77 434 Femenino 37 834 Masculino 45
35 Masculino 38 435 Masculino 47 835 Femenino 49
36 Femenino 61 436 Femenino 74 836 Masculino 39
37 Masculino 24 437 Femenino 57 837 Femenino 60
38 Masculino 75 438 Masculino 25 838 Femenino 31
39 Masculino 78 439 Masculino 68 839 Masculino 21
40 Femenino 34 440 Femenino 23 840 Masculino 66
Pgina 96 de 132
41 Masculino 57 441 Femenino 24 841 Masculino 58
42 Femenino 22 442 Femenino 37 842 Femenino 56
43 Masculino 31 443 Masculino 53 843 Femenino 77
44 Masculino 18 444 Masculino 45 844 Femenino 67
45 Femenino 71 445 Masculino 54 845 Femenino 73
46 Femenino 19 446 Femenino 47 846 Masculino 31
47 Masculino 31 447 Masculino 25 847 Masculino 36
48 Masculino 53 448 Femenino 20 848 Masculino 44
49 Femenino 32 449 Masculino 32 849 Masculino 71
50 Masculino 28 450 Masculino 71 850 Femenino 20
51 Femenino 58 451 Femenino 51 851 Masculino 24
52 Femenino 50 452 Masculino 26 852 Masculino 19
53 Femenino 48 453 Masculino 56 853 Masculino 35
54 Femenino 44 454 Femenino 41 854 Masculino 33
55 Femenino 65 455 Femenino 49 855 Femenino 38
56 Masculino 78 456 Femenino 67 856 Masculino 63
57 Femenino 36 457 Masculino 18 857 Femenino 83
58 Femenino 70 458 Masculino 42 858 Masculino 39
59 Masculino 76 459 Masculino 28 859 Masculino 28
60 Femenino 59 460 Femenino 21 860 Masculino 38
61 Masculino 18 461 Femenino 33 861 Masculino 50
62 Masculino 49 462 Masculino 31 862 Femenino 33
63 Femenino 21 463 Femenino 51 863 Femenino 71
64 Masculino 78 464 Femenino 23 864 Femenino 60
65 Femenino 21 465 Femenino 35 865 Masculino 50
66 Masculino 47 466 Masculino 32 866 Masculino 70
67 Masculino 20 467 Masculino 57 867 Femenino 32
68 Femenino 60 468 Femenino 68 868 Femenino 74
69 Femenino 30 469 Masculino 19 869 Masculino 51
70 Masculino 35 470 Masculino 63 870 Masculino 36
71 Femenino 63 471 Masculino 41 871 Femenino 35
72 Masculino 52 472 Femenino 19 872 Femenino 73
73 Masculino 18 473 Femenino 19 873 Femenino 32
74 Masculino 42 474 Masculino 23 874 Femenino 66
75 Femenino 28 475 Femenino 55 875 Femenino 25
76 Femenino 39 476 Femenino 63 876 Masculino 34
77 Masculino 37 477 Masculino 69 877 Femenino 28
78 Femenino 63 478 Masculino 64 878 Femenino 43
79 Masculino 42 479 Masculino 38 879 Masculino 40
80 Masculino 66 480 Femenino 35 880 Femenino 78
81 Masculino 33 481 Femenino 30 881 Femenino 44
82 Femenino 61 482 Femenino 43 882 Femenino 18
83 Femenino 18 483 Femenino 68 883 Masculino 25
84 Femenino 30 484 Masculino 21 884 Masculino 34
85 Masculino 20 485 Masculino 51 885 Femenino 39
86 Masculino 51 486 Femenino 76 886 Masculino 65
87 Femenino 28 487 Masculino 43 887 Masculino 67
Pgina 97 de 132
88 Masculino 50 488 Masculino 48 888 Femenino 34
89 Masculino 24 489 Femenino 72 889 Femenino 81
90 Femenino 64 490 Femenino 22 890 Masculino 64
91 Femenino 26 491 Masculino 26 891 Femenino 61
92 Femenino 46 492 Masculino 67 892 Femenino 47
93 Masculino 31 493 Masculino 41 893 Masculino 19
94 Femenino 70 494 Masculino 40 894 Masculino 25
95 Masculino 93 495 Masculino 36 895 Femenino 58
96 Masculino 70 496 Femenino 29 896 Masculino 47
97 Masculino 53 497 Femenino 31 897 Femenino 24
98 Masculino 40 498 Femenino 39 898 Masculino 56
99 Femenino 18 499 Masculino 69 899 Femenino 37
100 Femenino 53 500 Femenino 65 900 Masculino 55
101 Femenino 37 501 Masculino 30 901 Masculino 30
102 Femenino 68 502 Femenino 59 902 Masculino 44
103 Masculino 31 503 Femenino 61 903 Masculino 47
104 Masculino 33 504 Masculino 40 904 Femenino 35
105 Femenino 66 505 Femenino 23 905 Femenino 58
106 Femenino 45 506 Femenino 62 906 Masculino 61
107 Masculino 21 507 Masculino 55 907 Femenino 26
108 Femenino 62 508 Femenino 58 908 Masculino 23
109 Masculino 61 509 Masculino 33 909 Masculino 71
110 Masculino 54 510 Femenino 37 910 Femenino 43
111 Masculino 22 511 Masculino 35 911 Femenino 78
112 Femenino 50 512 Masculino 46 912 Masculino 22
113 Femenino 29 513 Femenino 25 913 Femenino 60
114 Masculino 24 514 Masculino 58 914 Masculino 91
115 Masculino 51 515 Masculino 87 915 Femenino 46
116 Masculino 49 516 Femenino 55 916 Femenino 30
117 Femenino 75 517 Femenino 24 917 Masculino 40
118 Femenino 30 518 Masculino 44 918 Masculino 62
119 Masculino 32 519 Masculino 29 919 Masculino 23
120 Femenino 34 520 Masculino 40 920 Femenino 65
121 Masculino 46 521 Femenino 76 921 Femenino 38
122 Masculino 25 522 Femenino 22 922 Masculino 71
123 Masculino 56 523 Masculino 63 923 Femenino 62
124 Masculino 35 524 Masculino 67 924 Femenino 75
125 Femenino 18 525 Femenino 22 925 Masculino 22
126 Femenino 43 526 Masculino 26 926 Femenino 28
127 Masculino 26 527 Femenino 40 927 Masculino 40
128 Femenino 68 528 Masculino 66 928 Masculino 60
129 Femenino 34 529 Masculino 38 929 Femenino 80
130 Masculino 49 530 Masculino 46 930 Femenino 43
131 Masculino 55 531 Masculino 23 931 Femenino 49
132 Femenino 72 532 Femenino 40 932 Masculino 18
133 Masculino 30 533 Masculino 18 933 Masculino 70
134 Femenino 23 534 Femenino 39 934 Masculino 48
Pgina 98 de 132
135 Femenino 23 535 Femenino 20 935 Femenino 21
136 Femenino 60 536 Femenino 70 936 Femenino 30
137 Masculino 58 537 Femenino 86 937 Masculino 18
138 Masculino 28 538 Femenino 21 938 Masculino 19
139 Femenino 46 539 Femenino 43 939 Masculino 31
140 Masculino 45 540 Masculino 21 940 Masculino 45
141 Femenino 75 541 Femenino 73 941 Femenino 69
142 Femenino 45 542 Masculino 39 942 Masculino 55
143 Masculino 57 543 Femenino 32 943 Femenino 52
144 Masculino 18 544 Masculino 66 944 Femenino 19
145 Femenino 21 545 Femenino 54 945 Masculino 40
146 Masculino 31 546 Masculino 77 946 Masculino 21
147 Masculino 44 547 Masculino 30 947 Masculino 21
148 Masculino 35 548 Femenino 41 948 Masculino 65
149 Femenino 39 549 Masculino 45 949 Masculino 45
150 Masculino 60 550 Femenino 25 950 Femenino 29
151 Masculino 29 551 Femenino 66 951 Femenino 85
152 Femenino 68 552 Femenino 29 952 Masculino 21
153 Femenino 58 553 Femenino 61 953 Masculino 79
154 Femenino 27 554 Masculino 18 954 Femenino 45
155 Masculino 40 555 Masculino 50 955 Femenino 81
156 Masculino 74 556 Masculino 45 956 Femenino 21
157 Femenino 24 557 Femenino 71 957 Femenino 54
158 Femenino 60 558 Femenino 36 958 Masculino 23
159 Masculino 23 559 Masculino 22 959 Masculino 43
160 Masculino 61 560 Femenino 77 960 Femenino 90
161 Femenino 70 561 Femenino 38 961 Masculino 72
162 Femenino 46 562 Masculino 46 962 Femenino 38
163 Femenino 34 563 Masculino 68 963 Femenino 75
164 Masculino 30 564 Femenino 50 964 Masculino 25
165 Femenino 43 565 Femenino 26 965 Femenino 32
166 Femenino 82 566 Masculino 69 966 Femenino 40
167 Femenino 75 567 Masculino 33 967 Femenino 56
168 Femenino 63 568 Femenino 52 968 Masculino 35
169 Masculino 25 569 Femenino 45 969 Femenino 68
170 Masculino 44 570 Masculino 46 970 Femenino 40
171 Femenino 35 571 Masculino 60 971 Masculino 64
172 Masculino 64 572 Masculino 37 972 Masculino 29
173 Masculino 35 573 Masculino 72 973 Masculino 65
174 Masculino 40 574 Femenino 69 974 Masculino 39
175 Femenino 28 575 Femenino 30 975 Femenino 50
176 Femenino 41 576 Masculino 39 976 Femenino 26
177 Femenino 77 577 Masculino 65 977 Femenino 30
178 Femenino 59 578 Masculino 19 978 Masculino 29
179 Masculino 75 579 Masculino 53 979 Masculino 68
180 Masculino 27 580 Femenino 41 980 Masculino 42
181 Masculino 61 581 Femenino 20 981 Femenino 43
Pgina 99 de 132
182 Femenino 31 582 Masculino 38 982 Femenino 21
183 Femenino 46 583 Masculino 80 983 Femenino 59
184 Masculino 22 584 Femenino 71 984 Masculino 66
185 Masculino 43 585 Femenino 27 985 Masculino 86
186 Femenino 28 586 Masculino 42 986 Masculino 43
187 Femenino 84 587 Masculino 18 987 Femenino 63
188 Femenino 63 588 Femenino 38 988 Masculino 29
189 Masculino 33 589 Femenino 72 989 Masculino 30
190 Femenino 24 590 Masculino 78 990 Femenino 35
191 Masculino 72 591 Masculino 62 991 Masculino 21
192 Masculino 54 592 Femenino 81 992 Femenino 51
193 Femenino 24 593 Masculino 18 993 Masculino 55
194 Masculino 59 594 Femenino 58 994 Femenino 29
195 Masculino 73 595 Femenino 49 995 Femenino 48
196 Femenino 72 596 Femenino 66 996 Masculino 70
197 Masculino 23 597 Masculino 72 997 Masculino 57
198 Masculino 38 598 Masculino 49 998 Femenino 64
199 Femenino 56 599 Femenino 69 999 Femenino 33
200 Femenino 34 600 Masculino 60 1.000 Masculino 18
201 Masculino 20 601 Femenino 34 1.001 Masculino 59
202 Masculino 45 602 Femenino 27 1.002 Femenino 79
203 Masculino 71 603 Femenino 64 1.003 Masculino 48
204 Femenino 76 604 Masculino 18 1.004 Femenino 28
205 Femenino 35 605 Femenino 54 1.005 Femenino 62
206 Femenino 57 606 Masculino 39 1.006 Masculino 26
207 Femenino 28 607 Femenino 62 1.007 Femenino 25
208 Femenino 20 608 Femenino 22 1.008 Masculino 52
209 Masculino 34 609 Masculino 76 1.009 Femenino 41
210 Masculino 28 610 Femenino 44 1.010 Femenino 37
211 Masculino 22 611 Femenino 18 1.011 Masculino 42
212 Femenino 25 612 Masculino 39 1.012 Masculino 53
213 Femenino 68 613 Femenino 50 1.013 Femenino 66
214 Femenino 52 614 Masculino 51 1.014 Femenino 67
215 Masculino 64 615 Masculino 18 1.015 Femenino 77
216 Femenino 71 616 Femenino 83 1.016 Femenino 77
217 Femenino 27 617 Masculino 27 1.017 Femenino 39
218 Femenino 25 618 Femenino 86 1.018 Masculino 59
219 Masculino 60 619 Femenino 69 1.019 Masculino 25
220 Femenino 33 620 Masculino 65 1.020 Masculino 23
221 Masculino 46 621 Femenino 52 1.021 Femenino 45
222 Femenino 57 622 Femenino 62 1.022 Masculino 49
223 Masculino 18 623 Femenino 44 1.023 Femenino 39
224 Femenino 18 624 Masculino 22 1.024 Femenino 47
225 Masculino 31 625 Masculino 43 1.025 Femenino 32
226 Femenino 87 626 Femenino 28 1.026 Masculino 33
227 Masculino 58 627 Masculino 48 1.027 Masculino 30
228 Femenino 34 628 Masculino 59 1.028 Femenino 36
Pgina 100 de 132
229 Masculino 59 629 Femenino 70 1.029 Masculino 34
230 Femenino 58 630 Femenino 33 1.030 Femenino 22
231 Femenino 28 631 Femenino 19 1.031 Masculino 53
232 Masculino 22 632 Masculino 28 1.032 Femenino 67
233 Masculino 49 633 Masculino 88 1.033 Masculino 18
234 Femenino 41 634 Femenino 50 1.034 Femenino 63
235 Femenino 89 635 Femenino 59 1.035 Masculino 29
236 Masculino 30 636 Femenino 36 1.036 Femenino 21
237 Masculino 30 637 Masculino 49 1.037 Masculino 27
238 Masculino 55 638 Femenino 21 1.038 Femenino 63
239 Femenino 45 639 Femenino 24 1.039 Masculino 57
240 Femenino 61 640 Femenino 21 1.040 Femenino 54
241 Masculino 21 641 Masculino 25 1.041 Femenino 57
242 Femenino 24 642 Masculino 51 1.042 Femenino 36
243 Masculino 84 643 Masculino 28 1.043 Masculino 34
244 Masculino 29 644 Femenino 20 1.044 Femenino 28
245 Masculino 18 645 Masculino 56 1.045 Masculino 28
246 Femenino 70 646 Femenino 35 1.046 Masculino 43
247 Femenino 83 647 Masculino 73 1.047 Femenino 53
248 Masculino 24 648 Femenino 60 1.048 Masculino 55
249 Femenino 81 649 Masculino 22 1.049 Femenino 23
250 Femenino 41 650 Masculino 32 1.050 Masculino 43
251 Masculino 26 651 Femenino 40 1.051 Femenino 25
252 Femenino 26 652 Masculino 65 1.052 Femenino 46
253 Masculino 30 653 Masculino 20 1.053 Femenino 35
254 Masculino 61 654 Masculino 45 1.054 Masculino 66
255 Femenino 31 655 Femenino 39 1.055 Masculino 20
256 Femenino 25 656 Masculino 59 1.056 Femenino 64
257 Femenino 48 657 Femenino 71 1.057 Masculino 46
258 Femenino 61 658 Masculino 64 1.058 Femenino 63
259 Masculino 39 659 Masculino 24 1.059 Femenino 70
260 Masculino 18 660 Femenino 41 1.060 Femenino 24
261 Masculino 24 661 Masculino 56 1.061 Masculino 18
262 Femenino 61 662 Femenino 76 1.062 Masculino 58
263 Femenino 57 663 Femenino 67 1.063 Masculino 48
264 Femenino 39 664 Masculino 73 1.064 Masculino 33
265 Masculino 35 665 Femenino 58 1.065 Masculino 75
266 Femenino 47 666 Femenino 37 1.066 Masculino 23
267 Femenino 21 667 Masculino 42 1.067 Masculino 52
268 Femenino 77 668 Femenino 54 1.068 Femenino 34
269 Femenino 80 669 Femenino 36 1.069 Femenino 57
270 Masculino 28 670 Masculino 18 1.070 Masculino 48
271 Femenino 35 671 Masculino 37 1.071 Femenino 70
272 Masculino 36 672 Femenino 26 1.072 Masculino 22
273 Femenino 49 673 Masculino 72 1.073 Femenino 37
274 Femenino 51 674 Femenino 37 1.074 Femenino 26
275 Masculino 63 675 Masculino 26 1.075 Femenino 48
Pgina 101 de 132
276 Masculino 39 676 Femenino 50 1.076 Femenino 51
277 Femenino 22 677 Masculino 65 1.077 Masculino 29
278 Masculino 29 678 Femenino 21 1.078 Masculino 18
279 Femenino 68 679 Masculino 31 1.079 Masculino 64
280 Femenino 46 680 Masculino 19 1.080 Masculino 21
281 Masculino 19 681 Femenino 42 1.081 Femenino 60
282 Masculino 29 682 Masculino 18 1.082 Femenino 49
283 Masculino 25 683 Femenino 30 1.083 Femenino 25
284 Femenino 42 684 Masculino 77 1.084 Femenino 24
285 Masculino 31 685 Femenino 68 1.085 Femenino 46
286 Femenino 30 686 Femenino 66 1.086 Masculino 70
287 Femenino 65 687 Masculino 57 1.087 Masculino 78
288 Masculino 37 688 Femenino 25 1.088 Femenino 86
289 Femenino 19 689 Femenino 25 1.089 Masculino 35
290 Femenino 42 690 Femenino 72 1.090 Femenino 58
291 Femenino 31 691 Masculino 53 1.091 Femenino 30
292 Femenino 51 692 Femenino 34 1.092 Masculino 23
293 Masculino 50 693 Masculino 71 1.093 Femenino 54
294 Masculino 65 694 Femenino 38 1.094 Femenino 19
295 Femenino 55 695 Femenino 49 1.095 Femenino 49
296 Masculino 37 696 Masculino 31 1.096 Masculino 46
297 Masculino 63 697 Masculino 53 1.097 Femenino 77
298 Masculino 54 698 Masculino 91 1.098 Masculino 21
299 Femenino 29 699 Femenino 71 1.099 Femenino 19
300 Femenino 40 700 Femenino 23 1.100 Masculino 77
301 Femenino 49 701 Femenino 33 1.101 Femenino 30
302 Masculino 32 702 Femenino 53 1.102 Masculino 42
303 Femenino 22 703 Femenino 75 1.103 Femenino 62
304 Masculino 48 704 Masculino 69 1.104 Masculino 26
305 Femenino 44 705 Masculino 22 1.105 Femenino 29
306 Masculino 31 706 Femenino 47 1.106 Masculino 70
307 Masculino 58 707 Masculino 30 1.107 Masculino 43
308 Masculino 18 708 Masculino 62 1.108 Femenino 52
309 Femenino 39 709 Femenino 71 1.109 Femenino 45
310 Femenino 43 710 Femenino 61 1.110 Femenino 61
311 Femenino 63 711 Masculino 40 1.111 Femenino 23
312 Femenino 29 712 Femenino 38 1.112 Masculino 38
313 Masculino 20 713 Masculino 22 1.113 Masculino 22
314 Masculino 68 714 Masculino 35 1.114 Femenino 43
315 Masculino 68 715 Femenino 25 1.115 Femenino 65
316 Masculino 50 716 Masculino 64 1.116 Femenino 32
317 Masculino 42 717 Femenino 38 1.117 Femenino 19
318 Femenino 52 718 Femenino 40 1.118 Masculino 71
319 Femenino 38 719 Masculino 26 1.119 Masculino 54
320 Femenino 77 720 Masculino 31 1.120 Femenino 42
321 Masculino 37 721 Masculino 70 1.121 Femenino 65
322 Femenino 30 722 Masculino 63 1.122 Masculino 37
Pgina 102 de 132
323 Masculino 55 723 Femenino 53 1.123 Masculino 47
324 Femenino 29 724 Femenino 28 1.124 Masculino 32
325 Femenino 80 725 Femenino 36 1.125 Masculino 27
326 Masculino 65 726 Masculino 21 1.126 Femenino 38
327 Femenino 24 727 Masculino 91 1.127 Masculino 57
328 Masculino 65 728 Masculino 48 1.128 Femenino 60
329 Femenino 67 729 Femenino 27 1.129 Femenino 75
330 Femenino 43 730 Masculino 41 1.130 Femenino 28
331 Masculino 21 731 Femenino 82 1.131 Masculino 79
332 Femenino 61 732 Masculino 19 1.132 Masculino 32
333 Masculino 40 733 Femenino 36 1.133 Masculino 43
334 Femenino 57 734 Masculino 20 1.134 Femenino 54
335 Masculino 54 735 Femenino 58 1.135 Femenino 29
336 Femenino 29 736 Masculino 36 1.136 Femenino 61
337 Masculino 40 737 Masculino 70 1.137 Masculino 68
338 Femenino 75 738 Femenino 47 1.138 Masculino 29
339 Masculino 22 739 Masculino 61 1.139 Femenino 47
340 Masculino 22 740 Femenino 26 1.140 Femenino 82
341 Femenino 26 741 Masculino 62 1.141 Masculino 21
342 Femenino 33 742 Femenino 32 1.142 Masculino 61
343 Femenino 78 743 Masculino 53 1.143 Femenino 58
344 Femenino 45 744 Femenino 62 1.144 Femenino 29
345 Femenino 36 745 Masculino 67 1.145 Femenino 35
346 Femenino 21 746 Femenino 42 1.146 Masculino 74
347 Masculino 39 747 Masculino 36 1.147 Masculino 40
348 Femenino 62 748 Femenino 18 1.148 Masculino 28
349 Masculino 18 749 Masculino 64 1.149 Femenino 29
350 Masculino 60 750 Masculino 65 1.150 Masculino 32
351 Masculino 20 751 Masculino 29 1.151 Femenino 38
352 Femenino 43 752 Masculino 35 1.152 Masculino 74
353 Femenino 24 753 Femenino 45 1.153 Femenino 65
354 Femenino 73 754 Femenino 54 1.154 Femenino 54
355 Masculino 63 755 Femenino 28 1.155 Masculino 22
356 Masculino 70 756 Masculino 41 1.156 Femenino 28
357 Femenino 28 757 Femenino 59 1.157 Masculino 23
358 Femenino 36 758 Femenino 28 1.158 Femenino 80
359 Masculino 31 759 Femenino 67 1.159 Femenino 22
360 Masculino 48 760 Masculino 45 1.160 Masculino 50
361 Femenino 36 761 Femenino 45 1.161 Femenino 59
362 Masculino 22 762 Masculino 23 1.162 Masculino 49
363 Femenino 26 763 Masculino 34 1.163 Masculino 21
364 Femenino 58 764 Masculino 23 1.164 Femenino 50
365 Masculino 65 765 Masculino 60 1.165 Masculino 50
366 Femenino 42 766 Masculino 20 1.166 Femenino 32
367 Masculino 32 767 Femenino 35 1.167 Masculino 48
368 Femenino 38 768 Masculino 41 1.168 Femenino 47
369 Masculino 18 769 Femenino 75 1.169 Femenino 56
Pgina 103 de 132
370 Femenino 24 770 Masculino 71 1.170 Masculino 54
371 Femenino 75 771 Femenino 58 1.171 Femenino 25
372 Femenino 53 772 Femenino 47 1.172 Femenino 49
373 Femenino 58 773 Masculino 38 1.173 Masculino 37
374 Femenino 67 774 Masculino 77 1.174 Femenino 21
375 Masculino 19 775 Masculino 19 1.175 Femenino 51
376 Femenino 30 776 Femenino 34 1.176 Masculino 24
377 Masculino 62 777 Femenino 54 1.177 Masculino 19
378 Masculino 39 778 Femenino 78 1.178 Femenino 38
379 Masculino 44 779 Femenino 23 1.179 Masculino 23
380 Femenino 40 780 Femenino 59 1.180 Masculino 34
381 Femenino 30 781 Masculino 24 1.181 Masculino 42
382 Masculino 56 782 Masculino 63 1.182 Masculino 52
383 Femenino 75 783 Femenino 21 1.183 Femenino 65
384 Femenino 29 784 Masculino 37 1.184 Masculino 67
385 Masculino 39 785 Masculino 69 1.185 Masculino 25
386 Femenino 32 786 Femenino 36 1.186 Femenino 48
387 Masculino 29 787 Femenino 72 1.187 Masculino 39
388 Masculino 76 788 Masculino 43 1.188 Femenino 55
389 Femenino 23 789 Femenino 62 1.189 Masculino 23
390 Masculino 49 790 Femenino 45 1.190 Masculino 67
391 Femenino 54 791 Masculino 62 1.191 Masculino 25
392 Femenino 71 792 Femenino 77 1.192 Masculino 19
393 Femenino 44 793 Femenino 40 1.193 Femenino 46
394 Masculino 23 794 Femenino 19 1.194 Masculino 43
395 Femenino 60 795 Masculino 18 1.195 Masculino 65
396 Femenino 49 796 Masculino 30 1.196 Femenino 73
397 Masculino 25 797 Femenino 28 1.197 Femenino 25
398 Femenino 27 798 Masculino 63 1.198 Femenino 27
399 Masculino 61 799 Femenino 33 1.199 Masculino 34
400 Masculino 39 800 Masculino 22 1.200 Femenino 36
Pgina 104 de 132
- Valores poblacionales de las variables: Sexo y Edad
Valores poblacionales de las variables: Sexo y Edad
Tamao de la Poblacin
N = 1200
Edad promedio
45,2042
Desviacin estndar de la edad
(X)
18,4239
Proporcin Poblacional
P (Femenino) % 51,5833
Q (Masculino) % 48,4167
Desviacin estndar del sexo
(X)
0,4997
Niveles de confianza = 1 - 2* Alfa Valores correspondiente de Z
90,0% 1,6449
95,0% 1,9600
97,5% 2,2414
99,0% 2,5758
99,5% 2,8070
Frmula para n tamao de la muestra para la
media
n = (Z* (X)/e )2 donde (X) es la
desviacin estndar de la variable en
estudio.
Frmula para n tamao de la muestra para la
proporcin
n = (Z/e)2 *P*Q, donde P y Q son las
proporciones de la variable en estudio.
Pgina 105 de 132
5.7. Clculo del tamao de muestra para las variables Sexo y Edad
Determinacin del tamao de muestra de la variable Sexo en funcin del
nivel de confianza (NC) y del error (e)
Error mximo admisible
en porcentajes
Nivel de confianza (Prob) Valores de Z
50% 25% 10% 5% 1%
90,00% 1,6449
3 11 68 270 6757
95,00% 1,9600
4 15 96 384 9594
97,50% 2,2414
5 20 125 502 12547
99,00% 2,5758
7 27 166 663 16571
99,50% 2,8070
8 31 197 787 19679
Determinacin del tamao de muestra de la variable Edad en funcin del
nivel de confianza (NC) y del error (e)
Error mximo admisible
en aos
Nivel de confianza (Prob) Valores de Z
20 10 5 2 1
90,00% 1,6449
2 9 37 230 918
95,00% 1,9600
3 13 52 326 1304
97,50% 2,2414
4 17 68 426 1705
99,00% 2,5758
6 23 90 563 2252
99,50% 2,8070
7 27 107 669 2675
Pgina 106 de 132
6. Estimacin puntual y por intervalo de los parmetros.
- Intervalos de confianza utilizando desviacin estndar
En estadstica, la probabilidad que asociamos con una estimacin de intervalo se
conoce como el nivel de confianza
Esta probabilidad nos indica que tanta confianza tenemos en que la estimacin del
intervalo incluya al parmetro de la poblacin. Una probabilidad mas alta significa
mas confianza.
El intervalo de confianza es el alcance de la estimacin que estamos haciendo pero
a menudo hacemos el intervalo de confianza en trminos de errores estndar, para
esto debemos calcular el error estndar de la media as:
Donde es el error estndar de la media para una poblacin infinita, es la desviacin
estndar de la poblacin.
Con frecuencia expresaremos los intervalos de confianza de esta forma: en la que:
= limite superior del intervalo de confianza
= limite inferior del intervalo de confianza
- Relacin entre nivel de confianza e intervalo de confianza
Podra pensarse que deberamos utilizar un alto nivel de confianza, como 99% en
todos los problemas sobre estimaciones, pero en algunos casos altos niveles de
confianza producen intervalos de confianza alto por lo tanto imprecisos.
Debe tenerse un intervalo de confianza que vaya de acuerdo al tema que se este
estimando.
- Intervalos de prediccin aproximados
una forma de ver el error estndar de la estimacin es concebirla como la
herramienta estadstica que podemos usar para hacer un enunciado de
probabilidad sobre el intervalo alrededor del valor estimado de , dentro del cual
cae el valor real de Y.
Pgina 107 de 132
Cuando la muestra es mayor de 30 datos, se calcula los intervalos de prediccin
aproximados de la siguiente manera,
Si queremos estar seguros en aproximadamente 65% de que el valor real de Y caer
dentro de + 1 error estndar de . Podemos calcular los limites superior e inferior de
este intervalo de prediccin de la siguiente manera:
= Limite superior del intervalo de prediccin
= Limite inferior del intervalo de prediccin
Si, en lugar decimos que estamos seguros en aproximadamente 95.5% de que el
dato real estar dentro de + 2 errores estndar de la estimacin de . Podramos
calcular los limites de este intervalo de la siguiente manera:
= Limite superior del intervalo de prediccin
= Limite inferior del intervalo de prediccin
y por ultimo decimos que estamos seguros en aproximadamente el 99.7% cuando
usamos + 3 errores estndar de la estimacin de Podramos calcular los limites de
este intervalo de la siguiente manera:
= Limite superior del intervalo de prediccin
= Limite inferior del intervalo de prediccin
Como ya habamos mencionado solo se usa para grandes muestras (mayores de 30
datos) para muestras ms pequeas se usan la distribucin T
Debemos poner nfasis en que los intervalos de prediccin son solo
aproximaciones, de hecho los estadsticos pueden calcular el error estndar exacto
para la prediccin Sp, usando la formula:
en la que:
X0 = valor especifico de x en el que deseamos predecir el valor de Y
Pgina 108 de 132
7. Contraste de Hiptesis.
8. Regresin simple y Correlacin.
La regresin lineal simple, es una herramienta muy importante para la
econometra, que estudia la dependencia existente entre una variable dependiente
y una o ms variables explicativas.
El inventor de dicha teora fue Francis Galton, junto con la del concepto de
correlacin
El modelo de regresin lineal simple, busca encontrar la recta de regresion Y = 0
+ 1 X + error que relacione dos variables (X e Y) de forma que el error sea
minimo
Un ejemplo de dicha regresin lineal, es la renta, ya que no podemos saber el nivel
de renta en un futuro, pero si podemos saber si el promedio de la renta aumentar
o disminuir determinando con cierta exactitud la cantidad
- Anlisis de Regresin
En el anlisis de regresin lo que se pretende es predecir o estimar el valor
promedio de la variable explicada en base a unos valores fijos de las variables
explicativas. En el anlisis de regresin, las variables explicativas son fijas y la
variable explicada es estocstica.
- Hiptesis del modelo
1. La variable Y se relaciona linealmente con la variable X
2. La variable Y es cuantitativa y aleatoria
3. Los errores son independientes entre si
- Correlacion
La correlacin es el grado de dependencia mutua entre las variables, y mide la
intensidad de su relacin.
Pgina 109 de 132
En otras palabras, el anlisis de correlacin trata de averiguar el grado o fuerza de
influencia que tienen las variables explicativas (una o ms) en la variable
dependiente o explicada.
El coeficiente de correlacin es llamado r, y su frmula es:
r = Sxy /[ Sx Sy] = (x - X )( y - Y) / Raiz* (( x - X )
2
(y - Y)
2
] =
= (xy - nXY ) / Raiz *(x
2
nX
2
) (y
2
nY
2
)] cuyo valor oscila entre 1 y -1;
X= media de la variable x e Y = media de la variable y
8.1. Principales tcnicas utilizadas en el anlisis de regresin lineal simple
- Diagrama de dispersin e interpretacin
El primer paso para determinar si existe o no una relacin entre dos variables es
observar la grafica de datos observados. Esta grafica se llama diagrama de
dispersin.
Un diagrama nos puede dar dos tipos de informacin, visualmente podemos
buscar patrones que nos indiquen que las variables estn relacionadas. Entonces si
esto sucede, podemos ver que tipo de lnea, o ecuacin de estimacin, describe esta
relacin.
Primero tomamos los datos de la tabla que deseamos analizar y dependiendo de
que se desea averiguar se construye la grafica colocando la variable dependiente
en el eje Y y la independiente en el eje X, Cuando vemos todos estos puntos juntos,
podemos visualizar la relacin que existe entre estas dos variables. Como
resultado, tambin podemos trazar, o ajustar una lnea recta a travs de nuestro
diagrama de dispersin para representar la relacin. Es comn intentar trazar estas
lneas de forma tal que un numero igual de puntos caiga a cada lado de la lnea.
Pgina 110 de 132
- Estimacin mediante la lnea de regresin
Hasta el momento las lneas de regresin se colocaron al ajustar las lneas
visualmente entre los puntos de datos, pero para graficar estas lneas de una forma
ms precisa podemos utilizar una ecuacin que relaciona las dos variables
matemticamente.
La ecuacin para una lnea recta donde la variable dependiente Y esta determinada
por la variable independiente X es: Y = A + B X + e
La A se denomina interseccin con el eje Y porque su valor es el punto en el cual la
lnea de regresin cruza el eje Y, es decir el eje vertical.
La B es la pendiente de la lnea, representa que tanto por cada cambio de unidad
de la variable independiente X cambia la variable dependiente Y. Tanto A como B
son constantes numricas, puesto que para cada recta dada, sus valores no
cambian.
Pgina 111 de 132
- Recta de regresin por el mtodo de mnimos cuadrados.
Como estamos buscando la lnea de estimacin que minimiza la suma de los
cuadrados de los errores a este mtodo lo llamamos Mtodo de los Mnimos
Cuadrados.
cmo podemos saber cuando hemos encontrado la mejor lnea de ajuste?
Los estadsticos han derivado dos formulas que podemos utilizar para encontrar la
pendiente y la interseccin Y de la lnea de regresin del mejor ajuste. Las formulas
son
A = (y / n) B (x / n)
B = *(xy / n) -(x / n) (y / n)+/ *(x
2
/ n) - (x / n)
2
]
- Verificacin de la ecuacin de estimacin
Ahora que sabemos como calcular la lnea de regresin, podemos verificar que
tanto se ajusta.
La suma de los errores individuales positivos y negativos deben dar cero.
- Error estndar de la estimacin
El error estndar nos permite deducir la confiabilidad de la ecuacin de regresin
que hemos desarrollado.
Este error se simboliza e y es similar a la desviacin estndar en cuanto a que
ambas son medidas de dispersin.
El error estndar de la estimacin mide la variabilidad, o dispersin de los valores
observados alrededor de la lnea de regresin y su formula es la siguiente:
e = Raiz *(y a b x)
2
/(n 2)] = Raiz [(y
2
ay bxy)/(n 2)]
Pgina 112 de 132
- Interpretacin del error estndar de la estimacin
Como se aplicaba en la desviacin estndar, mientras ms grande sea el error
estndar de estimacin, mayor ser la dispersin de los puntos alrededor de la
lnea de regresin. De manera inversa, si e = 0, esperemos que la ecuacin de
estimacin sea un estimador perfecto de la variable dependiente. En este caso
todos lo puntos deben caer en la lnea de regresin y no habra puntos dispersos.
Usaremos el error estndar como una herramienta de igual forma que la
desviacin estndar. Esto suponiendo que los puntos observados estn
distribuidos normalmente alrededor de la lnea de regresin, podemos encontrar
un 68% de los puntos entre +- 1 e; 95.5% entre +- 2 e y 99.7% de los puntos entre
+- 3 e. Otra cosa que debemos observar es que el error estndar de la estimacin
se mide a lo largo del eje Y, y no perpendicularmente de la lnea de regresin.
8.2. Anlisis de correlacin
El anlisis de correlacin es la herramienta estadstica que podemos usar para
describir el grado hasta el cual una variable esta linealmente relacionada con la
otra. Con frecuencia el anlisis de correlacin se utiliza junto con el anlisis de
regresin para medir que tan bien la lnea de regresin explica los cambio de la
variable dependiente Y. Sin embargo, la correlacin tambin se puede usar sola
para medir el grado de asociacin entre dos variables.
Los estadsticos han desarrollado dos medidas para describir la correlacin entre
dos variables: el coeficiente de determinacin y el coeficiente de correlacin.
- Coeficiente de determinacin
El coeficiente de determinacin es la principal forma en que podemos medir la
extensin, o fuerza de asociacin que existe entre dos variables, X y Y. Puesto que
hemos desarrollado una muestra de puntos para desarrollar las lneas de regresin,
nos referimos a esta medida como el coeficiente de determinacin de la muestra.
El coeficiente de determinacin de la muestra se desarrolla de la relacin entre dos
tipos de variacin: la variacin de los valores Y en conjunto de los datos alrededor
de
Pgina 113 de 132
la lnea de regresin ajustada
su propia media
el termino variacin en estos dos casos se refiere a la suma de un grupo de
desviaciones cuadradas. Al usar esta definicin, entonces es razonable expresar la
variacin de los valores Y alrededor de la lnea de regresin con esta ecuacin:
variacin de los valores Y alrededor de la lnea de regresin = ( y Yr)
2
la segunda variacin, la de los valores de Y con respecto a su propia media, esta
determinada por
variacin de los valores de Y alrededor de su propia media = ( y Y)
2
uno menos la razn entre estas dos variaciones es el coeficiente de determinacin
de la muestra que se simboliza r2 = ( Yr -Y)
2
/ ( y Y)
2
esta ecuacin es una medida del grado de asociacin lineal entre X y Y
Una correlacin perfecta es aquella en que todos los valores de Y caen en la lnea
de estimacin , por lo tanto el coeficiente de determinacin es 1
Cuando el valor del coeficiente de determinacin es 0 quiere decir que no hay
correlacin entre las dos variables
En los problemas con que se topa la mayora de los responsables de la toma de
decisiones, r2 caer en alguna parte entre estos dos extremos de 1 y 0. recuerde, no
obstante que un r2 cercano a 1 indica una fuerte correlacin entre X y Y, mientras
que un r2 cercano a 0 significa que existe poca correlacin entre estas dos variables.
Un punto que debemos subrayar fuertemente es que r2 mide solo la fuerza de una
relacin lineal entre dos variables.
Otra interpretacin de r2
Los estadsticos tambin interpretan el coeficiente de determinacin viendo la
cantidad de variacin en Y que es explicada por la lnea de regresin.
Pgina 114 de 132
Mtodo de atajo para calcular el coeficiente de determinacin (r2)
Hay una formula que nos ahorra muchos clculos tediosos y esta es:
en la que:
r2= coeficiente de determinacin de la muestra
a = interseccin en Y
b = pendiente de la lnea de estimacin de mejor ajuste
n = numero de puntos de datos
X = valores de la variable independiente
Y = valores de la variable dependiente
= media de los valores observados de la variable dependiente
- Coeficiente de correlacin
El coeficiente de correlacin es la segunda medida que podemos usar para
describir que tambin una variable es explicada por la otra. Cuando tratamos con
muestras, el coeficiente de variacin de muestra se denomina como r y es la raz
cuadrada del coeficiente de determinacin de la muestra:
cuando la pendiente de estimacin de la muestra es positiva, r es la raz cuadrada
positiva, pero si b es negativa, r es la raiz cuadrada negativa. Por lo tanto, el signo
de indica la direccin de la relacin entre las dos variables X y Y. Si existe una
relacin inversa, esto es , si y disminuye
Ejercicio de regresin lineal simple
Un corredor de bienes races estudio la relacin entre X= ingreso anual en miles de Bs.F
de los compradores de viviendas e Y= precio de ventas de las viviendas en miles de Bs.F
Se obtuvieron los datos de las solicitudes hipotecarias correspondientes a 24 ventas en una
temporada en el rea de inters del corredor.
Pgina 115 de 132
X=Ingreso 25.0 28.5 29.2 30.0 31.0 31.5 31.9 40.9
Y=precio 84.9 94.0 96.5 93.5 102.9 99.5 101.0 120.8
X=Ingreso 33.5 34.0 35.9 36.0 39.0 39.0 40.5 33.0
Y=precio 110.0 100.0 116.0 110.0 125.0 119.9 130.6 99.9
X=Ingreso 44.0 45.0 50.5 54.6 65.0 70.0 32.0 42.5
Y=precio 135.5 140.0 150.7 170.0 110.0 185.0 105.0 129.9
X =
Ingresos
Y =
Precios
Precios
Proyectados
25 84,9 92,22
28,5 94 98,53
29,2 96,5 99,79
30 93,5 101,23
31 102,9 103,03
31,5 99,5 103,93
31,9 101 104,65
40,9 120,8 120,88
33,5 110 107,54
34 100 108,44
35,9 116 111,87
36 110 112,05
39 125 117,45
39 119,9 117,45
Pgina 116 de 132
40,5 130,6 120,16
33 99,9 106,64
44 135,5 126,47
45 140 128,27
50,5 150,7 138,18
54,6 170 145,57
65 110 164,32
70 185 173,34
32 105 104,83
42,5 129,9 123,76
Pgina 117 de 132
Coeficiente
de
Regresin
A
47,15
Coeficiente
de
Regresin
B
1,80
Coeficiente
de
Correlacin
R
0,8201
Pgina 118 de 132
9. Series Cronolgicas o Series de Tiempo.
Una serie cronolgica, est formada por un conjunto de observaciones de una
variable, ordenadas en funcin del tiempo.
Su mbito de aplicacin, no est limitado a la esfera estrictamente econmica. Su
metodologa puede utilizarse en la medicina (electrocardiograma,
electroencefalograma, etc.), agricultura (evolucin de las lluvias en las diferentes
estaciones), psicologa (evolucin del coeficiente intelectual de una persona) y en
muchas otras disciplinas.
El propsito perseguido con el anlisis de series, consiste en predecir los valores
futuros de la variable estudiada.
Para ello, las observaciones son descompuestas en un conjunto de elementos
(componentes), que permitan descubrir las regularidades que presentan.
El anlisis de series cronolgicas, se realiza a travs de dos modelos bsicos.
A) Modelo Aditivo Yt = Tt + St + Ct + Et
B) Modelo Multiplicativo Yt = Tt * St * Ct * Et
Yt - Variable estudiada
Tt - Tendencia
St - Variaciones estacionales
Ct - Fluctuaciones cclicas
Et Sucesos aleatorios o irregulares
La eleccin del modelo a utilizar, estar dada por el que mejor se ajuste a los datos,
de cada problema en particular.
En el modelo aditivo todos los componentes son valores reales, mientras que en el
multiplicativo, la tendencia es real, pero los restantes componentes se expresan
como un porcentaje de ella.
Pgina 119 de 132
9.1. Componentes de una serie cronolgica
- Tendencia ( Tt)
El componente de tendencia de una serie representa movimientos lentos y
graduales del conjunto de datos. Su desplazamiento es uniforme, y se identifica
con los cambios permanentes y fundamentales, como los crecimientos de la
poblacin, los cambios en el salario real de una comunidad, etc.
Si analizamos el consumo de un producto alimenticio, en condiciones normales, es
razonable suponer que un aumento en la poblacin, traer como consecuencia un
mayor consumo del mismo.
Este aumento no se percibe en perodos cortos de tiempo, pues como veremos,
existen otros factores que distorsionan las observaciones, pero s se advierte en el
largo plazo.
En el grfico se aprecia una tendencia creciente, a pesar de que las observaciones
fluctan a lo largo del tiempo, por la influencia de los otros componentes.
0
5
10
15
20
25
30
35
40
45
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Pgina 120 de 132
- Estacionalidad o variacionales estacionales (St)
Las variaciones estacionales representan los movimientos oscilatorios,
dentro de un plazo relativamente corto (un ao o menos). En el perodo escogido,
presentan una considerable dosis de regularidad.
Si analizamos la evolucin de las ventas de una heladera, encontraremos
picos bastantes acentuados, en los meses de verano. La estacin, est
condicionando la distribucin de las ventas anuales, y ese cuadro se repetir en los
aos sucesivos.
El concepto de estacionalidad, se utiliza tambin para explicar variaciones
que no se corresponden con el concepto de estacin.
Las mayores ventas de un supermercado los das sbado, tambin se consideran
fluctuaciones estacionales, por ser una configuracin repetida a intervalos
regulares, del mismo fenmeno.
- Ciclos o fluctuaciones cclicas (Ct)
Las fluctuaciones cclicas, se identifican con los movimientos oscilatorios
alrededor de la tendencia, que no se encuentran ceidos a perodos regulares, pero
que siempre son de largo plazo. Aunque son fenmenos diferentes, podemos
asociar (al solo efecto de su compresin) estas fluctuaciones, al concepto de ciclo
econmico.
Ellos se caracterizan por una primera etapa de crecimiento acelerado, a
mayor ritmo que la tendencia.
Esta faz expansiva del ciclo, hace que los valores aumenten por encima del
valor de tendencia, hasta llegar al momento del boom en el cual la situacin se
revierte.
Los valores comienzan a caer vertiginosamente en esta faz depresiva, hasta
que un nuevo impulso vuelva a estabilizar la situacin, y pueda dar lugar al
surgimiento de un nuevo ciclo.
La construccin de viviendas en el Uruguay, ha estado caracterizada por
fluctuaciones de este tipo.
Pgina 121 de 132
- Erraticidad o sucesos aleatorios o irregulares (Et)
Los sucesos aleatorios o irregulares, reflejan el componente de la serie que vara en
forma totalmente espordica.
Sus variaciones son generalmente ocasionadas por factores accidentales
(huelgas, terremotos, inundaciones).
Si estudiamos las ventas de una empresa, cuya fbrica se incendi y
permaneci seis meses inactiva, es lgico encontrar una cada brusca durante ese
perodo.
Este componente representa un residuo, que no puede ser explicado por
las variaciones de tendencia, estacionalidad y ciclo.
Sus movimientos suelen suavizarse mediante la utilizacin de promedios,
que distribuyen sus efectos a lo largo del tiempo.
9.2. Tendencia.
Cuando se desea conocer la evolucin de una variable en el largo plazo, el estudio
de la tendencia se convierte en un factor relevante.
La orientacin de la demanda en el largo plazo, es un aspecto de vital importancia
para muchas empresas. Una demanda creciente, puede indicar la ampliacin de las
instalaciones, adquirir maquinaria y equipos ms productivos, o requerir fondos
que financien su desarrollo.
Una demanda decreciente en cambio, puede sugerir otro tipo de cambios, como
reducir los gastos fijos, reconsiderar la poltica de publicidad, o lanzar nuevos
productos al mercado.
Para obtener la tendencia es necesario proceder a su aislamiento. Esto se realiza en
funcin de los siguientes objetivos bsicos:
1. Para proyectar los valores futuros de la variable.
Pgina 122 de 132
2. Para eliminar la tendencia calculada para la serie, y estudiar el
comportamiento de los restantes componentes.
La ecuacin de la tendencia puede ser lineal o curvilnea (parbola, exponencial).
Nuestro enfoque ser lineal por la gran aplicabilidad que posee y la simplicidad
de los clculos.
La estimacin de la tendencia puede hacerse mediante diversos mtodos, nosotros
utilizaremos el mtodo de los mnimos cuadrados.
- Mtodo de los mnimos cuadrados
Este mtodo es el ms utilizado para la obtencin de la tendencia y ya fue
definido al hablar de regresin.
En este caso consideraremos a la variable X (tiempo) como independiente e Y
(valores observados) como dependiente, y las llamamos t y Yt
respectivamente.
Suponemos que el sistema causal que influye en la serie, es una funcin del
tiempo.
Los coeficientes de la recta, definidos al hablar de recta de regresin son:
A = (y / n) B (x / n)
B = *(xy / n) -(x / n) (y / n)+/ *(x
2
/ n) - (x / n)
2
]
Pgina 123 de 132
Ejemplo.
Ao t Yt t.Yt t
2
1998 1 10 10 1
1999 2 12 24 4
2000 3 11 33 9
2001 4 13 52 16
2002 5 14 70 25
2003 6 16 96 36
2004 7 12 84 49
2005 8 15 120 64
2006 9 14 126 81
45 117 615 285
B = [( 615/ 9) -(45 / 9) (117 / 9)]/ [(285 / 9) - (45 / 9)
2
] = 0,50
A = (117 / 9) 0,50 (45 / 9) = 10,50
Yt = A + B Xt = 10,50 + 0,50 Xt
La primera columna y la tercera corresponden a informacin obtenida, o
sea los datos en el tiempo. Las restantes columnas son de clculo para hallar los
coeficientes de la recta.
Con la recta obtenida pueden proyectarse los valores de tendencia para los
aos siguientes.
Pgina 124 de 132
Si quisiramos conocer el valor para 2009 bastara identificar el nmero que
le corresponde a ese ao el cual es 12 y sustituirlo en la recta
Yt = 10,50 + 0,50 x 12 = 16,50
9.3. Variaciones estacionales
Las variaciones estacionales de una serie cronolgica, son aquellas
fluctuaciones que se repiten regularmente dentro del ao.
El aislamiento del componente estacional, se funda en los siguientes
objetivos:
a.- Para identificar los valores estacionales, que complementan la estimacin
de valores futuros a travs de la tendencia.
b.- Para estudiar el componente cclico de la serie desestacionalizada.
Por ejemplo, si los productos que comercializa una empresa, tienen una
demanda estacional, el ritmo de produccin de los mismos, deber adaptarse
lgicamente a estos factores.
Si esa empresa se dedica a la fabricacin y venta de equipos de calefaccin y
aire acondicionado, no puede pasar por alto los factores estacionales opuestos que
tienen sus productos.
El proceso productivo se disear, para tener los calefactores en stock antes
de comenzar el invierno, y los equipos de fro antes del verano, procurando que los
stocks de los mismos sean mnimos fuera de la temporada.
En las siguientes lneas, veremos los mtodos ms usuales para aislar el
componente estacional.
- Mtodo de diferencia a la tendencia
Este procedimiento consiste en restar la tendencia de la informacin
Pgina 125 de 132
original, para eliminar posteriormente las variaciones cclicas e irregulares a travs
de la promediacin.
t t t t t
E C S T Y + + + =
; luego
t t t t t
E C S T Y + + =
Al promediar los elementos del segundo miembro, se suavizan los
factores cclicos y accidentales, quedando aislada la funcin estacional.
Ejemplo:
2004 2005 2006
1
er
cuatrim. 16 19 24
2
do
cuatrim. 19 26 34
3
er
cuatrim. 24 31 41
Yt = A + B Xt = 12,917 + 2,617 Xt
Los valores de tendencia para cada uno de los cuatrimestres son los que
aparecen en el siguiente cuadro.
2004 2005 2006
1
er
cuatrim. 15.533 23.383 31.233
2
do
cuatrim. 18.150 26.000 33.850
3
er
cuatrim. 20.767 28.617 36.467
Pgina 126 de 132
Si restamos los valores de tendencia hallados, de los valores observados del
cuadro anterior, se obtiene un nuevo cuadro con las diferencias, que luego se
promedian para calcular el componente estacional.
La funcin de estacionalidad (St) es la que aparece en la ltima columna. Si
por efecto del redondeo de cifras, su suma no fuera nula, los valores deberan
ajustarse, sumando o restando una constante adecuada.
Si quisiramos proyectar los valores de la serie para 2007 en base a tendencia y
estacionalidad, haramos lo siguiente:
1
er
cuatr./07=
5