Академический Документы
Профессиональный Документы
Культура Документы
ESTADISTICA ESTADISTICA
BASICA
INTEGRANTES : *
ARZATE SALGADO JOSE IVAN
* MIGUEL HERRERA ENRIQUE *
SALAS CURIEL JESSICA *
SAN VICENTE FERNANDEZ ALEJANDRA *
VALDEZ MANZO SARAI MIROSLAVA
CUADERNILLO DE ESTADISTICA
2 Distribuciones muéstrales.
2.1 Introducción.
2.2 Distribución muestral de
la media con varianza
conocida.
2.3 Teorema del límite
central.
2.4 Distribución muestral de
la proporción.
2.5 Distribución muestral de
la diferencia de medias y de
diferencia de proporciones.
2.6 Distribución muestral de
la media con varianza
desconocida.
2.7 Distribución muestral de
la diferencia de medias.
2.8 Distribución muestral de
la varianza.
2.9 Distribución muestral de
la razón de varianzas.
2.10 Aplicación en el caso
específico.
3 Teoría de la estimación.
3.1 Introducción.
3.2 Estimación y propiedades
de los estimadores.
3.3 Estimación por intervalo.
3.4 Intervalo de confianza
para la media con varianza
conocida y desconocida.
3.5 Intervalo de confianza
CUADERNILLO DE ESTADISTICA
4 Pruebas de hipótesis.
4.1 Conceptos de la teoría
de prueba de hipótesis.
4.2 Errores tipo I y II.
4.3 Prueba de hipótesis para
una media con varianza
conocida y desconocida.
4.4 Prueba de hipótesis para
una proporción y diferencia
de proporciones.
4.5 Prueba de hipótesis para
diferencia de medias con
varianzas conocidas y
desconocidas.
4.6 Prueba de hipótesis para
una varianza
4.7 Prueba de hipótesis para
una razón de varianzas.
4.8 Prueba de bondad de
ajuste.
4.9 Aplicación en el caso
específico.
ESTADISTICA:
La estadística es la ciencia cuyo objetivo es reunir información cuantitativa
relacionada a individuos, grupos, series de hechos, entre otros. Gracias al análisis
de estos datos se pueden deducir algunos significados precisos o algunas
previsiones para el futuro. La estadística, en general, es la ciencia que trata la
recopilación, la organización, la presentación, el análisis y la interpretación de
datos numéricos con el fin de realizar una toma de decisiones más efectiva.
CUADERNILLO DE ESTADISTICA
Importancia
La estadística resulta muy útil no sólo para recopilar y describir datos, sino
también para interpretar la información obtenida, que puede ser aprovechada para
demostrar la evolución de un fenómeno a través de cierto tiempo.
División de la Estadística
Conceptos básicos:
CUADERNILLO DE ESTADISTICA
Nominal: son variables presentadas sin orden ni jerarquía. Ej. Estado civil,
preferencia por una marca, sexo, lugar de residencia.
Ordinal: son variables organizadas de acuerdo con una clasificación. Ej.
grado de estudios, días de la semana, calidad de la atención, nivel
socioeconómico.
B) Elaboración de un modelo.
Se establece un modelo teórico de comportamiento de las variables de estudio. En
ocasiones no es posible diseñar el modelo hasta realizar un estudio previo.
Los posibles modelos son Normal, Binomial, Poisson, Uniforme, etc.
C) Extracción de la muestra.
Se usa alguna técnica de muestreo o un diseño experimental para obtener
información de una pequeña parte de la población.
EJERCICIO:
RANGO:
5 8 8 11 11 11 14 16 = 5-16 =11
MODA: 11
CUADERNILLO DE ESTADISTICA
MEDIANA:
11+11=22/2=11
MEDIA ARITMETICA:
n
2 xi 5+8+ 8+11+11+ 11+14+16 84
μ =∑ ¿ =¿ = =¿ ¿10.5
i =1 n 8 8
VARIANZA:
n
σ 2=∑ ¿ ¿ ¿ ¿
i−1
+¿ ¿10.75
DESVIACION ESTANDAR:
“DATOS AGRUPADOS”
Es agrupar la información con la que se cuenta, e ir clasificando por características
que nos faciliten manejar y tener el control de los datos.
En los datos agrupados se pueden calcular, su media y varianza, pero sería útil
proporcionar además una idea visual de la información que contienen los datos.
Una ordenación de datos es una de las formas más sencillas de presentarlos:
Organiza los valores en orden ascendente o descendente.
La ordenación de datos ofrece varias ventajas con respecto a los datos sin
procesar.
• Podemos identificar los valores mayor y menor rápidamente.
EJEMPLOS
CUADERNILLO DE ESTADISTICA
n
fimi 1662
x́=∑ ¿ = =20.770
i=1 ∑ fi 80
n
2 fi m2 36306.02
s =∑ −x́ 2= −¿ ¿
i =1 n 80
s= √ s2 =√ 22.43=4.73
EJERCICIO #2
A) Encuentre la media aritmética
B) DETERMINE LA VARIANZA
C) Encuentre la desviación estándar
Clases ventas f M fM F M2
dólares
10-20 1 15 15 225
20-30 8 25 200 5,000
30-40 10 35 350 12,250
40-50 9 45 405 18,225
50-60 8 55 440 24,200
60-70 4 65 260 16,900
70-80 2 75 150 11,250
total 42 1,820 88,050
CUADERNILLO DE ESTADISTICA
1820
x=̅ 42 =43.3
88,050
42
– ( 43.3) = 2,096.42-1,874.89
2
S2=221.53
S= √ 221.53
S=14.88
UNIDAD II
DISTRIBUCIONES MUESTRALES
EJERCICIO #3
DISTRIBUCIONES MUESTRALES
UNA POBLACION NORMAL TIENE MEDIA=80 Y DESVIACION ESTANDAR=14
90−80
A) M=80 Z= 14 =0.7142=0.2611
σ =14
P (75<X<90)
75−80
P (90<X<80) Z= 14
=0.3571=0.1368
0.2611+0.168 R= 39.79%
CUADERNILLO DE ESTADISTICA
C) M=80
σ =14
70−80
P (55<X<70) Z= 14
=0.7142 =.2611
.2611-.1368= .1243
R= 12.43%
CUADERNILLO DE ESTADISTICA
EJERCICIO #4
A) Se mayor que 63
B) Menor que 56
C) Este entre 56 y 63
A) x=̅ 60 P (x ̅>63)
63−20
3
σ =56 Z= 12 = 4 =.75 R=.75
√9
.5 + 2734 = .7734 1 - .7734 = 0.2266
22.66%
CUADERNILLO DE ESTADISTICA
C) P(56<X<63)
0.3938+.2734=0.3132
0.3132X100= R=31.32%
CUADERNILLO DE ESTADISTICA
Sea X1, X2,…, Xn una muestra aleatoria tomada de una población con una
distribución de Bernoulli con parámetro q. Por lo tanto su función de probabilidad,
su media y su varianza están dadas por:
E(X) = q, V(X) = q (1 - q)
En virtud del Teorema Central del Límite, como P es la media muestral de los
diferentes valores de Xi, entonces P tiende a seguir una distribución normal con
los parámetros dados anteriormente, es decir, P ~. Ó también la variable aleatoria
Sigue una distribución normal estándar con media cero y varianza unitaria, cuando
el tamaño de la muestra n es grande.
CUADERNILLO DE ESTADISTICA
EJEMPLO
ρ́− p
ρ́−ρ
ρ =.80 formula Z= σ ρ́ =¿ Z = ρq =
√ n
ρ́ =.775
1550
n=2000 P(A)
2000
=.775
q=.225
.775−.80
Z= ( .775 ) (.225) = -2.67
√ 2000
CUADERNILLO DE ESTADISTICA
Para conocer la distribución muestral de las diferencias entre las medias se debe
saber si las varianzas poblacionales son conocidas o desconocidas, y en caso de
que sean desconocidas, se debe saber si son iguales o diferentes. Cada uno de
estos tres casos se analizará por separado.
Por lo tanto, con base en la expresión anterior se pueden realizar inferencias con
respecto a la diferencia de medias poblacionales, bajo el supuesto de que las
varianzas sean conocidas. Si además, son iguales, la expresión anterior se puede
expresar como:
CUADERNILLO DE ESTADISTICA
Cuando las varianzas son desconocidas, se debe realizar previamente una prueba
estadística para verificar si éstas son iguales o diferentes. Para realizar esta
prueba debemos hacer uso de la distribución F para verificar si la relación de
varianzas es igual a uno o diferente de uno.
Para cada una de las dos muestras se definen sus respectivas varianzas como:
Además tienen distribuciones chi cuadrado con n1–1 y n2–1 grados de libertad
respectivamente. Por lo tanto su suma también sigue otra distribución chi
cuadrado con n1+n2–2 grados de libertad. Es decir:
Ahora bien, si Z es una variable normal (0,1) y Y tiene una distribución chi
cuadrado con n grados de libertad, entonces la variable tiene una distribución t con
n grados de libertad. Para nuestro caso la variable Z corresponde a la distribución
de la diferencia de las dos medias, con varianzas conocidas, y la variable chi
cuadrado corresponde a la variable Y acabada de definir. Por lo tanto
EJEMPLO:
De una población se toma una muestra de 40 observaciones. La media muestral
es de 102 y la desviación estándar de 5. De otra población se toma una muestra
de 50 observaciones y la media muestral es ahora 99 y la desviación estándar es
6. Calcule el valor estadístico de la prueba.
Supongo que las medias poblacionales son iguales a las varianzas.
x͞ 1= 102 Z=¿ ¿ ¿ x͞ 2= 99
S1=5
(102−99)(0) 3
Z= = =2.54
1.18 1.18
CUADERNILLO DE ESTADISTICA
S2=6
2
S2 S2 31.13 31.13
σ x1 x 2
√ +
n1 n 2
=
√ 40
+
50
=√ 0.77+0.62= √1.3926=1.18
.5+.4945=0.9945
.1-0.9945=.0055
CUADERNILLO DE ESTADISTICA
DISTRIBUCION DE PROBABILIIDAD
T DE STUDENT
DISTRIBUCION DE PROBABILIDAD:
Con respecto a una variable aleatoria es una función que asigna a cada suceso
definido sobre la variable aleatoria la probabilidad de que dicho suceso ocurra. La
distribución de probabilidad está definida sobre el conjunto de todos los eventos
rango de valores de la variable aleatoria.
Cuando la variable aleatoria toma valores en el conjunto de los números reales, la
distribución de probabilidad está completamente especificada por la función de
distribución, cuyo valor en cada real x es la probabilidad de que la variable
aleatoria sea menor o igual que x.
T DE STUDENT:
Permite decidir si dos variables aleatorias normales y con la misma varianza
tienen medias diferentes. Dada la ubicuidad de la distribución normal puede
aplicarse en numerosos contextos, para comprobar si la modificación en las
condiciones de un proceso (humano o natural) esencialmente aleatorio producen
una elevación o disminución de la media poblacional. Esto opera decidiendo si una
diferencia en la media muestral entre dos muestras es estadísticamente
significativa, y entonces poder afirmar que las dos muestras corresponden a
distribuciones de probabilidad de media poblacional distinta, o por el contrario
afirmar que la diferencia de medias puede deberse a oscilaciones estadísticas.
La eficacia aumenta con el número de datos del que constan las dos muestras, en
concreto del número de grados de libertad conjunto de las dos muestras, este
número viene siendo Ni el tamaño muestral, es decir, el número de datos en cada
muestral.
CUADERNILLO DE ESTADISTICA
1.- Suponga que los datos siguientes se seleccionan al azar de una población de
valores normalmente distribuidos y realicen un intervalo de confianza del 95%para
calcular la media poblacional.
40,51,43,48,44,57,54,39,42,48,45,39 y 43
n
X i 40+51+ 43+48+ 44+57 +54+39+ 42+48+ 45+39+ 43 593
χ́ =∑ = = = 45.61
i=1 n 13 13
n
( x −xi )
s2=∑ =¿ ¿
i=1 n−1
+¿ ¿
+¿ ¿
s= √ s2 =√ 32.42=5.69
∝=1−.95 %=0.05÷ 2=0.025
gl=n−1=13−1=12
5.69
S x= =1.57
√ 13
I ∝=x ±t S x
I ∝=45.61+ ( 2.179 ) (1.57 )=¿
45.61+3.42=49.03Límite superior
45.61−3.42=42.12Límite inferior
(42.12, 49.03)
CUADERNILLO DE ESTADISTICA
CUADERNILLO DE ESTADISTICA
EJERCICIO#2
Si se supone que X esta normalmente distribuida utiliza la siguiente información
para calcular un intervalo de confianza de 90% para estimar la media poblacional.
n
Xi
χ́ =∑ 313, 320, 319, 340, 325, 310, 321, 329, 317, 311, 307, 318.
i=1 n
313 ,320 , 319 ,340 , 325 , 310 ,321 , 329 ,317 ,311 , 307 , 318.
= 319.16
12
n
2= ∑ ¿¿¿
S i=1
¿
¿¿
¿
911.6672
= 11 = 82.87 √ 82.87 = 9.10
x́ =319.16
σ 2=82.87
σ =9.10
gl= n-1
gl= 12-1=11
∝ 1-.90%= 0.2/2= 0.05
9.10
IC=319.16+ (1.796) (2.6269) S x́ = =2.6269
√ 12
319.16 + 4.7179= 323.8779 Límite Superior
319.16 – 4.7179= 314.4421 Límite Inferior
(314.4, 323.8)
CUADERNILLO DE ESTADISTICA
EJERCICIO #3
Use información en base a cada una de las siguientes muestras para calcular el
intervalo de confianza para estimar la proporción de la población.
A)n= 44 y p= .51 calcule en IC 99%
B)n= 300 y p= .82 calcule un IC 95%
C)n= 1150 y p= .48 calcule un IC 90%
D)n= 95 y p= .32 calcule un IC 88%
A)n=44
p=.51
σρ=x=
√( .51 ) (.49) =0.075
44
IC= p ± zσx
IC=.51± (2.57) (.075)
=.51+0.19=0.7
=.51-0.19=.32
B)n=300
p=.82
σp=√ ( .82 ) ¿ ¿ ¿
IC=.82± (1.96) (.022)
=.82+0.043=0.863
CUADERNILLO DE ESTADISTICA
=.82-0.043=0.777
C)n=1150
p=.48
σp=
√( .48 ) (.52) =0.014
1150
IC=.48± (1.65) (0.014)
=.48+0.023=.50
=.48-0.023=.45
D)n=95
p=.32
σp=
√( .32 ) (.68) =0.047
95
IC=.32± (1.56) (0.047)
=.32+.073=0.39
=.32-.073=0.24
INTERVALO DE CONFIANZA:
n=212P̅ =.16
34
P( A) =.16
212
P = IC =P̅ ± Zσ P̅
√ pq √( .16 ) (.84)
IC= .16 ± (1.65) (0.25)σ P̅ = n σ P̅ ¿ 212 =.025
PROBLEMAS
Usen la información sobre cada una de las siguientes muestras para calcular el
intervalo de confianza para estimar la proporción de la población.
a) n=44 ṕ=.51 ; Calcule un Intervalo de Confianza del 99%
n= 44 p= IC∝ = ṕ ±Z√ ṕ
ṕ=.51 IC= .51± (2.57) (0.075)
IC= .51+ 0.19= 0.7 Limite Superior
IC= .51- 0.19= 0.32 Límite Inferior
(.32, .7)
√ pq .51(.49)
σ ṕ=
n √
= 44
= 0.075
CUADERNILLO DE ESTADISTICA
P̅ =.48 σ P̅ = √
pq
σ P̅ =
√( .48 )( .52) =.014
n 1150
P̅ =.32
.32 ± (1.56) (.047)
(.247, .393)
CUADERNILLO DE ESTADISTICA
EJERCICIOS
¿¿¿
¿
CUADERNILLO DE ESTADISTICA
σ 2= .191
σ = .4370
(11.7, 12.2)
∝= 1-.95%= 0.05/2= 0.025
.4370
IC= 12.03+ (2.262) (0.1381) S x́ = =0.1381
√10
12.03+0.3123= 12.3423 Límite Superior
CUADERNILLO DE ESTADISTICA
P = IC =P̅ ± Zσ P̅
σ P̅ = √
pq
σ P̅ ¿
√( .71 ) (.29)
IC= .71±(1.65) (0.026) n 284
=0.026
.71+ 0.0429= 0.7529 .71- 0.0429= 0.6671
(0.66, 0.75)
b) n= 1,250
ṕ= .48
P = IC =P̅ ± Zσ P̅
CUADERNILLO DE ESTADISTICA
σ P̅ = √
pq √( .48 )(.52)
n P̅
IC= .48±(1.96) (0.014) σ ¿
1,250
=0.014
.48+ 0.0274= 0.5074
.48- 0.0274= 0.4526
(0.45, 0.50)
PRUEBA DE HIPOSTESIS
La hipótesis nula La
es verdadera hipótesis
nula es
falsa
en tal grupo", o que los planetas poseen algún tipo de atmósfera, sin especificar
de qué elementos está compuesto.
Los trabajos de índole descriptiva generalmente presentan hipótesis del tipo
"todos los X poseen, en alguna medida, las característica Y". Por ejemplo,
podemos decir que todas las naciones poseen algún comercio internacional, y
dedicarnos a describir, cuantificando, las relaciones comerciales entre ellas.
También podemos hacer afirmaciones del tipo "X pertenece al tipo Y", como
cuando decimos que una tecnología es capital - intensiva. En estos casos,
describimos, clasificándolo, el objeto de nuestro interés, incluyéndolo en un tipo
ideal complejo de orden superior.
Por último, podemos construir hipótesis del tipo "X produce (o afecta) a Y", donde
estaremos en presencia de una relación entre variables.
Errores de tipo I y de tipo II.
Si rechazamos una hipótesis cuando debiera ser aceptada, diremos que se ha
cometido un error de tipo I.
Por otra parte, si aceptamos una hipótesis que debiera ser rechazada, diremos
que se cometió un error de tipo II.
En ambos casos, se ha producido un juicio erróneo.
Para que las reglas de decisión (o no contraste de hipótesis) sean buenos, deben
diseñarse de modo que minimicen los errores de la decisión; y no es una cuestión
sencilla, porque para cualquier tamaño de la muestra, un intento de disminuir un
tipo de error suele ir acompañado de un crecimiento del otro tipo. En la práctica,
un tipo de error puede ser más grave que el otro, y debe alcanzarse un
compromiso que disminuya el error más grave.
La única forma de disminuir ambos a la vez es aumentar el tamaño de la muestra
que no siempre es posible.
EJERCICIO 1
Un desarrollador considera 2 ubicaciones alternadas para un centro comercial
regional dado que el ingreso domestico de la comunidad es una consideración
importante en la selección del sitio, el desarrollador desea probar la hipótesis nula
de que no existe diferencia entre los montos de ingreso domestico medio que de
las 2 comunidades. En consonancia con esta hipótesis se supone que la
desviación estándar del ingreso domestico también es igual en los dos
comunidades.
En una muestra de n1=30 hogares de la primera comunidad el ingreso anual
promedio es de x̅ 1=45,000 con una desviación estándar S1= 1800. En una muestra
de n2 =40 hogares de la segunda comunidad x̅ 2=44,600 y S2=2,400. Pruebe la
hipótesis nula el nivel de significancia del 5%.
CUADERNILLO DE ESTADISTICA
2 ( n1 −1 ) S 21+(n2−1) S 22
S=
n1 +n2 −2
( 30−1 ) 1,8002 + ( 40−1 ) 2,4002 318,600,000
S2 = = 4, 685,294
30+ 40−2 68
2
S2 S2
σ x1 x 2
√ +
n1 n 2
4,685,294 4,685,294
= √ 30
+
40
=√ 156,176−117,132.35=522.78
EJERCICIO 2
.1285 .1285
√ 12
+
10
=.1534
EJERCICIO 4
Una empresa desea saber cómo está el ausentismo en sus trabajadores. A
continuación se da el número de días de ausencia durante una quincena en una
muestra de diez trabajadores 4, 1, 2, 2, 1, 2, 2, 1, 0 y 3.
A) Determine la media y la desviación estándar de la muestra
B) Cuál es la media poblacional y cuál es la mejor estimación de ese valor
C) Proporcione un intervalo de confianza de 95% para la media poblacional
D) Explique por qué se usa la distribución “t” como punto del intervalo de
confianza
E) Es razonable concluir que el trabajador promedio no falto ningún día
durante la quincena
n
X i 4+ 1+ 2+ 2+ 1+ 2+ 2+ 1+ 0+3 18
χ́ =∑ = = = 1.8
i+1 n 10 10
n
2
( x −xi )
s =∑ =¿ ¿
i=1 n−1
11.6
= 9 =1.288
t =2.262
s 1.134
S x= = =.358
√n √ 10
I ∝=x ±t S x
I ∝=1.8+ ( 2.262 )( .358 )=¿
1.8+.809=2.609
1.8−.809=.991
(.991, 2.609)