Вы находитесь на странице: 1из 22

INSTITUTO TECNOLÓGICO SUPERIOR DE

URUAPAN

LICENCIATURA EN
INGENIERÍA INDUSTRIAL

“Estadística Inferencial 1”

-Investigación Unidad 1-
(Distribuciones Fundamentales para el Muestreo)

P R E S E N T A

Amezcua Calderón Everardo Fernando


Colín Cruz Brenda
Pérez Alejandre Steven

DOCENTE:
ING. GILBERTO CHÁVEZ ESQUIVEL

URUAPAN, MICH. Septiembre 2017


Contenido
INTRODUCCIÓN ............................................................................................................................... 3
DISTRIBUCIONES FUNDAMENTALES PARA EL MUESTREO ............................................................. 4
1.1 DISTRIBUCIÓN MUESTRAL DE LA MEDIA .................................................................................. 4
EJEMPLOS ................................................................................................................................ 5
1.2 DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE MEDIASÓN MUESTRAL DE LA DIFERENCIA
DE MEDIAS ...................................................................................................................................... 6
EJEMPLOS ................................................................................................................................ 7
1.3 DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN ....................................................................... 8
EJEMPLOS ................................................................................................................................ 9
1.4 DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE PROPORCIONES........................................ 11
EJEMPLOS:............................................................................................................................. 12
1.5 DISTRIBUCIÓN T- STUDENT ..................................................................................................... 13
EJEMPLOS .............................................................................................................................. 14
1.6 DISTRIBUCIÓN MUESTRAL DE LA VARIANZA .......................................................................... 14
Propiedades de las distribuciones ji-cuadrada ......................................................................... 15
EJEMPLOS .............................................................................................................................. 16
1.7 DISTRIBUCIÓN MUESTRAL DE LA RELACIÓN DE VARIANZAS .................................................. 17
EJEMPLO: .............................................................................................................................. 18
CONCLUSIÓN ................................................................................................................................. 21
BIBLIOGRAFÍA ................................................................................................................................ 22
INTRODUCCIÓN
Investigar a toda una población para obtener datos sobre un tema específico puede
ser muy costoso, impráctico o imposible. La alternativa es entonces tomar una muestra
aleatoria para inferir el comportamiento de la población en algunos aspectos de interés.
La comprensión del concepto de la distribución de muestreo es fundamental para
el correcto entendimiento de la inferencia estadística.
Una distribución de la población es la distribución de la totalidad de las medidas
individuales de una población, en tanto que una distribución muestral es la distribución
de los valores individuales incluidos en una muestra.
En contraste con estas distribuciones de medidas individuales, una distribución de
muestreo se refiere a la distribución de los diferentes valores que una estadística
muestral, o estimador, podría adoptar en muchas muestras del mismo tamaño.
Así, aunque por lo general disponemos únicamente de una muestra aleatoria o
subgrupo racional, reconocemos que la estadística muestral particular que
determinamos, como la media o mediana de la muestra, no es exactamente igual al
respectivo parámetro de la población.
Más aún, el valor de una estadística muestral variará de una muestra a otra, a causa
de la variabilidad del muestreo aleatorio, o error de muestreo. Ésta es la idea en la que
se apoya el concepto de que toda estadística muestral es de hecho un tipo de variable
cuya distribución de valores está representada por una distribución de muestreo.
DISTRIBUCIONES FUNDAMENTALES PARA EL MUESTREO

1.1 DISTRIBUCIÓN MUESTRAL DE LA MEDIA


Es una distribución de probabilidad de todas las posibles medias de las muestras,
de un determinado tamaño, obtenida de la población.
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una
población grande. Se calcula la media muestral x para cada muestra; la colección de
todas estas medias muéstrales recibe el nombre de distribución muestral de medias, lo
que se puede ilustrar en la siguiente figura:

La distribución muestral de la media es importante. Suponga que de una población


normal con media μ y varianza σ2 se toma una muestra aleatoria de n observaciones.
Cada observación Xi, i=1, 2,…, n, de la muestra aleatoria tendrá entonces la misma
distribución normal que la población de donde se tomó. Así, por la propiedad reproductiva
de la distribución normal concluimos que
1
𝑋̅=𝑛(X1+ X2+… + Xn)

Tiene una distribución normal con media


1 1 σ2
𝜇𝑋̅ = (𝜇 + 𝜇 + ⋯ 𝜇) = 𝜇 y varianza 𝜎𝑋2̅ = (σ2 +σ2 +…σ2) =
𝑛 𝑛 𝑛

Si tomamos muestras de una población con distribución desconocida, ya sea finita


o infinita, la distribución de 𝑋̅ aún será aproximadamente normal con media μ y varianza
𝜎2
, siempre que el tamaño de la muestra sea grande. Este asombroso resultado es una
𝑛

consecuencia inmediata del siguiente teorema, que se conoce como teorema del límite
central:
Teorema del límite central: Si 𝑋̅ es la media de una muestra aleatoria de tamaño
n, tomada de una población con media μy varianza finita σ2 , entonces la forma límite de
la distribución de
̅̅̅̅̅̅̅
𝑋−𝜇
𝑍=
𝜎/√𝑛
A medida que n → ∞, es la distribución normal estándar n (z; 0,1)
La aproximación normal para 𝑋̅ por lo general será buena si n ≥ 30, siempre y
cuando la distribución de la población no sea muy asimétrica. Si n < 30, la aproximación
será buena soló si la población no es muy diferente de una distribución normal y, como
antes se estableció, si se sabe que la población es normal, la distribución muestral de 𝑋̅
seguirá siendo una distribución normal exacta, sin importar qué tan pequeño sea el
tamaño de las muestras.
El tamaño de la muestra n= 30 es un lineamiento para el teorema del límite central.
Sin embargo, como se indica el planteamiento del teorema, la suposición de la
normalidad en la distribución de 𝑋̅ se vuelve más precisa a medida que n se hace más
grande.

EJEMPLOS

1.- Una empresa eléctrica fabrica baterías que tienen una duración que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviación estándar de
40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 baterías tenga
una vida promedio de menos de 775 horas.
Formula: Desarrollo Utilizando tabla Z
̅̅̅̅̅̅
𝑋−𝜇 775−800
𝑍 = 𝜎/ 𝑍= = −2.5 Resultado= 0.62%
√𝑛 40/√16

2.- Se sabe que el saldo promedio para los clientes de una tarjeta de crédito de
cierto banco es de $14, 350.00 con una desviación estándar de $6, 500 del listado de
clientes se obtiene una muestra aleatoria de 49. ¿Cuál es la probabilidad de que la
muestra tenga un promedio mayor a $17, 500?
̅̅̅̅̅̅
𝑋−𝜇 17,500−14,350
𝑍 = 𝜎/ 𝑍= = 3.39 Resultado= 0.03%
√𝑛 6,500/√49
1.2 DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE
MEDIASÓN MUESTRAL DE LA DIFERENCIA DE MEDIAS
Una distribución muestral de las medias es de tipo probabilístico e indica cuán
probables son diversas medias de la muestra. La distribución es una función de la media,
de la desviación estándar de la población y del tamaño de la muestra.
Suponga que se tiene dos poblaciones distintas, la primera con media μ1 y
desviación estándar σ1, y la segunda con media μ2 y desviación estándar σ1. Más aún,
se elige una muestra aleatoria de tamaño n1 de la primera población y una muestra
independiente aleatoria de tamaño n2 de la segunda población; se calcula la media
muestral para cada muestra y la diferencia entre dichas medias. La colección de todas
esas se llama distribución muestral de las diferencias entre medias o la distribución
muestral del estadístico.

La distribución es aproximadamente normal para n 1≥ 30 y n2≥ 30. Si las


poblaciones son normales, entonces la distribución muestral de medias es normal sin
importar los tamaños de las muestras.
La fórmula que se utilizará para el cálculo de probabilidad del estadístico de
diferencia de media es:

(𝑥̅1 − 𝑥̅2 )(𝜇1 − 𝜇2 )


𝑧=
𝜎12 𝜎22
√(
𝑛1 + 𝑛2 )
EJEMPLOS

1.- En un estudio para comparar los pesos promedio de niños y niñas de sexto
grado en una escuela primaria se usará una muestra aleatoria de 20 niños y otra de 25
niñas. Se sabe que tanto para niños como para niñas los pesos siguen una distribución
normal. El promedio de los pesos de todos los niños de sexto grado de esa escuela es
de 100 libras y su desviación estándar es de 14.142, mientras que el promedio de los
pesos de todas las niñas del sexto grado de esa escuela es de 85 libras y su desviación
estándar es de 12.247 libras. Si 𝑥̅1 representa el promedio de los pesos de los 20 niños
y 𝑥̅2 es el promedio de los pesos de una muestra de 25 niñas, encuentre la probabilidad
de que el promedio de los pesos de los 20 niños sea al menos 20 libras más grande que
es de las niñas.

Datos:
𝜇1 = 100 𝑙𝑖𝑏𝑟𝑎𝑠 n1= 20 niños
𝜇2 = 85 𝑙𝑖𝑏𝑟𝑎𝑠 n2= 25 niñas
𝜎1 = 14.142 𝑙𝑖𝑏𝑟𝑎𝑠 Probabilidad (𝑥̅1 − 𝑥̅2 > 20) =?
𝜎2 = 12.247 𝑙𝑖𝑏𝑟𝑎𝑠

Formula: Desarrollo:
(𝑥̅ −𝑥̅ )(𝜇 −𝜇 )
𝑧= 1 2 1 2 (20) − (100 − 85)
2 2 𝑧= = 1.25
𝜎 𝜎
√( 1 + 2 ) (14.142)2 (12.247)2
𝑛1 𝑛2 √[ + ]
20 25

Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños


sea al menos 20 libras más grande que el de la muestra de las niñas es de 0.1056
equivalente al 10.52 %.
2.- Se prueba el rendimiento en Km/L de 2 tipos de gasolina encontrándose una
desviación estándar de 1.23 Km/L para la primera gasolina y una desviación estándar de
1.37 Km/L para la segunda gasolina; se prueba la primera gasolina en 35 autos y la
segunda en 42 autos.
1.- ¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio
mayor de 0.45 Km/L que la segunda gasolina?
2.- ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se
encuentre entre 0.65 y 0.83 Km/L a favor de la gasolina 1?
Solución: En este ejercicio no se cuenta con los parámetros de las medias en ninguna
de las dos poblaciones, por lo que se supondrán que son iguales:
Datos:
𝜎1 = 1.23 𝐾𝑚/𝐿 n1= 35 autos
𝜎2 = 1.37 Km/L n2= 42 autos

Desarrollo:
1.- P ( 𝑋̅1 − 𝑋̅2 > 0.45) =

(0.45)−0
𝑧= (1.23)2 (1.37)2
= 1.52
√[ + ]
35 42
Buscando en la tabla Z nos arroja un resultado de 0.0642, representado en porcentaje
es de 6.42%
2.- p (0.65 ≤ 𝑥̅1 − 𝑥̅2 ≤ 0.83)=
(0.65)−0
𝑧= (1.23)2 (1.37)2
= 2.19
√[ + ]
35 42
(083)−0
𝑧= (1.23)2 (1.37)2
= 2.80
√[ + ]
35 42

Buscando en la tabla z los valores obtenidos, la probabilidad de que la diferencia


en rendimientos promedio en las muestras se encuentre entre 0.65 y 0.83 Km/L a favor
de la gasolina 1 es de 0.0117, representado en porcentaje es de 1.17%

1.3 DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN


Existen ocasiones en las cuales no estamos interesados en la media de la muestra,
sino que queremos investigar la proporción de artículos defectuosos o la proporción de
personas con teléfono, etc. en la muestra. La distribución muestral de proporciones en la
adecuada para dar respuesta a estas situaciones.
Esta distribución se genera de igual manera que la distribución muestral de medias,
a excepción de que al extraer las muestras de la población se calcula el estadístico
proporción ( p= x/n en donde “x” es el número de éxitos u observaciones de interés y “n”
el tamaño de la muestra) en lugar de la media de cada muestra que era lo que calculamos
antes.
El siguiente diagrama sirve para explicar el concepto de distribución muestral de
proporciones.

La distribución muestral de proporciones está estrechamente relacionada con la


distribución binomial; una binomial es una distribución total de éxitos en las muestras,
mientras que una distribución de proporciones es la distribución de un promedio (media)
de los éxitos.

EJEMPLOS

1.- Suponga que se cuenta con un lote de 12 piezas, el cual tiene artículos
defectuosos. Se van a seleccionar 5 artículos al azar de ese lote sin reemplazo. Vamos
a generar la distribución muestral de proporciones para el número de piezas defectuosas.
Como se puede observar en este ejercicio la proporción de artículos defectuosos de esta
población es P= 4/12= 1/3.
Por lo que podemos decir que el 33% de las piezas de este lote están defectuosas.
El número posible de muestras de tamaño 5 a extraer de una población de 12
elementos es 12C5=792, las cuales se pueden desglosar de la siguiente manera:

Artículos Buenos Artículos Malos Proporción de artículos Numero de maneras en


defectuoso las que se puede
obtener la muestra
1 4 4/5= 0.8 8C1 * 4C4= 8
2 3 3/5= 0.6 8C2 * 4C3= 112
3 2 2/5= 0.4 8C3 * 4C2= 336
4 1 1/5= 0.2 8C4 * 4C1= 280
5 0 0/5= 0 8C5 * 4C0= 56
TOTAL 792
Para calcular la media de la distribución muestral de proporciones se tendría que
hacer la sumatoria de la frecuencia por el valor de la proporción muestral y dividirla entre
el número total de muestras. Esto es:
(0.8 ∗ 8) + (0.6 ∗ 112) + (0.4 ∗ 336) + (0.2 ∗ 280) + (0.56) 1
𝜇𝜌 = = = 0.333
792 3
Como podemos observar la media de la distribución de la distribución muestral de
proporciones es igual a la proporción de la población: 𝜇𝜌 = 𝑃
La desviación estándar de la distribución muestral de proporciones del ejemplo se
puede calcular directamente con los datos:
(0.8 − 0.33)2 ∗ 8 + (0.6 − 0.33)2 ∗ 112 + (0.4 − 0.33)2 ∗ 336 + (0.2.0.33)2 ∗ 280 + (0 − 0.33)2
𝜎𝜌 = √ = 0.168
756

2.- Un medicamento para malestar estomacal tiene la advertencia de que algunos


usuarios pueden presentar una reacción adversa a él, más aún, se piensa que alrededor
del 3% de los usuarios tienen tal reacción. Si una muestra aleatoria de 150 personas con
malestar estomacal usa el medicamento, encuentre la probabilidad de que la proporción
de la muestra de los usuarios que realmente presentan una reacción adversa, exceda el
4%.

a) Resolverlo mediante la aproximación de la normal a la binomial.


Datos:
n=150 personas p (x>6) =?
p= 0.03 Media= np= (150) (0.03)= 4.5
x= (0.04) (150)= 6 personas
Formula: Desarrollo
𝑥 − 𝑛𝑝 6.5 − 4.5
𝑧= = 𝑧= = 0.96
√𝑛𝑝𝑞 √150(0.03)(0.97)
P(X>6)= 0.1685. Este valor significa que existe una probabilidad del 17% de que al
extraer una muestra de 150 personas, más de 6 presentarán una reacción adversa

b.- Resolverlo con la distribución muestral de proporciones.


Datos:
n=150 personas p= 0.05
P= 0.03 p (p>0.04)?
Formula: Desarrollo:
𝑝−𝑃 0.0433 − 0.03
𝑧= = 𝑧= = 0.96
√𝑃𝑞 √ (0.03)(0.97)
𝑛 150
Observe que este valor es igual al obtenido y la interpretación es: existe
una probabilidad del 17% de que al tomar una muestra de 150 personas se tenga
una proporción mayor de 0.04 presentando una reacción adversa.

1.4 DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE


PROPORCIONES
Este método se utiliza para comparar las proporciones o porcentajes de dos
distribuciones muestrales distintas y formular una inferencia con respecto a la
diferencia de estas. Sean X₁, X₂, X₃,….. Xn₁e Y ₁, Y ₂, Y ₃,….., Yn₂. Dos
muestras aleatorias independientes de tamaños n₁ y n₂ seleccionadas
respectivamente de dos poblaciones diferentes de Bernoullí B (1, p₁) y B (1, p₂),
donde p y p son proporciones de éxito en las poblaciones respectivas.
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja
con dos proporciones muestrales, la distribución muestral de diferencia de
proporciones es aproximadamente normal para tamaños de muestra grande.
Entonces p1 y p2 tienen distribuciones muestrales aproximadamente normales,
así que su diferencia p1-p2 también tiene una distribución muestral
aproximadamente normal.
Cuando se estudió a la distribución muestral de proporciones se comprobó
√𝑃𝑞
que P=μp y que σp = , por lo que no es difícil deducir que μp1 - μp2 =
𝑛

P1q1 P2q2
P1 –P2 y que σp1-p2 =√ +
n1 n2

La fórmula utilizada para calcular la distribución muestral de la diferencia


de proporciones es la siguiente:
(p1-p2)-(P1-P2)
Z=
P1q1 P2q2
√ +
n1 n2

Donde:

 p1= proporción de la muestra aleatoria simple 1


 p2= proporción de la muestra aleatoria simple 2
 P1= proporción de la población 1.
 P2= proporción de la población 2.
 q1= proporción restante de la población 1.
 q2= proporción restante de la población 2.

EJEMPLOS:

1-. Los hombres y mujeres adultos radicados en una ciudad grande del
norte difieren en sus opiniones sobre la promulgación de la pena de muerte para
personas culpables de asesinato. Se cree que el 12% de los hombres adultos
están a favor de la pena de muerte, mientras que solo el 10% de las mujeres lo
están. Si se pegunta a 2 muestras aleatorias de 100 hombres y 100 mujeres su
opinión sobre la promulgación de la pena de muerte, determine la probabilidad
de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las
mujeres.

n1= 100 hombres


n2= 100 mujeres
P1= 12%= 0.12
P2= 10%= 0.10
Q1= 1 - 0.12= 0.88
Q2= 1 - 0.10= 0.90
Solución
(p1-p2)-(P1-P2) (0.0225)-(0.12-0.10) (0.0225)-(0.02)
Z= Z= Z=
P1q1 P2q2 0.12 (0.88) (0.10) (0.90) 0.1056 0.090
√ + √ + √ +
n1 n2 100 100 100 100

0.005 0.005 0.005


Z= Z= Z = 0.0442 Z = 0.11 = .5437
√0.01056+.0090 √0.001956

1-0.5437 = 0.4653

La probabilidad de que el porcentaje de hombres a favor de la pena de


muerte, al menos 3% mayor que el de las mujeres es de 0.4562.
2.- Consideremos dos máquinas que producen un determinado articulo; la
primera produce por término medio un 14% de artículos defectuosos, en tanto
que otra, produce el 20% de artículos defectuosos; si se obtienen muestras de
200 unidades en la primera y 100 unidades en la segunda, ¿Cuál es la
probabilidad de que difiera A de B en 8% o más?
n1= 200
n2= 100
P1= 14
P2= 20
q1= 0.86
q2= 0.8
Solución
(p1-p2)-(P1-P2) (0.8)-(0.14-0.20) 0.14
Z= Z= = = 2.98
P1q1 P2q2 0.14+0.86 0.2+o.8 0.047
√ + √ +
n1 n2 200 100

Z=2.98 ---- A= 0.4986


P= 0.5-0.4986= 0.0014= 0.14%

1.5 DISTRIBUCIÓN T- STUDENT


Las distribuciones t de Student fueron descubiertas por William S. Gosset
en 1908 cuando trabajaba para la compañía de cervezas Guinness en Dublín
(Irlanda). Gosset firmó sus publicaciones usando el nombre de "Student".
Necesitaba una distribución que pudiera usar cuando el tamaño de la
muestra fuera pequeño y la varianza desconocida y tenía que ser estimada a
partir de los datos. Las distribuciones t se usan para tener en cuenta la
incertidumbre añadida que resulta por esta estimación. Fisher comprendió la
importancia de los trabajos de Gosset para muestras pequeñas.
En probabilidad y estadística, la distribución t (de Student) es
una distribución de probabilidad que surge del problema de estimar la media de
una población normalmente distribuida cuando el tamaño de la muestra es
pequeño.
Aparece de manera natural al realizar la prueba t de Student para la
determinación de las diferencias entre dos medias muestrales y para la
construcción del intervalo de confianza para la diferencia entre las medias de dos
poblaciones cuando se desconoce la desviación típica de una población y ésta
debe ser estimada a partir de los datos de una muestra.
EJEMPLOS

1.- La longitud de los tornillos fabricados en una fábrica tienen media µ=10
mm y desviación s= 1 mm, calcular la probabilidad de que en una muestra de
tamaño n=25, la longitud media del tornillo sea inferior a 20.5 mm

Solución
P (µ<20.5)
Estandarizamos T=(X-µ)/(s√𝑛) que sigue un adistribucion t de n-1 grados de
libertad.
T=(20.5-20)/(s/√25)= 2.5
P (µ<20.5)-- > P (T<2.5)-t(24)
P (T<2.5)= 0.9902
P (µ<20.5)= 0.9902
La probabilidad de que la longitud media de la muestra de 25 tornillos sea inferior
a 20.5 mm es del 99.02%
2.-Calcular los percentiles I8>7;0=99 y I8>7;0=01
Solución
Para buscar en la tabla de la F-Snedecor el percentil I8>7;0=99 hemos de tener
en cuenta que :
Df_1= 8 (1dFila de la tabla)
Df_2=7 (1 d columna de la tabla)
0=99 = Probabilidad acumulada (Ultima columna de la tabla)
El valor donde se cruzan todos estos datos será el percentil buscado.
Por tanto: I9>7;0=99 = 6 = 840

1.6 DISTRIBUCIÓN MUESTRAL DE LA VARIANZA


El cálculo de probabilidad en una distribución muestral de varianzas nos
sirve para saber cómo se va a comportar la varianza o desviación estándar en
una muestra, que proviene de una distribución normal. También es utilizada para
obtener una estimación por intervalos y realizar pruebas de hipótesis para una
varianza poblacional.
Se usa principalmente para la estimación de riesgos en inversiones. Para
aplicar el teorema central del límite. Para estimar desigualdades en ingresos,
rentas, entre otros.
En realidad la distribución ji-cuadrada es la distribución muestral de s2. O
sea que si se extraen todas las muestras posibles de una población normal y a
cada muestra se le calcula su varianza, se obtendrá la distribución muestral
de varianzas.
Para estimar la varianza poblacional o la desviación estándar, se necesita
conocer el estadístico X2. Si se elige una muestra de tamaño n de una población

normal con varianza , el estadístico:

Tiene una distribución muestral que es una distribución ji-cuadrada con gl=n-
1 grados de libertad y se denota X2 (X es la minúscula de la letra griega ji). El
estadístico ji-cuadrada está dado por:

 Donde n es el tamaño de la muestra.


 s2 la varianza muestral.

 La varianza de la población de donde se extrajo la muestra.


El estadístico ji-cuadrada también se puede dar con la siguiente expresión:

Propiedades de las distribuciones ji-cuadrada


1. Los valores de X2 son mayores o iguales que 0.
2. La forma de una distribución X2 depende del gl=n-1. En
consecuencia, hay un número infinito de distribuciones X2.
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que
se extienden a la derecha; esto es, están sesgadas a la derecha.
5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es
2(n-1).
6. El valor modal de una distribución X2 se da en el valor (n-3).

EJEMPLOS

1.- Suponga que los tiempos requeridos por un cierto autobús para alcanzar un
de sus destinos en una ciudad grande forman una distribución normal con una

desviación estándar =1 minuto. Si se elige al azar una muestra de 17 tiempos,


encuentre la probabilidad de que la varianza muestral sea mayor que 2.
Solución:
Primero se encontrará el valor de ji-cuadrada correspondiente a s2=2 como
sigue:

El valor de 32 se busca adentro de la tabla en el renglón de 16 grados de


libertad y se encuentra que a este valor le corresponde un área a la derecha de
0.01. En consecuencia, el valor de la probabilidad es P (s2>2)

2.- Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones,

de una población normal con varianza tenga una varianza muestral:


 Mayor que 9.1
 Entre 3.462 y 10.745
Solución.
Primero se procederá a calcular el valor de la ji-cuadrada:

Al buscar este número en el renglón de 24 grados de libertad nos da un


área a la derecha de 0.05. Por lo que la P (s2 >9.1) = 0.05
Se calcularán dos valores de ji-cuadrada:
Y
Aquí se tienen que buscar los dos valores en el renglón de 24 grados de
libertad. Al buscar el valor de 13.846 se encuentra un área a la derecha de 0.95.
El valor de 42.98 da un área a la derecha de 0.01. Como se está pidiendo la
probabilidad entre dos valores se resta el área de 0.95 menos 0.01 quedando
0.94.
Por lo tanto la P(3.462 s2 10.745) = 0.94

1.7 DISTRIBUCIÓN MUESTRAL DE LA RELACIÓN DE


VARIANZAS
La relación entre la varianza de la muestra y la varianza de la población
está determinada por la distribución Chi-cuadrada (x2) siempre y cuando la
población de la cual se toman los valores de la muestra se encuentren
normalmente distribuida. Y aquí debemos tener especial cuidado, pues la
distribución Chi-Cuadrada es sumamente sensible a la suposición de que la
población esta normalmente distribuida y por ejemplo construir intervalos de
confianza para estimar una varianza poblacional, puede que los resultados no
sean correctos dependiendo de si la población no está normalmente distribuida.
La distribución Chi-cuadrada (x2) es la razón que existe entre la varianza
de la muestra (S2 ) multiplicada por los grados de libertad gl y la varianza de la
población es decir:
El termino grados de libertad gl se refiere al número de observaciones
independientes para una fuente de variación menos el número de parámetros
independientes estimado al calcular la variación.
Para la distribución Chi-cuadrada (x2) los grados de libertad (gl) vienen
dados por (n-1) por tanto, la formula anterior quedaría expresada como:

Donde podemos observar que la variación de la distribución Chi-cuadrada


(x2) depende del tamaño de la muestra y de los grados de libertad que posea.
En general y debido a que la distribución Chi-cuadrada (x2) no es simétrica
a medida que se incrementa el número de grados de libertad, la curva
característica de la distribución se vuelve menos sesgada.
La distribución Chi-cuadrara (x2) es en si toda la una familia de
distribuciones por lo que, existe una distribución Chi-cuadrado para grado de
libertad.

Algebraicamente podemos manipular la formula anterior con


el objetivo de que nos sea de utilidad para construir intervalos de confianza para
varianzas poblacionales, quedando de la siguiente manera

EJEMPLO:

Supongamos que una muestra de 7 pernos especiales, utilizados en el


ensamble de computadoras portátiles arrojo los siguientes resultados:

2.10mm; 2.00mm; 1.90mm; 1.97mm; 1.98mm; 2.01mm; 2.05mm

Si quisiéramos una estimación puntual de la varianza de la población, sería


suficiente con calcular la varianza de la muestra, de la siguiente manera: Primero
calculando la media aritmética de todos los datos mediante la siguiente formula;
Por lo tanto sustituyendo los datos tenemos que:

Al efectuar los cálculos el resultado de la media aritmética (redondeando a 2


decimales) es de:

Se realiza una tabla para facilitar el cálculo de la varianza de datos:

Ahora se utiliza la formula correspondiente para la varianza de una muestra:

Y sustituyendo los datos en esta fórmula podemos ver que el valor obtenido
de la sumatoria en la tabla anterior, corresponde al (0.02389) por lo tanto:

Efectuando los cálculos vemos que

Es decir, la varianza de la muestra tiene un valor de 0.003981, pero si


consideramos que el valor de la estimación puntual puede cambiar de una
muestra a otra entonces será mejor construir un intervalo de confianza, para lo
cual debemos suponer que la población de los diámetros de los pernos esta
normalmente distribuida, y como vemos que n=7 entonces los grados de libertad
serán gj=7-1=6, si queremos que el intervalo sea del 90% de confianza, entonces
el nivel de significancia (a) será de 0.10 siendo esta la pate del área bajo la curva
de la distribución Chi-cuadrada que esta fuera del intervalo de confianza, esta
área es importarte por que los valores de la tabla de distribución Chi-cuadrada
están dados de acuerdo con el área de la cola derecha de la distribución.
Además en nuestro caso a/2= 0.05 es decir, 0.05 del área está en la cola derecha
y 0.05 está en la cola izquierda de la distribución.
Es importante hacer notar que debido a la forma de la curva de la
distribución Chi-cuadrada, el valor para ambas colas será diferente, así, el primer
valor que se debe de obtener es el de la cola derecha, mismo que se obtiene al
ubicar en el primer renglón de la tabla el valor correspondiente al nivel de
significancia, que en este caso es de 0.05 y, posteriormente se ubica en el lugar
de las columnas correspondientes grados de libertad ya calculado, que en este
caso es de 6 grados de libertad, por lo tanto el valor de Chi-cuadrada obtenido
es:

Observe que en la nomenclatura se escribe la denotación de Chi-cuadrada


teniendo como subíndice el nivel de significancia y los grados de libertad y, a
continuación se escribe el valor correspondiente.
El valor de Chi-cuadrada para la cola izquierda se obtiene al calcular el área
que se encuentra a la derecha de la cola izquierda, entonces:
A la derecha de la cola izquierda= 1-0.05
A la derecha de la cola izquierda = 0.95
Por lo tanto, el valor de Chi-cuadrada para la cola izquierda será, utilizando
el mismo procedimiento anterior para un área de 0.95 y 5 grados de libertad de:

Incorporando estos valores a la formula, tenemos que el intervalo de 90%


de confianza para los 7 pernos utilizados en el ensamblado de computadoras
portátiles tendrá la forma mostrada a continuación

Este intervalo de confianza nos dice que con 90% de confianza, la varianza
de la población está entre 0.0001625 y 0.01252189.
CONCLUSIÓN
Las distribuciones de muestreo constituyen una pieza importante de estudio
por varias razones. En la mayoría de los casos, la viabilidad de un experimento
dicta el tamaño de la muestra. La distribución de muestreo es la distribución de
probabilidad de una muestra de una población en lugar de toda la población
BIBLIOGRAFÍA
(s.f.). Obtenido de
http://www.matematicasvisuales.com/html/probabilidad/varaleat/tstudent.ht
ml
(s.f.). Obtenido de http://metodosuvm.blogspot.mx/2012/11/t-de-student.html
Antonio Nieves, F. C. (s.f.). Probabilidad y estadística para ingeniería. México, D.F.: Mc
Graw Hill.
autor, S. (12 de Marzo de 2002). It Chihuahua. Obtenido de
http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/u0102.pdf
autor, S. (17 de Mayo de 2004). Cálculo CC. Obtenido de
http://calculo.cc/temas/temas_estadistica/muestreo/teoria/dist_difer_medias.
html
Diego, S. (2013). GoConar. Obtenido de GoConar:
https://www.goconqr.com/es/examtime/blog/tecnicas-de-estudio/
ecampus. (s.f.). Obtenido de ecampus:
http://ecampus.fca.unam.mx/ebook/imprimibles/contaduria/estadistica_2/Uni
dad_2.pdf
itchihuahua. (s.f.). Obtenido de itchihuahua:
http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap03b.html
Karina, D. Q. (s.f.). Centro de Investigaciones Psicológicas . Obtenido de Centro de
Investigaciones Psicológicas :
http://www.medic.ula.ve/cip/docs/tec_estudios.pdf
Ronald E. Walpole, R. H. (2012). Probabilidad y Estadística para ingeniería y ciencias.
México: Pearson.
Scribd. (s.f.). Obtenido de https://es.scribd.com/doc/96358923/Distribuciones-de-La-
Diferencia-de-Dos-Proporciones-Muestrales
torre, L. d. (06 de Noviembre de 2003). Geociencias UNAM. Obtenido de
http://www.geociencias.unam.mx/~ramon/EstInf/Clase4.pdf

Вам также может понравиться