Вы находитесь на странице: 1из 42

DISTRIBUCIONES

MUESTRALES
Inducción
Unidad de estudio

Unidad de muestreo

Muestreo
Es una técnica de obtención de un subconjunto de una población
(muestra) para estimar e inferir con respecto a la característica de una
población (parámetro).
La población ideal que se pretende estudiar se denomina población
objetivo.
Ventajas
• Poblaciones muy grandes
• Coste reducido
• Mayor rapidez
• Posible destrucción de las muestras
Muestra probabilística: Muestra que se selecciona de
modo que cada integrante de la población en estudio tenga una
probabilidad conocida ( no igual a cero) de ser incluido en la
muestra

Tipos de muestreo probabilísticas


Muestreo aleatorio simple (m.a.s.) En general, las técnicas de
Muestreo estratificado inferencia estadística
Muestreo sistemático suponen que la muestra ha sido
elegida usando m.a.s.
Muestreo por conglomerados

Muestra no probabilística: Métodos en los que no todos


los integrantes tienen probabilidad de ser incluidos en la muestra
Constante Variable aleatoria
Distribución muestral de la media
La distribución muestral de la media es una distribución probabilística
que consta de una lista de todas las medias muestrales posibles de un
tamaño de muestra dado de una población y la probabilidad de
ocurrencia asociada con cada media muestral. La media muestral es un
estadístico con media y varianza como sigue:

σ2
[ ]
E X =μ [ ]
y V X =
n
Población infinita

σ2 ⎛ N −n⎞
[ ]
E X =μ [ ]
y V X = ⎜ ⎟
n ⎝ N −1 ⎠
Población finita
Ejemplo
Finita

Posibles muestras de tamaño n=2

[ ] 1 1 1
E X = 1.5( ) + 2( ) + 2.5( ) = 2
3 3 3
[ ] 1 1 1
V X = 1.52 ( ) + 2 2 ( ) + 2.52 ( ) − 2 2 = 0.167
3 3 3
El Teorema Central del Límite
Si de una población infinita con media μ y varianza σ 2 se
extraen muestras aleatorias de tamaño n, entonces la media
muestral se comporta aproximadamente como una variable
aleatoria normal con media igual a la media poblacional y con
varianza igual a la varianza poblacional dividida por el tamaño
de la muestra, siempre que n sea grande.

σ2 X −μ
X ~ N (μ , ) , Estandarizando: Z= ~ N (0,1)
n σ
n
CASO PRÁCTICO

Según viene publicado en una prestigiosa revista de economía, el salario


semanal medio de trabajadores de construcción es de 406,15 u.m. Se
estima además que la desviación estándar de dichos salarios es de 55,5
u.m. Si suponemos que se toma una muestra aleatoria de 100 trabajadores
para estudiar sus salarios, calcular las siguientes probabilidades referentes
a la media de dicha muestra:

1. La probabilidad de que la media de la muestra sea menor de 400 u.m.


2. La probabilidad de que la media de la muestra esté entre 400 y 410 u.m.
3. La probabilidad de que la media de la muestra sea mayor de 415 u.m.
4. Hallar el valor del salario medio c tal que excluya el 5% de los salarios
promedio semanales superiores
Solución
Distribución muestral de la media con σ2 desconocida*

* Muestras pequeñas (si n es grande la distribución t se aproxima a la


normal)
Ejemplo
El gasto diario en llamadas telefónicas en el departamento de una
empresa sigue una distribución normal con media μ=64 nuevos
soles. Si para dicho departamento se elige al azar 10 días y se
encuentra un gasto promedio de 60 nuevos soles y una
desviación estándar de 7. Calcular la probabilidad de que el gasto
medio en el periodo muestral sea menor a lo observado.
Solución

1. Como X es normal con media = 60


2. varianza desconocida
3. Muestra pequeña n = 10
Calculamos el valor t- student con 10-1=9 grados libertad:

60 − 64
t= = −1.81
7 / 10
Distribución muestral de la proporción
Ejemplo
Se supone que el 12% de la población en una ciudad tiene una
segunda residencia. Con el fin de obtener una información más
precisa se toma una m.a. de 250 familias. ¿Cuál es la probabilidad
de que la proporción de familias de la muestra con segunda
residencia esté comprendida entre un 10% y un 15%?.

Solución

Debemos calcular

Pr( 0.10 < P < 0.15) = Pr(P < 0.15) – Pr(P < 0.1)

0.15 − 0.12 0.1 − 0.12


z1 = = 1.46 z2 = = −0.97
0.12(0.88) 0.12(0.88)
250 250
Luego
Pr( 0.10 < P < 0.15) = 0.927855 - 0.166023
= 0.761832
Distribución muestral de la Varianza
Ejemplo
La precisión de un instrumento de prueba es admisible si su
variabilidad no es mayor a 10 unidades2 de medida. Para
verificar la precisión de dicho instrumento, se realizan 27
lecturas sobre un dispositivo los que proporcionan una
varianza de 16.8 unidades. Si se asume que las lecturas son
obtenidas de una población normal.
a) ¿Cuál es la probabilidad de que la desviación estándar
esté entre 3 y 5,2?
b) ¿Se puede afirmar que el instrumento es aceptable?
Solución
a) Sea X: lecturas de cierto instrumento ∼ N(μ, σ2=10)
P(3<S<4) = P(9<S2<16)

⎛ (26)(9) (n − 1) S 2 (26)(16) ⎞
p⎜⎜ < < ⎟⎟
⎝ 10 σ 2
10 ⎠
(
= P 23.4 < χ 2 < 41.6 )
= P (χ 2
) (
< 41.6 − P χ 2 < 23.4 )
= 0.97302 − 0.38977 = 0.58325
b) Debemos determinar si probabilísticamente el instrumento
es admisible
P(S2 > 16.8)

⎛ (n − 1) S 2 (26)(16.8) ⎞ Poco
p⎜⎜ > ⎟
⎟ = P ( χ 2
> 43.68) = 0.01636
⎝ σ
2 probable
10 ⎠
Cociente de varianzas muestrales
Diferencia de medias muestrales
Ejemplo: Caso a
La vida útil de un dispositivo fabricado por la empresa A es de
1.400 horas, con una desviación estándar de 200 horas. Por su
parte, el mismo dispositivo fabricado por la empresa B de la
competencia tiene una duración de 1.200 horas con un desvío de
100 horas. Se eligen 125 dispositivos de cada empresa con un
muestreo al azar. Calcular la probabilidad que los de la empresa A
duren 250 días más que los de B.
Solución
Poblaciones normales con varianzas conocidas

Entonces, la probabilidad pedida es igual al área a la derecha de este


valor en la curva de Gauss.

P (Z > 2.5) = 0,0062. Lo que significa que hay un 0,6% de probabilidad


porcentual de que la vida útil del dispositivo fabricado por A dure 250
horas más que el de su competencia.
Ejercicio
Se registraron los siguientes datos, en minutos, que tardan
algunos empleados varones y mujeres en realizar cierta actividad
en una empresa, los cuales fueron seleccionados aleatoriamente

Suponga que los tiempos para los dos grupos se distribuyen


normalmente
Calcule la probabilidad de que las mujeres tardan mas de 3
minutos en realizar la misma tarea que los varones.
Diferencia de proporciones muestrales
Intervalo confidencial para la media
Ejemplo
El tiempo (en minutos) que tardaron 15 empleados para familiarizarse
con el manejo de un equipo informático adquirido por la empresa fue:
3.4 2.8 4.4 2.5 3.3 4 4.8 2.9 5.6 5.2 3.7 3 3.6 2.8 4.8 .
Suponga que los tiempos se distribuyen normalmente.
a) Determine e interprete un intervalo del 95% de confianza para el
verdadero tiempo promedio.
b) El instructor considera que el tiempo promedio requerido por la
población de empleados que recibe instrucción sobre este equipo es
superior a 5 minutos, ¿qué se puede decir de acuerdo con el intervalo
hallado?
Intervalo confidencial para la proporción

pˆ qˆ
IC ( p ) = pˆ ± .Z1−α / 2
n
Ejemplo
Se quiere analizar el índice de productividad de los
trabajadores de una empresa, y se ha tomado una muestra
aleatoria de 200 empleados y se ha observado que el 5% de
ellos no alcanzan el nivel mínimo productivo que se quiere
conseguir de cada uno de ellos. Calcular un intervalo de
confianza del 95% para la proporción de empleados que no
llegan al nivel de productividad fijado.
Determinación del tamaño de muestra n para
estimar la media poblacional (N infinito)
σ
E = z1-α/2 es la mitad del ancho del intervalo de confianza
n
(producto del coeficiente y el error estándar) y se denomina
error máximo de estimación E.

Dado un valor de error y un cierto nivel de confianza, podemos


estimar cuál sería el tamaño de la muestra

z2
σ 2
n= 1−α / 2
2
E
Ejemplo
Un analista de un departamento de personal desea estimar el
número medio de horas de capacitación al año para los
supervisores de una división de la compañía con un margen de
error inferior a 3 horas y confianza de 90%. Con base en datos
procedentes de otras divisiones, el analista estima que la
desviación estándar de las horas de capacitación es 20 horas.
¿Cuál es el tamaño de muestra mínimo requerido?

Solución
Determinación del tamaño de muestra n para
estimar la proporción poblacional (N infinito)
PQ
E= z1-ε/2 es la mitad del ancho del intervalo de confianza
n
(producto del coeficiente y el error estándar) y se denomina
error máximo de estimación E.

Dado un valor de error y un cierto nivel de confianza, podemos


estimar cuál sería el tamaño de la muestra
2
z PQ
n= 1−α / 2
2
E
Ejemplo
Una empresa está interesada en determinar la proporción de sus
clientes que poseen una segunda residencia. Por ello selecciona al
azar a 500 clientes y encuentra que 35 disponen de ella.
a) Calcular un intervalo de confianza al 95% para dicha proporción.
b) ¿Cuántos clientes debería haber seleccionado para asegurar
con la misma confianza que en el apartado anterior se tiene un
error en la estimación de a lo más del 5%?
Ejercicio
Una empresa tiene siete empleados (considerados como la población). El
número de horas extras que cada empleado realiza semanalmente se
presenta en la tabla
Empleado Horas extras
Javier 6
Saúl 5
Susana 9
Berta 4
Juan 7
Aura 8
Carlos 3
1. ¿Cuál es el promedio de horas extras semanal en la población y su
varianza?
2. ¿Cuál es el promedio y error estándar de horas extras semanales, si la
muestra está conformada por Javier y Susana?
3. ¿Cuál es el promedio esperado de las medias y su varianza?
4. Calcular un intervalo confidencial al 98% para el promedio de horas
extras.
5. Si es posible, calcular un intervalo confidencial al 98% para el total de
horas extras.

Вам также может понравиться