Вы находитесь на странице: 1из 7

Distribución en el muestreo de una proporción muestral

Definición: Sea x el número de éxitos en una muestra Binomial de n


observaciones, donde la probabilidad de éxito es p. En la mayoría de las
aplicaciones, el parámetro p será la proporción de individuos de una población que
poseen la característica de interés. La proporción de éxitos en la muestra es:

x
pˆ x =
n

Esta expresión recibe el nombre de proporción muestral

La media y la varianza de e la proporción muestral pueden deducirse del partir de


la media y la varianza del número de éxitos

E ( X ) = np Var ( X ) = np (1 − p )
De aquí se deduce

X  1 1
E ( px ) = E 
ˆ  = E ( X ) = np = p
n  n n
X 1 p (1 − p )
Var ( pˆ x ) = Var   = 2 Var ( X ) =
n n n
Así, la desviación típica de la proporción muestral es

p (1 − p )
σ pˆ =
n
La cual recibe el nombre de error estándar
Si el número N de individuos en la población no es demasiado grande comparado
con el número de individuos de la muestra, en la expresión de la varianza de la
proporción muestral será necesaria una corrección por población finita. La
varianza será entonces:

p (1 − p ) N − n
Var ( pˆ x ) = ×
n N −1
Y la desviación estándar de la proporción muestral será, entonces:

p (1 − p ) N − n
σ pˆ =
n N −1

Si el tamaño de la muestra es grande, en general para 50 observaciones o más,


entonces la variable aleatoria

pˆ − p
Z=
σ pˆ
Se distribuye aproximadamente como una normal estándar
Estimación de una Proporción

La proporción p en una población, en un experimento binomial está dado por el


valor p = x/N, donde x representa el número de éxitos en N pruebas, siendo N el
x
tamaño de la población. Por tanto, la proporción de la muestra pˆ =
n , donde n
es el tamaño de la muestra, se utilizará como estimador puntual del parámetro p.

Si no se espera que la proporción p desconocida esté demasiado cerca de 0 ó de


1, se puede establecer un intervalo de confianza para p al considerar la
distribución muestral de proporciones.

pˆ − p pˆ − p
Z= =
pq σ pˆ
n
El intervalo de confianza para la proporción poblacional queda:

p (1 − p )
pˆ ± Zσ pˆ = pˆ ± Z
n
Como esta ecuación depende del parámetro p desconocido, no es posible calcular
un intervalo de confianza. Sin embargo, si el tamaño muestral es grande,
generalmente 50 observaciones o más, podemos conseguir una buena

aproximación sustituyendo p por su estimador puntual p̂ , es decir:

p (1 − p ) pˆ (1 − pˆ )
pˆ ± Zσ pˆ = pˆ ± Z ≈ pˆ ± Z
n n
Entonces el intervalo de confianza del 100(1-α)% para la proporción poblacional
será:
pˆ (1 − pˆ ) pˆ (1 − pˆ )
pˆ − Zα / 2 < p < pˆ + Zα / 2
n n
Cuando n es pequeña y la proporción desconocida p se considera cercana a 0 ó a
1, el procedimiento del intervalo de confianza que se establece aquí no es
confiable, por tanto, no se debe utilizar. Para estar seguro, se debe requerir que
np ó nq sea mayor o igual a 5.

El error de estimación será la diferencia absoluta p̂ − p


Ejemplos:

1. Un fabricante de reproductores de discos compactos utiliza un conjunto de


pruebas amplias para evaluar la función eléctrica de su producto. Todos los
reproductores de discos compactos deben pasar todas las pruebas antes
de venderse. Una muestra aleatoria de 500 reproductores tiene como
resultado 15 que fallan en una o más pruebas. Encuentre un intervalo de
confianza de 90% para la proporción de los reproductores de discos
compactos de la población que no pasan todas las pruebas.

Solución:

n = 500 x = 15
1 − α = 90%
α
α = 10% = 5% = 0.05
2
15
pˆ = = 0.03
500
Zα / 2 = Z 0.05 = 1.645
pˆ (1 − pˆ ) 0.03(0.97)
pˆ ± Z = 0.03 ± 1.645
n 500
0.0237 < p < 0.0376
Se sabe con un nivel de confianza del 90% que la proporción de discos
defectuosos que no pasan la prueba en esa población esta entre 0.0237 y
0.0376.

2. En una muestra de 400 pilas tipo B fabricadas por la Batery Company, se


encontraron 20 defectuosas. Si la proporción p de pilas defectuosas en esa
muestra se usa para estimar P, que vendrá a ser la proporción verdadera
de todas las pilas defectuosas tipo B fabricadas por la Batery Company,
encuentre el máximo error de estimación ε tal que se pueda tener un 95%

de confianza en que P dista menos de ε de p̂ .

Solución:

n = 400 x = 20
1 − α = 95%
α
α = 5% = 2.5% = 0.025
2

x 20
pˆ = = = 0.05
n 400
Zα / 2 = Z 0.025 = 1.96
pˆ (1 − pˆ ) pˆ (1 − pˆ )
ε = Zα / 2 = Z 0.025
n n
0.05 ( 0.95 )
ε = 1.96 = 0.021
400

Si pˆ = 0.05 se usa para estimar p, podemos tener un 95% de confianza

en que p dista menos de 0.021 de p̂ ˆ = 0.05 se


. En otras palabras, si p
usa para estimar p, el error máximo de estimación será aproximadamente
0.021 con un nivel de confianza del 95%.

Para calcular el intervalo de confianza se tendría:

pˆ ± ε = 0.05 ± 0.021
Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza
del 95% se sabe que la proporción de pilas defectuosas de esta compañía
está entre 0.029 y 0.071.

Si se requiere un menor error con un mismo nivel de confianza sólo se


necesita aumentar el tamaño de la muestra.

3. En una muestra de 300 accidentes en una ciudad, 60 tuvieron


consecuencias fatales, con base en esta muestra, construya un intervalo de
confianza del 90%, para aproximar la proporción de todos los accidentes
automovilísticos que es esa ciudad tienen consecuencias fatales.

Solución

x 60
pˆ = = = 0.20
n 300
Zα / 2 = Z 0.05 = 1.645

ˆˆ
pq ˆˆ
pq
pˆ − Zα / 2 < p < pˆ + Zα / 2
n n

0.2 × 0.8 0.2 × 0.8


0.2 − 1.645 < p < 0.2 + 1.645
300 300

0.20 − 0.038 < p < 0.20 + 0.038


0.162 < p < 0.238

Вам также может понравиться