Вы находитесь на странице: 1из 92

Muestreo y

distribuciones
muestrales
CAPTULO 6

El problema de muestreo de
Electronics Associates.
Al director de personal de Electronics Associates, Inc. (EAI), se le ha
encargado la tarea de elaborar un perfil de los 2500 administradores
de la empresa. Las caractersticas a determinar son el sueldo medio
anual de los administradores y la proporcin de administradores que
ha terminado el programa de capacitacin de la empresa.
Con los 2500 administradores de la empresa como la poblacin para
este estudio, es posible hallar el sueldo anual y la situacin respecto
al programa de capacitacin de cada persona al consultar los
archivos del personal. Se calcula la media poblacional y la
desviacin estndar poblacional de los salarios anuales.
Media poblacional: = $51 800
varianza poblacional: $40

1500 de los 2500 administradores han terminado el


programa de capacitacin. Si p denota la proporcin de la
poblacin que ha terminado el programa de capacitacin,
se tiene que p = 1500/2500 0.60.
son parmetros de la poblacin de administradores de
EAI.
cmo puede obtener el director de personal de la
empresa, estimaciones de los parmetros poblacionales
usando una muestra de los administradores, en lugar de
usar a los 2500 administradores de la poblacin?.

Muestreo aleatorio simple


Para seleccionar una muestra de una poblacin hay
diversos mtodos; uno de los ms comunes es el
muestreo aleatorio simple. La definicin de
muestreo aleatorio simple y del proceso de seleccionar
una muestra aleatoria simple dependen de si la
poblacin es finita o infinita.
Como el problema de muestreo de EAI tiene una
poblacin finita de 2500 administradores, primero se
considera el muestreo de una poblacin finita.

Muestreo de una poblacin


finita
Una muestra aleatoria simple de tamao n de una poblacin
finita de tamao N es una muestra seleccionada de manera
que cada posible muestra de tamao n tenga la misma
probabilidad de ser seleccionada.
Un procedimiento para seleccionar una muestra aleatoria
simple de una poblacin finita es elegir los elementos para la
muestra de uno en uno, de manera que, en cada paso, cada
uno de los elementos que quedan en la poblacin tenga la
misma probabilidad de ser seleccionado. Al seleccionar n
elementos de esta manera, ser satisfecha la definicin de
muestra aleatoria simple seleccionada de una poblacin finita.

El tamao de una muestra es el


nmero n de individuos que
contiene.

N: es el tamao de la poblacin o universo (nmero total de posibles


encuestados).
Z: es una constante que depende del nivel de confianza que
asignemos. El nivel de confianza indica la probabilidad de que los
resultados de nuestra investigacin sean ciertos: un 95,5% de
confianza es lo mismo que decir que nos podemos equivocar con una
probabilidad del 4,5%. Los valores de Z se obtienen de la
tabla de la distribucin normal estndar N(0,1).

//

p: proporcin de individuos que poseen en la poblacin


la caracterstica de estudio. Este dato es generalmente
desconocido y se suele suponer que p=q=0.5 que es la
opcin ms segura.
q: proporcin de individuos que no poseen esa
caracterstica, es decir, es 1-p.
n: tamao de la muestra (nmero de encuestas que
vamos a hacer).

Los valores de Z ms utilizados y


sus niveles de confianza son:
Valor de
Z

1,15

1,28

1,44

1,65

1,96

2,24

2,58

Nivel de
confianz 75%
a

80%

85%

90%

95%

97,5%

99%

(Por tanto si pretendemos obtener un nivel de confianza del


95% necesitamos poner en la frmula Z=1.96)
e: es el error muestral deseado, en tanto por ciento. El error
muestral es la diferencia que puede haber entre el resultado
que obtenemos preguntando a una muestra de la poblacin
y el que obtendramos si preguntramos al total de ella

Ejemplos
Ejemplo 1: si los resultados de una encuesta dicen que 100 personas
compraran un producto y tenemos un error muestral del 5% comprarn
entre 95 y 105 personas.
Ejemplo 2: si hacemos una encuesta de satisfaccin a los empleados con
un error muestral del 3% y el 60% de los encuestados se muestran satisfechos
significa que entre el 57% y el 63% (60% +/- 3%) del total de los empleados
de la empresa lo estarn.

Ejemplo 3
si los resultados de una encuesta electoral indicaran
que un partido iba a obtener el 55% de los votos y el
error estimado fuera del 3%, se estima que el
porcentaje real de votos estar en el intervalo 52-58%
(55% +/- 3%).

Otra frmula:
n = el tamao de la muestra. N = tamao de la
poblacin.
: Desviacin estndar de la poblacin, que
generalmente cuando no se tiene su valor, suele utilizarse
un valor constante de 0,5.
Z Valor obtenido mediante niveles de confianza. Es un
valor constante que, si no se tiene su valor, se lo toma en
relacin al 95% de confianza equivale a 1,96 (como ms
usual) o en relacin al 99% de confianza equivale 2,58,
valor que queda a criterio

Ejemplo de tamao de muestra


Calcular el tamao de la muestra de una poblacin de
500 elementos con un nivel de confianza del 99%
Solucin: Se tiene N=500, para el 99% de confianza
Z=2.58, y como no se tienen los dems valores se
usar =0.5, y e=0.05.
Reemplazando valores en la frmula se obtiene:

Lo cual se aproxima a 286

Ej. Calcular el tamao de la muestra de una poblacin


de 500 elementos con un nivel de confianza del 95%
N=500, para el 95% de confianza Z = 1,96, y e = 0,05.
grfico que representa el 95% de confianza es:

Los clculos en Excel se muestran en la figura:

Caso EAI
Para seleccionar una muestra aleatoria simple de la poblacin finita de administradores de
EAI, primero se le asigna a cada administrador un nmero.
se les asignan los nmeros del 1 al 2500 en el orden en que aparecen sus nombres en el
archivo de personal de EAI. A continuacin se consulta la tabla de dgitos aleatorios que se
muestran en la tabla 7.1. Al consultar el primer rengln de la tabla se da cuenta que cada
dgito, 6, 3, 2, es un dgito aleatorio con la misma oportunidad de aparecer que cualquier
otro. Como el nmero mayor en la lista de la poblacin de administradores de EAI, 2500,
tiene cuatro dgitos, se seleccionarn nmeros aleatorios de la tabla en conjuntos o grupos
de cuatro dgitos. Aun cuando para la seleccin de nmeros aleatorios se puede empezar
en cualquier lugar de la tabla y avanzar sistemticamente
en una de las cuatro direcciones, aqu se usar el primer rengln de la tabla 7.1 y se
avanzar de izquierda a derecha. Los primeros 7 nmeros aleatorios de cuatro dgitos son
6327 1599 8671 7445 1102 1514 1807
Los nmeros aleatorios en la tabla aparecen en grupos de cinco para facilitar su lectura.

El primer nmero, 6327, es mayor que 2500. No corresponde a


ninguno de los administradores numerados que forman la
poblacin y por tanto se descarta. El segundo nmero, 1599,
est entre 1 y 2500. Por tanto, el primer administrador
seleccionado para la muestra aleatoria es el administrador que
tiene el nmero 1599 en la lista de los administradores de EAI.
Siguiendo este proceso, se ignoran los nmeros 8671 y 7445
antes de identificar a los administradores con los nmeros
1102, 1514 y 1807 e incluirlos en la muestra aleatoria. Este
proceso sigue hasta que se tiene la muestra aleatoria de 30
administrativos de EAI.

Tamao ideal de una muestra de


EAI
Solucin: Se tiene N=2500, para el 99% de confianza
Z=2.58, y como no se tienen los dems valores se
usar 2=40, y e=0.05.
n = 2500*40*6.6564/(0.0025*(2500-1) + 40*6.6564) =
2442.68

Muestreo de una poblacin


infinita
En algunas situaciones la poblacin o bien es infinita o tan grande
que, para fines prcticos, se considera infinita. Por ejemplo, suponga
que un restaurante de comida rpida desea obtener el perfil de su
clientela seleccionando una muestra aleatoria de los mismos y
pidindole a cada cliente que llene un breve cuestionario. En tales
situaciones, el proceso continuo de clientes que visitan el restaurante
puede verse como una poblacin infinita.
Una muestra aleatoria simple de una poblacin infinita es una
muestra seleccionada de manera que se satisfagan las condiciones
siguientes.
1. Cada uno de los elementos seleccionados proviene de la poblacin.
2. Cada elemento se selecciona independientemente.

ejemplo
En la seleccin de una muestra aleatoria simple entre los clientes
de un restaurante de comida rpida, el primer requerimiento es
satisfecho por cualquier cliente que entra en el restaurante. El
segundo requerimiento es satisfecho seleccionando a los clientes
de manera independiente. El objetivo del segundo requerimiento
es evitar sesgos de seleccin. Habra un sesgo de seleccin, por
ejemplo, si cinco clientes consecutivos que se seleccionaran
fueran amigos. Es de esperar que estos clientes tengan perfiles
semejantes.
Dichos sesgos se evitan haciendo que la seleccin de un cliente no
influya en la seleccin de cualquier otro cliente. En otras palabras,
los clientes deben ser seleccionados de manera independiente.

McDonalds
El restaurante lder en comida rpida, realiz un muestreo
aleatorio simple precisamente en una situacin as. El
procedimiento de muestreo se bas en el hecho de que
algunos clientes presentaban cupones de descuento. Cada vez
que un cliente presentaba un cupn descuento, al siguiente
cliente que se atenda se le peda que llenara un cuestionario
sobre el perfil del cliente. Como los clientes que llegaban al
restaurante presentaban cupones de descuento aleatoria e
independientemente, este plan de muestreo garantizaba que
los clientes fueran seleccionados de manera independiente.
Por tanto, los dos requerimientos para un muestreo aleatorio
simple de una poblacin infinita fueron satisfechos.

Conclusin
Las poblaciones infinitas suelen asociarse con un
proceso que opera continuamente a lo largo del tiempo.
Por ejemplo, partes fabricadas en una lnea de
produccin, transacciones en un banco, llamadas que
llegan a un centro de asesora tcnica y clientes que
entran en las tiendas son considerados como
provenientes de una poblacin infinita. En tales casos
un procedimiento de muestreo creativo garantiza que
no haya sesgos de seleccin y que los elementos de la
muestra sean seleccionados en forma independiente.

Nmeros aleatorios con Minitab


Ejemplo 1. MUESTREO ALEATORIO SIMPLE.Vamos a generar 100 valores en la columna C1,
de 1 a 100, que indicar el i-simo elemento de la
poblacin, de tamao 100; es decir N = 100.
Esto lo hacemos siguiendo los siguientes pasos:
Paso 1: < Calc > - < Make patterned data > - <
Simple of set numbers> Valor inicial: 1 Valor
final: 100.Incrementos: 1.
Paso 2: A continuacin, en la columna C2 vamos
a generar aleatoriamente las notas vigesimales
de 100 alumnos de un determinado colegio
particular. Supongamos que las notas van de 05 a

usando la siguiente secuencia:


<Calc> - <datos aleatorios> - <Enteros>

Nmeros aleatorios
2436
300
1046
2088
908
1755
556
1736
1640
2454

2377 369
69 1268
1526 1284
2370 1173
1481 211
327
341
1245 1749
360
1012
1879 1218
492
1671

Estimacin puntual
Para estimar el valor de un parmetro poblacional, la caracterstica
correspondiente se calcula con los datos de la muestra, a lo que se
le conoce como estadstico muestral. Por ejemplo, para estimar
la media poblacional y la desviacin estndar poblacional de
los salarios anuales de los administradores de EAI, se emplean los
datos de la tabla 7.2 y se calculan los estadsticos muestrales;
media muestral y desviacin estndar muestral s. Con las frmulas
para la media muestral y la desviacin estndar muestral
presentadas en el captulo 2 se obtiene que la media muestral es
x = xi/n=1 554 420/30= $51 814
y la desviacin estndar muestral es
S = (xi x)2/(n -1) = 325 009 260/29 =$3348

Tabla 7.2
Salario Programa de Salario Programa de
anual capacitacin anual ($) capacitacin
x1 49 094.30 S x16 51 766.00 S
x2 53 263.90 S x17 52 541.30 No
x3 49 643.50 S x18 44 980.00 S
x4 49 894.90 S x19 51 932.60 S
x5 47 621.60 No x20 52 973.00 S
x6 55 924.00 S x21 45 120.90 S
x7 49 092.30 S x22 51 753.00 S
x8 51 404.40 S x23 54 391.80 No
x9 50 957.70 S x24 50 164.20 No
x10 55 109.70 S x25 52 973.60 No
x11 45 922.60 S x26 50 241.30 No
x12 57 268.40 No x27 52 793.90 No
x13 55 688.80 S x28 50 979.40 S
x14 51 564.70 No x29 55 860.90 S
x15 56 188.20 No x30 57 309.10 No

proporcin muestral
Para estimar p, la proporcin de administradores que han terminado
el programa de capacitacin, se usa la proporcin muestral
correspondiente . Sea x el nmero de administradores de la muestra
que han terminado el programa de capacitacin. De acuerdo con la
tabla 7.2, x = 19. Por tanto, como el tamao de la muestra es n = 30,
la proporcin muestral es p =x/n =19/30 = 0.63
Al hacer los clculos anteriores, se lleva a cabo el proceso estadstico
conocido como estimacin puntual. A la media muestral se le conoce
como el estimador puntual de la media poblacional , a la
desviacin estndar muestral s como el estimador puntual de la
desviacin estndar poblacional y a la proporcin muestral como el
estimador puntual de la proporcin poblacional p. Al valor numrico
obtenido de , s, o se les conoce como estimaciones puntuales

Introduccin a las distribuciones


muestrales
se dijo que la media muestral es el estimador puntual de la
media poblacional y que la proporcin muestral es el
estimador puntual de la proporcin poblacional p. En la
muestra aleatoria simple de los 30 administradores de EAI
que se presenta en la tabla 7.2, la estimacin puntual de
es $51 814 y la estimacin puntual de p es 0.63. Suponga
que se selecciona otra muestra aleatoria simple de 30
administradores de EAI y se obtienen las estimaciones
puntuales siguientes:
Media muestral: x = $52 670
Proporcin muestral: p = 0.70

Ahora suponga que el proceso de seleccionar una


muestra aleatoria simple de 30 administradores se
repite una y otra y otra vez y que cada vez se calculan
los valores de y de . En la tabla 7.4 se muestra una
parte de los resultados obtenidos en 500 muestras
aleatorias simples y en la tabla 7.5 las distribuciones de
frecuencias y distribuciones de frecuencias relativas de
los valores de las 500 .

Distribucin muestral
En estadstica, la distribucin muestral es lo que resulta de
considerar todas las muestras posibles que pueden ser tomadas de
una poblacin. Su estudio permite calcular la probabilidad que se
tiene, dada una sola muestra, de acercarse al parmetro de la
poblacin. Mediante la distribucin muestral se puede estimar el
error para un tamao de muestra dado.
Consideremos todas las posibles muestras de tamao n en una
poblacin. Para cada muestra podemos calcular un estadstico
(media, desviacin tpica, proporcin,...) que variar de una a otra.
As obtenemos una distribucin del estadstico que se llama
distribucin muestral. Las dos medidas fundamentales de esta
distribucin son la media y la desviacin tpica, tambin
denominada error tpico.

Esquema

Distribucin muestral de medias


La distribucin muestral de xes la distribucin de probabilidad de todos
los valor es de la media muestral x.
Valor esperado de x
La media de la variable aleatoria xes el valor esperado de x. Sea E(x ) el
valor esperado de x y la media de la poblacin de la que se selecciona
una muestra aleatoria simple. Se puede demostrar que cuando se emplea
el muestreo aleatorio simple, E(x) y son iguales.
Esto ensea que usando el muestreo aleatorio simple, el valor esperado o
media de la distribucin muestral de es igual a la media de la poblacin.
En la seccin 7.1 se vio que el sueldo anual medio de los administradores
de EAI es $51 800. Por tanto, de acuerdo con la ecuacin (7.1), la
media de todas las medias muestrales en el estudio de EAI es tambin
$51 800.

E(x) =

(7.1)

Cuando el valor esperado de un estimador puntual es


igual al parmetro poblacional, se dice que el estimador
puntual es insesgado. Por tanto, la ecuacin (7.1)
muestra que xes un estimador
insesgado de la media poblacional .

Desviacin estndar de x
x = desviacin estndar de x
= desviacin estndar de la poblacin
n = tamao de la muestra
N = tamao de la poblacin

Forma de la distribucin
muestral de x
La poblacin tiene distribucin normal. En muchas
situaciones es razonable suponer que la poblacin de la que
se seleccion la muestra aleatoria simple tenga distribucin
normal o casi normal. Cuando la poblacin tiene distribucin
normal, la distribucin muestral de est distribuida
normalmente sea cual sea el tamao de la muestra.
La poblacin no tiene distribucin normal. Cuando la
poblacin de la que se tom la muestra aleatoria simple no
tiene distribucin normal, el teorema del lmite central
ayuda a determinar la forma de la distribucin muestral de .

TEOREMA DEL LMITE CENTRAL


Cuando se seleccionan muestras aleatorias simples de
tamao n de una poblacin, la distribucin muestral de
la media muestral x puede aproximarse mediante una
distribucin normal a medida que el tamao de la
muestra se hace grande.

En la prctica
Desde el punto de vista de la prctica, ser conveniente saber qu
tan grande necesita ser el tamao de la muestra para que aplique
el teorema del lmite central y pueda suponer que la forma de la
distribucin muestral es aproximadamente normal. En las
investigaciones estadsticas se ha estudiado este problema en
distribuciones muestrales de de muy diversas poblaciones y para
muy diversos tamaos de muestras. Lo que se acostumbra hacer
en la prctica es suponer que, en la mayor parte de las
aplicaciones, la distribucin muestral de se puede aproximar
mediante una distribucin normal siempre que la muestra sea de
tamao 30 o mayor. En los casos en que la poblacin es muy
sesgada o existen observaciones atpicas, pueden necesitarse
muestras de tamao 50.

Distribucin muestral de x en el
problema EAI
En el problema de EAI, para el que ya previamente se
mostr que E(x ) = $51 800 y x= 730.3, no se cuenta
con ninguna informacin acerca de la distribucin de la
poblacin; puede estar o no distribuida normalmente. Si la
poblacin tiene una distribucin normal, la distribucin
muestral de x estar distribuida normalmente. Si la
poblacin no tiene una distribucin normal, la muestra
aleatoria simple de 30 administradores y el teorema del
lmite central permiten concluir que la distribucin muestral
de puede aproximarse mediante una distribucin normal.

Valor prctico de la distribucin


muestral de x
Siempre que se seleccione una muestra aleatoria simple
y se use el valor de la media muestral para estimar el
valor de la media poblacional , no se podr esperar
que la media muestral sea
exactamente igual a la media poblacional. La razn
prctica por la que interesa la distribucin muestral de
x es que se puede usar para proporcionar informacin
probabilstica acerca de la diferencia entre la media
muestral y la media poblacional

Relacin entre el tamao de la


muestra y
la distribucin muestral de xx

Suponga que en el problema de muestreo de EAI se


toma una muestra aleatoria simple de 100
administradores en lugar de los 30 considerados. La
intuicin indica que teniendo ms datos proporcionados
por una muestra mayor, la media muestral basada en n
= 100 proporcionar una mejor estimacin de la media
poblacional que una media muestral basada en n = 30.
Para ver cunto es mejor, se considerar la relacin
entre el tamao de la muestra y la distribucin muestral
de .

Primero observe que E(xx ) = independientemente del tamao


de la muestra. Entonces, la media de todos los valores posibles
de es igual a la media poblacional independientemente del
tamao n de la muestra. Pero, el error estndar de la media,
xx = /n , est relacionado con la raz cuadrada del tamao
de la muestra. Siempre que el tamao de la muestra aumente,
el error estndar de la media xx disminuir. Con n = 30, el
error estndar de la media en el problema de EAI es 730.3. Sin
embargo, aumentando el tamao de la muestra n = 100, el
error estndar de la media disminuye a
x=/n = 4000/100 = 400

Grficas

Ejemplo:
Las estaturas de 1000 estudiantes estn distribuidas
aproximadamente en forma normal con una media de
174.5 centmetros y una desviacin estndar de 6.9
centmetros. Si se extraen 200 muestras aleatorias de
tamao 25 sin reemplazo de esta poblacin, determine:
a.- El nmero de las medias muestrales que caen entre
172.5 y 175.8 centmetros.
b.- El nmero de medias muestrales que caen por debajo
de 172 centmetros.

Solucin a:

(0.7607)(200)=152 medias muestrales

Solucin b:

(0.0336)(200)= 7 medias muestrales

Distribucin muestral de px
La proporcin muestral es el estimador puntual de la
proporcin poblacional p. La frmula para calcular la
proporcin muestral es
p = x/n
donde
x =nmero de elementos de la muestra que poseen la
caracterstica de inters
n = tamao de la muestra
La distribucin muestral de pp es la distribucin de probabilidad
de todos los posibles valores de la proporcin muestral p.

Diagrama

Caracterstica
Una poblacin binomial est estrechamente relacionada
con la distribucin muestral de proporciones; una
poblacin binomial es una coleccin de xitos y
fracasos, mientras que una distribucin muestral de
proporciones contiene las posibilidades o proporciones
de todos los nmeros posibles de xitos en un
experimento binomial

Generacin de la Distribucin
Muestral de Proporciones
Suponga que se cuenta con un lote de 12 piezas, el cual
tiene 4 artculos defectuosos. Se van a seleccionar 5
artculos al azar de ese lote sin reemplazo. Genere la
distribucin muestral de proporciones para el nmero
de piezas defectuosas.
Como se puede observar en este ejercicio la Proporcin
de artculos defectuosos de esta poblacin es 4/12=1/3.
Por lo que podemos decir que el 33% de las piezas de
este lote estn defectuosas

El nmero posible de muestras de tamao 5 a


extraer de una poblacin de 12 elementos es
12C5=792
Artculos Buenos

Artculos
Malos

Proporcin de
artculos defectuoso

Nmero de maneras en las que se puede


obtener la muestra

4/5=0.8

8C1*4C4=8

3/5=0.6

8C2*4C3=112

2/5=0.4

8C3*4C2=336

1/5=0.2

8C4*4C1=280

0/5=0

8C5*4C0=56

Total

792

Calculos:

Para calcular la media de la distribucin muestral de


proporciones se tendra que hacer la sumatoria de la
frecuencia por el valor de la proporcin muestral y
dividirla entre el nmero total de muestras. Esto
la media de la distribucin muestral de proporciones es
igual a la Proporcin de la poblacin la desviacin
estndar de la distribucin muestral de proporciones:

Valor esperado de px
El valor esperado de px, la media de todos los posibles valores de px,
es igual a la proporcin poblacional p.
E( p) = p
Donde
E( p) = valor esperado de p
p = proporcin poblacional
Como E(px ) = p, es un estimador insesgado de p. Recuerde que en la
seccin .1 se encontr que en la poblacin de EAI p = 0.60, siendo p
la proporcin de la poblacin de administradores que han participado
en el programa de capacitacin de la empresa. Por tanto, el valor
esperado de px en el problema de muestreo de EAI es 0.60.

Desviacin estndar de px
Como en el caso de la desviacin estndar de xx la
desviacin estndar de px obedece a si la poblacin es
finita o infinita. Las dos frmulas para calcular la
desviacin estndar de px se presentan a continuacin.

(7.5)

Ejemplo:
Se ha determinado que 60% de los estudiantes de una universidad grande
fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes.
Calcule la probabilidad de que la proporcin de la muestra de la gente que
fuma cigarrillos sea menor que 0.55.
Solucin 1
Aproximacin de la distribucin normal a la binomial:
Datos:
n=800 estudiantes
p=0.60
x= (.55)(800) = 440 estudiantes
p(x< 440) = ?
Media= np= (800)(0.60)= 480

p(x< 440) = 0.0017. Este valor significa que existe una


probabilidad del 0.17% de que al extraer una muestra
de 800 estudiantes, menos de 440 fuman cigarrillos

Solucin2 por Distribucin Muestral


de Proporciones
n=800 estudiantes
P=0.60
p= 0.55
p(p< 0.55) = ?

Interpretacin
Observe que este valor es igual al obtenido en el mtodo de la
aproximacin de la distribucin normal a la binomial, por lo que
si lo buscamos en la tabla de "z" nos da la misma probabilidad
de 0.0017. Tambin se debe de tomar en cuenta que el factor
de correccin de 0.5 se esta dividiendo entre el tamao de la
muestra, ya que estamos hablando de una proporcin
La interpretacin en esta solucin, estara enfocada a la
proporcin de la muestra, por lo que diramos que la
probabilidad de que al extraer una muestra de 800
estudiantes de esa universidad, la proporcin de
estudiantes que fuman cigarrillos sea menor al 55% es
del 0.17%.

Ejemplo:
Un medicamento para malestar estomacal tiene la
advertencia de que algunos usuarios pueden presentar
una reaccin adversa a l, ms an, se piensa que
alrededor del 3% de los usuarios tienen tal reaccin. Si
una muestra aleatoria de 150 personas con malestar
estomacal usa el medicamento, encuentre la
probabilidad de que la proporcin de la muestra de los
usuarios que realmente presentan una reaccin
adversa, exceda el 4%.
Resolverlo mediante la aproximacin de la normal a la
binomial
Resolverlo con la distribucin muestral de proporciones

Solucin 1
n=150 personas
p=0.03
x= (0.04)(150) = 6 personas
p(x>6) = ?
Media = np= (150)(0.03)= 4.5

Solucin 2.- Distribucin Muestral de


Proporciones
n=150 personas
P=0.03
p= 0.04
p(p>0.04) = ?

este valor es igual al obtenido y la interpretacin es: existe una


probabilidad del 17% de que al tomar una muestra de 150 personas se
tenga una proporcin mayor de 0.04 presentando una reaccin adversa

Ejemplo 4
Se sabe que la verdadera proporcin de los
componentes defectuosos fabricadas por una firma es
de 4%, y encuentre la probabilidad de que una muestra
aleatoria de tamao 60 tenga:
Menos del 3% de los componentes defectuosos.
Ms del 1% pero menos del 5% de partes defectuosas.

Solucin 1
n= 60 artculos
P=0.04 ; p= 0.03
p(p<0.03) = ?

La probabilidad de que en una muestra de 60 artculos


exista una proporcin menor de 0.03 artculos
defectuosos es de 0.2327

Solucin 2
n= 60 artculos
P=0.04 ; p= 0.01 y 0.05
p(0.01<p<0.05) = ?

Propiedades de los estimadores


puntuales
En esta seccin se estudian las propiedades que deben tener los
buenos estimadores puntuales:
insesgadez, eficiencia y consistencia.
Como hay distintos estadsticos muestrales que se usan como
estimadores puntuales de sus correspondientes parmetros
poblacionales, en esta seccin se usar la notacin general siguiente.
= el parmetro poblacional de inters
=el estadstico muestral o estimador puntual de
En general, representa cualquier parmetro poblacional como, por
ejemplo, la media poblacional, la desviacin estndar poblacional, la
proporcin poblacional, etc.;

Insesgadez
Se denomina sesgo de un estimador a la diferencia entre la
esperanza (o valor esperado) del estimador y el verdadero valor
del parmetro a estimar. Es deseable que un estimador sea
insesgado o centrado, es decir, que su sesgo sea nulo por ser
su esperanza igual al parmetro que se desea estimar.
Si el valor esperado del estadstico muestral es igual al
parmetro poblacional que se estudia, se dice que el estadstico
muestral es un estimador insesgado del parmetro poblacional.
Por tanto, el valor esperado, o media, de todos los posibles
valores de un estadstico muestral insesgado es igual al
parmetro poblacional que se estudia.

Insesgo de la Media aritmtica


con lo que, al aplicar las propiedades de linealidad de la
esperanza matemtica se tiene que:

Eficiencia
Diremos que un estimador es ms eficiente o ms preciso que otro
estimador, si la varianza del primero es menor que la del segundo.
Por ejemplo, si
y
son ambos estimadores de
diremos que es ms eficiente que un estimador
es ms
eficiente (ms preciso), por tanto, cuanto menor es su varianza.
La eficiencia de los estimadores est limitada por las
caractersticas de la distribucin de probabilidad de la muestra de
la que proceden
Si un estimador insesgado alcanza una cota mnima, entonces se
dice que el estimador es de mnima varianza dentro de los
estimadores insesgados, pudiendo existir estimadores sesgados
con varianza menor.

Consistencia
Si no es posible emplear estimadores de mnima
varianza, el requisito mnimo deseable para un
estimador es que a medida que el tamao de la
muestra crece, el valor del estimador tienda a ser el
valor del parmetro, propiedad que se denomina
consistencia. Existen diversas definiciones de
consistencia, ms o menos restrictivas, pero la ms
utilizada es la denominada consistencia

cuando en media

cuando
cuadrtica que exige que:

Robustez
El estimador ser un estimador robusto del parmetro
si la violacin de los supuestos de partida en los que se
basa la estimacin (normalmente, atribuir a la poblacin
un determinado tipo de funcin de distribucin que, en
realidad, no es la correcta), no altera de manera
significativa los resultados que ste proporciona.

Suficiencia
Se dice que un estimador es suficiente cuando resume
toda la informacin relevante contenida en la muestra,
de forma que ningn otro estimador pueda proporcionar
informacin adicional sobre el parmetro desconocido
de la poblacin. Por ejemplo, la media muestral sera un
estimador suficiente de la media poblacional, mientras
que la moda no lo sera.

Invarianza
Se dice que un estimador es invariante cuando el
estimador de la funcin del parmetro coincide con la
funcin del estimador del parmetro

Ejemplo.- Si para estimar la varianza poblacional


utilizamos la varianza muestral, entonces para estimar la
desviacin tpica poblacional ser razonable utilizar la
desviacin tpica muestral.

Otros mtodos de muestreo


Para que se puedan obtener conclusiones fiables para la poblacin
a partir de la muestra, es importante tanto su tamao como el
modo en que han sido seleccionados los individuos que la
componen.
El tamao de la muestra depende de la precisin que se quiera
conseguir en la estimacin que se realice a partir de ella. Para su
determinacin se requieren tcnicas estadsticas superiores, pero
resulta sorprendente cmo, con muestras notablemente pequeas,
se pueden conseguir resultados suficientemente precisos. Por
ejemplo, con muestras de unos pocos miles de personas se pueden
estimar con muchsima precisin los resultados de unas votaciones
en las que participarn decenas de millones de votantes.

Muestreo aleatorio estratificado


En el muestreo aleatorio estratificado los elementos de la poblacin
primero se dividen en grupos, a los que se les llama estratos, de manera
que cada elemento pertenezca a uno y slo un estrato.
La base para la formacin de los estratos, que puede ser departamento,
edad, tipo de industria, etc., est a discrecin de la persona que disea
la muestra. Sin embargo, se obtienen mejores resultados cuando los
elementos que forman un estrato son lo ms parecido posible.
Una vez formados los estratos, se toma una muestra aleatoria simple
de cada estrato. Existen frmulas para combinar los resultados de las
muestras de los varios estratos en una estimacin del parmetro
poblacional de inters.

Diagrama de muestreo estratificado

Ejemplo 1
Se quiere realizar un estudio en una poblacin de 250
nios, tomando una muestra de 61 nios. Sin embargo
este estudio est directamente relacionada con la edad.
Sabiendo que 110 tienen menos de 4 aos, 70 nios
de 4-5 aos, 45 nios de 6-7 aos y 25 son de ms de
ocho aos, determine el nmero de cada grupo

ni=n*Ni/N
Para el primer estrato se tomar:
n=61, N=250, N1= 110
n1=61*110/250= 27
Para el segundo estrato se tomar:
n=61, N=250, N2= 70
n2=61*70/250 = 17
Para el tercer estrato se tomar:
n=61, N=250, N3= 45 --- > n3=11
Para el cuarto estrato se tomar:
n=61, N=250, N4= 25 --- > n4=6

Ejemplo 2
Estamos interesados en estudiar el grado de aceptacin que la
evaluacin a los docentes ha tenido entre los padres de una
determinada provincia. A tal efecto seleccionamos una muestra
de 600 sujetos. Conocemos por los datos del ministerio que de
los 10000 nios escolarizados en las edades que nos interesan,
6000 acuden a colegios pblicos, 3000 a colegios privados y
1000 a colegios religiosos. Como estamos interesados en que en
nuestra muestra estn representados todos los tipos de colegio,
realizamos un muestreo estratificado empleando como variable
de estratificacin el tipo de centro educativo.

solucin
Por consiguiente, calculamos que proporcin supone
cada uno de los estratos respecto de la poblacin para
poder reflejarlo en la muestra.
Colegios pblicos: 600x6000/10000=360 sujetos
Colegios privados: 600x3000/10000=180 sujetos
Colegios religiosos: 600x1000/10000= 60 sujetos

Muestreo por conglomerados


El muestreo por conglomerados es una tcnica que aprovecha la
existencia de grupos o conglomerados en la poblacin que representan
correctamente el total de la poblacin en relacina la caracterstica que
queremos medir. Dicho de otro modo, estos grupos contienen toda la
variabilidad de la poblacin. Si esto sucede, podemos seleccionar
nicamente algunos de estos conglomerados para realizar el estudio.
Una de las principales aplicaciones del muestro por conglomerados es el
muestreo de reas, en el que los conglomerados son las manzanas de una
ciudad u otras reas bien definidas. El muestreo por conglomerados
requiere, por lo general, tamaos de muestra mayores que los requeridos
en el muestreo aleatorio simple o en el muestreo aleatorio estratificado

Ventajas y desventajas del


muestreo por conglomerados
seleccionar un conglomerado a estudiar suele ser ms fcil y
econmico que hacer una muestra aleatoria o sistemtica. Hemos
visto por ejemplo que usar conglomerados geogrficos puede
representar un importante ahorro en desplazamientos de personas.
estudios a travs de Internet en los que se sigue pensando en
trminos de estudiar slo unas zonas geogrficas, cuando en realidad
a travs de Internet no obtenemos ningn beneficio operativo; al
contrario, incurrimos en mayor riesgo de tener menor precisin por
diferencias entre las regiones estudiadas y el resto de la poblacin
Como principal inconveniente, al usar muestreo por conglomerados
corremos un riesgo importante: que los conglomerados no sean
realmente homogneos entre ellos

EJEMPLO de Muestreo por


Conglomerado
En una investigacin en la que se trata de conocer el grado de
satisfaccin laboral los profesores de instituto necesitan una
muestra de 700 sujetos. Ante la dificultad de acceder
individualmente a estos sujetos se decide hacer una muestra por
conglomerados. Sabiendo que el nmero de profesores por
instituto es de 35, los pasos a seguir seran los siguientes:

1. Recoger un listado de todos los institutos.


2. Asignar un nmero a cada uno de ellos.
3. Elegir por muestreo aleatorio simple o sistemtico los 20
institutos (700/35=20) que nos proporcionarn los 700
profesores que necesitamos

Muestreo sistemtico
Consistente en escoger un individuo inicial de forma aleatoria entre la
poblacin y, a continuacin, seleccionar para la muestra a cada ensimo
individuo disponible en el marco muestral.
1. Elaboramos una lista ordenada de los N individuos de la poblacin,
lo que sera el marco muestral.
2. Dividimos el marco muestral en n fragmentos, donde n es el tamao
de muestra que deseamos. El tamao de estos fragmentos ser K=N/n
donde K recibe el nombre de intervalo o coeficiente de elevacin.
3. Obtenemos un nmero aleatorio entero A, menor o igual al intervalo.
Este nmero corresponder al primer sujeto que seleccionaremos para la
muestra dentro del primer fragmento en que hemos dividido la poblacin.
4. Seleccin de los n-1 individuos restantes: A, A + K, A + 2K, A + 3K,
., A + (n-1)K

Ejemplo
Supongamos que tenemos un marco muestral de 5.000
individuos y deseamos obtener una muestra de 100 de
ellos. Dividimos en primer lugar el marco muestral en
100 fragmentos de 50 individuos. A continuacin
seleccionamosunnmero aleatorio entre 1 y 50, para
extraer el primer individuo al azar del primer
fragmento: por ejemplo el 24. A partir de este individuo,
queda definida la muestra extrayendo los individuos de
la lista con intervalos de 50 unidades, tal y como sigue
24, 74, 124, 174, , 4.974

EJEMPLO de M. por conglomerados


En una investigacin en la que se trata de conocer el grado de
satisfaccin laboral los profesores de instituto necesitan una
muestra de 700 sujetos. Ante la dificultad de acceder
individualmente a estos sujetos se decide hacer una muestra por
conglomerados. Sabiendo que el nmero de profesores por
instituto es de 35, los pasos a seguir seran los siguientes:

1. Recoger un listado de todos los institutos.


2. Asignar un nmero a cada uno de ellos.
3. Elegir por muestreo aleatorio simple o sistemtico los 20
institutos (700/35=20) que nos proporcionarn los 700
profesores que necesitamos

Muestreo de conveniencia
Los mtodos de muestreo hasta ahora vistos se conocen
como tcnicas probabilisticas de muestreo.
Los elementos seleccionados de una poblacin tienen una
probabilidad conocida de ser incluidos en la muestra.
El muestreo de conveniencia es una tcnica de muestreo
no probabilistica. Como el nombre lo indica, la muestra se
determina por conveniencia. Los elementos se incluyen en la
muestra sin que haya una probabilidad previamente
especificada o conocida de que sean incluidos en la muestra.

Ejemplos de muestreo por


conveniencia
Un profesor que realiza una investigacin en una universidad
puede usar estudiantes voluntarios para que constituyan una
muestra; la razn para elegirlos? simple, los tiene al alcance y
participarn como sujetos a un costo bajo o sin costo.
De manera similar, un inspector puede muestrear un
cargamento de naranjas seleccionando al azar naranjas de
varias de las cajas. Marcar cada naranja y usar un mtodo
probabilstico de muestreo puede no resultar prctico. Muestras
como los paneles de voluntarios en investigaciones sobre los
consumidores son tambin muestras de conveniencia.

Muestreo subjetivo
Otra tcnica de muestreo no probabilstica es el muestreo
subjetivo. En este mtodo la persona que ms sabe sobre un
asunto selecciona elementos de la poblacin que considera los
ms representativos de la poblacin. Este mtodo suele ser
una manera relativamente fcil de seleccionar una muestra.
Por ejemplo, un reportero puede seleccionar dos o tres
senadores considerando que estos senadores reflejan la
opinin general de todos los senadores. Sin embargo, la
calidad de los resultados muestrales depende de la persona
que selecciona la muestra. Aqu tambin hay que tener mucho
cuidado al hacer inferencias acerca de las poblaciones a partir
de muestreos subjetivos.

muestreo por cuotas


Esta tcnica es la que suele usarse en investigacin
online a travs de paneles.Podemos ver el muestreo
por cuotas como la versin no probabilstica del
muestreo estratificado.
1. Segmentacin, dividimos la poblacin objeto de
estudio en grupos de forma exhaustiva (todos los
individuosestn en un grupo) y mutuamente exclusiva
(un individuo slo puede estar en un grupo), de forma
similar a la divisin en estratos empleada en el
muestreo estratificado
2.Fijamos el tamao de las cuotas, fijamos el
objetivo de individuos a encuestar para cada uno de
estos grupos

muestreo por bola de nieve


Es una tcnica de muestreo no probabilstica en la que los individuos
seleccionados para ser estudiados reclutan a nuevos participantes
entre sus conocidos. El nombre de bola de nieve proviene
justamente de esta idea: del mismo modo que una bola de nieve al
rodar por una ladera se va haciendo ms y ms grande, esta tcnica
permite que el tamao de la muestra vaya creciendo a medida que
los individuos seleccionados invitan a participar a sus conocidos.
La bola de nieve funciona especialmente bien cuando el rasgo
distintivo de la poblacin que queremos estudiar tiende a agrupar a
dichos individuos, a favorecer su contacto social. Es algo ms
habitual de lo que podra parecer a simple vista

Вам также может понравиться