Вы находитесь на странице: 1из 142

UNIDAD 5

DISTRIBUCIONES
MUESTRALES
Antes de seguir adelante es
conveniente de que Usted tenga
en claro lo que ya vio.-
Si hacemos una recapitulación
de lo que hemos visto hasta
ahora podemos observar tres
temas bien diferentes.-
El primero es la Estadística
Descriptiva y en ella se aprende
una serie de técnicas para
organizar, presentar, analizar e
interpretar un conjunto finito de
observaciones, que según el
objetivo del estudio pueden
constituir una población o una
muestra.-
El segundo tema fue el cálculo
de probabilidades y en esta parte
se define la probabilidad como
una medida de la posibilidad de
ocurrencia de un experimento
aleatorio, extendiendo la noción
de frecuencia relativa a las
poblaciones finitas.-
Luego el tercer tema fue las distribuciones de
probabilidad y a través de ellas se presentan
modelos matemáticos teóricos del
comportamiento (en términos probabilísticos)
de las poblaciones.- Cada distribución surge
como consecuencia de hipótesis establecidas
sobre el comportamiento del fenómeno aleatorio
analizado.- Estas hipótesis son las que permiten
identificar una población con las
correspondientes distribuciones y a su vez cada
distribución depende de parámetros
matemáticos cuyo valor hemos supuesto
conocido.
A partir de este momento vamos a estudiar
métodos que nos permita obtener los valores de
los parámetros poblacionales basándonos en los
resultados de la muestra, y se podrá ver la
integración de los tres grandes temas antes
mencionados.-

Los resultados que en el


se expone se utilizarán
una y otra vez en los
Esta Unidad es métodos a desarrollar
en las Unidades
necesariamente
siguientes.-
teórica.-
Es necesario destacar la
importancia de un
entendimiento claro de estas
distribuciones muestrales ya
que este concepto es la clave
para comprender la
Inferencia Estadística.-
MUESTREO
DE UNA
POBLACION
A menudo utilizamos muestras en lugar de toda la población porque
el costo y el tiempo necesario para medir todos los elementos de la
población seria prohibitivos.- Además en algunos casos la medición
requiere la destrucción de los elementos.- En general, se consigue
una precisión mayor extrayendo con cuidado una muestra aleatoria
de la población, que dedicando los recursos a medir todos sus
elementos.- La precisión es mayor por dos razones:

En primer lugar, a En segundo lugar como


menudo es muy difícil veremos en esta Unidad,
obtener y medir a todos pueden utilizarse muestras
los elementos de una bien seleccionadas para
población, e incluso realizar estimaciones medidas
cuando es posible, el de las característica de la
costo es muy alto población que son muy
cuando la población es cercanas a los valores reales.-
grande.-
La forma como se selecciona una muestra se
llama Plan de Muestreo o Diseño Experimental y
determina la cantidad de información en la
muestra.-
Conocer el plan de muestreo usado en una
situación particular le permitirá medir la
confiabilidad o bondad de su inferencia.-

Las muestras ideales para este fin


es la:

MUESTRA ALEATORIA
SIMPLE.-
Muestra aleatoria simple.-

Supongamos que queremos seleccionar una muestra de


n objetos de una población de N objetos.- Se selecciona
una muestra aleatoria simple tal que todos los objetos
tienen la misma probabilidad de ser seleccionados y se
seleccionan independientemente, es decir, la selección
de un objeto no altera la probabilidad de que sean
seleccionados otros objetos.- Las muestras aleatorias
simples son el ideal.- En algunos estudios por muestreo
del mundo real, los analistas desarrollan métodos
alternativos para reducir el costo del muestreo.- Pero la
base para saber si estas estrategias alternativas son
aceptables es el grado en que los resultados se
aproximan a los de una muestra aleatoria.-
Es importante que una muestra represente al conjunto de
la población.- Por ejemplo, si un director de marketing
quiere evaluar las reacciones a un nuevo producto
alimenticio, no muestrea únicamente a sus amigos y
vecinos.- Es improbable que las opiniones de esos
grupos representen las de toda la población y es
probable que estén concentradas en un intervalo más
reducido.- Para evitar estos problemas seleccionamos
una muestra aleatoria simple.- El muestreo aleatorio es
nuestra póliza de seguro contra la posibilidad de que los
sesgos personales influyan en la selección.-
El muestreo aleatorio simple puede realizarse de varias
manera, lo más común es poner en una bolsa papelitos
con números de los N miembros de la población y luego
mezclar bien y seleccionar papelitos sin mirar.- (Esto es
poco posible si la población es muy grande).-
En la práctica, solemos utilizar números aleatorios para
seleccionar objetos a los que podemos asignar un valor
numérico.- Por ejemplo, los grupos de estudios de
mercado pueden utilizar números aleatorios para
seleccionar números de teléfonos a los que llamar y
preguntar por las preferencias por un producto.-
Algunos paquetes estadísticos y hojas de cálculo tienen
rutinas para obtener números aleatorios, que se utilizan
generalmente en la mayoría de los estudios por
muestreo.- Estos números aleatorios generados por
ordenador tienen las propiedades necesarias para
elaborar muestras aleatorias.- Las organizaciones que
necesitan muestras aleatorias de grandes poblaciones
humanas, por ejemplo los candidatos políticos que tratan
de averiguar las preferencias de los votantes, recurren a
empresas profesionales de muestreo, que se dedican a
seleccionar y gestionar el proceso de muestreo.-
Un buen muestreo exige mucho trabajo y un elevado
costo.-
Aquí centramos la atención en los métodos para analizar
los resultados de muestras aleatorias simples con el fin
de obtener información sobre la población.- Este proceso
sobre el que nos extenderemos en las Unidades
siguientes, se conoce con el nombre de Inferencia
Clásica.- Sin embargo, existen otros métodos de
muestreo, que es posible que en algunas circunstancias
se prefieran a otros métodos de muestreo.-

Las muestras aleatorias protegen contra la posibilidad de


que algún grupo de la población este subreprentado en la
muestra.- Si una población se muestrea repetidamente
utilizando métodos de muestreo aleatorio, ningún
subgrupo específico esta sobrerepresentado o
subrepresentado en la muestra.-
Además , el concepto de distribuciones en el
muestreo me permite averiguar la probabilidad de
obtener una determinada muestra.-
Utilizamos la información muestral para hacer inferencias
sobre la población de la que procede la muestra.- La
distribución de todos los valores de interés de esta
población pueden representarse por medio de una
variable aleatoria.- Sería demasiado ambicioso intentar
describir toda la distribución poblacional basándonos en
una pequeña muestra aleatoria de observaciones.-
Sin embargo, podemos muy bien hacer inferencias
bastantes sólidas sobre importantes características de la
distribución poblacional, como la media y la variancia
poblacional.-
Por ejemplo, dada una muestra aleatoria del consumo de
combustible de 20 automóviles de un determinado
modelo, podemos utilizar la media y la variancia muestral
para hacer inferencias sobre la media y variancia
poblacional del consumo de combustible.- Esta
inferencia se basará en la información muestral.-

Podemos hacernos preguntas como la siguiente:

“Si el consumo de combustible, en kilómetros por


litro, de la población de todos los automóviles de
un determinado modelo tiene una media de 25
litros y una desviación estándar de 2 litros”;

¿Cuál es la probabilidad de que el consumo medio


muestral de combustible de los automóviles de una
muestra aleatoria de 20 sea de menos de 24 kilómetros
por litro?
A continuación veremos que podemos utilizar la
distribución de la media muestral en el muestreo para
responder a esta pregunta.-

Necesitamos distinguir entre los atributos de la


población y los atributos de la muestra aleatoria.- En el
párrafo anterior, la población de mediciones del consumo
de combustible de todos los automóviles de un
determinado modelo, sigue una distribución que tiene
una determinada media.- Esta media, un atributo de la
población, es un número fijo (pero desconocido).-
Hacemos inferencias sobre este atributo extrayendo una
muestra aleatoria de la población y calculando la media
muestral.- Cada muestra que extraigamos tendrá una
media muestral distinta y la media muestral puede
considerarse, como una variable aleatoria con una
distribución de probabilidad .-
La distribución de las medias muestrales posibles
constituye la base para realizar inferencias sobre la
muestra.-

En esta Unidad se utiliza la distribución


muestral o distribuciones en el muestreo
para contestar preguntas de probabilidad acerca
de los estadísticos muestrales.- Recordemos
que vimos anteriormente que en la Estadística
Descriptiva, la media, mediana, la variancia, el
desvío estándar, son estadísticos que se
obtienen de la muestra.-
Veamos entonces que es
una DISTRIBUCION
MUESTRAL

La distribución de todos los valores posibles


que puede asumir un estadístico calculado a
partir de muestras del mismo tamaño,
seleccionado aleatoriamente de la población
se llama DISTRIBUCION MUESTRAL DE
ESE ESTADISTICO.-
DISTRIBUCIONES
MUESTRALES:
Elaboración

Las distribuciones muestrales pueden construirse


empíricamente a partir de poblaciones finitas.- Para
ello, se procede como sigue:

1.- De una población finita de tamaño N, se extraen de manera


aleatorias todas las muestras posible de tamaño n.-
2.- Se calcula el estadístico de interés para cada muestra.-
3.- Se ordena en una columna los distintos valores observados del
estadístico y en otra columna, las frecuencias de ocurrencia
correspondientes de cada valor observado.-
Elaborar la distribución muestral es
una tarea muy complicada si la
población es de un tamaño muy
grande e imposible si la población
es infinita.- En último caso, es
posible obtener aproximaciones de
las distribuciones muestrales
tomando un gran número de
muestras de un tamaño dado.-
DISTRIBUCIONES
MUESTRALES:
Características
importantes:

Normalmente para una distribución muestral se tiene


interés en conocer tres cosas:

Media
Variancia

Forma funcional Desviación


(grafica) estándar
DISTRIBUCION DE
LA MEDIA DE LA
MUESTRA
A CONTINUACIÓN VEAMOS UN EJEMPLO DE
CÓMO ELABORAR ESTA DISTRIBUCION
SIGUIENDO LOS PASOS ANTES MENCIONADOS:
(en la practica profesional nunca puede hacer esto)

Consideremos una población de tamaño N = 5, la cual


se compone de los años de antigüedad en la empresa de
cinco empleados.- Las antigüedades en años son las
siguientes; 6, 8, 10, 12, 14.-
Calculemos la media y la variancia de la población
como sabemos:

Σxi Σ (xi – μ)²


μ= = 10 σ² = =8
N N
Supongamos que elegimos todas las
posibles muestras de tamaño n = 2 de la
población de tamaño N = 5 que
determinamos antes.-
La tabla A muestra todas las posibles
muestras de tamaño 2.-
Las muestra que están arriba y debajo de
la diagonal principal resultan cuando el
muestreo es sin reemplazo.- Las medias
de las muestras están entre paréntesis.-
TABLA A
SEGUNDA SELECCION
6 8 10 12 14
1º 6 6;6 6,8 6;10 6;12 6;14
S (6) (7) (8) (9) (10)
E
L
8 8;6 8,8 8;10 8;12 8;14
E (7) (8) (9) (10) (11)
C 10 10;6 10,8 10;10 10;12 10;14
C (8) (9) (10) (11) (12)
I
12 12;6 12;8 12;10 12;12 12;14
O
N (9) (10) (11) (12) (13)
14 14;6 14;8 14;10 14;12 14;14
(10) (11) (12) (13) (14)
En este ejemplo se observa que cuando el muestreo se hace con
reemplazos, hay 25 muestras posibles.- En general, cuando el
muestreo se lleva a cabo con reemplazos, el número de muestras
posible es igual a N n
Puede construirse la distribución muestral de media ordenando los
diferentes valores de media en una columna y sus frecuencias de
ocurrencia en la otra, tal como mostramos a continuación:
MEDIAS FRECUENCIA FREC. RELATIVA
6 1 1/25
7 2 2/25
8 3 3/25
9 4 4/25
10 5 5/25
11 4 4/25
12 3 3/25
13 2 2/25
14 1 1/25
TOTAL 25 1,00
En la tabla se aprecian los datos que satisfacen los
requerimientos para la distribución de probabilidad.- Las
probabilidades individuales todas son mayores de 0 y la
suma de todas ellas me da 1,00.-
Se mencionó al principio que un interés principal radica
en la forma funcional de la distribución, su media y la
variancia.-
fx fx
Distribución
Distribución de muestral de x
la población

1
x
6 8 10 12 14 6 7 8 9 10 11 12 13 14
DISTRIBUCION MUESTRAL DE X: forma funcional

En las figuras anteriores observamos que el gráfico en la población


esta distribuido uniformemente, en la distribución muestral va
tomando una forma cada vez más similar a la normal.-

DISTRIBUCION MUESTRAL DE X: la media

El paso siguiente es calcular la media de la distribución muestral.-

Σ x
μx = =
250
= 10
25 25

Observamos que la media de la distribución


muestral me da igual a la media de la población,
esto no es casualidad, siempre es así.-
DISTRIBUCION MUESTRAL DE X: variancia.-

Σ ( x - μ )²
σ² = x = 100/25 = 4
x 25

También se puede advertir que la variancia de la


distribución muestral no es igual a la variancia de la
población, sin embargo, es interesante observar que la
variancia de la distribución muestral es igual a la
variancia de la población dividida entre el tamaño de la
muestra utilizada para obtener la distribución muestral.-
Esto es:
σ²
σ² = = 8/2 = 4
x n
A la raíz cuadrada de la variancia de la distribución
muestral, se le conoce como error estándar de la
media.-

σ σ
Entonces: σ²x = σx =
n n

Estos resultados no son coincidencia sino


ejemplos de las características de las
distribuciones muestrales en general, cuando el
muestreo es con reemplazo o cuando se
efectúan a partir de una población infinita.-
Para generalizar, se debe distinguir
entre dos situaciones;

Muestreo a partir de una población que


sigue una distribución normal

Muestreo a partir de una población que


no sigue una distribución normal.-
DISTRIBUCION MUESTRAL DE X:
muestreo a partir de poblaciones que
siguen una distribución normal.-

Cuando el muestreo se realiza a partir de una población


que sigue una distribución normal, la distribución de la
media de la muestra tiene las siguientes propiedades:

1.- La distribución de la media será normal.-


2.- La media de la media de la distribución muestral
será igual a la media de la población de la
cual proviene la muestra.-
3.- La variancia de la distribución muestral será igual
a la variancia de
la población dividida entre el tamaño de la muestra.-
DISTRIBUCION MUESTRAL DE X: muestreo a
partir de poblaciones que no siguen una
distribución normal.-
Cuando el muestreo se hace a partir de una población
que no sigue una distribución normal, se utiliza un
teorema matemático conocido como teorema central
del límite.- La importancia de este teorema en la
inferencia estadística se resume en el siguiente párrafo:

Dada una población de cualquier


forma funcional no normal con una
media μ y variancia finita σ², la
distribución muestral de la media x,
será casi normal con media μx y
variancia σ²/n cuando la muestra es
muy grande.-
Observamos que el Teorema Central del Limite permite
tomar muestras a partir de la poblaciones con distribución
no normal y garantizar que se obtengan
aproximadamente los mismos resultados que si la
población tuviera una distribución normal, siempre que se
tome una muestra grande.-
La importancia de esto se demostrara más adelante al
estudiar que una distribución muestral con distribución
normal es una herramienta importante en la inferencia
estadística.-

En el caso de la media de la muestra, se tienen la


seguridad de que la distribución muestral está
distribuida en forma al menos aproximadamente
normal con tres condiciones:
1.- Cuando se hace el muestreo a partir de una población
con distribución normal.-
2.- Cuando se hace el muestreo a partir de una población
que no exhibe una distribución normal y la muestra es
grande.-
3.- Cuando se hace el muestreo a partir de una
población cuya forma funcional se desconoce, siempre
que el tamaño de la muestra sea grande.-

Al llegar a este punto, nos surge una pregunta lógica

¿Qué tan grande debe ser la


muestra para que el teorema
central del límite sea aplicable?.-
No existe una sola respuesta, pues el tamaño de
la muestra depende de la condición de no
normalidad en la población.- Una regla empírica
establece que, en la mayoría de las situaciones
prácticas, una muestra de tamaño 30 es
suficiente.- Es decir,

n ≥ 30 normalidad

En general, la aproximación a la normalidad de la


distribución muestral de X llega a ser mucho
mejor a medida que crece el tamaño de la
muestra.-
MUESTREO SIN REEMPLAZO.-

Los resultados anteriores se han dado con la premisa de


que el muestreo es con reemplazo o que la muestra fue
extraída de una población infinita.- En general, no se
efectúan muestreo con reemplazo, y en muchos casos
prácticos, el muestreo debe hacerse a partir de una
población finita; por lo tanto, es necesario conocer el
comportamiento de la distribución muestral de la media
de la muestra con estas condiciones.-
Antes de hacer cualquier afirmación general, conviene
revisar nuevamente los datos de la tabla que vimos al
comienzo.- Las media de la muestra que resulta cuando
el muestreo es sin reemplazo se presentan sobre la
diagonal principal que son las mismas que se presentan
por debajo de dicha diagonal, siempre y cuando se
ignore el orden en que se hicieron las observaciones.-
Se observa que hay 10 muestras posibles.- En general,
cuando se extraen sin reemplazo muestras de tamaño n a
partir de una población finita de tamaño N y se ignora el
orden en que son extraídas las muestras, se obtiene el
numero posible mediante la combinación de N casos
tomados de n a la vez.- El siguiente ejemplo se tiene que:

N! 5!
CN =
n = = 10
n! (N-n)! 2! 3!

La media de las 10 medias muestrales es:

Σx 7 + 8 + 9 + 10 + 9 + 10 + 11 + 11 + 12 +13
= = 10
μx =
10 10
Nuevamente se aprecia que la media de la distribución
muestral es igual a la media de la población.-

La variancia de la distribución muestral se calcula como


sigue;
Σ ( xi - μx)²
σ²x = = 30/10 = 3
10

En esta ocasión se observa que la variancia de la


distribución muestral no es igual a la variancia de la
población dividida entre el tamaño de la muestra, sin
embargo, existe una relación interesante que se descubre
al multiplicar,
σ² N-n 8 5-2
= = 3
n N-1 2 4
Este resultado indica que si se multiplica la variancia de la
distribución muestral que se obtendrá si el muestreo fuese
con reemplazo por el factor (N-n)/(N-1), se obtiene el valor
de la variancia de la distribución muestral que resulta
cuando el muestreo es sin reemplazo.- Es posible
generalizar estos resultados con el siguiente enunciado:

Cuando el muestreo es sin


reemplazo a partir de una
población finita, la distribución
muestral de x tendrá una media μ
y una variancia;
σ² N-n
n N-1
Si el tamaño de la muestra es muy grande, el teorema
central del límite es aplicable y la distribución muestral de
la media será aproximadamente normal.-

Corrección por población finita

Al factor (N-n) / (N-1) se le llama factor de corrección


por población finita y se puede omitir cuando el
tamaño de la muestra es pequeño en comparación con el
tamaño de la población.- Cuando la población es mucho
mayor que la muestra la diferencia entre usar o no el
factor es insignificante.-
La mayoría de los Estadísticos no usamos el factor a
menos que la muestra sea de más de 5% de la
población.- Es decir, la corrección por población finita
generalmente se ignora cuando n/N ≤ 0,05.-
APLICACIÓN.- Como veremos en
Unidades siguientes, el conocimiento
y la comprensión de las distribuciones
muestrales son necesarias para
entender los conceptos de la
inferencia estadística.- La aplicación
más sencilla para la distribución
muestral de la media de la muestra es
el cálculo de la probabilidad de
obtener una muestra con una media
de alguna magnitud especificada.-
USO DE LA
DISTRIBUCION
MUESTRAL
DE LA MEDIA
La importancia de lo que venimos discutiendo hasta ahora
puede reconocerse solo si se recuerda que muchas de las
decisiones que tomamos se toman en base a los
resultados muestrales.-
Por ejemplo, un gerente administrativo puede tomar una
muestra de un producto para determinar si cumple o no
con ciertas especificaciones de producción.- Un agente de
gobierno tomará una muestra de los residentes para
decidir si cierto plan tributario producirá el efecto
esperado; cierta empresa desea implementar un programa
nuevo de trabajo y ver si producirá el efecto esperado en la
producción, etc.-

Como se dijo, las muestras tienen un impacto muy directo


y consecuencial en las decisiones que se toman.-
Por tanto, toda conclusión que se saque o todo conocimiento que
se tenga respecto a una muestra es muy importante.- Una
aplicación muy común y de gran utilidad en una distribución
muestral es la de determinar la probabilidad de que una media
muestral clasifique dentro de un cierto rango planteado.-

Dado que la distribución muestral estará


distribuida normalmente pues;

a) La muestra se toma de una población que se


distribuye como normal,

a) b) n  30 y el teorema central del límite garantiza la


normalidad en el proceso de muestreo, la desviación
normal puede usarse para ganar información esencial
para el proceso de toma de decisiones.-
Al desarrollar la
distribución normal,
vimos como usar la
normal estandarizada
(Z), en una distribución
muestral usamos el
mismo procedimiento,
pero modificamos el Z.-
Muchas de las decisiones en las empresas
depende de una muestra completa, entonces la
formula de reconversión estará dada por:

x
Z
 x

El valor de interés en el numerador no es una


observación única de X, sino la media de n
observaciones.- Además, el denominador no es la
desviación estándar poblacional , sino que el
error estándar de la distribución muestral  x.-
VEAMOS ESTE EJEMPLO:
Telecom Satelital es una empresa de Telecomunicación que presta
servicios en ciertas ciudades.- Los funcionarios de la empresa han
aprendido que la transmisión satelital promedio es de 150
segundos con una desviación estándar de 15 segundos.- Los
tiempos parecen estar distribuidos normalmente.- Plantea instalar
nuevos equipos que mejorarían la eficiencia de sus operaciones.-
Sin embargo, antes que los ejecutivos puedan decidir si dicha
inversión será eficaz en función de los costos debe determinar la
probabilidad de que la media de la muestra de n = 35,

a) Este entre 145 y 150


b) Sea mayor que 145
c) Sea menor que 155
d) Esté entre 145 y 155
e) Sea mayor que 155

SOLUCION
a) P(145 ≤ x ≤ 150).-

Calculamos x 145  150


Z   1.97
 x 15 / 35

P(145 ≤ x ≤ 150) = 0.50 - F(-1,97) = 0.50 - 0.0244


= 0,4756

145 150 X
b) P(x  145)
x 145  150
Z   1.97
Calculamos
 x 15 / 35

P ( x  145) = 1,00 - F (- 1,97) = 1,00 - 0,0244 = 0,9756

145 150 X
Así, con el mismo criterio se
seguirán calculando el resto de los
incisos, quedando ellos para
ejercitación del alumno.-

Lo importante que con esta


información Telecom puede tomar
decisiones más inteligente
respecto a la necesidad de nuevos
equipos.-
Veamos otro ejemplo.-

Supongamos que la empresa que usted


asesora produce productos
manufacturados, las ventas mensuales
sigue una distribución normal con media
de 186,6$ (en miles) y una desviación
estándar de 12,7$.- ¿Cuál es la probabilidad
de que una muestra aleatoria de tamaño 10
meses de esta población tenga una media
mayor que 190$ ?.-
Solución
Se sabe que la muestra individual que se estudia es solo
una de todas las muestras posibles de tamaño 10 que
pueden ser extraídas de la población, de modo que la
media a la que conduce es una de las x que forman
parte de la distribución muestral de x, que , teóricamente
podría inferirse de esa población.-
Cuando se dice que la población tiene una distribución
aproximadamente normal, se supone que la distribución
muestral de x sigue para fines prácticos una distribución
normal.- También se sabe que la media y la desviación
estándar de la distribución muestral son iguales a 186,6 $
y σ/ √n = 12,7 / √10 = 4,02 respectivamente.-
Se supone que la población es grande con respecto a la
muestra, de manera que el factor de corrección para
población finita puede omitirse.-
Hemos aprendido que siempre que se tenga una
variable aleatoria con distribución normal esta
puede transformarse en una distribución normal
estandarizada.- Entonces debemos obtener
nuestra Z con las transformaciones antes
planteadas y luego realizar el cálculo como
hemos visto oportunamente.-
Entonces,
x - μx
Z=
σ / √n
x
185,6 190
0 1,09 Z

P (x ≥ 190) = P ( Z ≥ 1,00) = 1 - F ( 1,09) =


= 1 - 0,8621 = 0,1379
 14 %
Veamos otro ejemplo del valor práctico
de la distribución muestral de la media.-
-.Para que los alumnos discutan.-

Al director de personal de cierta empresa multinacional muy


importante se le ha asignado la tarea de elaborar un perfil de los 2500
gerentes de la empresa.- Las características por identificar son, entre
otras, el sueldo anual promedio y la proporción de gerentes que
terminaron el programa de adiestramiento de la empresa.-
Si definimos a los 2500 gerentes como la población a estudiar,
podemos determinar el salario anual y el estado de adiestramiento en
el programa para cada individuo, consultando los registros del
personal que tiene la empresa.- Supongamos que ya se hizo lo
anterior y que contamos con información de todos los 2500 gerentes.-
Si empleamos las formulas que vimos en Unidades anteriores para
calcular la media de la población y la desviación estándar poblacional,
que resultaron ser:
μ = 51800 dólares y σ = 4000 dólares.-
Sabemos que tanto μ como σ , son parámetros (características de
la población).-
El asunto que deseamos considerar es como el director de personal
puede obtener estimados de esos parámetros poblacionales con una
muestra de gerentes, en lugar de hacerlo con los 2500 individuos
de la población.- Supongamos que se usara una muestra de 30
gerentes.- Es claro que el tiempo y el costo de desarrollar un perfil
para 30 gerentes serían mucho menores que para toda la población.-
Si el director de personal pudiera estar seguro de que la nuestra de
30 gerentes suministra la información adecuada sobre la población
de 2500 gerentes, preferirá trabajar con la muestra que con toda la
población.-
Empezará su investigación obteniendo la muestra de los 30
gerentes, aplicando un muestreo simple aleatorio (como hemos
visto).- Se calcula el valor de la media de la muestra para estimar ,
la media de la población, no podemos esperar que la media de la
muestra sea exactamente igual a la media de la población.-
Vimos que el valor absoluto de la diferencia entre
la media de la muestra y la media de la población
me daba el error muestral.-
La razón práctica de que nos interesa la
distribución muestral de x es que la podemos
usar para determinar información probabilística
acerca del tamaño del error de muestreo, ya que
no lo podemos calcular porque desconocemos la
media de la población.-.
Supongamos que el director de personal cree
que la media de la muestra será un estimado
aceptable de la media de la población si el
promedio muestral dista menos de 500$ del
promedio poblacional.-
En términos de probabilidad, lo
que le preocupa en realidad al
director es la siguiente pregunta,

¿Cuál es la probabilidad de que la media


de la muestra que obtengamos de una
muestra aleatoria simple de 30 gerentes
esté dentro del intervalo de 500 dólares
alrededor de la media de la población?
Como hemos identificado las propiedades de la
distribución muestral de x, usaremos esa información
para contestar la pregunta.- La distribución muestral,
será;

X
51300 51800 52300

 4000
x n

30
 730,30 μX = 51800 dól.-
El director de personal pregunta sobre la probabilidad de
que la media de la muestra sea entre 51300 y 52300
dólares.- Si el valor de la media de la muestra de X esta
en ese intervalo, se aproximará a 500 dólares de la media
poblacional.- La probabilidad correspondiente es el área
de la distribución muestral que vimos en la figura
anterior.-
Como la distribución muestral es normal, con promedio de
51800 y desviación estándar 730,30, podemos usar la tabla
de la distribución de probabilidad normal estandarizada,
para calcular el área.-
Tendremos;
x 51300  51800
Z   0,68
 x
730,30

P( 51300 ≤ x ≤ 52300) = 0,7518 - 0,2482 = 0,5036


Esto nos indica que una muestra aleatoria simple de 30
gerentes de la multinacional tiene una probabilidad de
0,50 de dar como resultado una media de la muestra que
quede a 500$ o menos de la media poblacional.-

En otras palabras, una muestra aleatoria simple de 30


gerentes tiene una probabilidad de 50 a 50 de quedar
dentro de los 500$ alrededor de la media poblacional.-
Quizás deba tomar la decisión de aumentar el tamaño de
la muestra para lograr obtener datos para tomar
decisiones más seguras.-

Seguramente al aumentar por ejemplo el tamaño de


muestra n =100, la probabilidad de obtener una media de
muestra dentro de los márgenes pedidos, respecto a la
media de la población sea mayor.-
EJERICICIO PARA HACER EN CLASE

Supóngase que los incrementos salariales porcentuales


anuales de los directores generales de todas las
empresas de tamaño medio siguen una distribución
normal que tiene una media de 12,2 por ciento y una
desviación estándar de 3,6 por ciento.- Se extrae una
muestra aleatoria de nueve observaciones de esa
población y se calcula la media muestral.- ¿Cuál es la
probabilidad de que la media muestral sea inferior a un
10 por ciento?.-
Solución
Resp: 0.0336
2.- Un fabricante de bujías sostiene que la duración de
sus bujías siguen una distribución normal que tiene una
media de 36000 kilómetros y una desviación estándar de
4000 kilómetros.- Una muestra aleatoria de 16 bujías
tenía una duración media de 34500 kilómetros.- Si la
afirmación del fabricante es correcta, ¿Cuál es la
probabilidad de obtener una media muestral de 34500 o
menos kilómetros?.-
Solución
Repta: 0,0668
3.- La duración de la enfermedad de Alzheimer desde el
inicio de los síntomas hasta la muerte varía de tres a
20 años; el promedio es ocho años con una
desviación estándar de cuatro años.- El administrador
de un centro médico selecciona al azar, de la base de
datos del centro médico, los expedientes de 30
pacientes que murieron de Aizheimer y anota la
duración media.-
Encuentre las probabilidades aproximadas para estos
eventos:
a) La duración promedio es menor que 7 años.-
b) Excede 7 años.-
c) La duración promedio queda dentro del intervalo de 1
año de la media poblacional 8.-
Rpta: a) 0.0853 b) 0.9147 c) 0.8294
4.- Para evitar dificultades con la Oficina de Protección al
Consumidor, un embotellador debe asegurarse que las
botellas de 12 onzas en realidad contenga esa cantidad
de bebida.- Para determinar si una máquina
embotelladora está trabajando satisfactoriamente, el
embotellador muestrea al azar 10 botellas por hora y
mide la cantidad de bebida en cada una.-La media x de
las 10 botellas de llenado se usa para decidir si se
reajusta la cantidad de bebida con que la máquina llena
cada botella.- Si en los registros se observa que la
cantidad de llenado por botella tiene una distribución
normal, con una desviación estándar de 0,2 onzas y si se
ajusta la embotelladora para producir un llenado medio
por botella de 12,1 onzas.-
¿Cuál es la probabilidad aproximada de que la media
muestral de las 10 botellas de prueba sea menor que 12
onzas?.-
LA DISTRIBUCION
DE LAS
PROPORCIONES
MUESTRALES
Hasta ahora la discusión se concentro exclusivamente en
las media de los asuntos que se tratan en la
administración, negocios, economía, etc., muchas veces
en ellos interesa la proporción “P” de la población.-

Una firma de marketing puede querer averiguar si un


cliente compra o no un producto, un banco puede estar
interesado en determinar su un depositante pedirá o no un
crédito para auto, muchas firmas deben determinar la
probabilidad de que un proyecto para presupuestar
capitales generará o no un rendimiento positivo, etc.-

En todos estos casos se usa la proporción muestral p


para hacer inferencias sobre la proporción poblacional.
“P”.- Podemos predecir que en cada repetición del
proceso obtendremos un valor distinto de la proporción
muestral p.-
La distribución de probabilidad de todos los valores
posibles de esa proporción p se llama distribución de
la proporción muestral.-
La distribución de probabilidad binomial según vimos
implica determinar las probabilidades de diferentes
números de éxitos en un experimento binomial.- La
distribución binomial es una distribución de probabilidad
discreta que indica la probabilidad de “x” éxitos en “n”
pruebas de un experimento binomial, donde cada prueba
tiene dos resultados posibles, éxitos y fracasos.-
x
p = -------
n
Esta fórmula nos muestra que para una muestra de n
pruebas de un experimento binomial, la proporción de
éxitos, el estadístico p, se calcula dividiendo el número
de éxitos “x” entre el número de pruebas “n”.-
Para determinar lo cercano que esta la proporción
muestral p de la proporción poblacional “P”
necesitamos comprender las propiedades de la
distribución muestral de p, su valor esperado, su
desviación estándar y la forma de la distribución.-
El valor esperado de p, la media de todos los valores
posibles de p, se puede expresar como,

E (p) = P

La ecuación anterior nos expresa que la media de todos


los valores posible de p es igual a la proporción P de la
población y esto siempre es así.-
La desviación estándar de p se llama error estándar de
la proporción.- Igual que en caso de las medias de la
muestra x, el error estándar de la proporción depende si
la población es finita o infinita, entonces:
p(1  p ) N n
 p

n
*
N 1
para poblacione s finitas. -

p (1  p )
p n
para poblacione s infinitas. -

Al comparar estas dos fórmulas, vemos que la diferencia


es el empleo del factor de corrección para
poblaciones finitas.-
Como en el caso de la media de muestra x, vemos que
la diferencia entre las ecuaciones para poblaciones finitas
e infinita se hace despreciable si el tamaño de la
población finita es grande en comparación con el tamaño
de la muestra.- Seguiremos la misma regla que
recomendamos antes.-
Como ya conocemos el promedio y la
desviación estándar de la proporción muestral
p, debemos conocer ahora la forma de la
distribución.- Al aplicar el Teorema Central del
Límite a p se tiene que la distribución
muestral de p se puede aproximar con una
distribución normal de probabilidad, siempre
que el tamaño de muestra sea grande.- En el
caso de p, se puede considerar que el tamaño
de muestra es grande cuando se cumple las
dos siguientes condiciones:

nP  5 y n (1- P)  5
Esto es, si la población es
infinita y n/N ≤ 0,05 usamos el
error estándar de la proporción
sin el factor de corrección, sin
embargo, si la población es finita
y la relación es n/N  0,05, se
debe usar el factor de
corrección.-
Sabemos que la aproximación
normal puede mejorar con la
corrección por continuidad, un
mecanismo que hace un ajuste en el
caso de que una distribución
continua se aproxime a una
distribución discreta.- En el caso de
estudio de proporción de una
población, estas son muy grandes y
la corrección no aporta diferencia y
por lo tanto la podemos obviar.-
Veamos un ejemplo, con valores irreales solo para
entender los conceptos elementales vistos.- Recuerde que
esto en la práctica profesional no se puede hacer.-

Casa Garbarino pregunta a toda la población de


clientes N = 4, si vieron el anuncio de ofertas,
publicitado en el diario del día.- Se registra una
respuesta de SI como éxito y de NO como
fracaso.- Los cuatro clientes respondieron: S1 N2
N3 S4.-

La proporción poblacional de éxito es P = 0.50.- Si


tomamos muestras de tamaño n = 2, la cantidad de
muestras será igual a las combinaciones de cuatro
elementos tomados de a dos, que me da igual a 6, la
proporción de éxitos se registra como sigue en la
siguiente tabla:
Xi Nº de éxitos Proporción de éxitos

S1N2 1 0.50

S1N3 1 0.50

S1S4 2 1.00

N2N3 0 0.00

N2 S3 1 0.50

N2 S4 1 0.50

Total ---------------------- 3.00


El valor esperado, media de distribución muestral de la
proporción muestral es;

 p 3
μp = E(p) = ------------- = ------ = 0.50 = P
K 6

Tenemos que calcular ahora el error estándar de la


proporción muestral, que será;


P ( 1 - P)
p

n
Observo si n / N  0.05 es este caso no necesito el
factor de corrección para poblaciones finitas, en
cambio si n / N  0.05 si lo debo usar al calcular el error
estándar de la proporción muestral.-

En nuestro caso n / N = 2 / 4 = 0.50  0.05


Luego:

p ( 1 - p) N-n 0.50 * 0.50 42


 p

n N -1

2
*
4 1
 0.2888
Las herramientas recientemente desarrolladas
para las proporciones muestrales permiten
determinar las probabilidades que pueden ser
muy útiles en la toma de decisiones
importantes.- Esto se logra aplicando la
distribución normal a la distribución muestral
de proporciones muestrales, como veremos en
el punto siguiente.-

p - P
Z = -----------------
p
VALOR PRÁCTICO DE
LA DISTRIBUCION
MUESTRAL DE LA
PROPORCIÓN
MUESTRAL.-
Siempre que se selecciona una muestra aleatoria
simple y que el valor de la proporción de la
muestra p se usa para estimar el valor de la
proporción poblacional P, podemos predecir que
hay cierto error de muestreo.- En este caso, el
error de muestreo es el valor absoluto de la
diferencia entre el valor de la proporción
muestral p y la proporción poblacional P.-

El valor práctico de la distribución muestral de p


es que se puede usar para proporcionar
información probabilística acerca del error de
muestreo.-
Veamos un ejemplo.-
El director de personal de cierta multinacional se le ha
asignado la tarea de elaborar un perfil de los 2500
gerentes de la empresa.- La característica por identificar
es la proporción de gerentes que terminaron el programa
de adiestramiento administrativo de la empresa.- Si
definimos a los 2500 gerentes como la población a
estudiar y sabemos que 1500 han terminado el programa
de adiestramiento.- Se saca una muestra de 30 gerentes
y sabemos que de ellos 19 han terminado el programa de
adiestramiento.-
Supongamos que el director de personal desea conocer
la probabilidad de obtener un valor de p que se acerque
a 0,05 o más de la proporción poblacional de gerentes
que participaron en el programa de adiestramiento.-
Esto es, ¿Cuál es la probabilidad de obtener
una muestra con proporción muestral p entre
0,55 y 0,65?.-
Usando el hecho de que la distribución
muestral p se puede aproximar con una
distribución normal de probabilidad con
promedio P = 0.60 y p = 0,0894, entonces
será:

0.55  0.60
Zi   0.56
0.0894
P( 0.55  p  0.65) = 0.7123 - 0.2877
= 0,4246

0,55 0,60 0,65 p

La probabilidad de seleccionar una muestra


que de cómo resultado una proporción
muestral más cercano que 0.05 a la proporción
poblacional P es del 42%.-
Veamos otro ejemplo práctico.- El 5% de los
cinescopio que la compañía Audio Films hace para
monitores de PC son devuelto por el fabricante de
monitores como defectuosos.- Este hecho preocupa a
Audio Films, en especial después de leer un artículo en la
revista PC Word, sobre la guía a los compradores de
monitores súper VGA.- Audio Films considera que es
esencial mejorar su desempeño de calidad si quiere
continuar suministrando cinescopios a la industria.-
Después de iniciar su programa de mejora de calidad,
Audio Films obtendrá una muestra de cinescopios para
verificar si la calidad se ha elevado.- Se elegirá una
muestra de 125 cinescopios del almacén durante unos
cuantos días.- ¿Cuál es la probabilidad de que más del
8% sean defectuosos, suponiendo que la tasa global de
unidades defectuosas es todavía el 5%?.-
Solución

0 .05 * 0 .95
p
  0 .0195 donde P  0.05
125

p P 0 .08  0 .05
Z    1,54
 p
0.0195

P( p 0.08) = 1 - F(1,54) =
= 1 - 0.9382 = 0.0618

Hay una probabilidad de alrededor del 6% de que


el 8% de los cinescopios o más sean
defectuosos, suponiendo que la tasa de defectos
de la población es del 5%.-
EJEMPLO 3.- Rosales SRL, adquiere componentes para
sus teléfonos celulares en lotes de 200 de una firma en
Buenos Aires.- El componente tiene una tasa de defectos
del 10%.- Una política establecida recientemente por
Rosales SRL establece que si el siguiente envió tiene:
a) Más del 12 % de defectos, definitivamente buscará un
nuevo proveedor.-
b) Entre el 10 y el 12 % de defectos (inclusive),
considerará un nuevo proveedor.-
c) Entre el 5 y el 10% de defectos (inclusive),
definitivamente no conseguirá un nuevo proveedor.-
d) Menos del 5 % de defectos, incrementará sus
pedidos.-
¿ Cual decisión es más probable que tome Rosales
SRL?.-
Debido a que el tamaño de la población no se suministra,
se asume que Rosales SRL compra muchos componentes
y el tamaño de la muestra de n = 200 es menor que 0,05 N
y por lo tanto no se necesita el factor de corrección para
poblaciones finitas.-

σp = 0,1 0,9


= 0,021
200

a) P (p > 0,12) = 0,1711


b) P ( 0,10 ≤ p ≤ 0,12) = 0,3289
c) P ( 0,05 ≤ p ≤ 0,10) = 0,4913
d) P ( p < 0,05) = 0,0087

Como la parte c) tiene la probabilidad más alta. Rosales


SRL se quedará con su proveedor actual.-
EJEMPLO 4.- En una encuesta se pregunto a 500
madres y padres acerca de la importancia de los
deportes para muchachos y chicas.- De los padres
entrevistados, 60% estaba de acuerdo en que los
géneros son iguales y debían tener las mismas
oportunidades para participar en los deportes.-
Describa la distribución muestral de la proporción P de
padres que están de acuerdo en que los géneros son
iguales y deberían tener las mismas oportunidades.-
Suponga que la proporción P de padres e la población
es en realidad 0.55.- ¿Cuál es la probabilidad de
observar una proporción muestral tan grande como o
mayor que el valor observado p = 0.60?.-
ANEXO
(PARA LEER)
TIPOS DE METODOS DE MUESTREO

El proceso de muestreo comienza con localización de


las fuentes adecuadas de datos, como listados de
población, registros, directorios y otras fuentes
llamadas MARCOS.- Las muestras se extraen de estos
marcos.- Si el marco es inadecuado debido a que ciertos
grupos de individuos o de objetos en la población no se
incluyeron de manera apropiada, entonces las muestras
serán inexactas y sesgadas.-

Recordemos que las razones para obtener una muestra


son:
1.- Una muestra requiere menos tiempos que un censo.-
2.- Cuesta menos administrar una muestra que un censo.-
3.- Administrar una muestra es menos tedioso y más practico que
administrar el censo de una población estadística determinada.-
Tipos de muestras utilizadas

No Probabilísticas Probabilísticas

Muestra subjetiva Aleatoria simple

Sistemática
Muestra por cuota

Estratificada
Por grupo naturales
Por
conglomerados
MUESTRA ALEATORIA SIMPLE.-
Una muestra aleatoria simple, es aquella en la cual cada
individuo o elemento de una población tiene la misma
oportunidad de ser elegido.- Además, cada muestra de un
tamaño fijo tiene la misma probabilidad de ser elegida,
que cualquier otra muestra del mismo tamaño.- El
muestreo aleatorio simple, es la técnica de muestreo
aleatorio más elemental y constituye la base para otras
técnicas.-
En el muestreo aleatorio simple, se usa n para
representar el tamaño de la muestra y N para representar
el tamaño de la población.- Cada persona o elemento en
el marco se enumera de 1 a N.-
La probabilidad de seleccionar a cualquier miembro en
particular de la población la primera vez es igual a 1/N.-
Existen dos métodos básicos para seleccionar muestras:

Sin
reemplazo
El muestreo con reemplazo, implica que una vez
seleccionada una persona o elemento, se regresa al
marco donde tiene la misma probabilidad de ser elegida
de nuevo.- Imagine que tiene una urna con 500 tarjetas de
presentación.- Suponga que en el primer sorteo sale la
ficha de Juan Llanos.- La información pertinente se
registra y se regresa la tarjeta a la urna.- Después se
mezclan bien las tarjetas y se saca una segunda tarjeta,.
En esta segunda extracción Juan Llanos, tiene la misma
probabilidad de salir 1/N, de ser elegida de nuevo.- Se
repite el procedimiento hasta alcanzar el tamaño muestra
n deseado.- Sin embargo, suele considerarse más
adecuado tener una muestra de personas o elementos
diferentes en lugar de permitir la repetición de
mediciones de la misma persona o elemento.-
En el muestreo sin reemplazo, no se regresa la
persona o elemento al marco una vez seleccionado y por
lo tanto, no puede elegirse otra vez.- Como antes, en el
muestreo sin reemplazo la probabilidad de que algún
miembro específico de la población, por ejemplo Juan
Llanos, sea elegido en el primer intento es 1/N.- La
probabilidad de que, cualquier individuo no
seleccionado, salga elegido en el segundo intento será 1 /
N-1.- Este proceso continua hasta alcanzar el tamaño de
muestra n deseado.-

Sin importar si el muestreo es con o sin reemplazo,


los métodos de urna para elegir una muestra tienen
un gran inconveniente: la habilidad para revolver
perfectamente las tarjetas y elegir la muestra en
forma aleatoria.- Como resultado, los métodos de
urna no son muy útiles.- Son preferibles otros
métodos de selección con menos problemas y
mejor base científica.-
Uno de estos métodos utiliza una TABLA DE
NUMEROS ALEATORIOS, para obtener la
muestra.- Una tabla de números aleatorios esta
formada por una serie de dígitos que se generan
en forma aleatoria y se colocan en la secuencia
en que se generaron.- Hay muchas tablas de
números aleatorios, como la que veremos en
práctica.- De hecho, lo normal es que los
investigadores antes de usar una tabla de
números aleatorio verifiquen la aleatoriedad de
los dígitos generados antes de emplearlos.-
Debido a que cada dígito o secuencia de dígitos
de la tabla es aleatorio, se puede leer en sentido
horizontal o vertical.-
Para usar una tabla como la que vemos en práctica en
lugar de una urna para seleccionar una muestra,
primero debemos asignar números de códigos a los
miembros individuales de la población.- Entonces se
obtiene la muestra aleatoria leyendo la tabla y
seleccionando los elementos del marco de población
cuyos números de código coinciden con los dígitos
encontrados en la tabla.- Para entender mejor, hagamos
un ejemplo con el curso.-
Hoy gracias a los avances de los paquetes estadísticos
de PC, las tablas se usan menos.- Los programas tienen
una secuencia para generar los números aleatorios que
se necesita.-
MUESTRA SISTEMATICA.-
En una muestra sistemática, se dividen N individuos o
elementos del marco poblacional en k grupos, dividiendo
el tamaño de la población N entre el tamaño de la muestra
deseado n.- Es decir, k = N / n donde k se
redondea al entero más cercano.-
Para obtener una muestra sistemática, el primer individuo
o elemento se selecciona al azar entre los k individuos o
elementos del primer grupo del marco de población y,
para el resto de la muestra se elige un individuo o
elemento cada k en la lista completa de la población.-
Cuando el marco de población consiste en listados
predeterminados es más rápido y fácil obtener una
muestra sistemática que una muestra aleatoria simple.-
En estas situaciones la muestra sistemática es un
mecanismo conveniente para obtener los datos
deseados.-
Aunque su aplicación es más sencilla, en general los métodos de
muestreo aleatorio simple y de muestreo sistemático son menos
eficientes que otros métodos de muestreo probabilístico más
elaborado.- Es decir, para cualquier muestra que se adquiere
mediante muestra aleatorias simple o muestreo sistemático, los
datos obtenidos pueden o no ser buena representación de las
características fundamentales (parámetros) de la población.-
Aunque la mayor parte de las muestras aleatorias simples son
representativas de la población correspondiente, no es posible saber
si una muestra en particular es, de hecho representativa.-.-
Se presentan posibilidades todavía mayores de un sesgo en la
selección y una falta de representatividad de las características de la
población, en el muestreo sistemático.- Si existiera un padrón en el
listado del marco de población, podría ocurrir errores de selección
importantes.- Para evitar el problema potencial de la
representatividad desproporcionada de grupos específicos en una
muestra, se pueden usar los métodos de muestreo estratificado o
muestreo conglomerado.-
MUESTRA ESTRATIFICADA.-
En una muestra estratificada, primero se dividen los N individuos o
elementos de la población en sub poblaciones separadas, o estratos,
de acuerdo con algunas característica común.- Se realiza un
muestreo aleatorio simple en cada estrato y después se combinan
los resultados de las muestras aleatorias simple.-

Estos métodos de muestreo son más eficientes


que el muestreo aleatorio simple o el sistemático,
porque garantizan la representación de individuos
o elementos de toda la población, lo que asegura
una mayor precisión en las estimaciones de los
parámetros poblacionales fundamentales.- Lo que
proporciona la presición, una vez combinados los
estratos, es la homogeneidad de individuos o
elementos dentro de cada estrato.-
MUESTRA CONGLOMERADA.-
En una muestra conglomerada, se divide los N individuos o
elementos de la población en varios conglomerados, de manera que
cada conglomerado sea representativo de la población completa.-
Después, se obtiene una muestra aleatoria de los conglomerados y
se estudian todos los individuos o elementos dentro de cada
conglomerado seleccionado.- Los conglomerados pueden ser
asignaciones naturales, como departamentos, ciudades, manzanas,
familias o edificio de departamento, etc.-

Los métodos de muestreo conglomerados pueden ser más eficientes


(con relación a su costo) que los métodos de muestreo aleatorio
simple, sobre todo si la población en cuestión se encuentra esparcida
en una vasta región geográfica.- Sin embargo, los métodos de
muestreo conglomerado tienden a ser menos eficientes que los
métodos de muestreo aleatorio simple o de muestreo estratificado, y
necesitan una muestra total más grande para obtener resultados tan
precisos como los que se obtienen con los procedimientos más
eficientes.-
EVALUACION DEL VALOR DE UNA ENCUESTA.-

Casi todos los días leemos o escuchamos hablar de resultados de


una encuesta.- Es evidente que los avances tecnológicos de las
comunicaciones han provocado una gran proliferación de
investigaciones mediante encuestas, sin embargo, no todas son
aceptables significativas e importantes.-

Para evitar encuestas carentes de objetividad o


credibilidad, debe evaluarse con sentido crítico
todo lo que se lee y escucha, además debe
examinarse el valor de la encuesta.- En primer
lugar se evalúa el propósito de la encuesta, por
que y para quién se realiza.-
En segundo lugar, se debe evaluar si esta basada
en una muestra probabilística o no.- Recuerde que
el único medio disponible para hacer inferencia
estadística correcta a partir de una muestra es que
esta sea probabilística.-
Las encuestas que emplean métodos no probabilísticos están
sujetas a errores importante, quizás no intencionales, que pueden
generar resultados sin sentido.-

ERRORES EN LAS ENCUESTAS

Aún cuando en las encuestas se utilicen


métodos de muestreo probabilístico están
sujetos a errores potenciales.-
Hay cuatro tipos de errores de encuestas.-
Con las encuestas correcta se diseñan
modelos para reducir o disminuir los
diferentes errores de las encuestas, los
cuales suelen tener un costo considerable
Los errores de las encuestan son:

1.- Errores de cobertura.-


2.- Errores o sesgos de no respuestas.-
3.- Errores de muestreo.-
4.- Errores de medición.-

ERRORES DE COBERTURA.-
La clave para una selección apropiada en la muestra es un marco de
población adecuado o una lista actualizada, de todos los sujetos
que participarán en el muestreo.- El error de cobertura ocurre si se
excluyen ciertos grupos de sujetos de las lista de población, de
manera que no tienen oportunidad de ser seleccionado en la
muestra.- El error de cobertura conduce a un sesgo de selección.-
Si el listado es inadecuado porque no se incluyeron algunos grupos
o sujetos de la población, cualquier muestra probabilística aleatoria
proporcionará una estimación de las características del marco, no
de la población real.-
ERRORES DE NO RESPUESTA.-
No todas las personas están dispuestas a contestar una encuesta.-
De hecho, la investigación indica que los individuos de las clases
económicas alta y bajas tienden a responder con menos frecuencia
que los individuos de clase media.- El error de no respuesta surge
del fracaso al recopilar datos de todos los sujetos de la muestra y
el resultado es un error de no respuesta.- Como el general, no se
puede suponer que las personas que no responden son semejantes
a aquellas que si responden, es en extremo importante dar
seguimiento a las no respuestas después de un período específico.-
Deberán varios intentos, ya sea por correo, teléfono o con
encuestador, para convencerlos y que cambien de opinión.- Con
base a estos resultados, las estimaciones obtenidas con las
respuestas iniciales se combinan con las estimaciones obtenidas
con el seguimiento, de manera que la inferencias hechas a partir de
la encuesta sean válidas.- El modo de respuesta afecta la tasa de
respuesta.- La entrevista personal y por teléfono casi siempre
producen una respuesta más alta que la encuesta por correo, pero a
un costo más elevado.-
ERRORES DE MUESTREO.-
Existen tres razones principales para extraer una
muestra en lugar de hacer un censo completo: es más
rápido, menos costo y más eficientes.- Sin embargo, en
el marco de la población el azar determina quién estará
o quién no estará incluido.- El error de muestreo refleja
la heterogeneidad o las diferencias aleatorias, de una
muestra a otra según la probabilidad de que individuos
o elementos específicos sean seleccionados en una
muestra determinadas.- Como se observa los resultados
de sondeo que se publican en revistas y diarios, se
hacen referencia a un margen de error por ejemplo de ±
4 porciento del valor real.- Este margen de error es el
error de muestreo.- Este error se puede reducir con
tamaños de muestras más grande, aunque esto
incrementa el costo de la encuesta.-
EL ERROR DE MEDICIÓN.-
Cuando se quiere realizar una buena investigación por
medio de encuestas, se diseña un cuestionario que
permita reunir información importante.- Los datos
obtenidos deben ser válidos; es decir, las respuestas
correctas deben ser evaluadas y plantearse de manera
que arrojen medidas significativas.-
Pero existe un dilema, es más fácil decir que se obtienen
mediciones significativas que el simple hecho de
obtenerlas.- Por desgracia, las realizaciones de
mediciones está gobernada por lo que es conveniente,
no por lo que se necesita.- Con bastante frecuencia, las
mediciones que se obtienen son solamente más
aproximadas de las mediciones que se desean en
realidad.-
El error de medición se refiere a la falta de precisión
en las respuestas registradas, debido a fallas en la
redacción del enunciado de las preguntas, la influencia
del entrevistador en la persona que responde o por el
esfuerzo que realiza la persona que responde.- Se le ha
dado mucha atención al error de medición que ocurre
por fallas de redacción en el enunciado de las
preguntas.-
Una pregunta debe ser clara, no ambigua.- Debe
presentarse en forma objetiva y neutral, se debe evitar
la pregunta guiada.-
Existe tres fuentes de errores en la medición:
redacción ambigua de la pregunta, efecto halo, y
errores de la persona que contesta.-
El efecto halo se presenta cuando la
persona que responde se siente obligada
a complacer al entrevistador.- Este tipo de
error puede minimizarse con la
capacitación adecuada en la realización
de entrevistas.-
El error que proviene de la persona que
responde se produce cuando ésta realiza
un esfuerzo demasiado grande o
demasiado pequeño.- Existen dos formas
para minimizar esta clase de error: 1)
mediante una revisión cuidadosa de los
datos y un nuevo o visita a aquellos
individuos cuyas respuesta parecen raras
y 2) al establecer un programa de
llamadas aleatorias para verificar la
confiabilidad de las respuestas.-
EJERCICIOS
Ejercicio 1.- Para estimar la edad media de una
población de 4000 empleados, se selecciona
una muestra aleatoria simple de 40 empleados.-
a)¿Usaría usted el factor de corrección por
población finita para calcular el error estándar
de la media? Explique por qué.-
b)Si la desviación estándar de la población es σ =
8,2 años, calcule el error estándar, aplicando y
sin aplicar el factor de corrección por población
finita.- ¿Cuál es el criterio para no tomar en
cuenta ese factor siempre que n/N ≤ 0,05?.-
Ejercicio 2.- Se informa en la revista Mercado que entre
sus suscriptores, los que planean comprar un
automóvil nuevo durante los próximos 12 meses
pretenden gastar un promedio de 27100$.- Suponga
que el precio del nuevo vehículo, para la población de
suscriptores de Mercado tiene una media de μ =
27100$ y que su desviación estándar es de σ = 5200$.-
a) ¿Cuál es la probabilidad de que el precio de la media
de la muestra del nuevo vehículo quede a 1000$ o
menos de la media de la población, si la muestra es de
30 suscriptores?.-
b) ¿Cuál es la probabilidad de que el precio de la media
de la muestra del nuevo vehículo quede a 1000$ o
menos de la media de la población, si la muestra es de
50 suscriptores?.-
c) ¿Cuál es la probabilidad de que el precio de la media
de la muestra del nuevo vehículo quede a 1000$ o
menos de la media de la población, si la muestra es
de 100 suscriptores?.-

d) ¿Recomendaría usted un tamaño muestral de 30, 50


o 100, si se desea tener una probabilidad mínima de
0,90 de que ese precio quede a 1000$ o menos de la
media de la población?.-

Solución
Ejercicio 3.- La compañía de baterías B afirma que sus baterías tienen
una vida media de 60 meses y una desviación estándar de 9
meses.- Un grupo de consumidores que está poniendo a prueba
esta afirmación compra 36 baterías y determina la vida media.-
a) Calcule el error estándar de la media.-
b) Suponiendo que lo que afirma B es cierto.- ¿Cuál es la
probabilidad de que la vida media de la muestra sea menor que
58?.-
c) Determine la probabilidad de que la vida media de la muestra esté
entre 57 y 63.-
d) Suponga que la vida media de la población real de las baterías de
B es de 55 meses.- Averigüe la probabilidad de que la vida media
de la muestra sea por lo menos 60.-
e) Si la media muestral del grupo de consumidores es de 55.- ¿A que
conclusiones llegaría usted si fuera el analista?.-
Solución
Ejercicio 4.- Una población se compone de las siguientes unidades
producidas hoy por cuatro trabajadores:
Trabajadores A B C D
Unidades producidas 5 3 7 8
a) Calcule la media y la desviación estándar de la población.-
b) Elabore una tabla que presente todas las muestras posibles de
dos elementos (muestreo con reemplazo).-
c) Calcule la media de cada una de las muestras de tamaño dos.-
d) Calcule la media de esta distribución muestral.- ¿Es igual esta
media a la media de la población?.-
e) Calcule el error estándar de esta distribución muestral .-
f) Calcule la desviación estándar de la distribución muestral de las
medias.- ¿Es esta desviación estándar igual al error estándar de la
media?.-
g) ¿Qué distribución tiene menor variabilidad, la distribución
poblacional o la distribución muestral de las medias de la
muestras?.-
Ejercicio 5.- La AFIP está considerando una campaña
publicitaria en el programa de televisión Noche de Goles,
que se transmite los días martes.- El martes pasado este
programa tuvo un porcentaje de participación en el rating
global de 25.- Lucia Gómez, la directora de relaciones
públicas de la AFIP sospecha que el porcentaje real es
menor que el 25%.- Contrata a una agencia de
investigación independiente para tomar una muestra
aleatoria de 750 televidentes que estén viendo la
televisión el martes pasado.- La agencia encuentra que
175 estaban viendo Noche de Goles.- ¿Presenta estos
datos suficiente evidencia para contradecir los rating
dados por la empresa que los mide?.-
Solución
Ejercicio 6.- Los registros de inversiones muestran que
la tasa promedio de rendimiento para las firmas que
están en la industria de consumo es del 30 %, con una
desviación estándar del 12%.- Si se selecciona una
muestra de 250 de tales firmas.- ¿Cuál es la probabilidad
de que la media de estas firmas exceda el 31%?.-
Solución
Ejercicio 7.- Solo el 22% de todos las firmas en la
industria de bienes de consumo comercializa sus
productos directamente con el consumidor final.- Si una
muestra de 250 firmas revela una proporción de más del
20% que se compromete en el mercadeo directo, usted
planea hacer su siguiente compra a las firmas de esta
industria.- ¿Qué tan probable es que usted gaste su
dinero bien ganado en otras parte?.-
Solución
8.- La Asociación de consumidores de productos
manufacturados, informa que el 76 % de los
consumidores leen los ingredientes que aparecen en la
etiqueta de los productos que ofrecen.-
Suponga que la proporción de población es P = 0,76 y que
de la población se selecciona una muestra de 400
consumidores.-
a) Describa la distribución de la proporción muestral p.,
que es la proporción en la muestra de consumidores
que leen la lista de ingredientes.-

b) ¿Cuál es la probabilidad de que la proporción muestral


este a  0,03 de la proporción poblacional?.-

c) ¿Cuál es la probabilidad de que la proporción muestral


este a  0,03 de la proporción poblacional, pero para un
tamaño de muestra n = 750 consumidores?.-
9.- Carlos Toledo, presidente de cierta empresa
de telefonía , esta molesto por el número de
teléfonos producidos por su empresa que tienen
auriculares defectuosos.- En promedio, 110
teléfonos al día son devueltos por este problema,
con una desviación estándar de 64.-El señor
Toledo ha decidido que ordenará la cancelación
del proceso a menos que puedan estar 80%
seguro de que en promedio, no se devolverán
más de 120 teléfonos al día durante los
siguientes 48 días.- ¿Terminará ordenando la
cancelación del proceso?.-
10.- Para una población de N = 250 que sigue una
distribución normal con una media de 60 y una
desviación estándar de 5,0, determine el error estándar
de la media de una distribución muestral basada en los
siguientes tamaños de muestra, si el muestreo se hace
sin reemplazo:
a) n = 10 b) n =50 c) n = 100

11.- El salario por hora en la planta de Laboratorios Bagó


para los 500 empleados tiene un promedio de 8,50$ con
una desviación estándar de 2,20$.- Determine la
probabilidad de que el salario medio de una muestra de
100 trabajadores sea:

a) Más de 9,00$.-
b) Entre 8,15 y 8,40$.-
12.- Un investigador informa que los resultados de una
encuesta diciendo que el error estándar de la media es
igual a 20.- La desviación estándar de la población es
de 500.-

a) De que tamaño fue la muestra que se uso en esta


encuesta.-
b) ¿Cuál es la probabilidad de que el estimado quede a ±
25 de la media poblacional?.-

Solución

Repta: a) 625 b= 0,7888


13.- Café La Virginia SA, está considerando la posibilidad
de abrir un negocio de cafés en la ciudad A, ciudad de
50000 habitantes.- Según algunos estudios de mercado
realizados anteriormente, sus negocios tendrán éxito
en las ciudades de ese tamaño si la renta anual per
cápita es de más de 60000$.- También se sabe que la
desviación estándar de la renta es de 5000$.- Se ha
obtenido una muestra aleatoria de 36 personas y la
renta media es de 62300$.- ¿Constituye esta muestra
una prueba para concluir que debe abrirse un
negocio?.-

Solución

Resp: 0.0029
14.- Cuando un proceso de producción funciona
correctamente, el número de unidades producidas por
hora sigue una distribución normal que tiene una
media de 92,0 y una desviación estándar de 3,6.- Se ha
tomado una muestra aleatoria de cuatro horas
distintas.-

a) Halle la media de la distribución de las medias


muestrales en el muestreo.-
b) Halle la variancia de la media muestral.-
c) Halle el error estándar de la distribución muestral.
d) ¿Cuál es la probabilidad de que la media muestral se
de más de 93,0 unidades?.-

Solución
15.- La duración de las lámparas de un fabricante tiene
una media de 1200 horas y una desviación estándar de
400 horas.- La población sigue una distribución
normal.- Suponga que compra nueve lámparas que
puede considerarse que son una muestra aleatoria de
la producción del fabricante.-
a) ¿Cuál es la media de la media muestral de la
duración?.-
b) ¿Cuál es la variancia de la media muestral?.-
c) ¿Cuál es el error estándar de la media muestral?.-
d) ¿Cuál es la probabilidad de que esas nueve lámparas
tengan en promedio una duración de menos de 1050
horas?.-

Solución
16.- El precio medio de ventas de las viviendas nuevas
fue en una ciudad de 115000 $ durante un año.- La
desviación estándar poblacional fue de 25000$.- Se
extrajo una muestra aleatoria de 100 viviendas nuevas
de esta ciudad.-
a) ¿Cuál es la probabilidad de que la media muestral de
los precios de venta fuera de más de 110000$?.-
b) ¿Cuál es la probabilidad de que la media muestral de
los precios de venta estuvieran comprendida entre
113000 y 117000$?.-
c) ¿Cuál es la probabilidad de que la media muestral de
los precios de venta estuvieran comprendida entre
114000 y 116000$?.-
d) Suponga que una vez realizados estos cálculos un
amigo le dijera que es casi seguro que la distribución
de los precios de venta de las viviendas nuevas de
esta ciudad no sea normal.- ¿Qué respondería?.-
17.- Se ha tomado una muestra aleatoria de 16 directores
de empresas de una gran ciudad para estimar el
tiempo medio que tardan diariamente en desplazarse
al trabajo.- Suponga que el tiempo poblacional sigue
una distribución normal que tiene una media de 87
minutos y una desviación estándar de 22 minutos.-
a) ¿Cuál es el error estándar de la media muestral de los
tiempos de desplazamiento?.-
b) ¿Cuál es la probabilidad de que la media muestral sea
de menos de 100 minutos?.-
c) ¿Cuál es la probabilidad de que la media muestral sea
de más de 80 minutos?.-
d) ¿Cuál es la probabilidad de que media muestral esté
fuera del intervalo 85; 95 minutos?.-

Solución
18.- En un curso de Economía hay 250 estudiantes.- Se
pide a cada miembro de una muestra aleatoria de 50
de estos estudiantes que estime la cantidad de tiempo
que ha dedicado a hacer los ejercicios que puso el
profesor la semana pasada.-
Suponga que la desviación estándar poblacional es de
30 minutos.-
a) ¿Cuál es la probabilidad de que la media muestral sea
más de 2,5 minutos superior a la media poblacional?.-
b) ¿Cuál es la probabilidad de que la media muestral sea
más de 5 minutos inferior a la media poblacional?.-
c) ¿Cuál es la probabilidad de que la media muestral
difiera en más de 10 minutos de la media
poblacional?.-

Resp: a) 0.2546 b) 0.0951 c) 0.0086


18 (bis).- El presidente de Distribuidores Díaz SA, cree
que el 30 por ciento de los pedidos a su empresa
provienen de clientes nuevos.- Se va a usar una
muestra aleatoria de 100 pedidos para comprobar lo
que dice, que P = 0,30.-

a) Suponga que el Presidente está en lo correcto y que P


= 0,30.- ¿Cual es la distribución de p para este
estudio?.-
b) ¿Cuál es la probabilidad de que la proporción
muestral de p este entre 0,20 y 0,40?.-
c) ¿Cuál es la probabilidad de que la proporción
muestral este a ± 0,05 de la proporción poblacional P
= 0,30?.-
Solución
19.- Se ha extraído una muestra aleatoria de 250
viviendas de una gran población de viviendas
antiguas para estimar la proporción cuya
instalación eléctrica es peligrosa.- Si el 30 por
ciento de las viviendas tiene realmente una
instalación eléctrica peligrosa, ¿Cuál es la
probabilidad de que la proporción de
viviendas de la muestra que tienen una
instalación eléctrica peligrosa esté
comprendida entre el 25 y el 35 por ciento?.-

Solución

Resp: 0.9146
20.- Se ha estimado que el 43 por ciento de los
Licenciados en Administración de Empresas cree que la
asignatura de ética empresarial es muy importante para
impartir valores éticos a los estudiantes.- Halle la
probabilidad de que más de la mitad de una muestra
aleatoria de 80 licenciados crea eso.-

Resp: 0.1020

21.- Se toma una muestra aleatoria de 100 votantes para


estimar la proporción del electorado que esta a favor de
una subida del impuesto sobre la nafta, a fin de obtener
más ingreso para reparar las autopistas.- ¿Cuál es el valor
más alto que puede tomar el error estándar de la
proporción muestral que esta a favor de esta medida?.-
22.- Según la Agencia Tributaria el 75% de todas las
declaraciones de la renta da lugar a una devolución.- Se
ha tomado una muestra aleatoria de 100 declaraciones de
la renta:
a) ¿Cuál es la media de la distribución de la proporción
muestral de declaraciones que dan lugar a una
devolución?.-
b) ¿Cuál es la variancia de la proporción muestral?.-
c) ¿Cuál es el valor del error estándar de la proporción
muestral?.-
d) ¿Cuál es la probabilidad de que la proporción muestral
sea superior a 0,80?.-
Solución
23.- El dueño de una tienda de discos ha
comprobado que el 20% de los clientes que
entran en su tienda realizan alguna compra.-
Cierta mañana, entraron en esta tienda 180
personas, que pueden ser consideradas como
una muestra aleatoria de todos sus clientes,
a) ¿Cuál será la media de la proporción muestral
de clientes que realizaron una compra?.-
b) ¿Cuál es la variancia de la proporción
muestral?.-
c) ¿Cuál es el error estándar de la proporción
muestral?.-
d) ¿Cuál es la probabilidad de que la proporción
muestral sea menor que 0,15?.-
24.- El administrador de una gran cadena de
hospitales opina que, de entre todos sus
pacientes, un 30% generará facturas que se
pagan con más de dos días de retraso.- Se
toma una muestra aleatoria de 200 pacientes:
a) ¿Cuál es el error estándar de la proporción
mensual de pacientes con facturas cuyo pago
se retrasará más de dos meses?.-
b) ¿Cuál es la probabilidad de que esta
proporción muestral sea inferior a 0,25?
c) ¿Cuál es la probabilidad de que esta
proporción muestral sea superior a 0,33?.-
d) ¿Cuál es la probabilidad de que la proporción
muestral esté entre 0,27 y 0,33?.-
25.- Una asociación benéfica ha comprobado que
el 42% de las personas que hicieron alguna
donación el año anterior donarán de nuevo este
año.- Se toma una muestra de 300 donantes del
año anterior:
a) ¿Cuál es el error estándar de la proporción
muestral de donantes que donarán de nuevo
este año?.-
b) ¿Cuál es la probabilidad de que más de la
mitad de los individuos de esta muestra
vuelvan a ser donantes este año?.-
c) ¿Cuál es la probabilidad de que esta
proporción muestral este entre 0,40 y 0,45?.-
26.-Una corporación esta considerando una nueva
emisión de bonos convertibles.- Sus directores piensan
que la oferta resultará atractiva para el 20% de los
accionistas actuales.- Supongamos que su creencia es
acertada.- Se toma una muestra aleatoria de 130
accionistas.-
a) ¿Cuál es el error estándar de la proporción muestral de
accionistas que encontrarán atractiva la oferta?.-
b) ¿Cuál es la probabilidad de que esta proporción
muestral sea superior a 0,15?.-
c) ¿Cuál es la probabilidad de que esta proporción
muestral esté entre 0,18 y 0,22?.-
d) Supongamos que se toma ahora una muestra de 500
accionistas.- Sin realizar los cálculos, razonar si las
probabilidades correspondientes a los apartados b) y c)
resultarán en este caso mayores, menores o igual que
las calculadas para la muestra anterior.-
27.- Una universidad cuenta con un total de 528
estudiantes de primer curso.- De ellos 211
llevan su propio ordenador a la universidad.- Se
toma una muestra aleatoria de 120 estudiantes
de primer curso:
a) ¿Cuál es el error estándar de de la proporción
muestral de alumnos que llevan su propio
ordenador a la universidad?.-
b) ¿Cuál es la probabilidad de que la proporción
muestral sea menor que 0,33?.-
c) ¿Cuál es la probabilidad de que la proporción
muestral se encuentre entre 0,50 y 0,60?.-
28.- Una fábrica tiene a 439 obreros contratados.-
De ellos 239 están preocupados sobre sus
futuras pensiones.- Se toma una muestra de 80
obreros y se les interroga con el fin de estimar
la proporción de la población que esta
preocupada sobre el futuro de la pensión.-
a) ¿Cuál es el error estándar de la proporción
muestral de obreros preocupados?.-
b) ¿Cuál es la probabilidad de que la proporción
muestral sea menor que 0,50?.-
c)¿Cuál es la probabilidad de que la proporción
muestral se encuentre entre 0,5 y 0,6?.-
29.- El año pasado, el 75 por ciento de las
compras con tarjetas de crédito en los grandes
tiendas Beige fue por menos de 150$.- En una
muestra aleatoria de 200 compras con tarjetas
de créditos, que probabilidad hay de que las
compras de menos de 150$ constituyan:

a)Entre 70 y 80 por ciento.-


b) Más de 80 por ciento.-
c) Más de 70 por ciento.-

Solución

Вам также может понравиться