Вы находитесь на странице: 1из 79

UNIVERSIDAD NACIONAL DE TUMBES

ESCUELA DE POST GRADO


CURSO ESTADSTICA

TERCERA UNIDAD:- MUESTREO ESTADSTICO Y TAMAO DE MUESTRA

MUESTREO

El Muestreo es un rea de la Estadstica, de suma importancia. Nos permite calcular una


Muestra representativa y adecuada de la poblacin de la cual procede, para realizar
una INFERENCIA VLIDA respecto al PARMETRO en estudio.

Es sumamente importante mencionar las diferentes alternativas que existen para realizar
una investigacin, en cada uno de las cuales, el objetivo final es calcular el tamao de la
Muestra para realizar inferencias confiables.
La investigacin puede ser original o puede basarse en antecedentes.

Cundo la investigacin se basa en antecedentes, como se calcula el tamao de la


Muestra?- De primera intencin el investigador que es una persona idnea en el campo
en el cual ha planteado objetivos a lograr, por tanto hiptesis a e valuar debe calificar al
antecedente o antecedentes que existen y definir que realmente cumplen con el objetivo
de constituir antecedentes del estudio.

A partir de este hecho, los diferentes indicadores que se necesitan para el clculo del
tamao de muestra mediante el Marco Terico Estadstico Matemtico se obtiene del
antecedente o antecedentes las referencias ms importantes.

Cundo la investigacin es original, cmo se calcula el tamao de la Muestra?

Se hace uso de una muestra piloto o encuesta piloto. Los diferentes indicadores que se
necesitan para calcular el tamao de muestra se obtienen de los resultados obtenidos en
la evaluacin realizada en la Muestra Piloto.

1
Son dos alternativas sumamente importantes de trabajo, las cuales al cumplirlas
estrctamente estamos en condiciones de obtener el tamao muestral esperado para lograr
inferencias confiables.

Muestra Piloto:- Es una muestra aleatoria pequea. El tamao estar en funcin de la


homogeneidad o heterogeneidad de la informacin en estudio.

La Estadstica no nos alcanza cifras sobre su tamao. Es pequea y


aleatoria.

TIPOS DE MUESTREO

Muestreo No Aleatorio:- Una muestra no es aleatoria cuando los elementos son


elegidos por medio de mtodos no aleatorios. Este procedimiento est sujeto a errores
ya que se confa al juicio subjetivo de seres humanos, como en el caso de la seleccin
dirigida ( no aleatoria), donde las unidades son tomadas en forma caprichosa y en la
mayora de las veces por conveniencia; tal sucede en las encuestas de opinin que
realizan los locutores deportivos, cuando se juega un partido de ftbol o en las
entrevistas para televisin, radio o prensa, hechas en las principales vas de las
ciudades, con el nimo de conocer la opinin sobre algn asunto de inters para la
comunidad.

La muestra dirigida est constituida por una parte de la poblacin que el investigador
considera representativa del universo, como en el caso de seleccionar diez (10)
familias ubicadas en un barrio de la ciudad, para que opinen sobre la seguridad o
medidas de vigilancia en la zona. Tambin pudo haberse hecho un llamado a las
familias del barrio para que se presentaran voluntariamente a dar su opinin; en este
caso el proceso se denomina muestreo de voluntarios.

Si la caracterstica es homognea, la representatividad de la muestra puede ser


satisfactoria; por ejemplo en un restaurante, una cucharada de sopa o un sorbo de
vino; en un almacn, un trozo de tela o un par de zapatos, son representativos del total
de la sopa preparada, del vino para la venta o de la tela o calzado de que dispone el

2
establecimiento. Si se desea practicar examen de sangre a un paciente, el resultado
ser el mismo aunque la muestra vare de 1 cm3 a un litro.

Hay otros mtodos de muestreo no aleatorio como: el opintcio, la unidad


se selecciona en opinin del investigador; el intencional, hay intencin al
seleccionar; por cuotas; ya que se le dice al entrevistador cuntos hombres,
mujeres, cuantos casados, solteros se deben entrevistar, es decir, se le fija
cuotas; de todas maneras es un muestreo sin validez, por esa razn se
llama errneo, conduce a errores.

Muestreo Aleatorio:- Una muestra es aleatoria cuando los elementos que constituyen
la poblacin o universo tienen la misma posibilidad de ser seleccionados.
Existen numerosos procedimientos en la aplicacin del muestreo aleatorio. Los ms
importantes son:

1.- Muestreo Aleatorio Simple:- Con reposicin de las unidades, corresponde a una
distribucin binomial; sin reposicin, a una distribucin hipergomtrica.

Este mtodo de muestreo aleatorio simple es recomendable, en especial, cuando la


poblacin no es numerosa y las unidades se concentran en un rea pequea; por otra
parte, la caracterstica no debe tener gran variabilidad, porque implicara un tamao
muestral muy amplio que, a su vez, incrementar costos y tiempo; por ltimo, la
poblacin debe facilitar su enumeracin para que permita la aplicacin de este mtodo.
Las anteriores observaciones conllevan a fijar tres inconvenientes que presenta el
mtodo de muestreo aleatorio simple.

a.Se requiere un listado de unidades de la poblacin, lo cual no es fcil, en


muchos casos (marco).
b. Si el rea es amplia, es probable que haya necesidad de traslado a
lugares lejanos, para investigar unas pocas unidades, dificultando su
aplicacin (costo y tiempo).
c. No existe garanta de que todas las unidades queden representadas
en la muestra, cuando la caracterstica tiene una gran variabilidad.
d. Si el coeficiente de variacin es mayor del 30% el tamao de la
muestra se va haciendo ms grande.

3
2.- Muestreo Aleatorio Estratificado:- se le domina tambin como muestreo
aleatorio restringido. Este procedimiento implica una divisin de la poblacin en grupos,
denominados estratos, en tal forma que el elemento presenta una caracterstica tan
definida que slo le permitir pertenecer a un nico estrato. Por lo tanto, para que la
divisin por grupos sea efectiva, los factores de estratificacin debern guardar
estrecha relacin con las caractersticas que se investigan y con el objetivo o finalidad
del estudio. De esta manera se logra una mayor precisin en los resultados.
Supongamos que se quiere hacer una investigacin sobre el transporte urbano en una
determinada ciudad, con el fin de establecer los costos de operacin por pasajero. En
este caso, una muestra aleatoria simple de 300 vehculos no nos da garanta de que
los diferentes tipos de vehculos, buses, busetas, micros y colectivos queden bien
representados en la muestra, si se tiene en cuenta que puede haber grandes
diferencias, no slo en cuanto a capacidad del vehculo, sino en su recorrido. En este
caso, es preferible establecer estratos o grupos mediante la clasificacin segn el tipo
del vehculo.

En el muestreo aleatorio Estratificado, como en el muestreo aleatorio simple, se


requiere una lista detallada de las unidades que constituyen la poblacin a fin de
elaborar los estratos o subpoblaciones pero a pesar de lo dispendioso que puede
resultar este procedimiento, hay garanta de que los elementos de la poblacin queden
bien representados en la muestra.

Este mtodo es ms eficiente que el muestreo aleatorio simple, pese al grado de


heterogeneidad y dispersin que puede presentar la caracterstica, con la ventaja de
que al formar grupos ms o menos homogneos, las muestras resultantes son ms
pequeas y representativas.

Mediante la seleccin aleatoria, en cada uno de los estratos se conformar la muestra.


Dependiendo de la distribucin o escogencia de los tamaos muestrales para cada
estrato, podrn obtenerse mediante alguno de estos tres procedimientos.
a) Afijacin Igual o Asignacin Igual:- se da cuando los elementos quedan
asignados o repartidos por igual en cada estrato muestra.

4
b) Afijacin Proporcional o Asignacin Proporcional:- los elementos se distribuyen
en los estratos muestrales, en la misma proporcin en que se distribuyen los
elementos en la poblacin.

c) Afijacin ptima:- cuando el tamao, tanto de la muestra general como para cada
uno de los estratos muestrales, dependen del grado de variabilidad de la
caracterstica en cada estrato y del costo mnimo para una precisin dada.

Se debe tener en cuenta que: si el coeficiente de variacin ( s / x ) es menor o igual al


30% se debe realizar el muestreo aleatorio simple; si por el contrario es mayor a dicho
valor; el tamao de la muestra va creciendo, obligando a aplicar el muestreo aleatorio
estratificado con el cual disminuiremos tiempo, costo y adems, una mayor precisin en
la estimacin.

3.- Muestreo Sistemtico:- ms que un mtodo, es considerado como un mtodo de


seleccin, al que algunos denominan mtodo de seleccin a intervalos regulares. Se
aplica cuando la caracterstica a investigar se encuentra ordenada por valor, tiempo,
cantidad, etc.

Prcticamente sobre los 3 mtodos anteriores, muestreo aleatorio simple, muestreo


aleatorio estratificado y muestreo sistemtico no son los nicos tipos de muestreo;
existen otros mtodos, no estudiados con amplitud, dado lo extenso de ellos.

4.- Muestreo Doble:- denominado tambin bifsico porque se efecta en dos fases.
Es aplicado de preferencia, cuando no existe informacin auxiliar que permita conocer
los tamaos poblacionales de los estratos, ni la identificacin de las unidades; en este
caso, primero se realiza una muestra aleatoria simple, generalmente grande, en forma
rpida y sencilla para conocer en forma muy general algunas de las caractersticas
objeto del estudio, luego se procede a una segunda muestra extrada de la anterior, la
que podra considerarse como submuestra con la cual se hacen las estimaciones. Si se
utilizan ms de dos fases, se habla de muestreo mltiple o polifsico.

5.- Muestreo por Conglomerados o reas:- en los mtodos anteriormente


expuestos es necesario contar con un listado de unidades finales o unidades

5
elementales de la poblacin. El muestreo por conglomerados se utiliza cuando o bien,
no existe listado, o las unidades estn demasiado dispersas.

Esto nos obliga a sustituir las unidades fsicas o elementos, por grupos de unidades,
que llamaremos conglomerados; generalmente son superficies o reas en las que se
ha dividido el espacio ocupado por la poblacin. Supongamos que se desean realizar
estudios a familias en una ciudad. Cada unidad o familia se constituye en un
conglomerado, por tal razn se aplica el muestreo aleatorio monoetpico, es decir, se
realiza la investigacin en una sola etapa.
Si anteriormente se realiz una seleccin de manzanas de cada una de estas
manzanas, se selecciona otra muestra correspondiente a familias, el mtodo ser
bietpico o multietpico. Obsrvese que hay una modificacin con respecto al anterior
mtodo, ya que los elementos no forman parte de los conglomerados, sino que son una
muestra o sub-muestra de cada uno de ellos.

Si hacemos una seleccin de barrios, luego de manzanas y por ltimo de familias, el


mtodo ser trietpico. El muestreo polietpico o multetpico es una generalizacin y
consta de ms de tres etapas.
Los conglomerados son unidades que contienen unidades o elementos, es de anotar,
que en la aplicacin del muestreo por etapas la unidad cambia en cada una de ellas,
por lo tanto se requiere de varios marcos o listados, ya que se tienen varias
poblaciones.

6.- Sub-muestras Interpenetrantes:- en este mtodo las submuestras, cada una con
un nmero de unidades, son seleccionadas aleatoriamente de la poblacin. Este
metido es utilizado en general para medir la concordancia entre los resultados
obtenidos de muestras sucesivas.

7.- Mtodos Mixtos:- son el resultado de la combinacin de algunos o de todos los


mtodos anteriormente mencionados.

6
MARCO

Para la seleccin de las unidades se requiere de un listado, que en algunos casos debe
prepararse, en otras, tan slo se actualiza. Este listado debe corresponder al total de
las unidades o elementos que integran la poblacin a investigar o a seleccionar que, a
su vez, constituyen el marco de referencia o marco muestral, constituido por la
poblacin objetivo. Por ejemplo, la nmina de pago, ya sea para un grupo de
trabajadores en una fbrica o reempleados en una empresa, podra ser el marco; otro
ejemplo podra ser el listado de matrculas de los estudiantes en una universidad.

Sin embargo, el marco no siempre estar representado por un listado, podra ser
tambin un mapa o fotografas areas. En el marco no deben aparecer unidades falsas;
ejemplo: en el listado de matriculas no deben figurar aquellos estudiantes que se han
realizado por diferentes causas, pero que se alcanzaron a matricular.

En el muestreo por etapas mltiples, debe existir un marco para cada etapa.
En marco en cada etapa, debe ser suficiente detallado en cuanto a la
identificacin de sus unidades de tal manera que si una de ellas es incluida
en la muestra, puede ser ubicada e investigada rpidamente sin que ello
implique que se especifique la informacin que debe suministrar cada
unidad.

Rara vez los marcos son perfectos y lo comn es que sean inexactos,
inadecuadamente descritos, desactualizados o con unidades duplicadas; por tal motivo,
deben ser revisados y actualizados de manera que permitan una fiabilidad razonable
por cuanto la muestra se basa en ellos.

OBJETIVOS DEL MUESTREO ALEATORIO

El objetivo del muestreo aleatorio es seleccionar una parte representativa de la poblacin


con el fin de obtener estimadores de los parmetros. Para lograrlo existen varios mtodos
y en cada uno de ellos se puede establecer:

7
a) El grado de precisin requerido en los estimadores.
b) Tamao de la muestra.
c) Costo y tiempo.

Estimadores:- el estimador es una medida que describe una caracterstica de la muestra,


obtenida mediante la aplicacin de promedios, proporciones, tasas, razones, varianzas,
desviaciones tpicas, etc.

Se les llama estimadores, ya que se les considera como el mejor valor que sustituye a los
valores numricos poblacionales, generalmente desconocidos, a los que se llega por
medio de datos proporcionados por la muestra, , en tanto que un parmetro describe una
determinada caracterstica de las unidades en la poblacin.

Los estimativos obtenidos a travs de una muestra pueden considerarse como el


comportamiento de esa caracterstica en toda la poblacin. La estimacin de los
parmetros se hace a partir de los estadgrafos calculados en una muestra, con los cuales
se obtienen conclusiones, que permiten, ala vez, la realizacin de pruebas de hiptesis,
proceso denominado inferencia estadstica.

Si para cada parmetro desconocido se calcula una cifra nica, la estimacin se denomina
puntual o estimacin de punto.

Sise establece un intervalo o rango de valores, dentro de los cuales se espera encontrar el
parmetro, con cierto grado de confianza, se le denomina estimacin de intervalo. Los
lmites que definen el intervalo se conocen como limites de confianza.

Un buen estimador debe reunir cuatro condiciones o propiedades:


a. Insesgado:- se dice si un estimador es insesgado, si el valor esperado del mismo
es igual al parmetro de la poblacin que estima.

b. Eficiente:- se refiere a lo cerca que se encuentre el valor estimado del parmetro.

8
c. Consistente:- se obtiene cuando el tamao de la muestra se incrementa en tal
forma que la varianza desminuya, siendo menor la diferencia entre el valor real y el
estimado.

d. Suficiente: es un estimador que utiliza toda la informacin que posee una muestra
sobre el parmetro que se estima.

Tamao de la muestra:- una de las decisiones ms importantes que se deben tomar en


una investigacin por muestreo, consiste en la determinacin del tamao ptimo,
simbolizado por n. Se dice que una muestra debe ser pequea, con el fin de que el costo
de la investigacin sea lo suficientemente bajo, y bastante grande para que el error del
muestreo sea admisible. Algunos creen que el tamao de la muestra crece
independientemente a medida que aumenta el tamao poblacional, simbolizado por N,
pero eso no es cierto, ya que existe un punto en el cual el tamao de la muestra
permanece constante, as el tamao poblacional aumenta.

En el clculo del tamao ptimo, se deben tener en cuenta, los siguientes componentes:

(1) El error de Muestreo:- es la diferencia que puede haber entre el valor poblacional y la
estimacin de la misma (estimacin puntual o estadgrafo), obtenida por medio de una
muestra aleatoria, observada en una de las tantas muestra posibles de una poblacin
dada. La totalidad de estos errores, genera la distribucin de muestreo empleada para
estimar el valor poblacional.
E x x Media muestral
xE Media poblacional.

En muchos casos, el error ser determinado por el investigador, por ejemplo: si para un
sector de la economa se quiere estimar el promedio de salarios y se sabe por
observaciones aisladas o por experiencia, que el ingreso promedio para ese sector es,
aproximadamente, de 480.000, el error respecto al parmetro podra ser: 480.000
E. de acuerdo a la finalidad de la investigacin podra considerarse, para este caso,
que un error de 60.000 o cualquier otro valor es ms que suficiente, dado el grado
de variabilidad que supuestamente tengan los salarios en dicho sector. Sin embargo,
este procedimiento requiere, adems de cierta experiencia, un conocimiento previo

9
sobre el comportamiento de la caracterstica en la poblacin que se estudia, de ah que
es mucho ms practico determinar el error como un porcentaje, en la mayora de los
casos no mayor del 10%, aplicando a la medida aritmtica, generalmente obtenida en
una encuesta preliminar: E (%)(x )
El porcentaje podra considerarse en algunos casos como un complemento del nivel de
confianza as que una confianza del 95% dara un error del 5%, pero no siempre ser el
complemento, ya que este porcentaje podr aumentarse o disminuirse dependiendo del
grado de precisin con que se desea hacer la estimacin.

Pero hay otro tipo de error que no tiene nada que ver con el muestreo y que no se
puede medir. Estos errores denominados ajenos al muestreo, no muestrales o
sistemticos, se consideran como el resultado de instrumentos de medicin
incorrectos, cuestionarios mal definidos, errores que comete el entrevistador al efectuar
las preguntas o al interpretar las respuestas, preguntas vagas o ambiguas; en otros
casos, son consecuencia de la influencia negativa del entrevistador, del mal diseo del
formulario. Tambin podra ser el resultado de los procesos de crtica, codificacin,
tabulacin, en los cuales se pueden cometer errores ajenos al muestreo.

(2) La varianza:- del grado de variabilidad, varianza, depende en gran parte el tamao de
la muestra. Por ejemplo, el mdico que realiza un anlisis de sangre, el panadero que
se come un pan, el cocinero que paladea una cucharada de sopa; cada uno de ellos ha
hecho uso de una muestra. Obsrvese que con un centmetro de sangre, un pan o una
cucharada de sopa se puede determinar el comportamiento de la totalidad (sangre del
paciente, total de panes producidos en una jornada, total de sopa preparada para el
almuerzo) y se debe al grado de homogeneidad que presenta la caracterstica
observada; cualquier muestra que se tome de estas poblaciones se espera que d un
resultado igual, representativo del total.

Si todas las caractersticas presentaran un alto grado de homogeneidad, sera muy


sencilla la investigacin por muestreo, pero esa situacin no seda en la mayora de las
poblaciones que se investigan; por lo tanto el tamao de la muestra deber aumentarse
de acuerdo al grado de variabilidad, de tal forma que queden representados en ella los
valores extremos que toma la variable.

10
En el clculo del tamao de la muestra, lo ideal sera que la varianza correspondiera a
la poblacin investigada, pero en la mayora de los casos esto no es posible, de ah
que exista la necesidad de estimarla mediante:
a). Encuestas preliminares, piloto o pretest, sistema que consiste en la realizacin de
una pequea encuesta, cuyo tamao por lo general se toma en forma abierta, fijndose
un porcentaje que debe ser aplicado al tamao poblacional. Esta varianza resultante de
la encuesta se considera que puede ser un buen sustituto al de la poblacin.
b). El empleo de la varianza, obtenida en censos o investigaciones similares, realizadas
con anterioridad.
c). Otras veces son el resultado de conjeturas sobre la poblacin.

Las encuestas preliminares permiten no slo estimar la varianza de las caractersticas


de aquellas variables que tienen que ver con el objetivo de la investigacin, sino que
facilitan su conocimiento, familiarizan al entrevistador al aplicar el formulario,
determinan las fallas del mismo, adems, se puede conocer la reaccin del
entrevistado, el tiempo necesario para cada entrevista y, como se dejo anteriormente,
permite el clculo del error necesario para fijar el tamao ptimo de la muestra.

De igual modo la encuesta preliminar permite hasta cierto punto, probar gran parte de
los mecanismos tcnicos de muestreo, establecer los costos, localizar las unidades,
comprobar si la medicin es exacta, etc.

(3) La confianza: se ha mencionado el grado de precisin, depende de alguna manera,


del tamao de la muestra y ste, a su vez, de factores tales como el error, la varianza,
la confianza. Esta ultima es fijada por el investigador, quien por lo general, trabaja con
una z = 2, valor correspondiente a un nivel de confianza del 95.5%; pero es posible que
sean otros los valores de Z, tales como: Z = 2.57 (confianza del 99%) y Z = 1.64 (90%
de confiabilidad). Lo ms prctico es trabajar con Z= 2 o Z = 1.96, pero de todas
maneras la decisin sigue dependiendo de la finalidad y del grado de precisin que se
desee.
(4) Tamao de la poblacin:- es el ltimo componente de la formula, para calcular el
tamao optimo de la muestra, cuando se trata de poblaciones finitas.

DISEO DE MUESTREO

11
El diseo y el tamao de la muestra nos van a determinar la cantidad de la informacin
necesaria respecto a los objetivos de la encuesta. Recordemos que el objetivo del
muestreo es contar con el mayor nmero de unidades, con la mayor cantidad de
informacin, pero al menor costo posible.

A veces se cree que con mucha informacin se logran buenas estimaciones; sin embargo,
generalmente ocasionan despilfarro de dinero, prdida intil de tiempo y complicaciones
en la organizacin y anlisis de los datos. Otras veces se peca por poca informacin, que
hace temer por el xito de la investigacin. Los dos casos se deben a que la muestra no
fue correctamente diseada.

Para el diseo de la muestra y clculo del tamao, se requiere que se hayan adelantado
algunas etapas, tales como:

a) Planteamiento del Problema:- nos permite determinar la necesidad, o no, de


adelantar una investigacin que permita recoger o utilizar informacin que
proporcione un mayor conocimiento del problema, aclarar algunas inquietudes y
tener ms herramientas de juicio para la toma de decisiones. Supongamos que se
tiene planteado como ejercicio de aplicacin: el problema de la mala calidad de la
leche, la baja nutricin de los nios, el precio elevado de este producto y su
distribucin.

b) Una vez determinada la necesidad de realizar la investigacin, debe


establecerse el objetivo o los objetivos, de una manera clara y precisa, los cuales
no deben perderse de vista, y si ser tenidos en cuenta a medida que se vaya
avanzando, tanto en el diseo como en la instrumentacin de la encuesta. En
nuestro caso, el ejercicio que nos permitir aplicar algunos de los mtodos de
muestreo, la realizacin de estimaciones e interpretacin de las mismas, consiste
en considerar que el objetivo principal del estudio es investigar el consumo de carne
en uno de los barrios de la ciudad; como objetivos secundarios nos interesa
conocer: las variaciones en el consumo; composicin y niveles de ingreso de la
familia; adems, se busca informacin sobre la calidad, precios, consumo de
pescado y pollo, distribucin, entre otros.

12
c) Debemos determinar la poblacin objetivo, que debe estar claramente definida y
plenamente identificable al iniciar el proceso de seleccin y la entrevista. Implica
identificar la unidad o el elemento, la cual debe ser: clara, mensurable, adecuada y
comparable. En nuestro problema, la unidad corresponde a aquellas familias que
viven en el barrio objeto de investigacin. Observemos que la familia es, en nuestro
caso, la unidad de seleccin.

d) Formulamos la hiptesis, ya sea para afirmar o rechazar. Anotaremos como


ejemplo algunas de ellas, al considerar la mala calidad de la leche.
- Hay tendencia a consumir leche de marca.
- Se observan variaciones en las cantidades compradas, frente a variaciones
de precios y marcas.
- El consumo de leche aumenta con la poblacin escolar.
- La posesin de neveras influye en los hbitos de compra.
- El consumo de leche por persona es bajo en comparacin con el mnimo
nutricional recomendable.

e) Se elabora el marco de referencia. Recordaremos que es un listado detonas las


unidades que constituyen la poblacin objetivo, y puede corresponder a un mapa o
croquis que indique la localizacin de las unidades. En nuestro ejercicio con el cual
desarrollamos la teora. El marco estar constituido por 355 familias, que adems
de estar completamente localizadas, se encuentran numeradas desde 001 hasta
355.

f) Se establece el mtodo de recoleccin, teniendo en cuenta las ventajas y


desventajas que presenta cada uno de ellos, que nos permita hacer una buena
seleccin. Algunos de estos mtodos son: la entrevista, el correo, la entrega
personal del cuestionario, el telfono y el panel. Para nuestro caso, se ha
considerado la entrevista como el mtodo de recoleccin mas indicado.

g) Se seleccionara el mtodo de muestre aleatorio, dependiendo de la variabilidad


que presenta la caracterstica principal que tiene que ver con el objetivo de la
investigacin.

13
h) A esta altura se han desarrollado otras etapas tales como: la elaboracin del
instrumento de recoleccin, la seleccin y preparacin del personal, se ha hecho el
examen de la documentacin en especial para determinar si este tipo de estudio ya
fue realizado y si existe alguna metodologa que se haya aplicado a una
investigacin similar, con buenos resultados; adems, se cuenta con los recursos
necesarios que permitan el buen desarrollo y terminacin del trabajo.
En el diseo y determinacin del tamao de la muestra se hicieron algunas
consideraciones que se deben tener en cuenta en una investigacin, siendo una de
ellas el grado de homogeneidad que presenten las caractersticas que se vana
investigar, pues nos permite tomar decisiones respecto al mtodo de muestreo que
debe corresponder a la investigacin que repiensa realizar.

FORMULARIO O CUESTIONARIO

Se prepara un instrumento con el fin de recoger la informacin necesaria, de acuerdo a los


objetivos establecidos en la investigacin. Este debe ser sometido a prueba, realizando
una encuesta preliminar o piloto, cuyo tamao fue elegido por el investigador teniendo en
cuenta factores tales como: poblacin, objetivo, costos, tiempo y recursos humanos.

En el caso de que se tenga una poblacin de 355 familias, ubicadas en un


determinado sector de la ciudad, el tamao de la muestra preliminar ser:
n = (%) (N) o sea n = 0.04 (355)=14 familias. Recordemos que el % lo determina el
investigador.

Presentamos a continuacin una parte del formulario y seguidamente el marco o


listado de las355 familias (incluimos la informacin de algunas caractersticas que luego
sern recolectadas, tanto para la muestra piloto como la definitiva con la cual se harn los
estimativos).

14
Realizada el departamento N 001
de investigacin cientfica

ENCUESTA SOBRE INGRESOS Y CONSUMO


DE LAS FAMILIAS EN EL BARRIO..

Direccin . Ciudad Fecha .


Telfono .

I GENERALIDADES

Nombre del
informante: _______________________________

Direccin ______________________ Telfono __________


Ocupacin ______________________ Edad __________

II..

1, Ingreso mensual ______________________________


2, Propiedad de la
vivienda
2,1 Propietario
2,2 Inquilino

3, Consumo diario
carne ___________ Gramos

Si se fuera hacer una investigacin total, la informacin sobre algunas caractersticas:


ingreso (miles de $); propiedad de vivienda; total personas por sexo y ocupacin; y
consumo de carne diaria (en gramos) se tendra en la siguiente tabla:

15
Datos correspondientes a 355 familias que residen en el barrio X

Familiar Ingresos Vivienda Nmero de Personas Consumo Diario


N (miles $) Propia Total M F Trabajando de carne (grs.)
001 186 si 5 3 2 2 789
002 384 no 6 2 4 3 807
003 92 no 3 1 2 1 802
.. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. ..
051 125 si 2 1 1 1 750
052 386 no 5 2 8 3 750
053 188 no 3 1 2 2 880
.. .. .. .. .. .. .. ..
.. .. .. .. .. .. ..
105 196 si 2 1 1 2 650
.. .. .. .. .. .. .. ..
159 126 no 3 1 2 1 516
.. .. .. .. .. .. .. ..
353 175 si 3 2 1 2 515
354 93 no 1 1 0 1 524
355 145 si 2 1 1 1 530

Muestreo aleatorio simple (M.A.S)

Tamao de la Muestra
Clculo del Tamao de la muestra cuando no se conoce la Varianza Poblacional:- En
la prctica es muy frecuente que no se conozca la varianza de la caracterstica en la
poblacin ( S 2 ); en tales casos se debe recurrir a censos, a investigaciones similares
realizadas con anterioridad o a investigaciones preliminares, denominadas encuestas
piloto. Este ltimo procedimiento es el que ms se emplea para determinar el tamao de la
muestra, partiendo del supuesto de que no existe informacin sobre la poblacin. En
primer lugar, se elabora un listado de familias a investigar y que conforman el marco
muestral, tal como aparece en el cuadro precedente. Despus de haber identificado la
poblacin a la cual se va a investigar, definida claramente la unidad de investigacin y las
caractersticas que tiene que ver con el estudio, se procede a establecer el tamao ptimo
para la muestra.

Para disear la muestra es indispensable contar con un marco de referencias, es decir, la


lista, mapa u otra especificacin de las unidades, que resulta de la informacin
previamente disponible respecto a la poblacin sobre la cual se basan los esquemas
particulares de muestreo. En nuestro caso el marco estar constituido por una lista de 355

16
familias. La familia o unidad de investigacin se ha definido como el conjunto de personas,
(del barrio X) que viven bajo un mismo techo, ligadas por un lazo de consanguinidad y
dependencia econmica. Una vez identificada y enumerada la poblacin se procede a
calcular el tamao de la muestra, mediante la frmula:

n0 S2
n Z 2S 2 NZ 2 S 2 E
(1) n0 Donde n0 (2) n (3) E S2
1 E2 NE 2 Z 2 S 2 ( )2
N Z N
Como se conocen las varianzas poblacionales de una o algunas de las caractersticos que
tienen que ver con el objetivo principal de la investigacin, se procede a estimarlas
mediante una encuesta piloto o preliminar, siendo:

4 4
n piloto n piloto (355) 14
100 100

El porcentaje del 4% es arbitrario, es una decisin del investigador, en algunos casos


depende, del tamao poblacional, tiempo y costos. Una vez establecido el valor n piloto , se
utiliza cualquier M.A.S. (Muestreo aleatorio simple) donde las unidades se seleccionan
sin reposicin, es decir, con igual probabilidad de seleccin.
Luego se procede a seleccionar, en este caso mediante el uso de la calculadora, las 14
familias que formarn la muestra piloto, (la poblacin est numerada desde 001 hasta
355), sin tomar nmeros superiores o repetidos. Supongamos que se obtuvieron los
siguientes nmeros aleatorios con los cuales debe prepararse la tabla:

335 004 289 128 097 271 253


348 202 349 197 018 020 207

17
Informacin obtenida mediante La Encuesta Preliminar o Piloto

Consumo
N Nmeros Ingresos Vivienda N Total Diario
M F Trabajando
de
Orden Aleatorios (miles $) Propia personas de carne (grs.)
1 335 242 si 3 1 2 1 760
2 004 106 si 3 1 2 1 765
3 289 286 no 3 1 2 2 592
4 128 232 no 3 1 2 2 520
5 097 112 si 3 1 2 1 610
6 271 250 si 5 1 4 2 636
7 253 193 si 2 0 2 2 650
8 348 102 si 3 2 1 1 605
9 202 196 si 2 1 1 1 642
10 349 11 no 2 0 2 1 520
11 197 97 no 2 1 1 1 508
12 018 179 no 4 2 2 1 767
13 020 225 no 3 1 2 2 842
14 207 175 si 2 0 2 1 684

Con la anterior informacin se determina la varianza y se calcula el tamao ptimo de la


muestra dependiendo de las caractersticas que hayamos seleccionado. Veamos los
resultados, cuando trabajamos con un error de muestreo del 5% para las variables
(Ingreso y consumo) y del 8% para el atributo (propiedad de la vivienda). La confianza en
los tres casos ser del 95.5% (Z=2).

a) ingreso promedio (miles de pesos)

x
x i

2506
179 E 0.05( x ) 0.05(179) 9 (Nueve mil pesos)
n 14

x 2
i nx 2 501.554 14(179) 2
s 2
4.075,38
n 1 14 1
Z 2 S 2 2 2 (4.075,38)
n0 181.11
E2 92

n0 181.11
n 120 familias
n0 181.11
1 1
N 355

NZ 2 S 2 355(22 )(4.075,38)
n 120 familias
NE 2 Z 2 S 2 355(92 ) 2 2

18
Tambin se puede calcular mediante:
S2 4.075,38
n 120 familias
( E / Z ) S / N (9 / 2) 4.075,38 / 355)
2 2 2

Algunos utilizan la formula con correccin, ya que se considera que la varianza obtenida
mediante una encuesta preliminar, cuando est es muy pequea, se hace poco
representativa, es decir, que el resultado de n es menor que el obtenido con varianza
poblacional.
Procedemos al clculo de n con correccin:

206,98
Z 2S 2 2 2 2 (4.075,38) 2 n 131 familias
n0 2 1 1 206,98 206,98
E n1 9 2
14 1
355

El tamao de la muestra obtenida al corregir va a ser un poco mayor que cuando no es


corregida. Si fuera necesario calcular el total de ingresos de las 355 familias, el tamao de
la muestra arrojara los mismos resultados anteriores, a pesar de que la frmula se
modifica:
Z 2 N 2S 2
n0 E N (0.05)( x ) 3055(9) 3.195
E2

181.11
22 (355)(4.075.38) n 120 familias
n0 650.07 1
181,11
3.1952 94

b) Consumo promedio de carne diaria por familia

x x 2
9.101 i nx 2 6054.547 14(650,07) 2
10.634,38
i
x 650.07 s 2
n 14 n 1 14 1
s = 103.12
E = 0.05 ( x ) = 0.05 (650.07) = 32.50 E 2 1.056,48

n 40,26
Z 2S 2 2 2 (10.634,38) n 0 37 familias
n0 40, 26 , n0 40,26
E 2
1.056,48 1 1
N 355

19
Tambin se puede calcular mediante la frmula:
SZ 2 S 2 355( 2) 2 (10.634,38)
n n 37 familias
NE 2 Z 2 S 2 355(32,50) 2 22 (10.634,38)

Otra forma de calcular el tamao ptimo, es as:

S2 10.634,38
n 2
n 2
37 familias
E S ; siendo: 32.5
2
10.634,38

Z N 2 355

Cuando hay cierto grado de homogeneidad en la caracterstica investigada, el tamao


tiende a ser pequeo, tal es el caso observado con el consumo de carne diaria donde se
obtuvieron 37 familias. El grado de homogeneidad seda cuando el coeficiente de variacin
es menor del 30%; en estos casos es recomendable la aplicacin del Muestreo Aleatorio
Simple.

s 103.12
CV 100 CV 100 15.89%
x 650.07

En el caso del ingreso por familia se puede observar que el CV es del 36%, superior al
30%, establecido, por tal razn, la muestra obtenida debe ser mayor a la del consumo,
siendo n = 120 familias. Nos quedan dos alternativas, si la caracterstica principal es el
ingreso, debemos trabajar con las 120 familias, lo cual implica un mayor costo, tiempo y
recursos humanos, o aplicar el mtodo de Muestreo Aleatorio Estratificado, disminuyendo
los tres factores antes mencionados; adems, se obtiene una mejor estimacin.

c) Proporcin de familias con vivienda propia:

P
a i

8
0.57
2
s p pq 0.57(0.43) 0.2451 E 8% 0.08
n 14

2 2
Z 2 PQ Z S p 2 2 (0.2451)
n0 2 ; n0 153.18 ;
E E2 0.082

20
n0 153.18
n 107 familias
n0 153.18
1 1
N 355

Tambin:

SZ 2 S 2 355(2) 2 (0.57)(0.43)
n 107 familias
NE 2 Z 2 PQ 355(0.08) 2 2 2 (0.57)(0.43)

APLICACIONES DE ALGUNOS ESTIMATIVOS

Se ha dicho que la estimacin de un parmetro se hace a travs del os resultados


obtenidos con una muestra. Si slo se utiliza una cifra nica para las caractersticas,
tales como: promedio, proporcin o razn, etc., se le denomina estimacin puntual.

Si redeterminan unos lmites de confianza dentrote los cuales deber estar


probablemente el parmetro, es denominada como estimacin por intervalo o lmites
de confianza. Se podr hablar de una estimacin total, cuando se haga referencia a la
totalidad de la caracterstica en la poblacin.

El proceso a seguir una vez determinado el tamao de la muestra, consiste en la


realizacin de la verdadera encuesta para la obtencin de la informacin; luego se
contina con el proceso de fabulacin o recuento lo que permitir la elaboracin de
cuadros y el clculo de los diferentes estadgrafos o medidas (promedios, razones,
varianza, etc.), denominados estimadores de los parmetros.
Vale la pena observar este proceso de la estimacin (puntual y por intervalos)
desarrollando el ejercicio de las 355 familias que retomaron para el calculo de n.
primero se calculan los promedios para datos sin agrupar, es decir, datos originales y
luego para datos agrupados (tablas de frecuencias). Supongamos, que le tamao
optim de la muestra obtenida pro cualquiera de los mtodos anteriores y
caractersticas utilizadas es 28, (valor arbitrario que no tiene nada que ver con los
resultados anteriores), tomando nicamente con la intencin de facilitar la aplicacin de
lat de Studente, vlido para muestras pequeas (n 30), casos pocos usuales en la

21
prctica, pues casi siempre se trabajaron muestras grandes (n > 30) donde utilizamos
Z. La muestra como en todos los procesos, va a ser aleatoria y el mtodo aplicado ser
el muestreo aleatorio simple, donde las probabilidades de seleccin de cada unidad
van a ser constantes y la seleccin va a ser sin repeticin.

Generalmente es considerada la caracterstica principal para determinar el tamao


ptimo de la muestra; si hay varias caractersticas con las cuales se obtienen los
tamaos, se toma como resultado final el mayor de ellos. En el caso del ingreso se
observa que el tamao es bastante grande, dada la gran variabilidad que presenta la
caracterstica, por lo tanto el investigador, tiene dos alternativas. (1) Trabajar con ese
tamao, lo cual implica mayor costo, tiempo y personal: (2) utilizar el Muestreo aleatorio
Estratificado, reduciendo los tres aspectos mencionados, a la vez que mejora la
estimacin.

Nuevamente se utiliza la calculadora para obtener los 28 nmeros aleatorios, sin


repeticin.

170 045 186 217 076 213 132 087 006 163 312
111 248 018 096 22 303 196 230 286 032 168
318 009 144 250 036 095

22
Informacin obtenida en la muestra de 28 familias. Datos sin agrupar

Consumo
N Nmeros Ingresos Vivienda N Total Diario
M F Trabajando
de
Orden Aleatorios (miles $) Propia personas de carne (grs.)
1 170 270 si 3 1 2 2 812
2 045 192 si 2 1 1 2 630
3 186 88 no 3 1 2 1 510
4 217 86 si 5 2 3 1 506
5 076 184 no 5 1 4 2 620
6 213 186 no 3 2 1 1 716
7 132 126 si 3 2 1 1 520
8 87 206 si 5 1 4 2 780
9 006 170 no 2 1 1 2 895
10 163 96 no 3 2 1 1 520
11 312 189 no 4 3 1 2 576
12 11 111 si 3 1 2 1 620
13 248 198 si 3 1 2 2 586
14 18 179 no 5 1 4 2 760
15 96 100 no 2 0 2 2 650
16 224 152 no 6 2 4 2 666
17 303 346 si 4 1 3 3 718
18 196 95 no 3 1 2 1 515
19 230 98 si 2 1 1 1 560
20 286 195 si 5 1 4 2 710
21 032 96 si 2 1 1 1 782
22 168 164 no 5 2 3 2 720
23 318 176 si 2 1 1 1 543
24 009 282 no 4 2 2 3 742
25 144 188 no 3 1 2 2 560
26 250 206 no 2 1 1 2 616
27 036 145 no 2 1 1 2 580
28 095 101 no 2 1 1 1 630
4625 12(si) 93 36 57 47 18043

Los lmites para los estimadores se fijarn con una confianza del 95%. En caso de que la
muestra sea grande (n 30) se utiliza Z = 1.96. En este caso, siendo n 30 se utiliza la
t Stundet; en primer lugar se establecen los grados de libertad (letra griega nu) igual a
(n 1) o sea 28 1 = 27, siendo 0.05 complemento del 95%, tomada como nivel de
confianza (la suma ser del 100%); por lo tanto el valor de t para este ejercicio ser igual
a 2.052.

Veamos ahora los estimativos puntuales y de intervalo para cada una de las caractersticas
de las que se recolect informacin.

23
ESTIMACION DE PROMEDIOS Y TOTALES

(1) Promedio de Ingresos por familia:- Los estimativos de promedio y total de los
ingresos (miles de $) por familia, se calcula de la siguiente manera:

A. Datos sin agrupar: x


x i

4.625
165.18
n 28

x 2
i nx 2 874.163 28(165.18) 2
s 2
4.081,93 s 4.081,93 = 63,89
n 1 28 1

El estimativo puntual es de 165,2 equivalentes a un ingreso promedio para las


familiar de $165.200. La estimacin por intervalo con un 95%, ser:

n 28
f = fraccin de muestreo t 0.078
N 355

Si la fraccin de muestreo es mayor al 5%; se aplica la correccin para poblaciones finitas.

63,89
= 189,0 = $189,000
X s 165,18 2,052 1 0,076
28 = 141,4 = $141,400

Estos resultados indican que el ingreso promedio poblacional deber estar


aproximadamente entre $141.400 y $189.000; con una probabilidad o confianza del 95%;
sien embargo queda un margen de error de 5%, es decir, que el promedio verdadero
puede ser superior a 189 o inferior a 141,4. El valor de la media poblacional o valor
verdadero, se debe de $178.2 o $178.200 que se encuentra dentro de esos lmites de
confiabilidad. De los estimativos anteriores es preferible deducir que el promedio
poblacional deber estar dentro de esos lmites con cierto nivel de confianza, que
considerar a $165.18 como si fuera el promedio verdadero de la poblacin.

24
Por otra parte, en el proceso de una investigacin por muestreo, es comn la formulacin
de hiptesis las que deben ser comprobadas. Por ejemplo: el investigador de las 355
familias puede considerar como hiptesis que su ingreso es de $175.000 (175) ante la
alternativa de que sea diferente, es decir, que puede ser mayor o menor a 175. E n este
caso el procedimiento que se sigue para contrastar esta hiptesis es:

1. H 0 : 175 (Hiptesis Nula)

H a 175 (Hiptesis Alternativa)

2. 0.05 (nivel de significacin)

3. s X S 189
(Lmites de confianza)
i X i 141

4. Como la hiptesis nula ( H 0 : 175 ) se ubica dentro de los lmites de confianza, se


acepta lo indicado por el investigador, es decir, que el ingreso promedio de las familias
puede ser considerado como de 175, o sea $175,000.

Obsrvese que en ejercicio puesto a consideracin se pudo conocer la media poblacional (


178,2 ), lo cual, en la prctica no sucede con frecuencias; adems se est afirmando

que el ingreso es de $175 cuando en realidad fue $178,2; por tanto se ha cometido un
error de tipo II. Si lo que se quiere probar es que el grupo familiar investigado tiene un nivel
de ingresos inferior a 175 (miles de $), no se deben utilizar los lmites de confianza, para
contrastar la hiptesis; por tanto el procedimiento a seguir es:
1. H 0 : 175 2. 0.05
H a 175

x 165,2 175
3. t 0.81
s n 63.9 28

v = n -1 =27
0.10 t = 1.703

RC = Regin Critica o de rechazo


ZA = Zona de aceptacin RR/ H 0 RA/ H 0
t = ,703 punto critico t = -1,703
+

25
El valor de t = -0.81, est dentro de la zona de aceptacin, por tanto es vlida la hiptesis
nula ( H 0 ). A un nivel de significacin del 5% los resultados obtenidos ( x 165.2) , no
permiten afirmar que los ingresos de estas familias sean inferiores a 175 (miles de $).

(2) Estimacin total de Ingresos para las 355 familias:- En algunos casos se requiere
realizar estimativos de totales y para tal efecto se procede de la siguiente manera:
Ns
X s Nx 1 1
n

= 67.092,8(miles $)
355(63,89)
X s 355(165.18) 2.052 1 0,078 = 59.199,2(miles $)
28
Con los anteriores resultados se concluye que el ingreso total de las 355 familias deber
estar entre $ 67095.800 y $50199.200, valor que se encuentra comprendido dentro de
estos lmites de confiabilidad.

Datos agrupados:- Se ha venido analizando la variable contina ingresos, con los


datos tal como resultan de la recoleccin. Sin embargo el procedimiento se vuelve
engorroso cuando n es relativamente grande; por tanto, con fines de simplificacin,
se hace necesaria la reduccin de la informacin a tablas de frecuencias, proceso
visto en la estadstica descriptiva para la variable continua.

El proceso se detalla a continuacin:


a. Se obtienen los valores mximos y mnimos de la variable, con lo cual el rango o
recorrido.
X mximo 346 X mnimo 86 Rango X mx X min

b. Se requiere fijar el nmero de intervalos (m) y la amplitud en cada uno de ellos.


Con fines de simplificacin, consideraremos una amplitud (c) constante y m, el
nmero de intervalos puede ser arbitrario; y lo determinaremos mediante la
frmula de Sturges.
m 1 3,3 log n m = 1+ 3,3log 28 = 1 + 3,3(1,447158) = 6
rango 260
c 44
m 6

26
y 'i 1 y 'i ni yi yi ni 2
yi ni
84,1 128 10 108 1,080 116,640
128,1 172 4 152 608 92.416
172,1 216 11 196 2.156 422.576
216,1 260 - 240 -- --
260,1 304 2 284 568 161.312
304,1 348 1 328 328 107.584

y
yn i i

4.740
169,29
n 28

y 2
i ny 2 900.528 28(169,29) 2
S 2
3.633,84
n 1 28 1
s 3.633,84 60,28

yi Marcas de clase

y
yn i i

459,8
16,42
n 28
ni Frecuencia absoluta

y 2
i ni ny 2 8.774,68 28(16.42) 2
s 2
45,34
n 1 27
s 45,34 6,73

(Nota:- Se trabaj en la calculadora con el programa de estadstica)


Se observan pequeas diferencias con los resultados obtenidos para la media y la
varianza, en relacin al mtodo anterior (datos no agrupados), lo cual se debe la prdida
de informacin al estableces los intervalos y al calcular los estadgrafos (media y varianza),
ya que estos se obtiene utilizando las marcas de clase y; de todas maneras las
diferencias carecen de importancia en los resultados.
(1) Promedio de personas por familia:- Para determinar los lmites de confianza del
95%, se debe calcular la media y la desviacin estndar.

X
x i

93
3,3214 s
x i
2
nx 2

351 28(3,3214) 2
1,2488 1,25
n 28 n 1 27
3,79

s 3(355)(1,25)
X s x t 1 f X 355(3,32) 2,052 1 0.078 2,85
n 28

(2) Total de personas para las 355 familias, ser obtenido as: 1.343,8

27
Ns (355)(1,25)
X s Nx t 1 t X s 355(3,32) 2,052 1 0,078
n 28
1.013,4

Se puede afirmar que, aproximadamente, el nmero total de personas para las 355
familias es de 1.179; sin embargo con una confianza del 95%, el total poblacional deber
estar entre 1.013 y 1.344, comparando el total poblacional (1.164) con el estimado puntual,
se aprecia una pequea diferencia y, como en los casos anteriores, se encuentra incluida
dentro de los lmites de confianza.

B. Datos agrupados:- el nmero de personas por familia corresponde a una caracterstica


cuantitativa, denominada variable. Por tratarse de nmeros enteros que no admiten
fracciones se le identifica como variable discreta.

En la elaboracin de una tabla de frecuencias para la variable discreta se debe, en primer


trmino, identificar los valores que toma la variable ( yi ), para luego determinar la
frecuencia con que se presenta cada valor.

Veamos el proceso de elaboracin de la tabla y el clculo de los estadgrafos.

28
Nmeros de personas por familia

Yi ni yi ni 2
yi ni
2 9 18 36 y
yn i i

93
3,32
3 9 27 81 n 28
4 6 12 48
y
2
5 6 30 150 i ni ny 2 351 28(3,32) 2
s 1,248 1,25
6 1 6 36 n 1 27
28 93 351

Nota:- Se trabaj en la calculadora con el programa de estadstica

Los resultados obtenidos con la relacin a la variable discreta son iguales, tanto para datos
sin agrupar como para datos agrupados, por tanto, no es necesario repetir el proceso de
asignacin de lmites de confianza para el promedio.

ESTIMACION DE PROPORCIONES Y TOTALES

(1). Proporcin de familias con vivienda:- Para el clculo de la proporcin y la varianza


se procede as:

12
p a / n = 28 0,4286 o 42,86%
i
2
so pq (0,4286)(0,5714) 0.2449

El 42,86%, es el estimado puntual, es decir, se estima que el 42,86% de las familias son
propietarias de vivienda.

Para obtener los lmites de confianza, se aplica la siguiente frmula:


0,6163=61,63%%
pq 0.2449
Pa p t 1 t Ps 0,4286 2,052 1 0.078
n 1 27
0,2409=24,09%

Analicemos los resultados:- en primer lugar, el estimador puntual fue de 42,86% y el


verdadero (poblacional) es de 48,73%, ubicado dentro de los lmites de confianza del 95%.

29
En la formulacin de hiptesis, se procede en forma similar al promedio. Supongamos que
el investigador asegura que el 45% de las familias son propietarias de vivienda.

1. H 0 : P 0.45 2. 0.05
H a P 0.45

3. Como 0,45 est dentro de los lmites de confianza, se acepta la hiptesis nula, es
decir, que el 45% de las familias son propietarias. Ahora, si observamos la
proporcin verdadera del 48,73% notamos que se ha cometido un error de tipo II
(aceptar algo falso). En una prueba unilateral,, se presenta por ejemplo; si el
investigador considera que el porcentaje puede ser inferior al 45%, en este caso se
deber proceder de la siguiente manera:
1. H 0 : P 0.45 2. 0.05
H a P 0.45

pP 0,4286 0,45
t 0.22
3. pq 0,2449
n 1 27
t = -0.22 n 1 27

RR/ H 0 RA/ H 0
t = -1,703
El valor de t (t = -0.22) se ubica en la zona de aceptacin, por lo tanto, al nivel del 5% no
existe suficiente razn para considerar que el porcentaje de familias propietarias sea
inferior al 45%, aqu tambin se comete un error de tipo II, dado que el promedio
verdadero es superior al 45%.
(2). Total de familias con vivienda:- Para la estimacin de totales, se aplica la siguiente
frmula:

218,77
pq 0,2449
As Np tN 1 t As 355(0,4286) 2,052(355) 1 0,078
n 1 27
85,54

30
El estimado puntual (total) es de 152 familias con vivienda propia; con intervalos, el
nmero verdadero de propietarios de vivienda deber estar entre 86 y 219 familias, con
una seguridad del 95%.

MUESTREO ALEATORIO ESTRATIFICADO

Generalidades
El Muestreo Aleatorio Estratificado, denominado tambin muestreo aleatorio
restringido, es un mtodo que permite una seleccin ms eficiente que el obtenido
mediante el muestreo aleatorio simple, en especial cuando la caracterstica que reinvestiga
es de gran variabilidad, lo cual, implica un tamao muestral relativamente gran de en
comparacin al obtenido mediante el muestreo aleatorio estratificado.

En una muestra aleatoria estratificada la poblacin a investigar se divide en grupos


relativamente homogneos con relacin a la caracterstica del estudio. Estos grupos de
denominan estratos, donde la unidad o el elemento investigado presenta una caracterstica
tal, que slo le permite pertenecer a un estrato.

Es necesario entender que un estrato es una subpoblacin y, como tal, cada uno se
constituye como un dominio de estudio.

Los estratos pueden o no estar compuesta del mismo nmero de unidades, por tal
razn la fraccin de muestreo (f) puede variar de un estrato a otro.

Al conformar los estratos, lo primero que se debe seleccionar, siempre que sea.
posible, es la caracterstica de inters principal, que guarde relacin, para lo cual debe
elevarse una distribucin de frecuencias, lo que a su vez, se corta en un nmero adecuado
de intervalos, de tal forma que el estrato genere la mayor homogeneidad posible. Las
investigaciones de sondeo o las encuestas preliminares ayudan no slo a identificar las
caractersticas de la poblacin, si no que permiten una buena estratificacin.

31
En resumen, se puede decir que la estratificacin logra:

a. Una mayor precisin en los estimadores; a pesar de ser menos nmero de


unidades seleccionadas en comparacin al muestreo aleatorio simple.

b. Garantizar la representatividad y una reduccin del error de la muestra, por


agrupacin de aquellos elementos que se parecen ms por la caracterstica que
se investiga que por pertenecer a la poblacin.

c. Allegar informacin detallada para un grupo o estrato especifico, ya que se logra


una muestra independiente de los dems estratos. De cada uno se obtienen
promedios y varianzas separados y mediante la ponderacin, se calcula el valor
del estimador del promedio y de la varianza.

d. Dividir la poblacin en grupos o estratos ms o menos homogneos en cuanto a


su composicin interna, pero heterogneos si se comparan los estratos en s.

e. Ventajas administrativas

El plan de estratificacin es ptimo cuando se minimiza la desviacin estndar del estrato.


Mientras ms estratos se establezcan, tanto ms homogneos sern, sin embargo, para
algunos autores hay un incremento en los costos en consideracin al nmero de
elementos que conlleva la muestra en cada estrato. Por otra parte, la estratificacin ser
efectiva, dependiendo de la estrecha relacin que guarden los factores de estratificacin
con las caractersticas que se investigan.

Las estimaciones podrn se ms precisas en la medida del tamao de la muestra por


estrato y en especial, por la forma en que se realizan la seleccin de las unidades de la
muestra en cada uno de ellos. Para su clculo, en el muestreo aleatorio estratificado se
utilizan varios mtodos.

32
a. Muestras de igual tamao, denomina tambin Afijacin igual y consiste en
establecer el mismo nmero de unidades para cada estrato muestral.

b. Muestras de asignacin o Afijacin proporcional, cuyo tamao estar determinado


por los costos y el grado de variabilidad, en tal forma que el error de estimacin sea
mnimo para un costo total dado.

SIMBOLOGA

En el Muestreo Aleatorio Estratificado se utilizan smbolos, especiales tanto para la


poblacin como para la muestra.

N = total de unidades que constituyen la poblacin objetivo.


N h Total de unidades que contiene cada estrato poblacional.

h = identifica el estrato, donde h toma valores de 1, 2, 3, hasta M estratos.


N1 N 2 N 3 , etc. Sern los tamaos poblacionales en los estratos 1, 2, 3, etc.

N h N N1 + N 2 + N 3 +. N M

Y Media aritmtica poblacional para cada estrato

Yh
Y hi
Y1
Y 1
Y2
Y 2
Y3
Y 3

NH N1 N2 N3

Yst Media aritmtica poblacional estratificada ponderada

Yst
Y N
h h
Y st Y W h h
N
Wh Proporcin de elementos en cada estrato

Nh N1 N2 N3
Wh W1 W2 W3
N N N N

W h W1 + W2 + W2 + WM 1

33
Y
2
2 2 hi N hYh
S h Varianza Poblacional en cada estrato S h
Nh 1
n = Nmero de unidades que contiene la muestra total.
nh Nmero de unidades que contiene la muestra en cada estrato muestral.

n h n n1 n2 n3 ......

yh Media aritmtica muestral para cada estrato

yh
Y hu
y1
y 1
y2
y 2
y3
y 3

nh n1 n2 n3

Yst Media aritmtica muestral estratificada

yst
N h yh
Y st yW

h h
N

y
2
2 2 hi nh yh
sh Varianza Poblacional en cada estrato sh
nh 1
Dependiendo de la manera como se distribuyen los elementos dentro de los estratos
muestrales, se ha dicho que se tienen tres mtodos, los que sern tratados en forma
independiente:

a) Asignacin Igual:- se ha dicho que este mtodo implica que los tamao
muestrales en cada estrato sean iguales:
n1 n2 n3 , etc.

Antes de determinar el tamao de la muestra, elaboramos la estratificacin para la


poblacin de las 355 familias que se ha venido analizando.
En primer lugar, se hace necesario identificar la caracterstica que se tendr en
cuenta al conformar los grupos o estratos, en este caso, sern los ingresos de las

34
355 familias. Los niveles de ingresos para los diferentes estratos fueron fijados en
forma caprichosa, de tal manera que permitan la explicacin de algunos resultados,
no esperados.

Estrato I: Ingresos menores a 165 (miles $)


Estrato II: Ingresos entre 165 y 250 (miles $)
Estrato III: Ingresos superiores a 250 (miles $)
A continuacin presentamos la poblacin de las 355 familias en los 3 estratos establecidos:

35
Veamos la aplicacin de las frmulas. En primer lugar, si consideramos que no existe
forma alguna de obtener las varianzas poblacionales para cada estrato, hay necesidad de
realizar una encuesta preliminar. Supongamos, arbitrariamente, que el tamao de la
encuesta preliminar es de 4% del tamao poblacional, tal como lo hicimos en el Muestreo
Aleatorio Simple.

n pre lim inar 0,04(355) 14,2 14 familias

Aplicando el mtodo de asignacin igual, donde n1 n2 n3 , se tendr:


n pre lim inar 14
nh 4.67 5 L = nmero de estratos = 3
L 3

n1 5 n2 5 n3 5 n pre lim inar 15

Con los anteriores tamaos para la encuesta preliminar, seleccionamos 5 unidades de


cada uno de los estratos poblacionales, utilizando la tabla de nmeros aleatorios o la
calculadora.
Estrato I
N Nmero Ingreso Propiedad Nmero de Personas Consumo diario
(Miles de carne en
de orden aleatorio $) vivienda Total Hombres Mujeres Trabajan grs.
1 136 146 si 3 2 1 1 508
2 008 79 si 2 0 2 1 680
3 052 156 no 4 3 1 1 720
4 036 79 no 1 0 1 1 580
5 111 145 si 2 1 1 1 632

Estrato II
N Nmero Ingreso Propiedad Nmero de Personas Consumo diario
de (Miles de carne en
orden aleatorio $) Vivienda Total Hombres Mujeres Trabajan grs.
1 028 205 Si 3 2 1 2 630
2 126 205 Si 3 2 1 2 630
3 096 193 Si 2 0 2 2 650
4 056 208 No 3 1 2 2 638
5 088 196 No 3 1 2 2 584

Estrato III
N Nmero Ingreso Propiedad Nmero de Personas Consumo diario

36
de (Miles de carne en
orden aleatorio $) vivienda Total Hombres Mujeres Trabajan grs.
1 23 273 si 3 3 2 2 816
2 55 296 no 2 2 1 2 555
3 09 395 no 5 5 3 3 680
4 18 323 si 7 7 5 3 744
5 46 293 si 3 3 2 2 686

A continuacin se calcula la varianza y la media del ingreso por familia en cada uno de los
3 estratos.

x1 121 x2 201,4 x3 316 s1 38,58 s2 6,50 s3 47,61


2 2 2
s1 1,488,5 s2 43,3 s3 2.267 n1 5 n2 5 n3 5

La media aritmtica estratificada es igual a:

xst W xh h 0,46(121) 0,37( 201,4) 0,17(316) 183 (Miles de $)

Supongamos que el investigador establece de acuerdo a su experiencia que el error (E)


debe ser igual al 5% de xst y la confianza del 95% o sea que z = 1,96 E = 0,05(183,9) =
9,19

2 2
E 9,19
22,0
z
1,96

El nmero de unidades encontradas en cada estrato poblacional es:

Estrato I: N1 162 Estrato II: N 2 132 Estrato III: N 3 61

N h N1 N 2 N 3 162 132 61 355 N h N 355

La proporcin de unidades en cada uno de los estratos poblacionales es:

N1 162 N 2 132
X1 0,4563 0,46 O 46% W2 0,3718 0.37 O 37%
N 355 N 355

37
N3 61
W3 0,1718 0,17 O 17%
N 355

Tamao de la Muestra

Para determinar el tamao de la muestra en una poblacin estratificada, utilizando el


mtodo de Afijacin igual, se deben aplicar las siguientes frmulas de acuerdo a la
caracterstica, sea cualitativa que se tome como referencia.

a) Estimacin del promedio de ingresos por familias.

2 2
1 Wh S h 1 E2 E
2

n0

W n0

Wh Sh
2
Siendo: V
z2 z
h

n0 NZ 2 Wh Sh
2
n
Y n Tambin se puede calcular mediante: n
1 0 NE 2 Z 2 Wh S h
2
N
La confianza es considerada del 95%, o sea z = 1.96

1 1
Wh S h n0 0,46(1.488,5) 0,37( 42,3) 0,17( 2.267) 49,35
2
n0
22

n0 49,35 NZ 2 Wh Sh
2
n 44 familias
n0 49,35 Si: n
1 1 NE 2 Z 2 Wh S h
2
N 355

355(1,96) 2 0,46(1.488,5) 0,37(42,3) 0,17(2.267)


n 44 familias
355(9,19) 2 1,96 0,46(1.488,5) 0,37(42,3) 0,17(2.267)

Y los tamaos muestrales en cada estrato sern:

44
N h nh 15 n1 15 n2 15 n3 15 , n n1 n2 n3 45
3

38
b) En la estimacin de proporciones, hay necesidad primero que todo de familiarizarse
con la simbologa a utilizar, tanto para la aplicacin de las medidas muestrales como
para los parmetros.

N = tamao de la poblacin
Ah Ahi Numero de unidades que presenta la caracterstica, en cada estrato
poblacional.

Ph Proporcin de elementos que presenta la caracterstica en cada estrato

poblacional.

Ph
A hi
P1
A 1i
P2
A 2i
P3
A 3i

N N1 N2 N3

2 2 2 2
S p h Varianza en los estratos poblacionales S p h PhQh S p1 P1Q1 S p 2 P2Q2

2
S p3 P3Q3

n = Tamao de la muestra

a hu Nmero de unidades que presenta la caracterstica en el estrato muestral.

ph
a hi
p1
a 1i

a1
p2
a 2i

a2
n n1 n1 N2 n2

Pst Proporcin poblacional estratificada Pst N h Ph


Pst W P h h
N

pst Poblacin muestral estratificada pst N h ph


pst W h ph
N

Dentro del esquema que se ha venido siguiendo, en primer lugar se deben calcular los
tamaos muestrales para realizar estimativos de proporciones y totales, cuando se
conocen y desconocen las varianzas poblacionales.

39
Con la informacin obtenida sobre familias propietarias de la vivienda, a travs de la
encuesta preliminar a 15 familias, se tendr:

3 3 3
p1 0,6 p2 0,6 p3 0,6
5 5 5

(Coincidencial es el hecho de que las proporciones sean iguales para los 3 estratos)

Adems se sabe que:


W1 0,46 W2 0,37 W3 0,17 q1 0,4 q2 0,4 q3 0,4

z 1,96 E 2 10% N 355 N1 162 N 132 N 3 61

Estos datos permiten trabajar con las frmulas anteriores vistas. En primer lugar
veamos su aplicacin, para obtener el valor de n en los estimativos de una proporcin,
con un error del 10% y una confianza del 95%.

n
W P Q
n n n n
n0

E Z 2 n
1 0
N
1
n 2
0,46(0,6)(0,4) 0,37(0,6)(0,4) 0,17(0,6)(0,4) 92,20
0,10 ;

1,96

96,15
n 76 familias
96,15
1
355

N 2 Z 2 Wn PnQn
Tambin podemos tabular n mediante la frmula: n
NE 2 Z 2 Wn PnQn

355(1,96) 2 0,46(0,6)(0,4) 0,37(0,6)(0,4) 0,17(0,6)(0,4)


n 76 familias
355(0,10) 2 1,96 0,46(0,6)(0,4) 0,37(0,6)(0,4) 0,17(0,6)(0,4)

El resultado debe ser exactamente igual si aplicamos la frmula anterior:

40
CALCULO DE ESTIMATIVOS Y FIJACION DE LMITES

En primer lugar consideraremos que el tamao de la muestra (n) es igual a 36, en lugar de
los resultados anteriores obtenidos. Teniendo en cuenta la caracterstica (variable)
ingresos, una confianza del 95%, con los cuales procederemos a calcular el estimador del
promedio y fijar los lmites de confianza.

Siendo n = 36, por el mtodo de Afijacin igual, se tendrn los siguientes tamaos
muestrales para cada uno de los estratos:
n 36
nh 12 n1 12 n2 12 n3 12 n = 36
L 3

Determinando los tamaos muestrales, se har la seleccin de las unidades en cada uno
de los estratos, con el fin de recoger la informacin para cada una de las familias:

41
MUESTREO ASIGNACION IGUAL

Estrato I

N Nmero Ingreso Propiedad Nmero de Personas Consumo de


(Miles carne diaria
orden aleatorio $) vivienda Total Hombres Mujeres Trabajan grs.
1 151 123 no 3 2 1 1 605
2 008 76 si 2 0 2 1 680
3 033 76 si 3 2 1 1 600
4 122 126 no 4 2 2 1 520
5 076 126 no 3 1 2 1 516
6 082 86 no 2 1 1 1 510
7 131 79 no 3 2 1 1 509
8 096 113 si 6 2 4 1 700
9 048 89 si 2 1 1 1 720
10 055 102 no 1 1 0 1 530
11 018 86 no 1 0 1 1 510
12 076 126 no 3 1 2 1 516

Estrato II

N Nmero Ingreso Propiedad Nmero de Personas Consumo de


(Miles carne diaria
orden aleatorio $) vivienda Total Hombres Mujeres Trabajan grs.
1 020 188 No 3 1 2 2 880
2 048 194 Si 4 3 1 1 536
3 11 205 Si 4 2 2 2 734
4 124 236 Si 4 2 2 2 716
5 076 214 Si 4 2 2 2 716
6 001 186 Si 5 3 2 2 789
7 032 186 Si 5 2 3 2 757
8 086 172 No 5 3 2 2 584
9 116 173 No 3 1 2 2 612
10 094 199 No 4 2 2 2 532
11 035 193 Si 4 2 2 2 520
12 022 187 No 2 2 0 2 520

42
Estrato III

N Nmero Ingreso Propiedad Nmero de Personas Consumo de


(Miles carne diaria
orden aleatorio $) vivienda Total Hombres Mujeres Trabajan grs.
1 25 268 Si 2 1 1 2 760
2 51 288 Si 2 1 1 2 724
3 58 286 Si 3 1 2 3 510
4 36 389 No 3 1 2 3 802
5 08 262 Si 5 2 3 3 620
6 05 313 No 5 2 3 3 868
7 11 289 No 4 2 2 2 770
8 29 287 Si 3 1 2 2 555
9 37 297 No 3 1 2 2 794
10 44 386 Si 3 1 2 3 830
11 19 496 Si 6 2 4 4 700
12 50 298 No 3 2 1 2 600

Ahora recordamos que la seleccin en el primer estrato, se realiza mediante el uso de la


tabla de nmeros aleatorios o de la calculadora, para la cual se toman 12 unidades cuyos
nmeros estn comprendidos entre 001 y 162; lo mismo que har, para el Estrato II entre
001 y 132 y para el Estrato III, para 01 y 61. Se ha acordado la seleccin sin repeticin de
las unidades.

Con las anteriores tablas se pueden obtener los diferentes estimadores para:
proporciones, razones y proporciones en conglomerados, fijando lmites de confianza para
cada estimador puntual.

ESTIMACION DEL PROMEDIO Y TOTAL

a) Consideramos el promedio y el total de ingresos de las familias, calculando en primer


lugar los promedios para cada uno de los estratos muestrales.

x1
x 1i

1.214
101,17 x2
x 2i

2.333
194,42
n1 12 n2 12

x3
x 3i

3.859
321,58,17
n3 12

43
Las desviaciones tpicas para cada estrato sern:

s1
x 1
2
n1 x1
2


127.366 12(101,17) 2
20,33 s 21 413,61
n1 1 12 1

(Nota:- Se trabaj en la calculadora con el programa de estadstica)

x
2
n2 x 2 2 457.021 12(194,42) 2
s2 i
17,70 s 2 2 313,36
n1 1 12 1

s3
x 3
2
n3 x 23

1.292,413 12(321,58) 2
68,37 s 23 4.674,81
n3 1 12 1
La media muestral estratificada ser igual a:

xst W xh h 0,46(101,17) 0,37(194,42) 0,17(321,58) 173,14 O $ 173.140

La frmula para fijar los lmites de confianza para el promedio, es:

1 s
2

X xst t 2 N h ( N h nh ) h
N nh

1 413,61 313,36 4.674,81


X st 173 2,035 162(162 12) 12 132(132 12) 12 61(61 12)
3552 12

Al fijar los lmites de confianza del 95% para el promedio, el valor de t, ser:

n1 n2 n3 3 12 12 12 3 33

Para 33 y 0,05, se tendr que t = 2,035

182,04=$182.049,96
X st 173,14 2.035 19,17
164,23=$164.230,05

En los estimativos de totales para la fijacin de los lmites de confianza del 95 %, se


proceder de la siguiente manera:

44
2
Sh
X st NX st N h ( N h nh ) nh

El estimador de la varianza con el cual se obtiene el valor del error de estimacin se


puede calcular de la siguiente manera:

2
sh
Vx st N h nh )
nh

413,63 313,36 4.674,81


V x st 162(162 12) 132((132 12) 61(61 12) 2'415.612,71
12 12 12

64.627,55 $64.627.550

X ST 355(173,14) 2,035 2'415.612,71 58.301.85 $58.301.850

El estimador de la varianza para obtener el error de estimacin se puede calcular

mediante la aplicacin de la frmula V x st


1 f
Wh s h
2
siendo:
n

X st xst
1 f
n Wh S h
2

Veamos como se calcula, tomando los anteriores datos muestrales:

36
1 355
V x st 0,465( 413.61) 0,37(313,36) 0,17( 4.674,81) 27, 48
36



183,67
X st 173 2,035 27,48 ( milesde$)
162,33
La diferencia observada es mnima; anteriormente el estimador haba sido de 19.17 y
ahora es de 27,48. Al hacer calculada con todos los decimales, el resultado deber ser
exactamente igual. Algo similar sucede con la siguiente frmula, para calcular el
estimador de la varianza.

2
s (1 f h ) )
2
W 2 h sh 2
v W
x st
h h

nh
Siendo: X st xst t (1 f n )

nh

45
0,462 (413,61) 12 1,37 2 (313,36) 12 0.17 (4.67,81 12
V x st 1 1 1 19.05
12 162 12 132 12 61

b) Para el clculo del promedio y total de personas por familia, el procedimiento es igual
al utilizado para los ingresos.
2 2 2
x1 2,75 x2 3,92 x3 3,5 s1 1,84 s2 0,81 s3 1,55

xst 0,46( 2,75) 0,37(3,92) 0,17)3,5) 3,31 Personas por familia.

1 1,84 0,81 1,55


x 162(162 12) 12 132(132 12) 12 61(61 12) 12 0,041
st
355 2
3.72
X st 3,31 2,035 0,0411 (Promedio de Personas)
2.99

1.320,06=1.321

X st 355(3,31) 355(0,41) (Total de personas)


1.029,5=1.030

c) Si se desea estimar y fijar lmites de confianza del 95% para el consumo promedio y
total de carne diario de las familias, se tendr:

x1 576,33; x2 658,0; x3 711,08; s12 6.726,97; 2


s2 15,027.17;

2
s3 13.226,45;

xst 0,46(576,33) 0,37(658) 0,17(711,08) 629,46 gramosdecarnediaria

1 6.726,97 15.017,27 13.226,45


V x st 162(162 12) 132(132 12) 61(61 12) 291,52
355 2 12 12 12

X st s i 629,46 2,035 291,52


664,72
594,72 (Promedio diario de consumo de carne)

235.79, 10
X st s 355(629,46) 355(34,74) (Total de consumo para las 355 familias)
i
211.125,6

46
ESTIMACION DE UNA PROPORCION Y TOTAL

A travs de los resultados obtenidos en la encuesta corresponde a la muestra de 36


unidades, se calcularn las proporciones muestrales para cada estrato, para la proporcin
y total de familias propietarias de vivienda.

p1
a 1

4
0,33 q1 0,67 p2
a 2i

7
0,58 q2 0,42
n1 12 n2 12

a 7 N Ph
W
3i
p3 0,58 q3 0,42 Siendo: pst h
h ph
n3 12 N

pst 0,46(0,33) 0,37(0,58) 0,17(0,58) 0,465 46,5% Son propietarios.

Para el estimador de la varianza en la proporcin se clculo es similar al utilizado para la


variable; veamos el primer procedimiento:

1 f
V PST
1
N 2

Wh ph qh 1 pq
Siendo: Pst pst t 2 N h ( N h n ) h h
n N nh h

1 0,33(0,67) 0,58(0,42) 0,58(0,42) 870,6587


V x st 162(162 12) 132(132 12) 61(61 12) 126.025 0.
3552 12 12 12
Tambin podemos obtener este mismo resultado mediante un segundo procedimiento,
como se puede observar a continuacin:

1 f
V p st Wh ph qh 1 f
Siendo: Pst pst Wh ph qh
n n

47
36
1
355 0,46(0,33)(0,67) 0,37(0,58)(0,42) 0,17(0,58)(0,42) 0,0058 Y por el
v p st
36
tercer procedimiento, para el clculo del estimador de la varianza se tendr:

Wh 2 ph qh Wh 2 ph qh
V p st n 1 f n

Siendo: Pst pst n 1 f n
h
h

0,462 (0,33)(0,67) 12 0,172 (0,58)(0,42) 12


V p st 12 1 1 0.0069
162 12 61

Los lmites de confianza del 95% para la proporcin de familias con vivienda se tendrn:
63,4%

Pst s i pst t V p st Pst s 0,465 2,035 0,0069


i

29,6%

Y los lmites de confianza del 95% para el total de familias con vivienda sern:
225
A st s Npst tN V p st
A st s i 355(0, 465) 355(0,169)
i 105

b) Asignacin proporcional:_Este mtodo nos permite determinar el tamao ptimo de la


muestra, as como los estimados puntuales y lmites de confianza para el promedio,
proporcin, razn y proporcin en conglomerados, en forma similar al de la asignacin
igual , con la diferencia de que los tamao muestrales en cada estrato, en lugar de ser
iguales en cuanto al nmero de unidades, se distribuyen en la misma proporcin que las
unidades en la poblacin; en otras palabras, el peso relativo dado por el nmero de
unidades en cada estrato en relacin al total de elementos de poblacin, debe ser igual al
obtenido en la muestra.

Nh nh
Wh wh Siendo: Wh wh
N n

Mediante este procedimiento, al igual que en el de asignacin igual y oprima, se pueden


obtener mejores estimaciones que a travs del muestreo aleatorio simple, ya que es

48
posible contener en la muestra, unidades de todos los tipos y caractersticas, hacindola
de esta manera mucho ms representativa de la poblacin.

Tamao de la Muestra

Como en todos los casos tratados, cuando no se conoce la varianza poblacional de la


caracterstica principal de la investigacin, para el clculo del tamao muestral, una de las
alternativas consiste en realizar una encuesta preliminar.

Recordemos que en la asignacin igual, el nmero de unidades es igual para cada uno de
los estratos muestrales. En la encuesta preliminar de 14 familias, esta fue la razn por la
cual se distribuyeron un total de (5) cinco familias para cada estrato; en cambio en la
asignacin proporcional, las 14 unidades se distribuyen en la muestra en la misma
proporcin como se distribuyen en la poblacin.

El peso relativo sigue siendo:

N1 162 N 2 132 N3 61
W1 0,46 W2 0,37 W3 0,17
N 355 N 355 N 355

W1 W2 W3 0,46 0,37 0,17 1 W h 1 100%

Los anteriores resultados sern utilizados para calcular los tamaos de la muestra en la
encuesta preliminar, para cada uno de los estratos.

n1 nW1 14(0,46) 7 n2 nW2 14(0,37) 5 n3 nW3 14(0,17) 3

En esta forma se tendr que el peso relativo en la muestra deber ser igual al de la
poblacin:

n1 7 n2 5
w1 0,47 w1 W1 w2 0,33 w2 W2
n 15 n 15

n3 3
w3
n 15
0,20 w3 W3 w h w1 w2 w3 1 100%

49
Las diferencias que resultan de las operaciones anteriores, se debe a las aproximaciones
realizadas para calcular los tamaos muestrales en cada estrato, pero de todas maneras
debern considerarse como iguales. Las diferencias que se presentan carecen de
importancia.

Una vez determinados los tamaos muestrales para la encuesta preliminar, se procede a
la seleccin de las unidades requeridas, que permitirn obtener informacin y as, calcular
la varianza y el error:

Encuesta preliminar Asignacin proporcional


Tabla N 14.10
ESTRATO I

N de Nmero Ingresos Propiedad Nmero de personas Consumo de


carne diario
orden Aleatorio (Miles $) Vivienda Total Masc. Fem. Trabajando grs.
1 086 163 SI 3 2 1 1 605
2 151 123 NO 3 2 1 1 605
3 008 79 SI 2 0 2 1 680
4 122 126 NO 4 2 2 1 520
5 076 126 NO 3 1 2 1 516
6 024 84 SI 4 2 2 1 610
7 055 102 NO 1 1 0 1 530

ESTRATO II

N de Nmero Ingresos Propiedad Nmero de personas Consumo de


carne diario
orden Aleatorio (Miles $) Vivienda Total Masc. Fem. Trabajando grs.
1 129 206 SI 5 1 4 2 780
2 063 186 NO 2 1 1 2 586
3 015 225 SI 3 1 2 2 852
4 039 172 SI 4 2 2 2 580
5 111 205 SI 4 2 2 2 734

ESTRATO III

50
N de Nmero Ingresos Propiedad Nmero de personas Consumo de
carne diario
orden Aleatorio (Miles $) Vivienda Total Masc. Fem. Trabajando grs.
1 03 306 SI 5 4 1 3 804
2 28 296 NO 5 2 3 3 558
3 11 289 NO 4 2 2 2 770

Con la informacin de la tabla N 14.10, respecto a ingresos (miles $) calcularemos el


tamao ptimo. Tambin calcularemos el tamao de la muestra para la caracterstica
propietarios de vivienda nicamente con el fin de aplicar las frmulas respectivas.

Los promedios y varianzas para los ingresos en cada estrato son:

2 2 2
x1 114,7 x2 198,8 x3 297,0 s1 839,24 s2 414,7 s3 73,0

La media ponderada ser: xst Wh xh 0,46(114,7) 0,37(198,8) 0,17(297,0) 176,8


El error de muestreo con un 5% ser igual a: E 0,005( xst ) 0,005(176,8) 8,84
La primera aproximacin para n ser:

W S
2
h h 0,46(839,24) 0,37(414,7) 0,17(73,0) 27,13
n0 27,13 n 26 familias
E Z 2
8,84
1,96
2
1
27,13
355

NZ 2 Wh Sh
2

Tambin mediante la frmula: n Se tendr que:


NE 2 Z 2 Wh S h
2

355(1,96) 2 0,46(839,24) 0,37(414,7) 0,17(73,0)


n 26 familias
355(8,84) 2 1,962 0,46(839,24) 0,37(414,7) 0,17(73,0)

Veamos ahora como sera el clculo n en una proporcin. Para ello consideramos como
caracterstica cualitativa a las familias propietarias de vivienda; adems, para este caso se
establece una confianza del 95% y un error del 10%.

3 4 1
p1 0,43 p2 0,8 p3 0,33
7 5 73

51
n0
W p q
h h h

0,46(0,43)(057) 0.37(0,8)(0,2) 0,17(0,33)(0,67)
80,49
E Z 2
0,10
1,96
2

80,49 NZ 2 Wh ph qh
n0 66 familias
80,49 Tambin mediante la aplicacin de: n
1 NE 2 Z 2 Wh ph q
355

355(1,96) 2 0,46(0,43)(0,57) 0,37(0,8)(0,2) 0,17(0,33)(0,67)


n 66 familias
355(0,10) 2 1,962 0,46(0,43)(0,57) 0,37(0,8)(0,2) 0,17(0,33)(0,67)

En el tema anterior, para la estimacin de promedios y totales por el mtodo de la


asignacin igual, se haba supuesto que el tamao de la muestra era de 36 familias. En el
caso de la Asignacin proporcional, tambin consideraremos que n sigue siendo igual a
36. Los tamaos muestrales para cada estrato seran:

n1 nW1 36(0,46) 17 familias n2 nW2 36(0,37) 13 familias


n3 nW3 36(0,17) 6 familias n = 36 familias

Determinados los tamaos muestrales para cada estrato, seleccionamos aleatoriamente


las unidades para la muestra, con lo cual se obtiene la informacin necesaria y con ellos
se 4expicaran los diferentes mtodos de estimacin puntual y de intervalos.

52
Tabla N 14.11 Muestra de Asignacin Proporcional

Estrato I
N de Nmero Ingresos Propiedad Nmero de personas Consumo de
carne diario
orden Aleatorio (Miles $) Vivienda Total Masc. Fem. Trabajando grs.
1 063 135 No 2 2 0 1 638
2 160 124 No 2 2 0 1 580
3 124 101 No 4 1 3 1 520
4 008 79 Si 3 1 2 1 620
5 096 113 Si 6 2 4 1 700
6 110 85 No 4 1 3 1 520
7 073 89 Si 3 2 1 1 520
8 037 126 No 3 1 2 1 580
9 021 106 No 3 1 2 1 730
10 056 95 Si 2 1 1 1 578
11 116 108 Si 4 1 3 2 716
12 141 95 Si 2 1 1 1 520
13 003 108 No 3 2 1 1 735
14 018 86 No 1 0 1 1 510
15 076 126 No 3 1 2 1 516
16 020 95 No 3 1 2 1 620
17 133 99 Si 3 1 3 1 512

Estrato II

N de Nmero Ingresos Propiedad Nmero de personas Consumo de


carne diario
orden Aleatorio (Miles $) Vivienda Total Masc. Fem. Trabajando grs.
1 006 235 Si 3 2 1 2 732
2 091 183 Si 3 0 3 2 636
3 121 218 No 5 2 3 3 687
4 034 202 Si 3 1 2 2 680
5 130 165 No 2 0 2 1 530
6 115 192 Si 5 3 2 2 732
7 081 215 No 3 1 2 2 613
8 075 196 Si 2 1 1 1 642
9 008 200 Si 3 1 2 1 804
10 100 226 Si 2 1 1 2 712
11 019 176 Si 3 1 2 2 880
12 023 214 Si 5 2 3 3 540
13 035 193 Si 4 2 2 2 520

Estrato III

53
N de Nmero Ingresos Propiedad Nmero de personas Consumo de
carne diario
orden Aleatorio (Miles $) Vivienda Total Masc. Fem. Trabajando grs.
1 31 321 No 4 2 2 2 806
2 42 296 No 3 1 2 2 684
3 53 346 Si 4 1 3 3 718
4 20 687 No 4 1 3 2 735
5 06 260 Si 4 2 2 2 752
6 38 299 No 4 2 2 2 755

Estimacin de promedio y de totales

Para este mtodo, nicamente se calculara el estimador del promedio y del total de
ingreso por familia, dejando al lector la aplicacin de las frmulas para hallar promedio de
personas por familia y consumo diario de carne (en gramos), toda vez que el proceso es
similar al utilizado para este ejercicio en la asignacin igual.

Las medias aritmticas y varianzas del ingreso (en miles $) por familia son:

2 2 2
x1 104,11 x2 201,15 x3 318,17 s1 266,11 s2 404,31 s3 1952,57
s1 163 s2 201 s3 442 n1 17 n2 13 n3 6

El estimador puntual se obtiene as:

xst W x h h 0,46(104,11) 0,37( 201,15) 0,17(318,17) 176,41

El estimador de la varianza para el clculo de error de estimacin ser:


2
1 sh
V x st
N2
N h ( N h nh )
nh

1 266,11 404,31 1952,57


V x st 132(162 17) 17 132(132 13) 13 61(61 6) 15,45
3552 6

sx st 15,43 3,93 Y los lmites de confianza del 95% para el promedio:

184,41= $184.410
X st s xst s tsx st X st s 176,41 2,035(3,93)
168,41= $168.410

54
n1 n2 n3 3 17 13 6 3 33 Siendo 0.05 , el valor de t =2,035

Para el total estimado se tiene:


65.607,75=miles $
X st N x st tsx st X st 355(176,41) 2,035(3,55)(3,93) 59.785,55=miles $
Se estima que ingreso total de las 355 familias ser aproximadamente de $ 62.625,550 y
que el verdadero total estar entre %59.785,550 con una seguridad del 95%.

Estimacin de proporciones y totales

Consideramos como ejemplo una caracterstica, cualitativa: propiedad de vivienda, para


estimar la proporcin y el total de propietarias, fijando lmites de confianza del 95%. Se
tendr:
7 10 2
p1 0,41 p2 0,77 p3 0,33
17 13 6
pst W h ph 0,46(0,41) 0,37(0,77) 0,17(0,33) 0,5296 52,96%

Se estima que el 52,96% de las familias son propietarias de vivienda.

1 ph qh
Psi pst t V p st V p st 2
N
N h ( N h nh )
nh

1 0,41(0,59) 0,77(0,23) 0,33(0,67)


V p st 162(162 17) 132(132 13) 61(61 6) 0,006
3552 17 13 6
68,81%
Pst 0,5296 2,035 0,006
37,11%

Entre 68,81% y 37,11% deber estar el verdadero porcentaje de familias propietarias de


vivienda. Para calcular el total de familias propietaria de vivienda, se tendr:

244,11 244

NP tN V
A 355(0,53) 2,035(355) 0,006
A Familias
si st p st su

132,19 132

55
Se estima que el total, 188 familias son propietarias de vivienda y el verdadero valor estar
entre 132 y 244 familias.

MUESTREO SISTEMATICO

Ms que un mtodo de Muestreo, podra ser considerado como un proceso de seleccin,


que algunos denominan seleccin a intervalos regulares. Generalmente se le define como
la obtencin de los elementos o unidades de una muestra mediante la aplicacin de algn
mtodo sistemtico, en el sentido opuesto a los aleatorios. Por tal motivo algunos no le
consideran como un mtodo de muestreo al azar, a menos que la lista o marco se haya
conformado al azar.

El Muestreo Sistemtico o en serie, se usa frecuentemente por ser un mtodo simple,


sencillo, directo y econmico. Arroja buenos estimativos, cuando la variable est ordenada;
por aos, valor, cantidad, etc. Se puede observar en las unidades seleccionadas, que la
variable se distribuye en la muestra casi igual que en el muestreo aleatorio estratificado,
Asignacin proporcional. Consiste en seleccionar una muestra, tomando las unidades a
intervalos regulares. Veamos cual es el proceso de seleccin.

a) supongamos que la poblacin estudiada est compuesta por 360 familias (en vez de
las 355 familias con las cuales se ha venido trabajando), adems el tamao de la
muestra (muestreo aleatorio simple o el obtenido por el mtodo de Afijacin) es de 30
familias; con esta informacin se podr determinar el intervalo de seleccin,
simbolizada por I.
I N
I
1 I Reemplazando, se tiene: I
360
12 cuando es un nmero entero.
f n n 30
N

Determinando el intervalo de seleccin, se debe obtener un nmero aleatorio dentro de


ese intervalo; supongamos que entre 001 y 012, se obtuvo el nmero 004, el cual se le

56
denomina punto de arranque. Se ha hecho la primera seleccin dentro del intervalo, en
razn a ser el intervalo (I) un nmero entero.

Una vez establecido el punto de arranque, mediante la seleccin aleatoria, se inicia el


proceso de seleccin sistemtica, correspondiendo el nmero 016 a la segunda unidad
seleccionada, a sta se le suma nuevamente el valor del intervalo, para obtener la
tercera unidad y as sucesivamente.

004 016 028 040 052 064 076 088 100 112 124 136 148
160 172 184 196 208 220 232 244 256 268 280 292 304
316 328 340 352

En el caso de que el valor obtenido para el intervalo de seleccin no sea un nmero


entero, se proceder de manera diferente. Siendo la poblacin de 355 familias y el tamao
30, se tendr un intervalo igual a:

N 355
I 11,83 12
n 30
Una vez calculado el valor del intervalo, deber redondearse al nmero inmediatamente
superior por pequea que sea la fraccin.

Mediante la tabla de nmeros al azar se selecciona un nmero, entre 001 y 355;


supongamos que fue el 208, a partir del cual (punto de arranque) se va acumulando el
valor del intervalo, as:
208 220 232 244 256 268 280 292 304 316
328 340 352 364 011 023 035 047 059 071
083 095 117 119 131 143 155 167 179 191

El proceso ms utilizado en la prctica, es el de calcular el intervalo de seleccin sin


importar si es un nmero entero o si presenta decimales en ste ltimo caso, se aproxima
al nmero inmediatamente superior, luego se selecciona aleatoriamente (al azar) un
nmero dentro del intervalo, con el fin de obtener el punto de arranque, al cual se le va
acumulando el valor del intervalo, es decir, se procede exactamente igual al primer
procedimiento.

57
Observemos los niveles de ingresos para cada uno de los nmeros aleatorios obtenidos:

N aleatorio 4 016 028 040 052 064 076 088 100 112
Ingreso (miles $) 106 206 114 95 386 186 184 285 202 262
Propiedad-vivienda si si si si no no no no si si

N aleatorio 124 168 148 160 172 184 196 208 220 232
Ingreso (miles $) 84 102 186 88 195 287 95 389 262 102
Propiedad-vivienda No Si Si Si Si Si No No No Si

N aleatorio 244 256 268 280 292 304 316 328 340 352
Ingreso (miles $) 226 214 105 128 79 279 111 286 132 124
Propiedad-vivienda Si No No No No Si No Si No No

Con la anterior informacin se puede efectuar la estimacin puntual, tanto para el


promedio como para la proporcin, as como tambin determinar el estimador por
intervalo, con una confianza del 95%.

5.500 1.238.682 30(183,3) 2


x 183,3 s2 7.943,05
30 30 1

s
X si x t 1 f (nota: se trabaj en la calculadora con el programa estadstica)
n

89,12 30 215.20=$215.200
X su 183,3 2,045 1 183,3 31,9
30 355
151,40=$151.400

58
15
En esta proporcin se tendr: p 0,50
30
0,68=68%

pq 0,05(05) 30
PS i p t 1 f PS i 0,5 2,045 1
n 1 30 1 355 0.32=32%

Ahora veamos que hubiera sucedido si la poblacin se encuentra estratificada. Podramos


considerar dos procedimientos, en primer lugar, en el caso de que la poblacin
estratificada, est enumerada en forma continua, desde 001 hasta N.

Numeracin por Numeracin


Estrato
Estrato Continua
I Desde 001 hasta 162 Desde 001 hasta 162
II Desde 001 hasta 132 Desde 001 hasta 294
III Desde 001 hasta 61 Desde 001 hasta 355

Los nmeros aleatorios seleccionados en el ejercicio anterior, corresponde en la


enumeracin contnua, a los siguientes:

N aleatorio N N
Equivalencia Estrato Equivalencia Estrato Equivalencia Estrato
anterior aleatorio aleatorio
004 004 I 124 124 I 244 082 II
016 016 I 136 136 256 094 II
018 028 I 148 148 268 1069 II
040 040 I 160 160 280 118 II
052 052 I 172 010 292 130 II
064 064 I 184 022 304 10 III
076 076 I 196 034 316 22 III
088 088 I 208 046 328 34 III
100 100 I 222 058 340 46 III
112 112 I 232 070 352 58 III

Si consideramos la informacin de la tabla dada para la Asignacin Proporcional respecto


al ingreso de las familias (x) en miles de ($) y propiedad (a), y suponiendo que los tamaos
muestrales por estratos sean:

59
ESTRATO II
ESTRATO I
N de Nmero x1 a1
orden aleatorio
1 004 08 No
2 016 83 Su
3 028 95 Si
4 040 135 Si
5 052 156 No
6 064 130 Si
7 076 126 No
8 088 88 No
9 100 162 No
10 112 163 No
11 124 101 No
12 136 146 Si N de Nmero
13 148 98 Si x1 a1
orden aleatorio
14 160 124 no 1 172 206 No
2 184 187 No
3 196 202 Si
4 208 232 No
5 220 206 Si
6 232 236 No
7 244 186 Si
8 256 199 No
9 268 208 No
10 280 166 Si
11 292 165 no

ESTRATO III
N de Nmero
x1 a1
orden aleatorio
1 304 286 si
2 316 332 si
3 328 362 si
4 340 293 si
5 352 286 si

N1 162 N 2 132 N 3 61 W1 0,46 W2 0,37 W3 0,17

6
x1 120,5 x2 199,36 x3 311,18 p1 0,43
14
2 2 2
s1 878,57 s2 520,25 s3 1.153,20 p2 0,36

s1 29,64 s2 22,8 s3 33,95 p3 1,0

60
Lo primero que observamos es la forma como los elementos se distribuyen en la muestra,
igual a la obtenida mediante la asignatura proporcional. El tratamiento que se d, para el
clculo de los estimadores puntual e intervalos de confianza, es exactamente igual al
utilizado para este mtodo.

x st Wh xh xst 0,46(120,5) 0,37(199,4) 0,17(311,18) 182,2 $182,200

pst W h ph pst 0,46(0,43) 0,37(0,36) 0,17(1) 0,50 50%

2
1 s
X st xst t 2 h
N ( N h nh ) h
N nh

1 878,57 520,25 1.153,2


X st 182,2 2,052 162(162 14) 14 132(132 11) 11 61(61 5)
3552 5

192,29=$192.2900
X st 182,2 2,052 24,19 182,2 10,09
172,11=$172,110

1 0,43(0,57) 0,36(0,64) 1(0)


Pst 0,50 2,052 162(162 14) 132(132 11) 61(61 5)
3552 14 11 5

0,66=66%
Pst 0,50 2,052 0,005985 0,50 0,16
0,34=34%

Especialmente, en el muestreo aleatorio estratificado, la aplicacin del mtodo sistemtico,


en primer lugar se debe determinar el tamao de la muestra y luego los tamaos
muestrales para cada uno de los estratos, por cualquiera de los mtodos de asignacin
que hubisemos decidido. En cada uno de los estratos muestrales, en forma
independiente, se calcula el valor del intervalo de seleccin, con el fin de aplicar la
seleccin sistemtica.

Supongamos, que mediante el mtodo de asignacin igual se obtuvo la siguiente


informacin:
n = 30 n1 10 n2 10 n3 10

61
Los intervalos son:
(Intervalos de seleccin)
En cada estrado
N1 162 132 61
I1 17 I2 14 I3 7
n1 10 10 10

Seleccionamos un nmero (aleatoriamente) entre 1 y 17, para el primer intervalo por


ejemplo 2, se tendr que los nmeros de seleccin para este estrato sern 002 019
036 053 070 087 104 121 138 155, ya que N, es igual a 162. Para el segundo
estrado tambin se selecciona un nmero aleatorio; supongamos que los resultados fueron
005 019- 033 047 061 075 089 103 117- 131, en este ejemplo el tamao
proporcional N 2 es igual a 132; para el tercero estrato los nmeros de seleccin fueron 01
08- 015 22 29 36 43 50 57. Podemos observar que n3 9 , lo cual se explica
por la aproximacin efectuada el valor del intervalo, al nmero inmediatamente superior, tal
que como generalmente lo hacemos. La experiencia, sin embargo, nos ensea que en
algunos casos es preferible trabajar con nmero inmediatamente inferior. Otro
procedimiento a seguir, para este caso sera continuar la serie, es decir:
57 + 7= 64, siendo N 3 61 , el nmero que sigue ser 03 y con ello se completa el total de
elementos para la muestra en es estrato.

En conclusin, en el muestreo sistemtico, la primera unidad se selecciona mediante la


utilizacin de los nmeros aleatorios y el resto se selecciona automticamente de acuerdo
a un proceso predeterminado. Cuando la lista esta hecha al azar u ordenado, este
procedimiento es equivalente al muestreo aleatorio estratificado, asignacin proporcional,
en cuanto a las unidades seleccionadas, siendo aplicado, en estimaciones de: deudores
en un almacn que vende al crdito; para revisar sumas, supongamos que de cada 10
cuentas se revisa minuciosamente una; en el control de horario de entrada y salida de los
obreros de una fbrica, por ejemplo: se toman 12 tarjetas diarias y se las revisa; se puede
utilizar tambin para la revisin de obreros con el objeto de evitar el robo de elementos o
herramientas, por cada 10 obreros que salen se revisa uno; otros muchos ejemplos se
podra citar, tales como vehculos que se revisan en un retn, barcos pesqueros que
atracan en la costa, nombres en un directorio telefnico, etc. Es indispensable preocuparse
en la aplicacin de este mtodo por las periodicidades escondidas, por ejemplo, las ventas
de un almacn, si slo se tiene en cuenta un da a la semana (siendo el intervalo 7) por
ejemplo los jueves; esta muestra no seria representativa de todas las ventas diarias. Por

62
otra parte en la aplicacin de este mtodo se hace necesaria la enumeracin u ordenacin
de los elementos en la poblacin, lo cual en algunos casos es casi imposible.

63
MUESTREO POR CONGLOMERADOS

UNA ETAPA
Si una poblacin se divide en grupos y se toma una muestra, se dice que se ha realizado
una muestra por conglomerados en una etapa, en la cual cada grupo sirve como unidad de
muestreo. Recordemos que los estratos se definen como grupos o mas o menos
homogneos en cuanto a su composicin interna; en cambio, en los conglomerados, se
espera que la composicin sea mas heterognea posible de tal forma que cada
conglomerado represente en lo posible a la poblacin. Es muy comn que estos
conglomerados hagan referencia a superficies o reas en que se ha dividido el terreno, por
ejemplo, un barrio o una manzana que pueden considerarse como conglomerados; el
primero como un grupo de manzanas, el segundo como un grupo de viviendas. Este
mtodo permite reemplazar a las unidades mas pequeas (unidades de seleccin) de las
poblaciones cuando ellas no puedan ser enumeradas, por unidades ms grandes que las
contiene, hacindolas fciles de listar y de manejar y desde luego resulta menos costoso
que los mtodos anteriormente prestados. Sin embargo, vale la pena sealar que entre
ms pequeo sea el conglomerado, ms exacto ser el estimador.

Con frecuencia a los conglomerados se les denomina unidades de muestreo primario.


Para este mtodo se presentan varias formas de trabajo para lograr que el estimador del
parmetro sea lo ms representativo, dependiendo de la caracterstica en la poblacin.

a) En primer lugar vimos en el muestreo aleatorio simple como una unidad de


elemental de seleccin, familias, en un momento dado se constitua en
conglomerado, al estar conformado por un grupo de personas; en ese caso, la
proporcin se estimaba mediante la frmula:

a a i 2 p a i mi p mi
2 2 2
1 f
P
I
V p
n i nm
2
n 1

b) En segundo lugar, el muestreo sistemtico en algunos casos se parece en sus


aplicaciones, al muestreo por conglomerados, siendo equivalente la muestra
sistemtica de un conglomerado, si se efecta una seleccin aleatoria de los (k)
conglomerados en que se ha dividido la poblacin. Supongamos una seleccin

64
sistemtica de 30 familias de una poblacin estratificada, para la cual hemos
calculado el intervalo se seleccin.

355
I 12
30
Se podr decir que aproximadamente se tienen 12 grupos o conglomerados de 30
unidades cada uno. Mostraremos algunos de esos conglomerados, para que el
lector se forme una idea de su conformacin.

Conglomerado N 2
Conglomerado N 01

N de Nmero x1 a1
orden aleatorio
1 001 92 si
2 013 126 No
3 025 135 Si
4 037 126 Si
5 049 101 No
6 061 113 No
7 073 89 No
8 085 101 Si
9 097 114 Si
10 109 102 No
- --- - -
- --- - -
- -- - -
28 325 321 Si
29 337 328 Si
30 349 296 Si

65
N de Nmero
x1 a1
orden aleatorio
1 002 106 Si
2 014 104 No
3 026 125 Si
4 038 95 Si
5 050 100 No
6 062 84 No
7 074 106 Si
8 086 163 Si
9 098 96
10 110 85
- --- - -
- --- - -
- -- - -
28 326 324 Si
29 338 386 Si
30 350 329 Si

66
Conglomerado N 03 Conglomerado N 12

N de Nmero
N de Nmero
x1 a1 x1 a1
orden aleatorio
orden aleatorio
1 012 79 No
1 003 108 No
2 024 84 Si
2 015 145 No
3 036 79 No
3 027 105 Si
4 048 89 Si
4 039 98 No
5 060 98 Si
5 051 112 Si
6 072 106 No
6 063 135 No
7 084 88 No
7 075 86 No
8 087 113 Si
8 086 103 Si
9 108 96 no
9 099 93 No
10 120 - -
10 111 145 Si
- --- - -
- --- - -
- --- - -
- --- - -
- -- - -
- -- - -
27 324 284 No
28 327 386 Si
28 324 296 No
29 339 261 Si
29 348 279 Si
30 351 286 Si

Observemos al establecer todos los conglomerados posibles, que en los 7 primeros


cada uno tiene 30 unidades y los restantes 5 tan slo tienen 29 unidades, ya que la
poblacin es de 355 familias y no de 360, para que tuviesen igual nmero de
elementos.

Cada conglomerado ser una pequea rplica de la poblacin, utilizamos la tabla de


nmeros aleatorios, con el fin de seleccionar un nmero entre 01 y 12. Supongamos
que el resultado fue de 03, correspondiente al conglomerado seleccionado y que se
constituye en una muestra de 30 elementos.

c) En general, cuando una poblacin se divide en grupos o conglomerados y se


requiere realizar estimativos, se debe tener en cuenta la siguiente simbologa:

N = Nmero de conglomerados en la poblacin.


n = Nmero de conglomerados en la muestra.
M 1 = Tamao de cada conglomerado (Total de elementos en el grupo).

M= M 1 =Total de elementos en la poblacin de N conglomerados.

m= m 1 = Total de elementos en la muestra de n conglomerados.

67
M
M (Tamao medio de los conglomerados)
N
yi j Valor de la variable

yi Total del conglomerado en la muestra

mi
yi yi j

mi

y ij
y (Media del conglomerado)
n
y yi
n mi

Y ij (Total general de la muestra)


yi i
mi mi

y y
=Media general de la muestra Siendo: y
mi m
y

y
y =Medida de totales o total medio por conglomerado, en la muestra: y
n

Es de anotar, que en el muestreo estratificado el estimador de una proporcin por


conglomerados se debe calcular con la siguiente frmula:

pst
M p h h
Siendo: ph
a hu

M h m hi

Y el error de estimacin igual a:

1 f ahi 2 ph mhi ahi p 2 h m 2 hi


2

V ost

2
n m
h h nh 1

Veamos dos ejercicios que nos permitan entender el significado y la aplicacin en


conglomerados iguales y desiguales, realizados en una etapa; y al mismo tiempo,
observar el proceso que se sigue para el clculo del estimador, cuando se trata de
una variable, ya que en algunos ejemplos anteriores se ha hecho referencia al
estimador de una proporcin.

68
En primer lugar, para el muestreo por conglomerados iguales, supongamos que la
poblacin de 355 familias se ha dividido en 71 conglomerados y cada conglomerado
se encuentra conformado por 5 familias, as que todos contienen el mismo nmero
de familias, por tal razn de las denomina conglomerados iguales.

Consideramos ahora que la muestra sta constituida por 12 conglomerados: (n =


12), adems han sido seleccionados aleatoriamente, con la siguiente informacin:

Conglomerados Nmero N de personas


Total
De seleccin Por familia
1 18 3 -5 -2 - 1 - 4 15
2 03 3-3-1-2-3 12
3 64 46351 19
4 36 4432-2 15
5 41 52612 17
6 38 33422 14
7 30 32352 15
8 22 2 -2 4 5 3 16
9 14 1361-2 13
10 26 21521 11
11 19 3233-1 12
12 46 6144-2 17
N=71 n =12
Con los datos de la anterior muestra, calcularemos el promedio para cada
conglomerado.

i x1 xi xi
2
x
x i

35,2
2,93 3
n 12
1 15 3,0 9,00
N n xi nx
2 12 2,4 5,76 2 2
2
3 19 3,8 14,44 s
4 15 3,0 9,00 x Nn n 1
5 17 3,4 11,56
6 14 2,8 7,84 2 71 12 105,76 12(2,93) 2
s
7 15 3,0 9,00 12 1
x
71(12)
8 16 3,2 10,24
9 13 2,6 6,76 s
2
(0,0692)(0,2492) 0,017
10 11 2,2 4,84 x

11 12 2,4 5,76
12 17 3,4 11,56
176 35,2 105,76
El anterior resultado nos indica que en promedio ( x ) se tiene 3 personas por familia

69
Para el caso de muestreo por conglomerados desiguales con probabilidades
iguales, supongamos ahora que el barrio de 355 familias est compuesto por 35
manzanas y cada una de ellas se constituye en un conglomerado desigual con
respecto al nmero de vivienda.

De la poblacin N = 25 (conglomerados), supongamos que se extrajo una muestra


de 10 manzanas (n = 10), con la siguiente informacin:

i
mi yi 2
Conglomerados yi
m
2
Personas i 1,189
Vivienda
1 5 18 324
2 12 48 2,304 y i
2
15,631
3 8 40 1,600
4 10 36 1,296 m i 105
5 14 30 900
6 11 45 2,025 y i 379
7 13 34 1,156
8 9 28 784 m y i i 4,182
9 8 39 1,521
10 15 61 3,721
105 379 15,631

En el primer lugar identificamos smbolos:


N = Nmero total de conglomerados en la poblacin (N =25)
n = Nmero total de conglomerados en la muestra (n=10)
M = El nmero total de elementos en la poblacin (M=330 viviendas)
M i Nmero de elementos en cada conglomerado poblacional

M Tamao medio de los conglomerados

M
M i

330
13.2(Promedio de viviendas por conglomerado)
N 25

y
y i
Promedio de personas por conglomerado en la muestra
n
379 14 Ny
y
10
37,9 y
Mn
yi
M
y Estimador de la media por elemento
1
y (379) 2,87;
13,2(10)

70
25(37,9) 947,5
Tambin se puede calcular: y 2,8725 Promedio de personas por
330 330
vivienda.

1 f yi ny
2 2
1 0,4 15.631 10(37,9) 2
V 2 V
2

y n M n 1 y
10(13,2) 10 1

n 10
f 0,4 V


y

(0,00034)(140,7667) 0.048
N 25

Tambin se puede calcular:

V
N n 1
2 y i
2

ny 2
y
Nn( n 1) M

25 10 1
V
2
15.631 10(37.9) 2 ) 0,048
y
25(10 )(9 ) (13, 2)

De otra manera se podr hacer:

V
N
1 f
1
yi
2 yi
2


y
M n( n 1) n

10 25 1
2
(379) 2
V
1 15.631 0.048
y

25 330 20(19) 10

s 0.048 0.22 (Error estndar de 0.22) personas


y

El error de estimacin, tambin se puede calcular usando los estimadores de la razn,


siendo:
2
1 f yi 2 y M i yi y M i
2 2

V 2
nM

y n 1


10
1 25 15.631 2( 2.87)( 4.182) 2.87 2 (1.189)
V
2 0.054 S y 0.23
y



10(13.2) 10 1


71
MUESTREO BIETPICO

A este mtodo se le denomina muestreo por etapas. Cuando son dos, recibe el nombre de
bietpico y si son ms de dos etapas se le considera polietpico. Este mtodo puede
considerarse como un sub muestreo y se trata de una modificacin del mtodo de
muestreo por conglomerados, ya que la primera muestra est conformada por unidades
que son consideradas como conglomerados, una vez seleccionados stos, se efecta una
nueva seleccin o submuestreo dentro de cada conglomerado para la segunda etapa y as
sucesivamente.

A los conglomerados que resultan de la primera divisin se les denomina unidades


primarias, los de la segunda, secundarias y as sucesivamente. Los conglomerados
pueden ser de igual o de diferentes tamaos, siendo este ltimo caso el ms generalizado.

De lo anterior se desprende, que lo caracterstico de este tipo de muestreo es que el


proceso de seleccin se hace por etapas sucesivas; en cada una de las etapas la unidad
es diferente y las unidades finales (la ltima muestra) son las que nos permiten la
realizacin de la encuesta, para la recoleccin de la informacin; las anteriores son
unidades de seleccin.

Son muchos los ejemplos que se podran citar, en el caso del muestreo por etapas. En
primer lugar para la realizacin de la encuesta de hogares, podramos dividir la ciudad en
barrio (clasificados por niveles de ingresos, que seria los estratos); en esta etapas se
eligen en forma aleatoria o sistemtica, (de acuerdo al procedimiento adoptado), las
unidades que conforman el tamao de la muestra, cuya unidad de seleccin es el barro; la
segunda etapa consistira en elegir las manzanas en cada uno de los barrios
seleccionados en la primera etapa. En la tercera etapa podran seleccionarse las
viviendas, tomadas de las manzanas obtenidas en la etapa anterior. De continuarse con la
etapa cuarta, si se tiene como unidad de seleccin a la familia y una ltima podra ser,
cuando la unidad es el individuo.

Si una empresa tiene el sistema de venta a crdito, para cada deudor se tendr un tarjeta,
lo que implica tener varias gavetas, cada un de ellas con un nmero dado de tarjetas. El
proceso a seguir aplicando el mtodo bietpico, consiste en enumerarlas y seleccionar una

72
muestra cuya unidad sea la gaveta, luego se vuelve a muestrear, enumerando las tarjetas
en cada una de esas gavetas para efectuar una nueva seleccin, teniendo como unidad
final las tarjetas.

De los anteriores ejemplos se desprende, que si la unidad de muestreo es un


conglomerado constituido por elementos o unidades de observacin, no es necesario
considerar todas las unidades de observacin que pertenecen a la unidad seleccionada de
muestreo. Esta misma unidad de muestreo, la podemos considerar como una pequea
poblacin de la cual se podr obtener una muestra y as sucesivamente. Esto requiere la
construccin de marcos y su definicin, para cada una de las etapas.

Para el muestreo bietpico estratificado tambin hay frmulas especiales que pueden ser
consultadas en los diferentes textos de muestreo, lo mismo sucede para el muestreo
trietpico o polietpico, y algo similar cuando se trata de atributos. Para estudio de estos
mtodos se recomienda al lector consultar el libro del profesor Francisco Azorin Poch (ver
bibliografa) que lo presenta en forma bastante comprensible esta teora; no se exponen en
este texto, por ser considerados extensos para los objetivos propuestos.

Muestreo Por Conglomerados De Dos Etapas

En varias oportunidades se ha definido qu es un conglomerado, pero vale la pena


recordar que, el muestreo aleatorio por conglomerado es aqul en el cual cada unidad de
seleccin es una coleccin, conjunto o conglomerado de unidades o elementos. Se dice
que es de dos etapas o bietpico, ya que se obtiene primero una muestra aleatoria de
conglomerados y luego en una segunda etapa una muestra aleatoria de los elementos de
cada conglomerado seleccionado.

Este mtodo facilita la elaboracin del marco de la primera etapa y luego el de la segunda,
siendo ms econmico que el obtenido mediante el muestreo aleatorio estratificado.

Estimacin de promedio y totales

Supongamos que una firma tiene 110 fbricas distribuidas por todo el territorio nacional y
desea estimar el tiempo y nmero de mquinas que duraron paralizadas, ya sea por

73
mantenimiento o por dao, durante un trimestre. Por tiempo y distancia se disea una
investigacin aplicando el muestreo por conglomerados en dos etapas, para ello procede
a realizar una muestra de 12 fbricas y se toma, en la segunda etapa, una muestra del
20% de las mquinas de cada una de ellas.

El problema se puede presentan de dos maneras: (a) conociendo el total de mquinas


para las 110 fbricas, por ejemplo 5.500 mquinas; (b) se desconoce el nmero valor de
M.
a) cuando se conoce el valor de M
Solucin:
Algunos smbolos de entrada que debemos conocer

N = numer de conglomerados en la poblacin N=10


n = numer de conglomerados en la muestra n = 12
M = numer de elementos en la poblacin M = 5.500 M= M i

M 5.500
M Tamao promedio del conglomerado M 55
N 110
mi Numer de elementos en cada conglomerado

Veamos la presentacin de la informacin obtenida en la siguiente tabla:

2
Fbrica M i mi Tiempo sin funcionar (horas) xi si
1 46 9 3 5 0 0 0 8 6 0 2,44 10,03
2 38 8 4 0 0 6 10 0 5 3,13 14,13
3 52 10 0 0 0 6 0 4 8 1 0 2,50 10,06
4 60 12 3 3 0 1 1 0 0 5 0 2 1,33 2,31
5 55 11 0 0 3 0 0 6 0 0 1 0 155 6,87
6 40 8 2 1 5 0 0 0 0 2,00 8,86
7 40 8 4 0 0 6 10 2 6 3,50 13,43
8 36 7 0 0 3 7 0 1 2 1,86 6,48
9 30 6 5 0 6 0 0 4 2,50 7,9
10 64 13 0 0 0 6 5 0 10 0 0 0 0 1 2,15 11,47
11 70 14 2 0 0 0 4 6 2 0 6 2 0 0 0 1,79 4,95
12 50 10 2 3 5 0 0 0 0 0 2 1,30 2,90

N M i xi 1,216.09(110 )
Clculo del estimador de la media: Xc 2,03
Mn 5.500(12)

M i X i 46( 244) 38(3,13) 52(250) ..... 1.216.09

74
M i 46 38 52 60 .... 581

Los lmites de confianza del 95% para el estimador de la media son:

X x t N n 1 s 2 1 M (M m ) si
2

c c N nM 2 b nNM 2 i i i m
i

2 1
sp
n 1

( M i x 2 Mxc M i xi n( Mxc )
2 2

Reemplazando se tendr que:

M x (466 2.44) 2 38 3.13 52 2.5 .... 132.247,64


2 2 2
i i

2 1
sb
132.247,64 2 55 2.031.216,09 12 55 2.03 934.86
2

12 1

2
si 10.03 14.13
M i M i mi mi
46( 46 9)
9
38(38 8)
8
.... 18.571,91

Ahora de tendr que

110 12 1 1
X c 2.03 2.201 2
934.86 2
18.571,91
110 12 55 12110 55

2.40
X c 2.03 0.37 Horas
1.66

Para el total, los lmites del 95% de confianza sabiendo que M = 5.500

110 12 1 1
X c 5.500 2.03 5.500 2.201 2
934.48 2
18.571,91
10 12 55 12110 55
13.200
X c 11 .165 2.035 Horas
9.130

75
b) Cuando no se conoce el valor de M i , las frmulas anteriores sufren una ligera
modificacin:

M i xi 1.216,09
x 2,09
Mi
c
581

2 1
SR
M i x 2 2 xc M i 2 xi xc 2 M i 2
N 1

M xi 462 2.44 382 3.13 522 2.50 .... 60.207,47


2
i

M
2
i 462 382 522 602 552 ..... 29.781

2 1
SR
12 1

132.247.64 2 2.09 60.207,47 2.09 29.781 969.71
2


Los lmites de confianza del 95% para el estimador del promedio sern:

110 12 1 1
xc 2.09 1.201 969.71 2
18.571,91

110 12 49 2
12110 49

2.51
M
M u

581
49 X c 2.09 0.42 Horas
n 12
1.67

Y el total de horas, con un 95% de confianza, ser:

110 12 1 1
X c 5.390 2.09 1100 969.71 2
18.571,91

12 49 2
12110 49

13.528,9

X c 11 .265,10 2.263,8 Horas


9.001,3
Siendo: M NM 110 49 5.390 mquinas (estimacin)

76
Nota:- en la tabla N 14, 13, puede estar dado nicamente el tiempo sin funcionar
para que el estudiante calcule cada uno de x1 y x2 ; tambin puede suministrar
solamente las dos ltimas columnas, evitando su clculo.

Estimacin De Una Proporcin Y Total

a) Se conoce el valor de M
Cuando se conoce M. Se va a estimar la proporcin de mquinas que se paralizan
en el trimestre ya sea por mantenimiento y/o reparacin.

N de
Fbrica M i mi paralizados p qi
1 46 9 4 0,44 0,56 Se encuentra el nmero de mquinas que
2 38 8 4 0,50 0,50 fueron reparadas o se les hizo
3 52 10 5 0,50 0,50 mantenimiento. Informacin adicional.
4 60 12 7 0,58 0,42
5 55 11 4 0,36 0,64 M i 581
6 40 8 4 0,50 0,50 N = 110
M = 5.500
7 40 8 5 0,63 0,37
M 5.500
8 36 7 4 0,57 0,43 M 55
9 30 6 3 0,50 0,50 N 110
M
2
10 64 13 5 0,38 0,62 i 29.781
11
12
70
50
14
10
7
5
0,50
0,50
0,50
0,50 M
M i

581
49 (Cuando se estima)
n 12

M 110
Pc
nM
M P 12 5.500 284.88 0.4748 47,48 47%
i i

Los lmites de confianza para el estimador se obtienen mediante la siguiente
frmula:

N n 1 2 1 pq
Pc pc t 2 sb 2 M i M i mi i i
N nM nNM mi
2
Siendo: sb
n 1

M i qu 2 2 pc M M i pi n Mpc
1

2
reemplazando se tiene

que:

1
s 2b
7.172,31 2 0.47 49 284.88 12 55 0.47 188.12
2

12 1

77
M p 46 0.44 38 0.5 52 0.05 ........ 7.172.31
2 2 2 2
i i

M i pi 46 0.44 38 0.5 52 0.05 .................... 284.88

pi qi 0.44 0.56 0.5 0.5


M M i i mi
mi
46 46 9
9
38 038 8
8
..... 580.24

Con una confianza del 95% los lmites sern:

110 12 1 1
Pc 0.47 2.201 2
188.12 2
580.24
110 12 55 1210 55

0.62 Nota:- El error es muy grande, es


0.47 0.15 posible que se deba al trabajar con una
Pc muestra muy pequea.
0.32

Para establecer los lmites de confianza para el total, ser:

0.47 5.500 5.500 2.201 110 12 1 1


Ac 110 12 55 2 188.52 1210 55 2 580.24

3.119
834
A Mquinas
c 1.451

b) No se conoce M
Cuando no se conoce M se procede de la siguiente manera:

2 1
sr M i pi 2 2 pc M 2
i
pi pc
2
M i
2

n 1
2 1
sr
7.172,31 2 0.4914.435,24 0.492 29.781 16.02
n 1

M pi 462 0.44 0.382 0.5 522 0.5 ...... 14.435,24


2
i

pc
M p i i

284.88
0.49 49%
M i 581

Los limites de confianza del 95% para el estimador de la poblacin, ser:

110 12 1 1
Pc 0.44 2.201 2
16.02 2
580.24
110 12 49 12119 49

78
0.69=69%
0.49 0.20
Pc
0.29=29%

Para el estimador del total, con una confianza del 95% sern:

0.49 5.390 2.201 5.390 110 12 1 1


Ac 110 12 49 2 16.02 12110 49 2 580.24

3.709
2.641 1.064
A Mquinas
c 1.573

79

Вам также может понравиться