Вы находитесь на странице: 1из 12

UNIVERSIDAD CENTRAL DEL ECUADOR

FACULTAD DE CIENCIAS ECONMICAS


CARRERA ESTADSTICA
TRABAJO
TEMA: TAMAO DE LA MUESTRA,
EFECTO DEL DISEO, IMPREVISTOS EN
EL MUESTREO
AUTOR: JIMENEZ CLINTON
DOCENTE: INGENIERO ENRIQUE
NOBOA
AULA: 29

Tamao de la Muestra
El determinar el tamao de una muestra es la parte esencial del mtodo cientfico
para llevar a cabo una investigacin. Muestreo es el conjunto de observaciones
necesarias para estudiar la distribucin de determinadas caractersticas en la
totalidad de una poblacin, a partir de la observacin de una parte o subconjunto
de una poblacin, denominada muestra. El muestreo debe ser representativo, ya
que proporciona ventajas de ndole econmicas y prcticas.
Para determinar el tamao de la muestra depende de los parmetros que se
desean estimar, es decir que podemos estar interesados en conocer una media
aritmtica, una proporcin poblacional, diferencias de medias o una diferencia
de proporciones.

Definir el Tamao de una Muestra


Al definir el tamao de la muestra, la informacin debe ser representativa, vlida
y confiable y al mismo tiempo de un mnimo costo. Por lo tanto, el tamao de la
muestra estar delimitado por los objetivos del estudio y las caractersticas de la
poblacin, adems de los recursos y el tiempo de que se dispone.1
Etapas para determinar el Tamao De La Muestra
Una pregunta frecuente al disear un estudio estadstico es" Cuntos objetos
deben tomarse en la muestra?" Si la muestra es demasiado grande, se
desperdicia dinero al obtener los datos. Si la muestra es demasiado pequea, la
conclusin obtenida ser insegura. El tamao necesario de la muestra depende
de tres factores:
1. El nivel de confianza deseado.
2. El margen de error que el investigador est dispuesto a tolerar.
3. La variabilidad de la poblacin que se estudia.
El primer factor es el nivel de confianza. Las personas que realizan el estudio
eligen el nivel de confianza. Los niveles de confianza ms comnmente usados

1 Estadstica para la administracin y la economa de Lind Marchal

son 95% y 99%, pero se puede usar cualquier nivel entre O y 100%. El nivel de
confianza de 95% corresponde al valor z 1.96, y el nivel de confia1za de 99%
corresponde al valor z 2.58. Entre mayor sea el nivel de confianza elegido, mayor
ser el tamao de la muestra correspondiente.
El segundo factor es el error permitido. El mximo error permitido se designa por
E, es la cantidad que se suma o resta a la media muestral (o a la proporcin
muestral) para determinar los extremos del intervalo de confianza. ste es la
cantidad de error que las personas que realizan el estudio estn dispuestas a
tolerar. Este error corresponde a la mitad de la amplitud del intervalo de
confianza. Si el error permitido es pequeo, se necesitar una muestra grande.
Si el error permitido es grande, esto permitir una muestra ms pequea.
El tercer factor para determinar el tamao de la muestra es la desviacin
estndar poblacional. Si la poblacin est muy dispersa, se requerir una
muestra grande. Por otro lado, si la poblacin est concentrada (es homognea)
el tamao de muestra requerido ser ms pequeo. Ser necesario usar una
estimacin de la desviacin estndar poblacional.
1. Uso de un estudio comparable. Este mtodo se usa cuando existe una
estimacin de la dispersin, que se obtuvo en otro estudio. Supngase que se
quiere estimar el nmero de horas que trabajadores reticentes trabajaron por
semana. La informacin de alguna dependencia oficial que regularmente toma
muestras de trabajadores puede servir para obtener una. Estimacin de la
desviacin estndar, Si se piensa que una desviacin estndar obtenida en un
estudio anterior es confiable, se puede usar en el estudio actual para aproximar
el tamao de la muestra.
2. Uso de un mtodo basado en el intervalo. Para emplear este mtodo se
necesita conocer o tener un valor estimado de los valores mayor y menor de la
poblacin. Recuerde que en el captulo 4, donde se describi la regla emprica,
se vio que virtualmente. Puede esperarse que todas las observaciones se
encuentren entre ms o menos 3 desviaciones
Calculo del tamao de la muestra en el Muestreo aleatorio simple.
Si se conoce el tamao de la poblacin:

N = tamao de la poblacin
n = tamao necesario de la muestra
Z = margen de confiabilidad o nmero de unidades de desviacin estndar en
la distribucin normal que producir un nivel deseado de confianza
S = desviacin estndar de la poblacin conocida o estimada a partir de
anteriores estudios o de una prueba piloto.
E = error o diferencia mxima entre la media muestral y la media de la
poblacin que se est dispuesto a aceptar con un nivel de confianza que se ha
definido.
Si no se conoce el tamao de la poblacin:

n = tamao necesario de la muestra


Z = margen de confiabilidad o nmero de unidades de desviacin estndar en
la distribucin normal que producir un nivel deseado de confianza
S = desviacin estndar de la poblacin conocida o estimada a partir de
anteriores estudios o de una prueba piloto.
E = error o diferencia mxima entre la media muestral y la media de la
poblacin que se est dispuesto a aceptar con un nivel de confianza que se ha
definido.
El nico inconveniente del M.A.S. es la dificultad de llevarlo a la prctica
en investigaciones reales. Recordemos: al ser una tcnica probabilstica,
necesito un marco muestral con todos los individuos y que todos ellos sean
seleccionables para mi muestra. Un requisito que difcilmente puede cumplirse

en la mayora de estudios de mercado y opinin reales, lo que nos obligar a


emplear otras tcnicas.
Muestreo proporcional

n = tamao necesario de la muestra


Z = margen de confiabilidad
P = probabilidad de que el evento ocurra
Q = probabilidad de que el evento no ocurra
E = error de estimacin
N = tamao de la poblacin
Ejemplo:
En el proyecto de Al Haouz en Marruecos, se ha calculado que cerca del 30%
(0,3) de los nios de la zona del proyecto padecen de malnutricin crnica. Este
dato se basa en estadsticas nacionales sobre malnutricin en las zonas rurales
con alrededor de 2500; con un error del 5%. Utilizando los valores estndar
indicados se efecta el clculo siguiente:

/
()+ /

, (,)(,)
(, ())+ , (,)(,)

= 285,90 286

Calculo para el tamao de muestra para el muestreo estratificado


Vemos que la estratificacin puede proporcionar beneficios. Si estas tcnicas
pueden emplearse para estimar de forma ms precisa ya sean medias o
proporciones, tambin pueden permitirnos reducir el tamao de muestra
requerido para lograr una estimacin con un nivel de error determinado.

La siguiente tabla resume el tamao de muestra requerido al emplear cada


tcnica, en funcin del error mximo que estamos dispuestos a aceptar y de las
caractersticas del propio universo, que consideraremos de tamao infinito (si
fuese finito, debe aplicarse un factor de correccin).

Para interpretar el cuadro anterior es necesario tener en cuenta lo siguiente:


Z = Es la desviacin del valor medio que aceptamos para lograr el nivel
de confianza deseado. En funcin del nivel de confianza que busquemos,
usaremos un valor determinado que viene dado por la forma que tiene la
distribucin de Gauss. Los valores ms frecuentes son:
Nivel de confianza 90% -> Z=1,645
Nivel de confianza 95% -> Z=1,96
Nivel de confianza 99% -> Z=2,575
L: es el nmero de estratos en que peticionamos la muestra y h es un
ndice que se refiere a un estrato concreto. Por lo tanto, h puede variar
entre 1 y L estratos.
P: es la proporcin que buscamos en el total de la poblacin (p.e. % de
fumadores). Por lo tanto, (1-p) es la proporcin de la muestra
complementaria, la que no cumple el criterio buscado (no fumadores). Del
mismo modo, ph es dicha proporcin dentro de cada uno de los estratos.
2: es la varianza que el dato buscado (en el caso de estimar medias)
tiene en el total de la poblacin. Asimismo, h2 es la varianza dentro de
cada estrato.

e: es el margen de error aceptado.


Wh: es el peso que el estrato tiene en la muestra (tamao del estrato
respecto al total de la muestra). Si hablamos de estratificacin
proporcional, cada Wh es igual a la proporcin que ese estrato representa
en la poblacin. Si hablamos de estratificacin ptima, cada Wh se calcula
en funcin de la dispersin dentro de cada estrato.

Calculo del tamao de muestra en el Muestreo Sistemtico.


Entre ms grande sea la muestra, el intervalo de confianza para la media ser
ms pequeo, entonces, para definir el tamaa de la muestra primero se define
el tamao del intervalo esperado. Se define B como la distancia que se desea
entre la media y el lmite superior de la media, segn las unidades utilizadas.
Desafortunadamente, para encontrar el tamao de la muestra, se requiere
conocer de antemano la varianza poblacional, la cual se puede hacer de la
siguiente manera:
a) Investigar pruebas anteriores donde se haya calculado la varianza
b) Si se conoce el valor mnimo y el mximo, el rango dividido entre cuatro puede
ser un estimador.
c) Obtener una pequea muestra, luego calcular el tamao de la muestra
correcta utilizando los datos ya recopilados.
Se calcula el valor de D

Se calcula n

2
4

2
(1)+ 2

Ejemplo:
En una productora de chorizos se desea conocer el contenido de grasa promedio
de la produccin diaria. Si al da se producen 200 productos y por experimentos
previos se sabe que la varianza es de 21.24 grs. Encontrar el tamao de la
muestra necesaria si se permite un error mximo de 1 grs.

12
4

= 0,25

20021.242

= (2001)0,25+21,242 = 59,83
El resultado se redondea a 60. La cantidad es muy alta porque el lmite de error
se seleccion muy pequeo.

Efecto del diseo


Para calcular el tamao de la muestra, el efecto de diseo se debe tomar en
cuenta en la frmula de clculo. Hay dos problemas.
Primero, mientras que es fcil calcular el valor de ED despus de la encuesta, a
menudo no se conoce su valor antes de la encuesta a menos que se hayan
realizado encuestas previas sobre las mismas variables.
Segundo, el valor de deff difiere para cada indicador y, en realidad, para cada
grupo meta, ya que la homogeneidad de conglomerados vara por caracterstica.
No es prctico, por supuesto, realizar una encuesta con diferentes tamaos de
muestra para cada caracterstica con base en sus deffs variables, aun si se
conocieran sus valores.
Los valores de los deffs generalmente no se conocern para indicadores antes
de la encuesta, pero se espera que sean bastante pequeos para varios
indicadores, es decir, aquellos basados en subclases poco comunes (por
ejemplo, nios y nias de 12 a 23 meses).
La seleccin de una muestra mediante un diseo complejo tiene consecuencias
en el anlisis estadstico posterior.
Material y mtodo: Las diferentes formas de seleccin muestral pueden acarrear
la aparicin de sesgo y de una mayor varianza de los estimadores y es el
muestreo aleatorio simple el diseo de referencia. Se proporcionan diversos
ejemplos ilustrativos en los que diferentes estrategias de muestreo conducen a
situaciones de aparicin de sesgo y de aumento de la varianza. Resultados: La
inclusin de ponderaciones conduce a la eliminacin de sesgo. La evaluacin

del efecto del diseo permite medir el grado de distorsin que sufren las
varianzas debido al diseo muestral empleado y, por lo tanto, proporciona una
valoracin directa de la alteracin que sufren los intervalos de confianza
estimados cuando el diseo muestral se aparta del caso aleatorio simple. 2
Eliminacin de sesgo: uso de ponderaciones individuales
Los diseos basados en una asignacin no proporcional pueden corregirse
mediante la inclusin de los correspondientes factores de ponderacin.
Medicin del efecto del diseo
El muestreo aleatorio simple tiene 2 funciones.
1. permite tener una base de referencia para poder comparar la eficiencia
relativa de otros mtodos de muestreo.
2. en algn momento de la seleccin de individuos, ya sea dentro de los
estratos o para seleccionar los conglomerados, se utilizar como sistema
de aleatorizacin.
Para medir el efecto que tiene el diseo muestral hay que atender a la
estimacin de la varianza, la mayora de las situaciones prcticas utiliza
ponderaciones para evitar la aparicin de sesgo. Como las estimaciones de
parmetros poblacionales (como la proporcin de individuos que presentan una
determinada en enfermedad o tienen un determinado hbito) puede variar segn
cul sea la muestra que se haya seleccionado, se puede medir la varianza de un
estimador para concluir sobre el grado de variabilidad de las estimaciones.
La varianza del estimador empleado depende del diseo muestral y por esta
razn se denomina a veces varianza del diseo. Esta varianza se puede estimar
a partir de la informacin muestral y en este caso se denomina varianza muestral.
La raz cuadrada de esta varianza muestral provoca el error muestral.
La forma de poder evaluar el efecto de un diseo muestral es comparar la
varianza de un estimador obtenida mediante ese diseo con la que se obtendra
mediante un diseo simple de referencia. Habitualmente se considera muestreo
2

http://mics.unicef.org/files?job=W1siZiIsIjIwMTUvMDQvMDIvMDgvMjYvMzUvMTc3L01JQ1MzX0NhcGl
0dWxvNF9EaXNlbmFyX3lfc2VsZWNjaW9uYXJfbGFfbXVlc3RyYV9qdW4wNi5wZGYiXV0&sha=2fa5bfd8994
aa39d

de referencia el obtenido empleando una seleccin aleatoria simple. El cociente


entre ambas varianzas se conoce como el efecto del diseo y se denomina DEFF
(design effect).3

()

Imprevistos en el muestreo.
Error de muestreo
Definido como el error ocasionado por entrevistar a una parte de la poblacin
objeto de estudio, y es un indicador de la precisin de las estimaciones
realizadas. El nivel de precisin est muy relacionado con el tamao de la
muestra; de modo que, a medida que disminuye el tamao de la muestra,
disminuye tambin la precisin de las estimaciones y, por lo tanto, aumenta el
error muestral. Cuando aumenta el tamao de la muestra aumenta tambin la
precisin de las estimaciones y disminuye el error de muestreo, aunque es
preciso sealar que esta disminucin del error no es proporcional al aumento de
la muestra. De este modo, una elevada precisin de las estimaciones est
reflejando una escasa dispersin de la distribucin del estimador en la muestra
seleccionada o, dicho de otro modo, est reflejando una concentracin de los
valores
Errores producidos por los entrevistadores
En primer lugar, se sealan los errores producidos por una mala actuacin
de las personas que realizan la recogida de datos, que puede tener su
origen en una inadecuada seleccin, preparacin o control de estas
personas. A grandes rasgos, podramos sealar cuatro grandes tipos de
errores producidos por los entrevistadores: la cumplimentacin de los
cuestionarios por parte de los propios entrevistadores, realizar una mala
seleccin de las personas a entrevistar, influir de alguna forma en la
respuesta de los entrevistados y, por ltimo, una mala recogida de las
respuestas de stos. Para reducir el peligro (o tentacin) de la
3

http://www.elsevier.es/es-revista-medicina-clinica-2-articulo-la-importancia-del-efecto-del-13057544

cumplimentacin de los cuestionarios por los entrevistadores, es


necesario dedicar recursos a la supervisin de las entrevistas, supervisin
que debe realizarse con ms intensidad al comienzo de la investigacin,
tal y como apuntan Gonzlez Gmez y otros (1998b: 208).
En relacin con el segundo error, la realizacin de una mala seleccin de
las personas a entrevistar, es preciso recordar que este trabajo
comenzaba definiendo el muestreo probabilstico como aqul en el que se
conoce la probabilidad que tiene una persona de ser elegida, y que sigue
un proceso de seleccin que respeta tal probabilidad. Ello implica que las
personas son seleccionadas por un criterio aleatorio, y no basado en las
preferencias arbitrarias de los entrevistadores. No obstante, en
numerosas ocasiones esta situacin no se cumple en las ltimas etapas
del muestreo, desconsiderando as el criterio definitorio del muestreo
probabilstico. Cuando el investigador tiene una lista detallada con los
nombres y las direcciones de las personas que componen el marco
muestral, para realizar el proceso de eleccin muestral basta con la
seleccin de stos con una tabla de nmeros aleatorios. Sin embargo, en
la mayora de los casos, los investigadores no disponen de un marco
muestral tan detallado, y por ello utilizan diversos mtodos para la
seleccin de las unidades ltimas del muestreo. Entre stos suelen
distinguirse los mtodos utilizados para la seleccin de la vivienda a
entrevistar, generalmente sistemas de rutas aleatorias2, y los que se
emplean para seleccin de la persona dentro del hogar. Existen una gran
cantidad de mtodos para la seleccionar la persona dentro del hogar,
aunque uno de los ms utilizados en nuestro pas es el mtodo de cuotas.
El tercer error de los entrevistadores se produce por la influencia de stos
en la respuesta de los entrevistados, y se corrige fundamentalmente
con una adecuada seleccin y formacin de stos, as como con una
supervisin intensiva de las primeras entrevistas realizadas (MortonWilliams, 1991; Gonzlez Gmez y otros, 1998a: 141-144). El
entrevistador puede ser hombre o mujer, adoptar un estilo de vestir y
realizar las preguntas de una determinada forma. Adems, tiene una
orientacin ideolgica, unos prejuicios, etc.

Errores producidos por el sistema de recogida de datos y por la


situacin de la entrevista
El sistema de recogida de datos presenta en ocasiones una gran influencia
en las respuestas de los entrevistados, aspecto que no analizaremos aqu,
puesto que supondra alejarnos del tema principal de este trabajo, y por haber
sido realizado en otra publicacin del autor.
Error de no respuesta
En esta definicin aparecen dos tipos de no respuesta, la producida porque
una persona no ha contestado ninguna pregunta del cuestionario, y la
producida porque el entrevistado que estaba contestando el cuestionario ha
decidido no responder a determinadas cuestiones. La primera de ellas recibe
el nombre de no respuesta total, mientras que la segunda es definida como
no respuesta parcial.
Bibliografa:
Departamento de Econometra, Estadstica y Economa Espaola.
Universidad de Barcelona. Barcelona. Espaa:
http://www.elsevier.es/es-revista-medicina-clinica-2-articulo-laimportancia-del-efecto-del-13057544.
Muestreo estadstico conceptos y problemas de Cesar Prez.
Problemas de representatividad en las encuestas con muestreos
probabilsticos Vidal Daz de Rada:
https://ddd.uab.cat/pub/papers/02102862n74/02102862n74p45.pdf.
Vivanco, Manuel. Muestreo Estadstico: Diseo y Aplicaciones.
Universitaria, Santiago, 2005.