Вы находитесь на странице: 1из 4

El tamao (de la muestra) importa, pero quizs

no de la manera que pensamos


19 de marzo de 2013 en Estadstica
Recuerdo que cuando era pequeo en las estadsticas que aparecan en
televisin sola aparecer en una esquina de la pantalla el margen de
error del estudio realizado y el nmero de personas que participaron en
el mismo, como se puede ver en esta imagen
A m siempre me pareca poca gente en comparacin con el margen de
error que nos indicaban. Solamente con 400 personas obtenemos un
margen de error del 5%?
Y en realidad parece poco, pero eso no significa que no sea suficiente. La
pregunta es: estaba yo en lo cierto? Es poco, y por tanto nos estaban
engaando, o en realidad basta con esa cantidad de individuos para
asegurarnos ese margen de error?
En esencia, lo que querramos tener es una manera de calcular el
nmero necesario de personas que necesitamos para que los resultados
de nuestro estudio tengan un error mximo fijado desde el principio (s,
en estos casos se fija el error mximo admisible al principio del estudio).
Supongamos que partimos de una poblacin inicial de la cual conocemos
el nmero de individuos que la componen (podra ser la poblacin de
una cierta zona de Espaa) y queremos estimar qu proporcin de
individuos de entre todos los de dicha poblacin cumple cierta
caracterstica (por ejemplo, qu proporcin de habitantes de dicha zona
tiene un smartphone). Esta estimacin se suele realizar calculando
un intervalo de confianza, que es un intervalo en el cual se confa que
estar el valor de la proporcin de individuos que estamos buscando.
Qu significa eso de que se confa? Pues que no se puede asegurar con
total seguridad que la proporcin buscada pertenezca al intervalo, sino
que se tiene una cierta confianza en que sea as. Cunta confianza?
Pues la que se fije de antemano. El valor que mide esta confianza se
denomina nivel de confianza y se suele denotar como
, aunque se
suele dar en tanto por cierto,
% (a se le denomina nivel de
significacin). Por ejemplo, para un nivel de confianza del 95% (valor
que se usa muy frecuentemente) todo esto significa que al calcular un
intervalo de confianza para la proporcin que queremos estimar

confiamos al 95% en que el valor de dicha proporcin pertenecer al


intervalo.
Recapitulando vemos que para calcular el tamao de muestra en este
tipo de estudios tenemos que conocer el tamao de la poblacin y fijar
de antemano el nivel de confianza y el error mximo que admitimos.
Llamando
al tamao de la poblacin, el tamao de muestra, , que
necesitamos con un nivel de confianza
y un error se puede
calcular con la siguiente frmula:

siendo
un valor de la distribucin normal que se obtiene de una
tabla y la proporcin de individuos de la poblacin que poseen la
caracterstica que se est estudiando. Como ese dato es desconocido, se
suele usar
valor que maximiza el producto
.
Lo que parece claro es que cuanto mayor sea el tamao de la poblacin
mayor tendr que ser el tamao de la muestra. La cuestin que nos
ocupa es saber de qu forma crece el tamao de muestra en funcin del
tamao de la poblacin si tenemos fijado de antemano el nivel de
confianza y el margen de error. Vamos a realizar algunos clculos para
intentar hacernos una idea del asunto. Fijamos un nivel de confianza del

95% (con el cual


y, por tanto, se sabe que
) y un
error del 5% (con lo que
):
Para una poblacin de 100 personas, tenemos que el tamao de
muestra necesario en este caso ser:

Es decir, con 100 personas deberamos tomar una muestra de 80


individuos, casi la poblacin entera.
Veamos qu ocurre con 1000 personas:

Evidentemente el valor aumenta, 278 en esta ocasin, pero ya no est


tan cerca del tamao total de la poblacin como ocurra antes.
Para 10000 personas:

Sigue aumentando, pero como podis ver ya aumenta mucho


ms despacio. Hemos aumentado bastante el tamao de la poblacin,
de 1000 a 10000, pero el tamao de muestra no llega a aumentar ni en
100 individuos.
Y veamos qu ocurre para 100000:

Aqu se ve mucho mejor. Pasando de una poblacin de 10000 individuos


a una de 100000 la muestra aumenta en 13 individuos.
De todo esto se deduce que para poblaciones pequeas el tamao
de la muestra que debemos tomar es bastante grande en
comparacin con dicha poblacin (en ocasiones casi la poblacin
completa), pero para poblaciones de gran tamao (todos los
habitantes de Espaa, por ejemplo) basta con una muestra no
demasiado
grande
para
obtener
unos
resultados
estadsticamente fiables. O sea, que eso de que necesitamos muchos
individuos en una muestra para que los resultados sean buenos no es
del todo cierto.
Cul sera en nuestro caso el tamao mximo de una muestra? Pues el
que corresponda a una poblacin con una gran cantidad de elementos.
Podemos obtenerlo tomando la expresin del tamao de muestra como
una funcin cuya variable es
y calcular el lmite de esa funcin
cuando
tiende a infinito:
Es decir, que para poblaciones muy muy grandes necesitaremos tomar
una muestra de 385 personas para obtener buenos resultados para el
nivel de confianza y el error fijados de antemano (95% y 5%
respectivamente). Os dejo tambin la grfica de esta funcin (eje X:
tamao de la poblacin; eje Y: tamao de la muestra) hasta
:
Como se puede intuir a partir de la misma, la funcin tiene una asntota
horizontal a la altura del valor del lmite calculado antes.
Una ltima, pero muy importante, cuestin. Imaginemos que tenemos
una poblacin de 10000 personas, por lo que deberamos tomar una
muestra de 370 individuos. Nos vale cualquier muestra que tenga con
ese nmero de personas? Rotundamente no. Para que el proceso
funcione la muestra debe ser representativa de la poblacin, y si

no es as todo esto no sirve de nada. Para ello, la muestra debe


elegirse de manera aleatoria. De otra forma no tendremos asegurado
que sea representativa de la poblacin, por lo que el estudio no valdr
para nada.
A ver si toma nota ms de uno cuando saca conclusiones de toda una
poblacin a partir de los resultados de ciertas encuestas en las que la
muestra que genera dichos resultados no est elegida de manera
aleatoria y, por tanto, es cualquier cosa menos representativa de dicha
poblacin.
Fuentes:

La certeza absoluta y otras ficciones, libro de Pere Grima.

Tamao de la muestra en la Wikipedia en espaol.

Вам также может понравиться