Вы находитесь на странице: 1из 4

NUESTREO Lic.

Oscar Cruz N
Teora de muestreo
Introduccin
Una parte fundamental para realizar un estudio estadistico de cualquier tipo es obtener resultados
confiables y capaces de aplicar. Como es sabido, resulta casi imposible o impractico llevar a cabo
algunos estudios sobre toda una poblacin, por lo que la solucin es llevar a cabo el estudio
basandose en un subconjunto de esta denominado muestra.
Sin embargo, para que los estudios tengan la validez y confiabilidad buscada es necesario que este
subconjunto de datos, o muestra, posea algunas caracteristicas especificas que permitan, al final,
generalizar (inferir) los resultados en funcin de la poblacin. Esas caracteristicas tienen que ver
principalmente con el tamano de la muestra y con la forma de obtenerla.
En las siguientes secciones de este documento lo comentaremos.
Importancia del muestreo
A lo largo del curso de Estadistica se hacen uso de dos tipos de razonamiento: el deductivo y
el inductivo. El primero esta relacionado directamente con la teoria de probabilidad, y que a partir
de las caracteristicas de la poblacin se obtienen las posibles caracteristicas de una muestra. El
segundo tipo de razonamiento se relaciona con la denominada inferencia estadistica: utilizar las
caracteristicas de un subconjunto de la poblacin (la muestra) para hacer afirmaciones (inferir)
sobre la poblacin en general. ste sera el caso de este documento.
El muestro, como ya se mencion, implica algo de incertidumbre que debe ser aceptada para
poder realizar el trabajo, pues aparte de que estudiar una poblacin resulta ser un trabajo en
ocasiones demasiado grande, algunos autores ofrecen las siguientes razones extras:
Recursos limitados. Es decir, no exisfen Ios recursos humonos, moferioIes o economicos
poro reoIi;or eI esfudio sobre eI fofoI de Io pobIocion. Es como cuondo se compro un
oporofo, un oufomoviI usodo (por ejempIo), que se pruebo unos minufos (eI encendido,
uno correrifo, efc.) poro ver si funciono correcfomenfe y Iuego se odquiere, pero no se
espero o proborIo fodo Io vido (encendiendoIo y opogondoIo o, simpIemenfe, dejondoIo
encendido) onfes de reoIi;or Io odquisicion.
Escasez. Es eI coso en que se dispone de uno soIo muesfro. Por ejempIo, poro eI esfudio
poIeonfoIogico de Ios dinosourios (ejempIo) sero muy bueno confor con, oI menos,
muchos resfos fosiIes y os reoIi;or foIes invesfigociones, sin emborgo, se cuenfo soIo
con uno doceno de esqueIefos fosiIi;odos (cosi fodos incompIefos) de esos criofuros en
fodo eI mundo.
Pruebas destructivas. Es eI coso en eI que reoIi;or eI esfudio sobre fodo Io pobIocion
IIevoro o Io desfruccion mismo de Io pobIocion. Por ejempIo, si se quisiese sober eI
confeo exocfo de hemogIobino de uno persono hobro que exfroerIe fodo Io songre.
El muestreo puede ser mas exacto. Esfo es en eI coso en eI que eI esfudio sobre Io
pobIocion fofoI puede cousor errores por su fomoo o, en eI coso de Ios censos, que seo
necesorio ufiIi;or personoI no Io suficienfemenfe copocifodo, mienfros que, por ofro
NUESTREO Lic. Oscar Cruz N
Iodo, eI esfudio sobre uno muesfro podro ser reoIi;odo con menos personoI pero mos
copocifodo.
Ya se ha mencionado la necesidad de realizar muestras, describiremos algunas caracteristicas
que deben tener estas para que, realmente, se puedan realizar inferencias (inducciones) sobre
ellas hacia la poblacin total.
Tamao de las muestras
Para calcular el tamano de una muestra hay que tomar en cuenta tres factores:
1. EI porcenfoje de confion;o con eI cuoI se deseo generoIi;or Ios dofos desde Io muesfro
hocio Io pobIocion fofoI.
2. EI porcenfoje de error que se prefende ocepfor oI momenfo de hocer dicho
generoIi;ocion.
3. EI niveI de voriobiIidod que se coIcuIo poro comprobor Io hipofesis.
La confianza o el porcentaje de confianza es eI porcenfoje de seguridod que exisfe poro
generoIi;or Ios resuIfodos obfenidos. Esto quiere decir que un porcentaje del 100 equivale a
decir que no existe ninguna duda para generalizar tales resultados, pero tambien implica estudiar a
la totalidad de los casos de la poblacin.
Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
practicamente imposible el estudio de todos los casos, entonces se busca un porcentaje de
confianza menor. Comnmenfe en Ios invesfigociones socioIes se busco un 9b7.
El error o porcentaje de error equivoIe o eIegir uno probobiIidod de ocepfor uno hipofesis que seo
foIso como si fuero verdodero, o Io inverso: recho;or o hipofesis verdodero por considerorIo
foIso. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo
como 0, entonces la muestra es del mismo tamano que la poblacin, por lo que conviene correr
un cierto riesgo de equivocarse.
Comunmente se ocepfon enfre eI 47 y eI o7 como error, tomando en cuenta de que no son
complementarios la confianza y el error.
La variabilidad es Io probobiIidod (o porcenfoje) con eI que se ocepfo y se recho;o Io hipofesis
que se quiere invesfigor en oIguno invesfigocion onferior o en un ensoyo previo o Io
invesfigocion ocfuoI. El porcentaje con que se acept tal hiptesis se denomina variabilidad
positiva y se denota por , y el porcentaje con el que se rechaz se la hiptesis es la variabilidad
negativa, denotada por .
Hay que considerar que y son complementarios, es decir, que su suma es igual a la unidad:
1 . Ademas, cuando se habla de la maxima variabilidad, en eI coso de no exisfir
onfecedenfes sobre Io invesfigocion (no hay otras o no se pudo aplicar una prueba previa),
entonces los valores de variabilidad es 0.5 .
NUESTREO Lic. Oscar Cruz N
Una vez que se han determinado estos tres factores, entonces se puede calcular el tamano de la
muestra como a continuacin se expone.
Hablando de una poblacin de alrededor de 10 000 casos, o minimamente esa cantidad, podemos
pensar en la manera de calcular el tamano de la muestra a traves de las siguientes frmulas. vale
mencionar que estas frmulas pueden aplicarse de manera aceptable pensando en instrumentos
que no incluyan preguntas abiertas y que sean un total de alrededor de 30.
Presentaremos dos frmulas, siendo la primera la que se aplica en el caso de que no se conozca
con precisin el tamano de la poblacin, y es:
2
2

donde:
n : tamano de la muestra;
Z : nivel de confianza;
p : variabilidad positiva;
q : variabilidad negativa;
E : precisin o error.
Debe notar que debido a que la variabilidad y el error se pueden expresar por medio de
porcentajes, hay que convertir todos esos valores a proporciones en el caso necesario.
Tambien hay que tomar en cuenta que el nivel de confianza no es ni un porcentaje, ni la
proporcin que le corresponderia, a pesar de que se expresa en terminos de porcentajes. El nivel
de confianza se obtiene a partir de la distribucin normal estandar, pues Io proporcion
correspondienfe oI porcenfoje de confion;o es eI oreo simefrico bojo Io curvo normoI que se
fomo como Io confion;o, y Io infencion es buscor eI voIor de Io voriobIe oIeoforio que
correspondo o foI oreo.
Por ejemplo: Si se quiere un porcenfoje de confion;o deI 9b7, enfonces hoy que consideror Io
proporcion correspondienfe, que es 0.9b. Lo que se buscoro en seguido es eI voIor Z poro Io
voriobIe oIeoforio ; foI que eI oreo simefrico bojo Io curvo normoI desde -Z hosfo Z seo iguoI o
0.9b, es decir, P(-Z;Z)~0.9b.
UfiIi;ondo Ios fobIos, o Io funcion DISTR.NORM.ESTAND.INV() deI ExceI, se puede coIcuIor eI
voIor de Z, que sero I.9o (con uno oproximocion o dos decimoIes).
Esfo quiere decir que P(-I.9o;I.9o)~0.9b.
En el caso de que si se conozca el tamano de la poblacin entonces se aplica la siguiente frmula:
2
2 2

NUESTREO Lic. Oscar Cruz N


donde
n: tamano de la muestra;
Z : nivel de confianza;
p : variabilidad positiva;
q : variabilidad negativa;
N : tamano de la poblacin;
E : precisin o el error.
La ventaja sobre la primera frmula es que al conocer exactamente el tamano de la poblacin, el
tamano de la muestra resulta con mayor precisin y se pueden incluso ahorrarse recursos y tiempo
para la aplicacin y desarrollo de una investigacin.
Por ejemplo: En eI UMCA, se deseo reoIi;or uno invesfigocion sobre Ios oIumnos inscrifos en
Adminisfrocion y sisfemos, poro Io cuoI se opIicoro un cuesfionorio de monero oIeoforio o uno
muesfro, pues Ios recursos economicos y eI fiempo poro procesor Io informocion resuIforo
insuficienfe en eI coso de opIicorseIe o Io pobIocion esfudionfiI compIefo.
En primera instancia, suponiendo que no se conoce el tamano exacto de la poblacin, pero con la
seguridad de que esta se encuentra cerca a los diez millares, se aplicara la primera frmula.
Se considerara una confianza del 95, un porcentaje de error del 5 y la maxima variabilidad por
no existir antecedentes en la institucin sobre la investigacin y porque no se puede aplicar una
prueba previa.
Primero habra que obtener el valor de Z de tal forma que la confianza sea del 95, es decir,
buscar un valor de Z tal que P(-Z<z<Z)=0.95. Utilizando las tablas o las funciones de Excel se
pueden obtener, o viendo (en este caso) el ejemplo anterior, resulta que Z=1.96.
De esta manera se realiza la sustitucin y se obtiene:


2
2
1.96 0.5 0.5
0.9604
384.16
0.0025
0.05

Esto quiere decir que el tamano de 385 alumnos.
Supongamos ahora que si se conoce el tamano de la poblacin estudiantil y es de 9,+08, entonces
se aplicara la segunda frmula. Utilizando los mismos parametros la sustitucin queda como:


2
2 2
1.96 0.5 0.5 9408
9035.4432
369.088
24.4804
9408 0.5 1.96 0.5 0.5

Con lo que se tiene 370 alumnos para la muestra y asi poder realizar la investigacin sin mas
costo del necesario, pero con la seguridad de que las condiciones aceptadas para la generalizacin
(confiabilidad, variabilidad y error) se mantienen.