Вы находитесь на странице: 1из 12

ESCUELA DE POSTGRADO

JOSE TORRES VASQUEZ


Facultad de Medicina
Humana
SECCIN DE POST GRADO
PROGRAMA DE SEGUNDA ESPECIALIDAD EN MEDICINA

PRCTICA
SELECCIONAR LA MUESTRA
En este acpite tendremos en cuenta los siguientes aspectos:

Seleccionar la muestra de nuestro estudio consiste en determinar lo


siguiente:
o Unidad de anlisis,
o Poblacin,
o Muestra.

1. La Unidad de Anlisis

Para seleccionar una muestra, lo primero que hay que hacer es definir la
unidad de anlisis, es decir a los individuos, organizaciones,
comunidades, situaciones, eventos, etc. en los que se aplicar el
instrumento de recoleccin de la informacin en un estudio de
investigacin. A las unidades de anlisis se les denomina tambin casos o
elementos.

Determine la unidad de anlisis de su estudio:

2. La poblacin

Una vez que se ha definido cual ser la unidad de anlisis, se procede a


delimitar la poblacin que va a ser estudiada y sobre la cual se pretende
generalizar los resultados. As, una poblacin es el conjunto de todos los
casos que concuerdan con una serie de especificaciones.

Determine la poblacin de su estudio:

1
3. La muestra

Bsicamente categorizamos las muestras en dos grandes ramas: las


muestras no probabilsticas y las muestras probabilsticas.

En las muestras no probabilsticas, la eleccin de los elementos no


depende de la probabilidad, sino de causas relacionadas con las
caractersticas de la investigacin o de quien hace la muestra. Aqu el
procedimiento no es mecnico ni con base en frmulas de probabilidad,
sino que depende del proceso de toma de decisiones de un investigador o
de un grupo de investigadores y, desde luego, las muestras seleccionadas
obedecen a otros criterios de investigacin. Elegir entre una muestra
probabilstica o una no probabilstica depende de los objetivos del estudio,
del esquema de investigacin y de la contribucin que se piensa hacer
con ella.

Las muestras no probabilsticas, tambin llamadas muestras dirigidas,


suponen un procedimiento de seleccin informal. Se utilizan en diversas
investigaciones cuantitativas y cualitativas. Seleccionan individuos o
casos tipicos sin intentar que sean representativos de una poblacin
determinada. Por ello, para fines deductivos-cuantitativos, donde la
generalizacin o extrapolacin de resultados hacia la poblacin es una
finalidad en s misma, las muestras dirigidas implican algunas
desventajas. La primera es que, al no ser probabilsticas, no es posible
calcular con precisin el error estndar, es decir, no podemos calcular con
qu nivel de confianza hacemos una estimacin. Esto es un grave
inconveniente si consideramos que la estadstica inferencial se basa en la
teora de la probabilidad, por lo que las pruebas estadsticas en muestras
no probabilsticas tienen un valor limitado a la muestra en s, ms no a la
poblacin. Es decir, los datos no pueden generalizarse a esta. En las
muestras de este tipo, la eleccin de los casos no depende de que todos
tengan la misma probabilidad de ser elegidos, sino de la decisin de un
investigador o grupo de personas que recolectan los datos. La nica
ventaja de una muestra no probabilstica desde la visin cuantitativa
es su utilidad para determinado diseo de estudio que requiere no tanto
una representatividad de elementos de una poblacin, sino una
cuidadosa y controlada eleccin de casos con ciertas caractersticas
especificadas previamente en el planteamiento del problema. Para el
enfoque cualitativo, al no interesar tanto la posibilidad de generalizar los
resultados, las muestras no probabilsticas o dirigidas, son de gran valor,
pues logran obtener los casos (personas, contextos, situaciones) que
interesan al investigador y que llegan a ofrecer una gran riqueza para la
recoleccin y el anlisis de los datos. Ejemplos de muestreos no
probabilsticos son los muestroespor conveniencia, por juicio (criterio),
bola de nieve y por cuotas.

En las muestras probabilsticas todos los elementos de la poblacin


tienen la misma posibilidad de ser escogidos y se obtienen definiendo las

2
caractersticas de la poblacin y el tamao de la muestra, y por medio de
una seleccin aleatoria o mecnica de las unidades de anlisis. Imagnese
el procedimiento para obtener el nmero premiado en un sorteo de
lotera. Este nmero se va formando en el momento del sorteo. En las
loteras tradicionales, a partir de las esferas con un digito que se extraen
(despus de revolverlas mecnicamente) hasta formar el nmero, de
manera que todos los nmeros tienen la misma probabilidad de ser
elegidos. El principal objetivo en el diseo de una muestra probabilstica
es reducir al mnimo este error, al que se le llama error estndar.
Para ilustrar lo anterior mire los ejemplos que toman en cuenta dichas
consideraciones.

EJEMPLO DE MUESTREO PROBABILSTICO

En una investigacin en el Per, para saber cuntos nios han sido


vacunados y cuntos no, y las variables asociadas (nivel socioeconmico,
lugar donde viven, educacin) con esta conducta y sus motivaciones. Se
hara una muestra probabilstica nacional de digamos por ahora 1600
infantes, y de los datos obtenidos se tomaran decisiones para formular
estrategias de vacunacin, as como mensajes dirigidos a persuadir la
pronta y oportuna vacunacin de los nios.

Comentario: este tipo de estudio, donde se hace una asociacin entre


variables y cuyos resultados servirn de base para tomar decisiones
polticas que afectarn a una poblacin, se logra por medio de una
investigacin por encuestas y, definitivamente, por medio de una muestra
probabilstica, diseada de tal manera que los datos lleguen a ser
generalizados a la poblacin con una estimacin precisa del error que
pudiera cometerse al realizar tales generalizaciones.

EJEMPLO DE MUESTREO NO PROBABILSTICO

Se dise un experimento para determinar si los contenidos violentos de


la televisin generan stress en los nios. Para lograr tal objetivo se
seleccionara en un colegio a 60 nios de cinco aos de edad, de igual
nivel socioeconmico y nivel intelectual, y se asignaran aleatoriamente a
dos grupos o condiciones. As, 30 nios veran dibujos animados
prosociales y otros 30 observaran dibujos animados muy violentos.
Inmediatamente despus de la exposicin a dichos contenidos, los
infantes seran observados en un contexto de grupo y se mediran sus
conductas violentas y prosociales.

Comentario: sta es una muestra no probabilstica. Aunque se asignen los


nios de manera aleatoria a las dos condiciones experimentales, para
generalizar a la poblacin se necesitaran repetidos experimentos. Un
estudio as es valioso en cuanto a que el nivel causa-efecto es ms preciso
al aislar otras variables; sin embargo, no es posible generalizar los datos a
todos los nios, sino a un grupo de nios con las mencionadas
caractersticas. Se trata de una muestra dirigida y clsica de un estudio
3
de este tipo. La seleccin de la muestra no es al azar, aunque la
asignacin de los nios a los grupos s lo es.

3.1. Clculo del tamao de muestra:

Si eligi realizar un muestreo probabilstico, son necesarios los


siguientes procedimientos:

3.1.1. Calcular un tamao de muestra que sea representativo


de la poblacin:

Aqu el investigador debe preguntarse: dado que una


poblacin es de N tamao, cul es el menor nmero de
unidades muestrales (personas, organizaciones,
comunidades, etc.) que necesito para conformar una muestra
(n) que me asegure un determinado nivel de error estndar,
digamos menor de 0.05? La respuesta a esta pregunta busca
encontrar una muestra que sea representativa del universo o
poblacin con cierta posibilidad de error (se pretende
minimizar) y nivel de confianza (maximizar), as como
probabilidad.

Se puede calcular el tamao de muestra, usando formulas


clsicas que se han desarrollado, o utilizar software
estadsticos con resultado igual o muy similar al que
proporciona la utilizacin de frmulas estadsticas.

Muestreo aleatorio simple (MAS)


Su caracterstica esencial, es que todos los casos del universo
tienen al inicio la misma probabilidad de ser seleccionados.

Imaginemos que pretendemos realizar un estudio en la


siguiente poblacin: los establecimientos de salud de la
regin Loreto. Entonces, lo primero es conocer el tamao de
la poblacin (nmero de establecimientos de salud en la
regin). Supongamos que hay 350 de ellas. La mayora de
programas estadsticos nos pedirn los siguientes datos:
Tamao del universo
Error mximo aceptable
Porcentaje estimado de la muestra
Nivel deseado de confianza

El tamao del universo o poblacin ya dijimos que es de 350.


Debemos conocer este dato o uno aproximado. Tambin nos
pide que definamos el error estndar mximo aceptable
(probabilidad), el porcentaje estimado de la muestra y el
nivel de confianza.
- El error mximo aceptable se refiere a un porcentaje de error
potencial que admitimos tolerar de que nuestra muestra no
sea representativa de la poblacin (de equivocarnos). Los
niveles de error pueden ir de 20 a 1%. Los ms comunes son
5 y 1% (uno implica tolerar muy poco error, 1 en 100, por as
4
decirlo; mientras que 5%, es aceptar en 100, 5 posibilidades
de equivocarnos).
- El porcentaje estimado de la muestra es la probabilidad de
ocurrencia del fenmeno (representatividad de la muestra
versus no representatividad, la cual se estima sobre marcos
de muestreo previos o se define, la certeza total siempre es
igual a uno, las posibilidades a partir de esto son p de que
si ocurra y q de que no ocurra (p + q = 1). Cuando no
tenemos marcos de muestreo previo, usamos un porcentaje
estimado de 50% (que es la opcin por default que nos
brinda la mayora de programas estadsticos, es decir,
asumimos que p y q sern de 50%, y que resulta lo mas
comn, particularmente cuando seleccionamos por vez
primera una muestra en una poblacin).
- Finalmente, el nivel deseado de confianza es el
complemento del error mximo aceptable (porcentaje de
acertar en la representatividad de la muestra). Si el error
elegido fue de 5%, el nivel deseado de confianza ser de
95%. Una vez ms los niveles ms comunes son de 95 y
99%. Por default, la mayora de programas estadsticos
colocan el primero.

Ya con todos los campos llenos, con solo presionar el botn


de calcular, se obtiene el tamao de muestra apropiado
para el universo. En el ejemplo podra ser:
Tamao del universo: 350
Error mximo aceptable: 5%
Porcentaje estimado de la muestra: 50%
Nivel deseado de confianza: 95

El resultado de tamao de muestra que nos proporciona


EpiInfo 7 es: 183. Es decir, necesitamos que nuestra
muestra est conformada por 183 establecimientos de salud
para tener representadas a las 350 de la regin.

Muestreo probabilstico estratificado


Es el muestreo en el que la poblacin se divide en segmentos
y se selecciona una muestra para cada segmento porque el
investigador tiene el inters de comparar sus resultados entre
segmentos, grupos o nichos de la poblacin. En el mismo
ejemplo, imaginemos que nos interesa estudiar
establecimientos de salud de toda la regin y contrastar
ciertos datos, como por ejemplo, la calidad de atencin de
establecimientos de salud urbanos versus rural. Con MAS es
casi seguro que no elijamos establecimientos representativos
de cada uno de los grupos. No podramos efectuar las
comparaciones. Entonces es cuando preferimos obtener una
muestra probabilstica estratificada (el nombre nos dice que
ser probabilstica y que se considerarn segmentos o grupos
de establecimientos de salud, o lo que es igual: estratos).

5
Nuestro universo es de 350 establecimientos de salud.
Usando un programa estadstico o mediante frmulas,
determinamos que el tamao de la muestra necesaria para
representar a la poblacin seria de n = 183 establecimientos
de salud. Pero supongamos que la situacin se complica y
que debemos estratificar esta n con la finalidad de que los
elementos muestrales o las unidades de anlisis posean un
determinado atributo. En nuestro ejemplo, este atributo es el
rea geogrfica en donde se encuentran los establecimientos
de salud. Es decir, cuando no basta que cada uno de los
elementos muestrales tenga la misma probabilidad de ser
escogidos, sino que adems es necesario segmentar la
muestra en relacin con estratos o categoras que se
presentan en la poblacin, y que adems son relevantes para
los objetivos del estudio, se disea una muestra probabilstica
estratificada.
Lo que aqu se hace es dividir a la poblacin
(establecimientos de salud) en subpoblaciones o estratos, y
se selecciona una muestra para cada estrato. Para ello se
utiliza la siguiente frmula:

Submuestra (fh) = n = 183 = 0.52


N 350
fh = fraccin constante

Supongamos que de los establecimientos de salud de la


regin Loreto 55 se encuentran en la zona urbana y 295 en la
zona rural. Entonces utilizando la frmula anterior la
submuestra para la zona urbana sera n = 28.6 = 29 y para la
zona rural n = 153.4 = 154. La estratificacin aumenta la
precisin de la muestra e implica el uso deliberado de
diferentes tamaos de muestra para cada estrato, a fin de
lograr reducir la varianza de cada unidad de la media
muestral.

Total
Estra Muest
EESS poblacin
to ra
(fh) = 0.52
1 Urban 55 29
o
2 Rural 295 154
Total 350 183

Muestreo probabilstico por racimos


Tambin llamado muestreo por clusters o conglomerados. En
este tipo de muestreo se reducen costos, tiempo y energa, al
considerar que muchas veces las unidades de anlisis se
encuentran encapsuladas o encerradas en determinados
lugares fsicos o geogrficos, a los que se denomina racimos.
Para dar algunos ejemplos tenemos la siguiente tabla. En la
primera columna se encuentran unidades de anlisis que
frecuentemente vamos a estudiar. En la segunda columna,
6
sugerimos posibles racimos donde se encuentran dichos
elementos.
Unidades de Posibles racimos
anlisis
Enfermos Hospitales/Centros de Salud
Adolescentes Preparatorias
Obreros Industrias o fbricas
Amas de casa Mercados/ centros
comerciales/hogares
Nios Colegios
Muestrear
por racimos implica diferenciar entre la unidad de anlisis y
la unidad muestral. La unidad de anlisis indica quienes
van a ser medidos, o sea, los participantes o casos a quienes
en ltima instancia vamos a aplicar el instrumento de
medicin. La unidad muestral (en este tipo de muestra) se
refiere al racimo por medio del cual se logra el acceso a la
unidad de anlisis. El muestreo por racimos supone una
seleccin en dos o ms etapas, todas con procedimientos
probabilsticos. En la primera, se seleccionan los racimos,
siguiendo los pasos ya sealados de una muestra
probabilstica simple o estratificada. En las fases
subsecuentes y dentro de estos racimos, se seleccionan los
casos que van a medirse. Para ello se hace una seleccin que
asegure que todos los elementos del racimo tienen la misma
probabilidad de ser elegidos.

Por ejemplo, en una muestra nacional de ciudadanos de un


pas por clusters o racimos, podramos primero elegir al azar
una muestra de regiones, departamentos o provincias
(primera etapa); luego, cada departamento o provincia se
convierte en un universo y se seleccionan al azar distritos
(segunda etapa); posteriormente, cada distrito se considera
un universo o poblacin y se eligen al azar comunidades o
localidades (tercera etapa); a su vez, cada una de estas se
concibe como universo y de nuevo, al azar, se eligen
manzanas o cuadras (cuarta etapa); finalmente se escogen al
azar viviendas u hogares e individuos (quinta etapa). En
ocasiones se combinan tipos de muestreo, por ejemplo: una
muestra probabilstica estratificada y por racimos, pero
siempre se utiliza una seleccin aleatoria que garantiza que
al inicio del procedimiento todos los elementos de la
poblacin tienen la misma probabilidad de ser elegidos para
integrar la muestra.

Determine el tipo de muestreo de su estudio y calcule el


tamao de muestra:

7
3.1.2. Seleccionar los elementos muestrales (casos)

El segundo paso consiste en seleccionar los elementos


muestrales (los 183 establecimientos de salud de la poblacin
de 350) de manera que al inicio todos tengan la misma
posibilidad de ser elegidos. Es decir, cmo y de dnde vamos
a elegir los casos. Para ello requerimos un marco de seleccin
adecuado (marco muestral) y un procedimiento que permita
la aleatoriedad en la seleccin.
El marco muestral es un marco de referencia que nos
permita identificar fsicamente los elementos de la poblacin,
la posibilidad de enumerarlos y, por ende, de proceder a la
seleccin de los elementos muestrales (los casos de la
muestra). Normalmente se trata de un listado existente o una
lista que es necesario confeccionar ad hoc, con los casos de
la poblacin. Los listados existentes sobre una poblacin son
variados: guas telefnicas, listas de miembros de las
asociaciones, directorios especializados, listas oficiales de
escuelas de la zona, bases de datos de los alumnos de una
universidad o de los clientes de una empresa, registros
mdicos, catastros, nminas de una organizacin, etc. En
todo caso hay que tener en cuenta lo completo de una lista,
su exactitud, su veracidad, su calidad y su nivel de cobertura
en relacin con el problema a investigar y la poblacin que va
a medirse, ya que todos estos aspectos influyen en la
seleccin de la muestra. Con frecuencia es necesario
construir listas ad hoc, a partir de las cuales se elegirn los
elementos que constituirn las unidades de anlisis en una
determinada investigacin.
En el ejemplo el marco muestral sera la relacin oficial de los
establecimientos de salud de la regin Loreto segn el
RENAES Registro Nacional de Establecimientos del Ministerio
de Salud del Per).

Determine el marco muestral de su investigacin:

8
La seleccin de las unidades de anlisis o los elementos
muestrales es siempre aleatoria para asegurarnos de que
cada elemento tenga la misma probabilidad de ser elegido.
Se utilizan bsicamente tres procedimientos de seleccin:
tmbola, nmeros aleatorios y seleccin sistemtica de
elementos muestrales.

Tmbola
Muy simple y muy rpido, consiste en numerar todos los
elementos muestrales de la poblacin, del uno al nmero N.
Despus se hacen fichas o papeles, uno por cada elemento,
se revuelven en una caja y se van sacando n nmero de
fichas, segn el tamao de la muestra. Los nmeros elegidos
al azar conformaran la muestra.
Cuando nuestro muestreo es estratificado, se sigue el
procedimiento anterior, pero por cada estrato. Por ejemplo,
tenemos que, de una poblacin N = 183 establecimientos de
salud de la regin Loreto, se necesita una muestra n = 29 de
55 de zona urbana y n = 154 de 295 de zona rural. En una
lista se numeran cada uno de los establecimientos de salud.
En fichas aparte se sortea cada uno de los 55 nmeros, hasta
obtener los 29 necesarios (pueden ser las 29 primeras fichas
que se extraigan). Los nmeros obtenidos se verifican con los
nombres, para precisar los establecimientos de salud que
sern participantes del estudio.

Nmeros random o nmeros aleatorios


Para este procedimiento se puede utilizar una tabla de
nmeros aleatorios (ver figura).

Tambin se pueden generar nmeros aleatorios con algunos


programa estadsticos como el STATS, que contiene un
9
subprograma para ello y evita el uso de la tabla de nmeros
aleatorios. El programa nos pide que le indiquemos cuantos
nmeros aleatorios requerimos, entonces tecleamos el
tamao de muestra y luego elegimos la opcin: Establecer
lmite superior e inferior y nos solicita que establezcamos el
lmite inferior (que siempre ser uno, el primer caso de la
poblacin, pues la muestra se extrae de sta) y el lmite
superior (el ltimo nmero de la poblacin, que es el tamao
de la poblacin). Luego tecleamos Calcular y nos genera
automticamente los nmeros. Vemos contra nuestro listado
a quin o a qu corresponde cada nmero y estos nmeros
son los casos que pasaran a integrar la muestra. Con
estratos o conglomerados repetimos el procedimiento para
cada uno.

Seleccin sistemtica de elementos muestrales


Este procedimiento de seleccin es muy til e implica elegir
dentro de una poblacin N un numero n de elementos a partir
de un intervalo K. Este ltimo (K) es un intervalo que se va a
determinar por el tamao de la poblacin y el tamao de la
muestra. De manera que tenemos que K = N/n, en donde K =
un intervalo de seleccin sistemtica, N = la poblacin y n =
la muestra.
Ilustremos los conceptos anteriores con un ejemplo.
Supongamos que se quiere hacer un estudio que pretende
medir la calidad de la atencin en los servicios
proporcionados por los mdicos y las enfermeras de un
hospital. Para tal efecto consideremos que los investigadores
consiguen grabaciones de todos los servicios efectuados
durante un periodo determinado (se sabe que el nmero de
servicios en un hospital es muy variable y depende de
diversos factores, como el nmero de camas, de mdicos y
profesionales no mdicos; el tipo y nivel de atencin (desde
consultas simples hasta ciruga compleja), la poca, el
nmero de habitantes en la zona donde se encuentra ubicado
o el nmero de derechohabientes, etc. El ejemplo trata de ser
simple para que sea entendido por todos).
Supongamos que se hayan filmado 1548 servicios (N). Con
este dato se procede a determinar que numero de servicios
necesitamos analizar para generalizar a toda la poblacin
nuestros resultados. Con EpiInfo determinamos que se
necesitan 308 servicios para evaluar (con un error mximo de
5%, nivel de confianza de 95% y un porcentaje estimado de
50% para la muestra [p = 0.5]).
Si necesitamos una muestra de n = 308 episodios de servicio
filmados, se utiliza para la seleccin el intervalo K, donde:

El intervalo 1/K = 5 indica que cada quinto servicio 1/K se


seleccionara hasta completar n = 308. La seleccin
10
sistemtica de elementos muestrales 1/K se puede utilizar al
elegir los elementos de n para cada estrato o para cada
racimo. La regla de probabilidad, segn la cual cada elemento
de la poblacin debe tener idntica probabilidad de ser
elegido, se cumple al empezar la seleccin de 1/K al azar.
Siguiendo nuestro ejemplo, no comenzamos a elegir de los
1548 episodios, el 1, 6, 11, 16, sino que procuramos que el
inicio sea determinado por el azar. As, en este caso, podemos
tirar unos dados y si en sus caras muestran 1, 6, 9,
iniciaremos en el servicio 169, y seguiremos 174, 179, 184,
189 1/K y volveremos a empezar por los primeros si es
necesario.

Mencione cmo realizar la seleccin de los elementos


muestrales (casos) de su investigacin:

EJEMPLO

TTULO DE TESIS

FACTORES ASOCIADOS AL NIVEL DE CONOCIMIENTO EN DIAGNSTICO Y


TRATAMIENTO DE DENGUE EN MDICOS DE LA REGIN LAMBAYEQUE
BACH. MED. CLAUDIA NATALIA PAICO ROMERO

Poblacin y muestra

11
1. Unidad de anlisis:
Mdicos de atencin primaria en los diferentes establecimientos de
salud de la regin Lambayeque.

2. Poblacin:
El Ministerio de Salud cuenta con 223 mdicos que laboran en el
primer nivel de atencin del Ministerio de Salud.

3. Muestra:

Tamao de muestra: Utilizando el programa estadstico EPIDAT se


obtiene un tamao de muestra de 125 mdicos, con una proporcin
esperada de nivel de conocimiento adecuado de 24,3%, precisin
absoluta del 5% y un nivel de confianza de 95%.

Marco muestral: lo constituye la nmina de mdicos que laboran en


el primer nivel de atencin de Lambayeque proporcionado por la
DIRESA.

Tipo de muestreo: Muestreo probabilstico simple.

Seleccin de la unidad de anlisis: Aleatoria (tmbola).

4. Criterios de inclusin y exclusin:

Criterios de inclusin:
Mdicos generales del primer nivel de atencin del Ministerio de Salud
de la Regin Lambayeque.

Criterios de exclusin:
Mdicos que se nieguen a responder el instrumento.
Mdicos que entreguen un instrumento incompleto.

12