Вы находитесь на странице: 1из 294

TÉCNICAS DE

MUESTREO ESTADÍSTICO
DISEÑO Y APLICACIONES A LA INVESTIGACIÓN
EN CIENCIAS EMPRESARIALES

Segunda edición

AUTOR
José Santos Loaiza Torres

REVISIÓN DE ORTOGRAFÍA Y REDACCIÓN


(poner nombre)

DISEÑO DE TAPA Y CONTRATAPA


(poner nombre)
2 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo
PRÓLOGO

Gran parte de la solución a problemas se realizan en base a la aplicación y resultados


del Muestreo Estadístico, que establece las técnicas y procedimientos para la selección
de una muestra a partir de una población determinada.

El autor de la segunda edición del presente libro, José Santos Loaiza Torres, con varios
años de experiencia profesional y como docente distinguido en materias de pre y
postgrado, ha logrado plasmar en este libro la suficiente rigurosidad teórica-
cuantitativa requerida en esta materia junto a un enfoque pedagógico que permite a
docentes y estudiantes avanzar por sus distintos capítulos de forma didáctica y
práctica.

El libro llena desde su primera edición y ahora en su segunda edición actualizada llena
una sentida necesidad tanto de estudiantes, profesionales independientes como de
docentes porque explicita los lineamientos para realizar un buen diseño de muestreo,
tomando en cuenta los factores que se deben considerarse en las diferentes etapas
de toma de decisión en lo que hace a una determinada técnica de muestreo estadístico
en base a los objetivos planteados en una investigación.

Por último, no se trata solamente de un libro de lectura, sino de una base que orienta
el trabajo de investigación por muestreo dotando de ejemplos y aplicaciones en el
área de las Ciencias Empresariales.

Directora de Departamento de Ciencias Empresariales


Mba Ing. Carolina Soto Montenegro
4 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo

Queda rigurosamente prohibida, sin la autorización del autor, bajo las leyes, la
reproducción total o parcial de esta obra por cualquier medio o procedimiento, incluido
el tratamiento informático y la distribución de ejemplares de ella mediante alquiler o
préstamo públicos.

Segunda Edición, 2017

Depósito legal de la primera edición N°1-1095/2009 de La Paz – Bolivia

Depósito legal de la segunda edición……………………..

Impreso en Tarija – Bolivia

Editorial e Imprenta ……………………………..


DEDICATORIA:

A mis hijos: Josué Anthony, María José y Alejandra


Pamela por ser la motivación permanente en este
proceso de crecimiento personal y profesional.

A mi esposa Teresa por su desprendimiento para


apoyarme en el cumplimiento de mis metas.

A mis Padres y Hermanos por su incondicional apoyo.


6 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo

AGRADECIMIENTOS

Sin lugar a dudas, lo primero que deseo agradecer es a nuestro Padre creador al Dios
de la vida y todo poderoso, por todas las cosas lindas que me da.

A las Universidades que me permitieron impartir y compartir los conocimientos tanto


en el pregrado como en el postgrado, esa experiencia ha sido fundamental para
escribir este libro. Especialmente, a la Universidad Católica Boliviana “San pablo”-
Unidad Académica Regional Tarija, que me ha dado la oportunidad en la docencia
relacionada a la disciplina de la estadística e investigación de mercados, proceso que
ha permitido ser la base para producir esta obra.

Agradecer al Lic. Bernandino Vásquez por sus contribuciones a la mejora del contenido
de la segunda edición, al Lic. Holbein Rivera por sus aportes y comentarios a la primera
edición y sus sugerencias para mejorar la segunda edición y al Dr. Roberto Volfovicz
por su valioso aporte y revisión técnica. Asimismo agradezco a…………………….. en la
revisión ortográfica y de redacción y al …………………………….por el diseño de la tapa y
contratapa
NOVEDADES RESPECTO A LA PRIMERA EDICIÓN

En cada capítulo se ha incorporado una serie de ejemplos tomados del acervo


bibliográfico y de la experiencia del autor; además, de incorporar problemas resueltos,
algunos hipotéticos y otros reales, que permiten ilustrar de mejor manera la base
teórica conceptual.

En cada capítulo, además de la revisión, se amplía la explicación de los gráficos, figuras


y fórmulas con el fin de proporcionar mayor información y comprensión al lector, de
manera tal, que al recorrer por el contenido del libro sea más fácil su entendimiento.

En el capítulo 5 de la estimación del tamaño de la muestra, se expone el proceso de


derivación de la fórmula para determinar n, asimismo, se muestra claramente las
relaciones de los componentes de la fórmula y el tamaño de muestra, que permite al
lector inferir sus efectos al mover la cuantía de algún elemento de la fórmula sobre el
tamaño de muestra. En este mismo capítulo, se indica la disponibilidad de algunos
softwares para calcular el tamaño de la muestra.

Se ha incluido un capítulo en relación a la primera edición, relacionado con el muestreo


en internet, un aspecto de actualidad y que está siendo utilizado cada vez con
frecuencia por los investigadores.
8 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo
ÍNDICE GENERAL

CAPÍTULO 1
FUNDAMENTOS DEL MUESTREO

1.1.- Introducción ......................................................................................... 23


1.2.- Muestra o Censo ................................................................................... 24
1.3.- El muestreo .......................................................................................... 26
1.4.- Población y muestra .............................................................................. 27
1.4.1.- Definición de población ....................................................................... 27
1.4.2.- Definición de muestra ......................................................................... 30
1.4.3.- Condiciones que debe cumplir la muestra ............................................. 31
1.4.4.- Características deseables de una investigación por muestreo ................. 31
1.5.- El diseño muestral................................................................................. 32
1.5.1.- Importancia ....................................................................................... 32
1.5.2.- Tipos de diseños muestrales ............................................................... 33
1.6.- El proceso de diseño y ejecución del muestreo ........................................ 34
1.7.- Fuentes de datos .................................................................................. 37
1.8.- Instrumentos básicos que utiliza el muestreo para la recopilación de datos 38
1.9.- Evaluación comparativa de los métodos de encuesta................................ 41
1.10.- Fuentes potenciales de error en una investigación ................................ 42
1.11.- Preguntas y problemas ........................................................................ 46

CAPÍTULO 2
EL PLAN DE MUESTREO

2.1.- Introducción ......................................................................................... 53


2.2.-Definir la población objetivo, de estudio y parámetro ................................ 53
2.3.- Determinar el marco de la muestra........................................................ 56
2.4.- Selección de un tipo y técnica de muestreo ............................................ 56
2.4.1.- Decisiones principales al elegir el tipo de muestreo ............................... 57
2.4.1.1. Muestreo mixto ................................................................................ 60
2.4.2.- Clasificación de las técnicas de muestreo. ........................................... 63
2.4.2.1.- Relación entre los tipos de investigación y las técnicas de muestreo .... 63
2.4.2.2.- Factores a considerar en la selección de una técnica de
muestreo probabilística ..................................................................... 65
2.5.- Determinación del tamaño de la muestra ................................................ 68
2.6.- Seleccionar la muestra y reunir la información (ejecución) ........................ 69
2.7.- Validar la muestra (ejecución) ................................................................ 70
2.8.- Analizar los datos y presentar los resultados (Ejecución) .......................... 71
2.9.- Preguntas y problemas .......................................................................... 71
10 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo

CAPÍTULO 3
MUESTREO NO PROBABÍLISTICO

3.1.- Concepto y características ..................................................................... 77


3.2- Tipos de muestreo no probabilístico......................................................... 78
3.2.1.- Muestreo por conveniencia o basado en la comodidad del investigador ... 78
3.2.2. - Por juicio o con fines especiales ......................................................... 80
3.2.3. - Por cuota ......................................................................................... 81
3.2.4.- Bola de nieve ..................................................................................... 84
3.3.- Cuándo utilizar técnicas de muestreo no probabilísticas ............................ 85
3.4.- Preguntas y problemas .......................................................................... 86

CAPÍTULO 4
MUESTREO ALEATORIO SIMPLE PARA VARIABLES CUANTITATIVAS Y
CUALITATIVAS

4.1.- Concepto.............................................................................................. 95
4.2.- Procedimiento para la selección de una muestra aleatoria simple .............. 96
4.3.- Ventajas y limitaciones del muestreo aleatorio simple .............................. 100
4.4.- Muestreo para variables: La distribución muestral de una media-
Definición y notación ............................................................................. 101
4.5. - Propiedades de las estimaciones (el teorema central del límite) ............... 103
4.6. – Estimaciones e intervalos de confianza .................................................. 111
4.6.1.- Para medias....................................................................................... 111
4.6.2.- Para totales ....................................................................................... 111
4.7.- Muestreo para proporciones ................................................................... 112
4.7.1.- Concepto – Características .................................................................. 112
4.7.2.- Notación............................................................................................ 113
4.7.3.- Estimadores de una proporción ........................................................... 114
4.7.4.- Intervalos de confianza ....................................................................... 115
4.8.- Otras consideraciones ........................................................................... 115
4.9.- Criterios para aplicar el muestreo aleatorio simple ................................... 120
4.10.- Preguntas y problemas ........................................................................ 121

CAPÍTULO 5
ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA

5.1.- Introducción ......................................................................................... 129


5.2.- Pasos principales para la elección del tamaño de la muestra ..................... 130
5.3.- La especificación de la precisión (Error de estimación) ............................. 134
5.4.- La estimación del nivel de confianza ....................................................... 134
5.5.- Estimaciones anticipadas de varianzas de la población ............................. 139
5.6.- La fórmula para n al hacer un muestreo para estimar una media .............. 141
5.6.1.- En poblaciones infinitas ...................................................................... 143
5.6.2.- En poblaciones finitas ......................................................................... 146
5.7.- La fórmula para n al hacer un muestreo para estimar una proporción........ 149
5.7.1.- En poblaciones infinitas ...................................................................... 150
5.7.2.- En poblaciones finitas ......................................................................... 153
5.8.- Tamaño de la muestra con más de una característica............................... 155
5.9.-Tamaño de la muestra cuando las estimaciones se quieren para
subdivisiones de la población (o poblaciones independientes) .................. 156
5.10.- Ajuste del tamaño de la muestra determinado estadísticamente .............. 156
5.11.- Validación de la muestra ...................................................................... 160
5.11.1.- El papel del nivel de confianza y del error de estimación en la validación
del tamaño de muestra. ................................................................................ 162
5.12.- Árbol práctico para elegir la fórmula del tamaño de muestra ................... 162
5.13.- A manera de resumen: la relación de los elementos del tamaño de la
muestra y el valor de n ....................................................................... 165
5.14.- Software para cálculo de tamaño de muestra ........................................ 168
5.15.- Preguntas y problemas ........................................................................ 173

CAPÍTULO 6
MUESTREO ALEATORIO ESTRATIFICADO

6.1.- Concepto.............................................................................................. 183


6.2.- Razones para la estratificación ............................................................... 184
6.3.- Notación .............................................................................................. 185
6.4.- Determinación del tamaño de muestra.................................................... 185
6.4.1.- Asignación proporcional al tamaño del estrato ...................................... 190
6.4.2.- Asignación proporcional al tamaño de las varianzas............................... 191
6.4.3.- Asignar en forma igualitaria y luego ponderar los resultados .................. 191
6.4.4.- Asignación óptima .............................................................................. 192
6.5.- Propiedades de las estimaciones ............................................................ 193
6.6.- Límites de confianza .............................................................................. 195
6.7.- Muestreo estratificado para proporciones ................................................ 197
6.8.- Otros aspectos del muestreo estratificado ............................................... 200
6.9.- Criterios para aplicar el muestreo aleatorio estratificado ........................... 203
6.10.- Preguntas y problemas ........................................................................ 204

CAPÍTULO 7
MUESTREO POR CONGLOMERADOS O DE RACIMO

7.1.- Concepto.............................................................................................. 217


7.2.- Diferencias entre el muestreo por Conglomerados y el muestreo
Estratificado......................................................................................... 218
7.3.- Procedimiento en la selección de la muestra............................................ 220
7.4.- Ventajas y desventajas .......................................................................... 221
7.5.- Estimaciones ........................................................................................ 222
7.6.- Muestreo conglomerado para proporciones ............................................. 223
7.7.- Otras consideraciones ........................................................................... 225
7.8.- Criterios para aplicar el muestreo por conglomerados .............................. 225
7.9.- Preguntas y problemas .......................................................................... 226
12 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo

CAPÍTULO 8
MUESTREO SISTEMÁTICO

8.1.- Concepto.............................................................................................. 233


8.2.- Procedimiento para la selección de la muestra ......................................... 233
8.3.- Ventajas y desventajas .......................................................................... 236
8.4.- Estimaciones basadas en el muestreo sistemático .................................... 239
8.5.- Relación con otros métodos de muestreo ................................................ 241
8.6.- Criterios para aplicar el muestreo sistemático .......................................... 244
8.7.- Preguntas y problemas .......................................................................... 245

CAPÍTULO 9
TÉCNICAS DE MUESTREO COMBINADAS

9.1.- Introducción ......................................................................................... 251


9.2.- Muestreo Doble .................................................................................... 251
9.3.- Diseño de etapas múltiples .................................................................... 252
9.4.- Muestreo secuencial .............................................................................. 252
9.5.- Muestreo por Rutas Aleatorias................................................................ 253
9.6.- Muestreo de centro comercial ................................................................ 254
9.7.- Preguntas y problemas .......................................................................... 257

CAPÍTULO 10
SISTEMAS DE SELECCIÓN DE UNIDADES MUESTRALES

10.1.- Introducción ....................................................................................... 263


10.2.- Tabla de números aleatorios y el sorteo ................................................ 263
10.3.- Salto sistemático ................................................................................. 263
10.4.- Esquina Noreste .................................................................................. 263
10.5.- Mitad de manzana ............................................................................... 264
10.6.- Serpentina .......................................................................................... 264
10.7.- Zigzag ................................................................................................ 265
10.8.- Salto de Caballo .................................................................................. 265
10.9.- Trébol ................................................................................................ 266
10.10.- Preguntas y problemas ...................................................................... 267
CAPITULO 11
EL MUESTREO EN INTERNET

11.1.- Introducción ....................................................................................... 273


11.2.- Las encuestas por internet ................................................................... 273
11.3.- Métodos aplicables en el muestreo por internet ..................................... 274
11.4.- Ventajas y desventajas del muestreo por internet .................................. 281
11.5.- Redes sociales y muestreo ................................................................... 282
11.6.- Preguntas y problemas ........................................................................ 283

BIBILIOGRAFIA
APENDICE
14 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo

ÍNDICE DE CUADROS

Cuadro 1.1: Ventajas que favorecen el uso del muestreo ................................. 24


Cuadro 1.2: Ejemplo de muestra transversal y longitudinal ............................... 34
Cuadro 1.3: Evaluación comparativa de los métodos de encuesta ..................... 41
Cuadro 2.1: Ejemplo de definición de Población meta ...................................... 55
Cuadro 2.2: Factores a considerar en la elección del tipo de muestreo ............. 59
Cuadro 2.3: Características de las estrategias de muestreo mixtas .................... 62
Cuadro 3.1: Estructura poblacional de la variable para muestreo por cuotas ...... 82
Cuadro 3.2: Ejemplo de asignación de una muestra por cuotas......................... 83
Cuadro 3.3: Estructura bidimensional de una población en muestreo por cuotas 87
Cuadro 3.4: Registro de las características de una población para muestreo
por cuotas .................................................................................. 89
Cuadro 4.1: Notación para muestreo aleatorio simple ...................................... 102
Cuadro 4.2: Distribución de muestras ............................................................. 106
Cuadro 4.3: Distribución de medias muestrales ............................................... 110
Cuadro 4.4: Número de personas según empleo.............................................. 113
Cuadro 4.5: relación entre el ingreso y gastos en alimentos ............................. 122
Cuadro 4.6: Número de estudiantes y profesores por tipo de academia ............. 123
Cuadro 4.7: Número de caries por niño .......................................................... 123
Cuadro 5.1: Diferentes tamaños de muestra, dados un valor de n, p, e
y un nivel de confianza del 95% para el cual z toma 1,96 ............ 166
Cuadro 5.2: Diferentes tamaños de muestra dados un valor de n," σ" , e
y un nivel de confianza del 95% para el cual z toma 1,96 ............ 167
Cuadro 6.1: Datos para el cálculo del tamaño de la muestra estratificada para
medias ..................................................................................... 189
Cuadro 6.2: Familias con cuentas de ahorro .................................................. 205
Cuadro 6.3: Familias por estratos ................................................................. 206
Cuadro 6.4: Número de bachilleres según colegios ........................................ 206
Cuadro 6.5: salario por niveles de la organización.......................................... 207
Cuadro 6.6: Habitantes por ciudades ............................................................ 208
Cuadro 6.7: Número de estudiantes por carrera en la facultad ........................ 209
Cuadro 6.8: Número de personas según nivel de educación ........................... 210
Cuadro 6.9: Número de personas según nivel de educación ........................... 211
Cuadro 7.1: Diferencias del muestreo por conglomerados con el muestreo
estratificado ............................................................................. 218
Cuadro 7.2: Ejemplo de diferencias del muestreo por conglomerados con el
muestreo estratificado ............................................................... 219
Cuadro 7.3: Número de personas según número de casas.............................. 227
Cuadro 7.4: Bombillas defectuosas por caja .................................................. 228
Cuadro 8.1: Ejemplo hipotético de muestra sistemática .................................. 242
Cuadro 8.2: Muestra estratifica y muestras sistemática .................................. 243
Cuadro 8.3: Número de empleados por establecimiento industrial ................... 245
Cuadro 8.4: Rendimiento de maíz en 10 parcelas .......................................... 245
ÍNDICE DE FIGURAS

Figura 1.1:
Población y muestra ..................................................................... 30
Figura 1.2:
Fuentes de datos ......................................................................... 36
Figura 1.3:
Instrumentos de recolección de datos ............................................ 38
Figura 1.4:
Métodos de encuesta ................................................................... 39
Figura 1.5:
Fuentes potenciales de error en la investigación ............................ 42
Figura 2.1:
Tipos y técnicas de muestreo ........................................................ 63
Figura 2.2:
Relación entre tipos de investigación y técnicas de muestreo ........... 64
Figura 2.3:
Mapa conceptual sobre los criterios para seleccionar una técnica de
muestreo ..................................................................................... 65
Figura 2.4: Técnica de muestreo y sus criterios determnantes .......................... 66
Figura 2.5: Condiciones para aplicar una técnica de muestreo .......................... 67
Figura 4.1: Síntesis del procedimiento con que se escoge una muestra aleatoria
simple empleando una tabla de números aleatorios ......................... 99
Figura 4.2: Distribución de medias muestrales............................................... 110
Figura 5.1: Proceso esquematizado de la estimación del tamaño de muestra ... 132
Figura 5.2: Representación gráfica del error muestral .................................... 136
Figura 5.3: representación gráfica del nivel de confianza ................................ 138
Figura 5.4: Métodos para mejorar los índices de respuesta ............................. 159
Figura 5.5: Árbol práctico para elegir la fórmula del tamaño de muestra .......... 163
Figura: 5.6: Relación entre las técnicas de muestreo probabilísticas ................ 164
Figura 5.7: Página principal del POSDEM ...................................................... 168
Figura 5.8: Ventana principal del SOFTME..................................................... 169
Figura 5.9: Ventana del Stats 2000 .............................................................. 170
Figura 5.10: Ventana del SourveyIM ............................................................. 171
Figura 5.11: Ventana de Tammuestralonline ................................................. 172
Figura 7.1: Tipos de Muestreo de grupo ....................................................... 217
Figura 8.1: Simulador del muestreo sistemático ............................................. 235
Figura: 8.2: Periodicidad oculta del muestreo sistemático ............................... 238
Figura 10.1: Método serpentina ................................................................... 234
Figura 10.2: Método zigzag ......................................................................... 265
Figura 10.3: Método de salto de caballo........................................................ 266
Figura 10.4: Método del trébol ..................................................................... 266
16 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo
INTRODUCCIÓN

El propósito de este libro en su segunda edición actualizada y complementada, es presentar


las técnicas y herramientas de muestreo más utilizadas en el área de las Ciencias
Empresariales. A lo largo del libro se hace énfasis en aspectos críticos en la elaboración de un
plan de muestreo, y se presentan factores que podrían tomarse en cuenta para elegir una o
más técnica de muestreo; se pone énfasis en el diseño de muestreo y en la elección de una
determinada técnica, más que en el planteamiento y solución de ejercicios desde el punto de
vista matemático. Si bien, existen libros sobre el análisis y solución matemática de los datos
en una investigación por muestreo, a nuestro juicio, no hay suficiente literatura que aborda la
temática que se presenta en ésta obra.

El libro llena una sentida necesidad de docentes y estudiantes universitarios de todos los
niveles que imparten o cursan muestreo estadístico; como así también, de profesionales del
área de las ciencias empresariales que aplican las técnicas de muestreo. No está dirigido a
expertos en muestreo estadístico ni a matemáticos del muestreo.

El libro está organizado en forma didáctica de manera tal, que el lector podrá comprender
fácilmente todo su contenido. Sin embargo, con el fin de lograr una mejor comprensión se
recomienda al lector revisar conceptos previos de: estadística descriptiva, probabilidad y
estimación estadística. El texto comienza, presentando conceptos fundamentales de la teoría
del muestreo, luego se aborda el plan de muestreo; continúa el libro, con el muestreo no
probabilístico que es muy útil especialmente en la investigación de mercados a un nivel
exploratorio. Posteriormente, se aborda una de las técnicas de muestreo más utilizadas como
es la teoría del muestreo aleatorio simple, se prosigue con el capítulo de estimación del tamaño
de muestra, enfatizando en el diseño y la estimación de los valores que componen el tamaño
de la muestra, luego se aborda el muestreo estratificado, el muestreo por conglomerados, el
muestreo sistemático, y la técnicas de muestreo combinadas. También es importante exponer,
qué métodos o técnicas de selección de unidades muestrales alternativos a la aleatoriedad
existen para que pueda aplicar el investigador en las ciencias empresariales. En esta segunda
edición se aborda en un capítulo separado el muestreo en internet.
18 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo
CAPÍTULO 1
FUNDAMENTOS DEL
MUESTREO
1.1.- Introducción
1.2.- Muestra o Censo
1.3.- El muestreo
1.4.- Población y muestra
1.4.1.- Definición de población
1.4.2.- Definición de muestra
1.4.3.- Condiciones que debe cumplir la muestra
1.4.4.- Características deseables de una investigación por muestreo
1.5.- El diseño muestral
1.5.1.- Importancia
1.5.2.- Tipos de diseños muestrales
1.6.- El proceso de diseño y ejecución de muestreo
1.7.- Fuentes de datos
1.8.- Instrumentos básicos que utiliza el muestreo para la recopilación de datos
1.9.- Evaluación comparativa de los métodos de encuesta
1.10.- Fuentes potenciales de error en una investigación
1.11.- Preguntas y problemas
20 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo
MAPA CONCEPTUAL

CAPÍTULO 1: FUNDAMENTOS DEL MUESTREO

COMPETENCIA QUE SE PRETENDE LOGRAR: COMPRENDE E IDENTIFICA EN


FORMA CLARA Y CRÍTICA LOS ASPECTOS FUNDAMENTALES DE LA TEORÍA DEL
MUESTREO, A PARTIR DE UN ENFOQUE, METODOLOGÍA E INSTRUMENTOS QUE
UTILIZA.

INFERENCIA ESTADÍSTICA

Deducir

FUNDAMENTOS DEL MUESTREO


Analizar

2.- Factores que 3.- Clasificación de 4.- Proceso de 5.- Fuentes de 6.-
1.- Conceptos y favorecen al diseño y ejecución
definiciones de la diseños muestrales datos Instrumentos
muestreo del muestreo
teoría del muestreo que utiliza el
(Muestra o Censo)
Diseño transversal y muestreo
Criterios para elegir para recopilar
longitudinal Pasos que
una fuente de datos datos
involucra

Relacionar
1-2-3-4-5-6

Comprende e identifica

ASPECTOS FUNDAMENTALES
DE LA TEORÍA DEL MUESTREO

Fuente: Elaboración propia


22 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo
CAPITULO 1: Fundamentos del muestreo José Loaiza Torres 23

CAPÍTULO 1
FUNDAMENTOS DEL MUESTREO

1.1.- Introducción

En la mayoría de las tareas y actividades que ejecutamos de manera cotidiana ya sea


de forma consciente o inconsciente realizamos muestreo, verbigracia cuando vamos a
comprar un automóvil, cuando compramos un televisor, vamos de vacaciones en
verano, en fin; antes de tomar una decisión, lo primero que hacemos es consultar a
algunas personas o fuentes de información sobre lo que nos interesa, pero no
consultamos a la totalidad de las fuentes existentes o a todas las personas entendidas
en el tema, en consecuencia lo que estamos realizando es un muestreo, porque
actuamos o decidimos en base a resultados de una parte de una población o universo.

El propósito de un estudio estadístico suele ser extraer conclusiones acerca de la


naturaleza de una población. Al ser la población1 generalmente grande y no poder ser
estudiada en su totalidad, máxime si las características no son homogéneas; en la
mayoría de los casos, las conclusiones obtenidas deben basarse en el examen de una
parte de ésta, lo que nos lleva, en primer lugar a la justificación, necesidad y definición
de la teoría del muestreo y a la aplicación de las diferentes técnicas de muestreo.

Por otra parte, la inferencia estadística es una rama de la estadística y que emplea
métodos para determinar algo acerca de una población, con base en una muestra.
¿Cómo seleccionar esa muestra? es lo que precisamente estudia la teoría del
muestreo.

En síntesis, la teoría del muestreo estudia la relación disímil y simbiótica entre la


muestra y la población y es de lo que trata el presente libro.

1
Conjunto de unidades seleccionadas para estudiar y examinar de acuerdo a un objetivo. Que
para fines del presente libro, universo y población se utilizaran como términos sinónimos.
24 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo

1.2.- Muestra o censo

Podríamos definir que un Censo es un estudio completo de las unidades que


conforman la población. Mientras que una muestra es una parte seleccionada
cuidadosamente de la población.

A continuación en el cuadro 1.1 se menciona los factores que favorecen el uso de una
muestra en comparación con un censo.

Cuadro 1.1: Ventajas que favorecen el uso del muestreo

FACTORES MUESTRA CENSO


1.- Costo Menor Mayor
2.- Tiempo Reducido Prolongado
3.- Tamaño de la población Grande Pequeña
4.- Varianza de la característica Baja Alta
5.- Errores de muestreo Bajo Alto
6.- Errores por falta de muestreo Alto Bajo
7.- Naturaleza de la medición Destructiva No destructiva
8.- Atención a casos individuales Sí No
9.- Discreción en el estudio Alta Baja
10.- Accesibilidad a la población Baja Alta
Fuente: Elaboración propia en base a Malhotra (2008) y Weiers(1987)

A continuación se describe con más de detalle las principales ventajas que favorecen
al uso del muestreo:

 Costo: El realizar un muestreo significa un menor costo, en comparación al


analizar una población, está claro que es por la cantidad de casos o unidades que
se estudia.
 Tiempo: El muestreo consume menor tiempo por lo tanto se hace con mayor

rapidez que en un censo, debido a que se analiza o estudia menor cantidad de


unidades.
CAPITULO 1: Fundamentos del muestreo José Loaiza Torres 25

 Tamaño de la población: El muestreo se aplica cuando el tamaño de la


población es grande, mientras que el censo cuando la población es pequeña.
Este criterio está relacionado también con el costo.
 Varianza de la característica: Cuando la varianza es Baja se aplica el
muestreo, caso contrario se debe aplicar un censo puesto que se requerirá mayor
número de unidades para estudiar a efectos de obtener información confiable y
representativa. Es muy importante definir la característica, generalmente se refiere
al parámetro de estimación.
 Errores de muestreo: Los errores muestrales se refieren a errores al azar y si el
investigador está dispuesto a asumir un costo relativamente bajo, debe decidir
por un muestreo, caso contrario por un censo. Este criterio se relaciona con la
varianza de la característica.
 Errores por falta de muestreo: Se refieren a errores que son imputables al

investigador y al investigado, generalmente estos errores deben ser


controlables y su valor debe ser bajo, pero si su valor es alto debería optarse
por un muestreo, debido a que se puede capacitar y supervisar al personal de
campo con mayor efectividad, de no ser posible debería optarse por un censo. Este
criterio se relaciona también con la exactitud.
 Naturaleza de la medición: Se refiere al hecho de que algunas unidades

muestrales son destructivas como el caso de productos alimenticios,


imaginemos el hacer un censo de todos los quesos de un mercado para identificar
el porcentaje de contenido de sal que tienen estos, habría que comerse todos los
quesos y no quedaría nada, obviamente en tales casos nos obliga a hacer un
muestreo y no un censo.
 Atención a casos individuales: Al hacer un muestreo es posible tener mayor

exactitud y atención a casos individuales, al ser pocas las unidades de


observación.
 Discreción en el estudio: Al hacer un muestreo, existe menos probabilidad

de que otros investigadores o grupos de interés tomen conocimiento de nuestro


estudio, así por ejemplo, de que nuestro competidor se entere de nuestras
intenciones de lanzar un nuevo producto al mercado.
26 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo

 Accesibilidad a la población: cuando la accesibilidad es baja conviene hacer


un muestreo y no un censo por las dificultades que representa en el trabajo de
campo a la hora de recolectar los datos.

Ahora bien, lo ideal para cualquier investigación es, estudiar a la población total, es
decir, a todas las unidades de la población, lo que se denomina censo; sin embargo,
por las limitaciones y condiciones de una determinada población, no siempre es
posible, lo que genera ciertas ventajas para hacer un muestreo.

1.3.- El Muestreo

Muestreo es seguir un método, un procedimiento tal que al escoger un grupo pequeño


de la población (muestra) podamos tener un grado de probabilidad de que ese
pequeño grupo efectivamente posee las características del universo y de la población
que estamos estudiando (Pardinas, 1972).

Por otra parte, Cesar Pérez (2005) menciona: Podemos definir los métodos de
muestreo como el conjunto de técnicas estadísticas que estudian la forma de
seleccionar una muestra lo suficientemente representativa de una población
cuya información permita inferir las propiedades o características de toda la población
cometiendo un error medible acotable.

Por tanto, el muestreo es uno de los métodos de investigación más importantes dentro
de la inferencia estadística, ya que permite obtener resultados confiables para
poderlos generalizar hacia la población de donde se extrae la muestra.
Consecuentemente, el muestreo es una herramienta de la investigación, cuya
función es determinar que parte de una población debe examinarse, con el
objetivo de hacer inferencias sobre dicha población.
CAPITULO 1: Fundamentos del muestreo José Loaiza Torres 27

1.4.- Población y Muestra

1.4.1.- Definición de población

Una población es el conjunto de todos los elementos que concuerdan con una serie
de especificaciones, es decir, todos los objetos, fenómenos o situaciones que pueden
ser agrupados sobre la base de una o más características comunes (Rodríguez y
colaboradores, 1994).

Si un conjunto de datos consta de todas las observaciones concebibles (o


hipotéticamente) posibles de un fenómeno determinado, lo llamamos una población
(Freund y Simon, 1994).

Por tanto, se puede decir que, una población es un conjunto de unidades que pueden
ser: Personas, clientes, familias, viviendas, animales, árboles, objetos, empresas, etc.
Dichas unidades han sido definidas cuidadosamente para un determinado estudio y
que además comparten una o más características comunes. Debe definirse entonces
con claridad, de manera que una unidad sea fácilmente identificada de si pertenece o
no a la población.

En términos de ecuación puede representarse:

P = {u}

Donde:
P = Población meta o universo
u = Unidades de observación, que pueden ser: personas, familias, objetos, animales,
viviendas, organizaciones, plantas, etc.
La pregunta es: ¿Cómo definir la población meta?
28 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo

Un proceso orientativo es aplicar la siguiente secuencia, tomando en cuenta los


componentes de una investigación:
- El problema de investigación.
- La hipótesis de investigación.
- Objetivo(s) de la investigación.
- Otras características como: Quién decide la compra, quién consume o usa el
producto/servicio, quién compra, etc.

Para comprender mejor, veamos algunos ejemplos sencillos a continuación.

Ejemplo 1:
Considere que está interesado en determinar el consumo promedio por semana de las
gaseosas negras en los hogares de su ciudad, entonces ¿Cuál es la población?

La respuesta está en base a la característica de interés en este caso hogares que SI


consumen gaseosas negras, puesto que en base a ello podrá calcular el consumo
promedio, no considere como parte de su población a aquellos hogares donde no se
consume este tipo de producto, ya que no podrá obtener lo que necesita que es el
promedio de consumo de gaseosas negras.

Ejemplo 2:
Objetivo: Evaluar la percepción sobre la calidad del servicio educativo de un instituto
de formación superior, ¿Quiénes conforman la población?

La respuesta sería todas las personas que alguna vez han utilizado los servicios de
este instituto, no podría considerar a todas las personas que viven en el área donde
se encuentra el instituto, solo podrán evaluar la calidad aquellas personas que han
experimentado el servicio.
CAPITULO 1: Fundamentos del muestreo José Loaiza Torres 29

Ejemplo 3:
Objetivo: Calcular el porcentaje de personas que prefieren un determinado canal de
televisión en una Ciudad. ¿Quiénes conforman la población?

La respuesta es, todas las personas que viven en esa ciudad y que ven algún canal de
televisión, no podría considerar solo a aquellas que ven el canal de televisión específico
de cuya preferencia le interesa conocer, puesto que para obtener el porcentaje de
preferencia, se debe considerar a todas las personas que sí ven al menos un canal de
televisión, o sea televidentes de todos los canales.

Ejemplo 4:
Determinar la demanda potencial para lanzar un nuevo producto para desayuno.
¿Quiénes conforman la población?

La respuesta es, todas las familias de una determinada área geográfica, así no
consuman ningún producto relacionado o sustituto al que se pretende ofrecer, igual
se los debe considerar a efectos de identificar los motivos por los que no demandan
este tipo de productos y poder ofrecer con determinadas características.

Ejemplo 5:
Determinar el consumo per cápita de vino en un país. ¿Cuál es la población?

La respuesta es, que la población estaría conformada por todas las personas que SI
consumen vino, primero habría que determinar probablemente el porcentaje de
personas que no consumen para separar a estas de la población o universo de estudio.

Si bien, existen estadísticas de consumo per cápita de mucho productos en base al


total poblacional, sin duda, éstas estadísticas son distorsionadas, porque considera
también a los no consumen.
30 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo

1.4.2.- Definición de muestra

Freund y Simon (1994) indican que por muestra se entiende al conjunto de elementos
que se toma de una población para, después de su estudio, llegar a conclusiones
válidas sobre toda la población. Si un conjunto de datos consiste sólo en una parte de
estas observaciones, se le conoce como una muestra.

Sierra bravo (citado por Aneiva, 1991) dice al respecto. “Se pueden definir las
muestras como una parte de un conjunto o población debidamente elegida, que se
somete a observación científica en representación del conjunto, con el propósito de
obtener resultados válidos, también para el universo total investigado.”

Tomando como referencia ambas definiciones, podemos decir que, la muestra es una
parte representativa de la población; esto quiere decir que en la muestra se deben
intentar encontrar todas las propiedades, condiciones, cualidades y peculiaridades de
la población y en las mismas proporciones que ésta, tomando en cuenta la variable
principal que se estudia. En otras palabras, la muestra debe reproducir los más
fielmente las características de la población

Si la población toma la forma de un pastel, la muestra será una porción de éste, esta
relación la podemos representar en la siguiente figura.

Figura 1.1: Población y muestra

Muestra

Poblacion

Fuente: Elaboración propia


CAPITULO 1: Fundamentos del muestreo José Loaiza Torres 31

1.4.3.- Condiciones que debe cumplir la muestra probabilística

Una muestra probabilística debe cumplir las siguientes condiciones:

a).- Que comprenda una parte de la población y no su totalidad.


b).- Que su tamaño esté relativamente proporcionado al de la población total, relación
que establece si es o no admisible. Lo que nos invita a calcular su tamaño de
forma estadística.
c).- Que incluya todas las características de los elementos de la población, de tal
manera que sea representativa, es decir, sea el reflejo de ésta.
d).- Que la elección de los elementos no sea distorsionada o subjetiva, lo que la haría
anómala o viciada. Esto nos invita a seleccionar la muestra con métodos o técnicas
estadísticas probabilísticas para garantizar la objetividad.

1.4.4.- Características deseables de una investigación por muestreo

Según Pérez (2005) las características óptimas que debe cumplir una investigación
por muestreo son:
- Acuricidad.- Proximidad al valor verdadero de las características poblacionales
estimadas.
- Pertinencia.- Capacidad de un resultado estadístico obtenido con la investigación
por muestreo para completar ciertas lagunas en el resultado de un fenómeno.
- Oportunidad.- Utilidad de un resultado estadístico en función de su disponibilidad
en el tiempo (puntualidad, rapidez y actualidad).
- Accesibilidad.- La información obtenida por muestreo ha de ser totalmente
accesible, así como tener presente desde el diseño la legalidad vigente.
- Detalle y cobertura.- La producción de datos externos y profundos puede llevar a
complementar una investigación exhaustiva con una muestra.
- Economía.- La investigación por muestreo debe ser lo más barata posible.
- Integración.- Hay que obtener buena concepción global de la información y buena
comparabilidad.
32 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo

Se puede deducir que, si una muestra tiene las características anteriores será
representativa de la población, lo que significa que se trata de una muestra
probabilística.

1.5.- El diseño muestral

El diseño muestral se refiere a “la aplicación de los métodos del muestreo para conocer
si las diferencias que se pueden obtener entre dos muestras son o no representativas
o, precisar si una muestra es representativa a una determinada población (Bardales,
1992)”

Lo que implica entonces, definir con precisión la población, la(s) técnica(s) de


muestreo, determinar de manera óptima el tamaño de la muestra, entre otros
aspectos a fin de obtener una muestra que represente a la población.

1.5.1.- Importancia

El diseño muestral es importante por lo siguiente:

a) Ahorra dinero, tiempo y energía al investigador.


b) Permite diferenciarse de los censos al tomar unidades más representativas.
c) Capta los atributos o características comunes de la población seleccionada. Sus
medidas son interpretadas y cuantificadas por la estadística.
d) Establece una labor científica más adecuada. El procesamiento de un menor
número de datos, facilita al investigador agruparlos con mayor precisión y
cometer menos errores.
e) Podemos emplear personal capacitado y realizar una supervisión cuidadosa del
trabajo de campo y del procesamiento de los resultados.
CAPITULO 1: Fundamentos del muestreo José Loaiza Torres 33

Por ello, es necesario realizar un diseño muestral antes de iniciar la recogida de datos
en una investigación, este diseño ha de permitir contar con un plano o estructura de
lo que se va a realizar en términos muestrales.

1.5.2.- Tipos de diseños muestrales

Una de las clasificaciones más conocidas sobre los diseños de muestras, es dividir en
transversal y longitudinal (Malhotra, 2008).

Muestra transversal.- Es una muestra que se extrae de una población por única vez
para un determinado tema u objetivo de estudio y no se vuelve a repetir en la misma.
Es como una fotografía en un momento determinado. Tiene muchas aplicaciones en
el área empresarial, por lo cual, este tipo de diseño es muy utilizado en los estudios
de mercado; por ejemplo, estudios sobre aceptación de un determinado producto en
la población actual con todas sus características demográficas, determinación de la
posición actual de la marca, determinación del grado de satisfacción o insatisfacción
con el producto/servicio, selección de documentos en una auditoria operativa y
financiera, conocer la intención de compra de un nuevo producto. En todos estos
ejemplos, bastaría en inicio con una muestra transversal.
Muestra longitudinal.- También se denomina muestra de la diagonal, se refiere a
que se extrae la muestra de una población para estudiarla, y considerarla a lo largo
de un periodo de tiempo. Se utiliza fundamentalmente en estudios de cambio de
comportamientos, actitudes y percepciones que ocurren con el transcurso del tiempo.
Por ejemplo, se puede estudiar cómo cambia las preferencias por un determinado
candidato durante un periodo electoral, cómo se modifica el grado de lealtad del
consumidor en un periodo de tiempo hacia un determinado producto, otro ejemplo es
el estudio sobre grado de aprendizajes competenciales en una universidad conforme
los estudiantes avanzan de nivel en su carrera universitaria.

Para comprender mejor, veamos un ejemplo hipotético referido al consumo de


refresco por edades.
34 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo

Cuadro 1.2: Ejemplo de muestra transversal y longitudinal


(Expresado en porcentajes)

Edad 1980 1990 2000 2010


8-19 52,9 62,6 73,2 81,0
20-29 45,2 60,7 76,0 75,8
30-39 33,9 46,6 67,7 71,4
40-49 23,2 40,8 58,6 67,8
50+ 18,1 28,8 50,0 51,9

Diseño longitudinal:
Diseño transversal:
cada grupo de edad
Muestras múltiples
10 años después,
en diagonal

Resultado investigación: Resultado


decrece el consumo con el investigación: aumenta
aumento de la edad el consumo con el
aumento de la edad
Fuente: Adaptado de Malhotra (2008)

Como se observa, las conclusiones pueden ser diferentes, si se considera un diseño


transversal, la conclusión es que el consumo disminuye conforma aumenta la edad de
las personas, mientras que por medio de un diseño longitudinal se concluye que el
consumo aumenta conforme aumenta la edad de las personas. Ambos diseños son de
mucha utilidad en ciencias empresariales e investigación de mercados.

1.6.- El proceso de diseño y ejecución del muestreo

Tomando como referencia a Malhotra(2004) y Weiers(1987), podemos proponer siete


pasos para seguir el proceso de diseño y ejecución del muestreo:
CAPITULO 1: Fundamentos del muestreo José Loaiza Torres 35

1.-Definir la población objetivo, de estudio y los parámetros pertinentes: Se


debe definir la unidad, el elemento, la extensión, el tiempo y los parámetros
pertinentes a estimar.
2.-Determinar el marco muestral: Qué marco se utilizará como referencia para
seleccionar las unidades muestrales.
3.-Seleccionar un tipo y técnica de muestreo: No solamente seleccionar si el
muestreo es probabilístico o no probabilístico, sino también la técnica específica
dentro de cada tipo de muestreo.
4.-Determinar el tamaño de la muestra: Debe obtenerse el tamaño de muestra,
tanto final como inicial.
5.-Seleccionar la muestra y reunir la información: Es el trabajo de campo y debe
especificarse qué técnica(s) se utilizaran para elegir las unidades muestrales.
6.-Validar la muestra: Es un paso muy importante, esto se hace con el fin de
verificar la representatividad de la muestra.
7.-Analizar los datos y presentar los resultados: Se debe dar respuesta a los
objetivos y al problema de investigación.

Cada uno de estos pasos se desarrollan en detalle en el capítulo Nº2.

1.7.- Fuentes de datos

Antes de elegir una fuente de datos y para una correcta interpretación y aplicación de
los datos debe definirse algunos aspectos o criterios:

 El grado de fiabilidad de la información (atendibilidad). Dependerá básicamente


de la fuente de datos.
 El ritmo de actualización (periodicidad) para trabajar en todo momento con los
datos más recientes y ajustados a la realidad.
 El grado de discriminación (homogeneidad) o de detalle, por cuanto unas veces
la información distingue los distintos tipos y características del fenómeno
estudiado, pero otras, aun siendo fiable, se presenta poco discriminada,
36 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo

englobando en un mismo concepto a datos que no permiten conocer los


componentes del fenómeno sobre el cual se pretende tomar una decisión.

Las fuentes se clasifican en primarias y secundarias, las que a su vez pueden ser
internas o externas; esquemáticamente se muestra en la figura 1.2

Figura 1.2: Fuentes de datos

Internas
Primarias
Externas
Fuentes de
datos
Internas
Secundarias
Externas

Fuente: Elaboración propia

Según de donde provengan los datos, se puede decir que hay datos internos, externos,
primarios o secundarios:
 Los datos internos son aquellos que la empresa puede obtener y explotar por
sus propios medios, sin necesidad de recurrir a terceros.
 Los datos externos son los que no proceden de la empresa, sino de terceros.
 Los datos primarios son los que se obtiene expresamente para un estudio
concreto, son aquellos que desarrolla el investigador con el propósito específico
de dirigirlos al problema de investigación que confronta, por ejemplo, ante unas
elecciones se realizan sondeos mediante encuestas sobre intención de voto y se
pronostican resultados, estos datos son primarios. En general, los datos pueden
ser cualitativos o cuantitativos.
 Los datos secundarios son aquellos que se encuentran disponibles antes de
que se haga necesaria su obtención, es decir, todo aquello de lo que se puede
disponer pero no los origina el investigador, o dicho de otro modo, son aquellos
datos recopilados con propósitos distintos al del problema que se resuelve, por
CAPITULO 1: Fundamentos del muestreo José Loaiza Torres 37

tanto, ya están disponibles antes de que hayamos iniciado una investigación. Por
ejemplo, si un fabricante quiere conocer el tamaño de los segmentos de población
por edad y sexo, para estimar el mercado potencial de sus productos, puede
consultar las estadísticas reportadas por el Instituto Nacional de Estadística, en
este caso dichos datos fueron recogidos mediante un censo de población y
vivienda y que están disponibles para su uso y para diferentes propósitos.

Por tanto, los datos secundarios son hechos, cifras e información que alguien ha
compilado para otros fines, y el investigador puede hacer uso de ellos evitando
de esta manera gastos de dinero y tiempo. Consecuentemente, las ventajas más
importantes de los datos secundarios son el costo y el tiempo. Como regla general
puede decirse: que el análisis de datos secundarios disponibles es un prerrequisito
para la recopilación de datos primarios, lo que quiere decir a su vez que, debe
iniciarse la búsqueda de los datos secundarios, luego continuar con los datos
primarios sólo cuando las fuentes de datos secundarios se hayan agotado o si
producen resultados marginales.

Antes de escoger los datos secundarios que se van a utilizar, se debe valorar de
acuerdo a determinados criterios (Hair y otros, 2010) y realizarse algunas preguntas:
Finalidad u objetivo: ¿En qué grado están íntimamente relacionados los datos
con el problema o con el objetivo de la investigación? ¿Cuál fue el propósito por el
cual se recopilaron?
Actualidad: ¿Cuándo fue recolectada la información y cuán representativa es
hoy? ¿Se están utilizando los datos?
Confiabilidad y credibilidad: ¿Por quién o quiénes fue recopilada esta
información?
Especificaciones y metodología: ¿Al reunirlos, qué métodos o técnicas se
emplearon?
Exactitud y congruencia: ¿Con qué cuidado se preparó el trabajo?
38 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo

Respondiendo a cada una de las interrogantes podremos valorar una determinada


fuente de datos para poder utilizarla para nuestra investigación, mientras más se
relacionen los datos secundarios con nuestro objetivo, sean más actuales, la fuente
sea más confiable, la metodología que se haya seguido sea objetiva, y estén libres de
sesgos, más útiles serán los datos secundarios para nuestra investigación.

1.8.- Instrumentos básicos que utiliza el muestreo para la recopilación de


datos

Las formas de recolección generales tanto para datos secundarios como para datos
primarios se muestra en la siguiente figura.

Figura 1.3: Instrumentos de recolección de datos

Encuestas y entrevistas Registros y banco de datos


Instrumentos
De Experimentos Análisis de contenido
recolección
Observación Investigación cualitativa

Fuente: Elaboración propia

Dependiendo, si los datos son secundarios o primarios, se aplicará determinado


instrumento para recopilar los mismos. Así podemos decir (basado en Jany, 2000 y
Loaiza 2010):

Para recopilar datos primarios: Se utiliza las encuestas, las entrevistas, la


investigación cualitativa (entrevistas a profundidad, técnicas proyectivas, grupo focal,
análisis de contenido), la observación (personal, mecánica, auditorias del hogar,
análisis de vestigios) y el experimento.
CAPITULO 1: Fundamentos del muestreo José Loaiza Torres 39

Para recopilar datos secundarios: Se utiliza la revisión documental de los bancos


de datos que pueden estar disponibles en registros y archivos de la empresa o son
manejados por terceras personas naturales o jurídicas.

Ahora bien, para la recolección de datos primarios en ciencias empresariales e


investigación de mercados, los métodos tradicionales más utilizados son los diferentes
tipos de encuesta; estos se resumen en la siguiente figura.

Figura 1.4: Métodos de encuesta

Métodos de encuesta

Telefónica Personal Correo/E-mail

Entrevista Entrevista En el Intercepción Asistida por Encuesta Panel Correo


tradicional asistida hogar en centros computadora por de postal
Por comerciales correo correo
computadora E-mail E-mail

Fuente: Adaptado de Malhotra (2008)

Encuesta telefónica:
Entrevista tradicional: Ocurre cuando por medio del teléfono se realiza la entrevista.
Entrevista asistida por computadora: Se realiza por intermedio del computador
conectado a internet y se da con transmisión de voz, de manera sincrónica.

Personal:
En el hogar: Es cuando un entrevistador y un entrevistado interactúan directamente
cara a cara.
40 José Loaiza Torres CAPITULO 1: Fundamentos del muestreo

Intercepción en centros comerciales: Es una entrevista que se realiza en el lugar de


compra del entrevistado; por ejemplo, en un supermercado, en una tienda comercial,
en una tienda de mercado.
Asistida por computadora: Este tipo de encuesta, se realiza por medio de una cámara
web con la cual se interactúa entre el entrevistador y el entrevistado.

Correo/E-mail:
Correo postal: Es la encuesta tradicional utilizando una casilla de correo, la encuesta
deberá imprimirse y acompañarse con instrucciones precisas para que sea completada
por parte del encuestado.
E-mail: Este tipo de encuesta está siendo muy utilizado, exige que el entrevistado
tenga una cuenta de correo por internet.
Panel de correo E-mail: A diferencia del anterior, se trata de un grupo de encuestados
y se mantienen en el tiempo para diversos temas.

Es importante, señalar las ventajas y limitaciones que tienen cada uno de los métodos
de encuesta más utilizados, con el fin de que el investigador sea capaz de seleccionar
el método apropiado a su tema de investigación, a sus recursos disponibles, a las
características de la población, etc. El cuadro 1.3 resume lo anteriormente señalado.
CAPITULO 1: Fundamentos del muestreo José Loaiza Torres 41

1.9.- Evaluación comparativa de los métodos de encuesta


Cuadro 1.3: Evaluación comparativa de los métodos de encuesta
Criterios Telefónica En el hogar Intercepción Correos Panel de
/E-Mail correos
Flexibilidad en la recopilación de datos: Complejidad del Moderada Alta Alta Baja Baja
cuestionario, explicaciones, aclaraciones, técnicas no
estructuradas.
Depende del grado de intercambio con el encuestado.
Variedad de preguntas: Depende del intercambio encuestador- Baja Alta Alta Moderada Moderada
encuestado y la visualización de las preguntas.
Uso de estímulos físicos: Apoyo audiovisual a la encuesta como No Moderado Alto Moderado Moderado
productos y promociones. Depende del intercambio y el ambiente
de la encuesta.
Control de la muestra: Capacidad para llegar con efectividad y Moderado a alto Potencialmente Moderado Bajo Moderado a
eficiencia a las unidades muestrales. Depende de las posibilidades ( especial alto alto
del entrevistador para contactar a los elementos muestrales para accesibilidad a
aplicar el cuestionario. Depende del grado de respuesta a la lugares
entrevista. remotos)
Control del ambiente o entorno de la encuesta: Se busca la Moderado Moderado a alto Alto Bajo Bajo
concentración y motivación del entrevistado. Depende de la
presencia del investigador y las condiciones que pueda crear para
la entrevista
Control de la fuerza de campo: supervisión de los Moderado Bajo Moderado No No
entrevistadores que constituyen la fuerza de campo.
Cantidad de datos a recopilar: Depende del ambiente para la Baja Alta Moderada Moderada Alta
entrevista, la motivación y el intercambio
Tasa de respuesta: Porcentaje que concluye la entrevista del Moderada Alta Alta Baja Moderada
total contactado.
Percepción del anonimato: Percepción del encuestado de que Moderada Baja Baja Alta Alta
su identidad no la discernirá el encuestador o el investigador.
Aceptación social: Tendencia a dar respuestas “aceptadas” Moderada Alta Alta Baja Baja
socialmente. Depende de la presencia del entrevistador.
Obtención de información delicada (personal) Potencialmente Baja Baja Alta Alta
alta
Potencial para las tendencias del entrevistador: sesgo que Moderado Alto Alto No No
introduce el entrevistador en la selección de encuestados, al hacer
las preguntas y el registro de respuestas. Depende de la extensión
del papel del entrevistador.
Velocidad: rapidez para obtener la información Alta Moderada Moderada a alta Baja Baja a
moderada
Costo: Valor monetario que se eroga en realizar las encuestas, Moderado Alto Moderado a alto Bajo Bajo a
incluye gastos de la administración. moderado
Fuente: Malhotra (2008)
42 José Loaiza Torres CAPITULO 2: El plan de muestreo

A manera de resumen, presentamos las ventajas de cada método de encuesta:


Telefónica: Mayor velocidad.
En el hogar: Más flexibilidad para recopilar datos, el control de la muestra, cantidad
de datos, mayor índice de respuestas, menor coste.
Intercepción en centros comerciales: Más flexibilidad para recopilar datos,
posibilidad de uso de estímulos físicos, el control de factores ambientales, mayor
índice de respuestas, menor coste.
Correo postal: Mayor control de la fuerza de campo.
Email: Mayor control de la fuerza de campo, acceso especializado y cada vez de
mayor uso.
Internet: Mayor rapidez y bajo costo.

1.10.- Fuentes potenciales de error en una investigación

Hay básicamente dos tipos de errores que suman el error total, el error muestra y el
error no muestral, a continuación se expone los errores que se pueden cometer en
una investigación.

Figura 1.5: Fuentes potenciales de error en la investigación

Error total

Error muestral Error no muestral

Error en la respuesta Error por falta de


respuesta

Error del Error del encuestador Error del entrevistado


investigador

Fuente: Adaptado de Malhotra (1997)


Error total.- Es la variación entre el valor real de la media de la población de la
variable que se estudia y el valor de la media observada en la investigación.

Error muestral.- Ocurre porque la muestra seleccionada es una representación


imperfecta de la población que se estudia, pero es un error que ocurre totalmente al
azar. El error muestral tiene dos características que lo hacen útil para el investigador:

a. Puede medirse.
b. Disminuye a medida que se aumenta el tamaño de la muestra.

Error no muestral.- Error que puede atribuirse a fuentes distintas a la del muestreo;
puede ser por causas que incluyen errores en la definición del problema, el
planteamiento, el diseño de la investigación, las escalas, el diseño del cuestionario,
los métodos de entrevistas, el análisis de datos. Se debe analizar lo siguiente:

1. Cuáles errores no muestrales pueden ocurrir.


2. Qué efecto pueden tener estos errores sobre los resultados.
3. Qué pasos podemos seguir para reducir estos errores.

Los errores no muestrales no son fáciles de medir y aumentan a medida que el tamaño
de la muestra aumenta. Lo que hacen los errores no muestrales, es sesgar los
resultados en una dirección y magnitud desconocidas. El error no muestral puede
inutilizar los resultados de un estudio. La pregunta es: ¿Qué se puede hacer para
reducir o minimizar el error no muestral?, la respuesta, se debe seguir rigurosamente
la metodología objetiva y científica de la investigación a fin de reducir el error no
muestral.

Error por falta de repuesta.- Ocurre cuando uno de los entrevistados no contesta
o se rehúsan a ser parte de la muestra o no están en su lugar donde deberían estar
para el contacto durante el período de muestreo.
44 José Loaiza Torres CAPITULO 2: El plan de muestreo

Error en la respuesta.- Tipo de error por falta de muestreo que surge cuando los
entrevistados dan respuestas imprecisas o cuando éstas se registran o analizan en
forma equivocada.

Error del investigador.- Puede ocurrir por sustitución de la información, error de


medición en la asignación de números y escalas, diseño pobre del instrumento de
recolección de datos, mala definición de la población, error en la estructura de la
muestra, error en el análisis de datos por inferencias causales impropias.

Error del entrevistador.- Se puede dar por error en la selección de los


entrevistados, error al preguntar, error de registro y errores por engaño, éste último
es el error de mayor impacto negativo en el resultado de una investigación por
muestreo.

Error del entrevistado.- Puede tener dos fuentes: error por incapacidad y error por
falta de voluntad. El error por incapacidad se da cuando el entrevistado responde
sobre un tema que no es de su conocimiento, pero que asume que lo sabe, es decir
es una total falta de honestidad. Mientras que el error por falta de voluntad ocurre
cuando el entrevistado responde por responder por diferentes motivos, ya sea por
sacarse de encima al entrevistador o porque está muy ocupado o tiene su mente en
otro lado.

Vamos a intentar representar los diferentes tipos de errores en forma de ecuaciones


de la siguiente manera:

ET = EM + ENM (1)

Donde:
ET = Error total
EM = Error muestral
ENM = Error no muestral
EM  Zσ X (2)

Donde:
EM = Error muestral.
Z = Unidades estandarizadas de la variable cuantitativa
 X = Error estándar de la media

ENM = ER + EPR (3)

Donde:
ENM = Error no muestral
ER = Error en la respuesta
EPR = Error por falta de respuesta

ER = EI + EEC + EENT (4)

Donde:
ER = error por falta de respuesta
EI = Error del investigador
EEC = error del entrevistador
EENT = error del entrevistado

De manera general:

ET = ( Z X ) + EPR + (EI + EEc + EENT) (5)


46 José Loaiza Torres CAPITULO 2: El plan de muestreo

1.11.- Preguntas y problemas

1. ¿Explique qué estudia la teoría del muestreo? y ¿Qué es el muestreo?

2. Defina lo que es una población y una muestra.

3. Describa las condiciones que debe cumplir una muestra.

4. ¿Cuál es el propósito fundamental del muestreo?

5. ¿Cómo se clasifican las fuentes de datos?

6. ¿Qué criterios se utilizan para valorar los datos secundarios?

7. ¿Cómo se podría reducir al mínimo los errores no muestrales? ejemplifique su


respuesta.

8. Suponga que está tratando de medir el efecto sobre la actitud que tienen los spots
publicitarios en un año. ¿Qué diseño de muestra transversal o longitudinal
utilizaría? ¿Por qué?

9. El propietario de una ferretería en Tarija - Bolivia, está interesado en determinar


las características demográficas de las personas que compran en su tienda, versus
las que compran en tiendas de la competencia. También quiere saber cuál es su
imagen con relación a la de la competencia. Le gustaría tener esta información
dentro de tres semanas y está trabajando con un presupuesto limitado. ¿Qué
método de encuesta le recomendaría usted? ¿Por qué?

10. ¿Qué tipos de errores se podrían asociar con las siguientes situaciones?
a) Hacer una encuesta acerca de las actitudes hacia el gobierno municipal de la
Ciudad, utilizando el directorio telefónico como marco de la muestra.

b) Entrevistar a los participantes únicamente entre las 8:00 a.m. y las 5:00 p.m.
sobre las características que les gustaría ver en un nuevo desarrollo de
condominios.

c) Preguntarles a las personas si han visitado la biblioteca pública municipal


durante los dos meses anteriores.

d) Preguntarles a las personas cuántos tubos dentífricos utilizaron el año pasado.


48 José Loaiza Torres CAPITULO 2: El plan de muestreo
CAPÍTULO 2
EL PLAN DE MUESTREO
2.1.- Introducción
2.2.- Definición de la población meta y los parámetros
2.3.- Determinación del marco de la muestra
2.4.- Selección de una técnica de muestreo
2.4.1.- Decisiones principales al elegir el tipo de muestreo
2.4.2.- Clasificación de las técnicas de muestreo
2.5.- Determinación del tamaño de la muestra
2.6.- Selección de la muestra y recolección de los datos (ejecución)
2.7.- Validación de la muestra (ejecución)
2.8.- Análisis de los datos y presentación de los resultados (Ejecución)
2.9.- Preguntas y problemas
50 José Loaiza Torres CAPITULO 2: El plan de muestreo
CAPITULO 2: El plan de muestreo José Loaiza Torres 51

MAPA CONCEPTUAL

CAPÍTULO 2: EL PLAN DE MUESTREO

COMPETENCIA QUE SE PRETENDE LOGRAR: DISEÑA UN PLAN DE MUESTREO,


SIGUIENDO LOS PASOS NECESARIOS CON PERTINENCIA Y EFECTIVIDAD.

PLAN DE MUESTREO
Analizar

1.- Definición de la población meta 2.- Determinación del 3.- Selección de una 4.- Determinación
marco de la muestra del tamaño de la
y los parámetros pertinentes técnica de muestreo
muestra

Criterios para elegir un tipo


Estimar la
y técnica de muestreo
varianza

Relacionar
Seleccionar 1-2-3-4

La mejor muestra y reunir la Analizar los datos Con técnicas adecuadas, y presentar los
información (Mejor método de resultados (Ejecución)
selección)

Relacionar Seleccionar

Validación de la muestra Mejores componentes del plan y


(ejecución) ejecución de muestreo

Diseñar

PLAN DE MUESTREO

Fuente: Elaboración propia


52 José Loaiza Torres CAPITULO 2: El plan de muestreo
CAPITULO 2: El plan de muestreo José Loaiza Torres 53

CAPÍTULO 2
EL PLAN DE MUESTREO

2.1.- Introducción

Hemos querido abordar en un capítulo aparte el plan de muestreo por la importancia


que se merece, de la experiencia profesional, nos atrevemos a decir que los errores
más frecuentes que se presentan en las investigaciones en general y en las
investigaciones en el área empresarial en particular, están precisamente en la
elaboración de un buen plan de muestreo; por consiguiente, en el presente capítulo
abordaremos a detalle el diseño del muestreo.

Recordando los pasos que involucra se tiene:


1.-Definición de la meta y los parámetros pertinentes.
2.-Determinación del marco muestral.
3.-Selección de un tipo y técnica de muestreo.
4.-Determinación del tamaño de la muestra.
5.-Selección de la muestra y recolección de los datos.
6.-Validación de la muestra.
7.-Analisis de los datos y presentación de los resultados

Cada uno de estos pasos, se describe a continuación

2.2.- Definición de la población meta y parámetros

Población meta.- Conjunto de unidades delimitadas para investigar que contienen


las características relevantes.
La población meta, se define en términos de sus elementos, unidades de muestra,
extensión, tiempo y parámetros.
54 José Loaiza Torres CAPITULO 2: El plan de muestreo

Unidad de muestra.- Son colecciones no traslapadas de elementos. Contiene el


elemento o es el elemento. Unidad seleccionada de la población para la aplicación
de la técnica de investigación; contiene los elementos de la población que pueden
formar parte de la muestra. La suma de las unidades es el tamaño de la población
N.

Elementos.- Objeto sobre el cual o del cual se desea información y que es parte
de la unidad muestral. Es decir, es la unidad más fundamental de la cual se obtiene
información.

Extensión.- Límite geográfico.

Tiempo.- Período a considerar en el proceso de muestreo.


Parámetros2.- Son características de la población y que a partir de la muestra se
han de estimar sus valores. Es necesario definir con claridad a cuál o cuáles nos
vamos a referir. Generalmente se define en términos de porcentaje (p) o promedio
(  ). Cuando se recopila información mediante encuestas, generalmente se

relaciona con alguna(s) pregunta(s) de la encuesta o cuestionario.

2
Dicho de otra manera, significa elegir un parámetro o valor poblacional a estimar con el
muestreo, generalmente se relaciona con variables cuantitativas de lo que se obtiene la
media aritmética y/o con variables cualitativas de lo que se calcula una proporción
(porcentaje). Una forma de saber cuál de los dos debemos elegir es reflexionar sobre el
objetivo esencial o básico de la investigación, por ejemplo, si estamos interesados en conocer
las posibilidades de aceptación de un nuevo producto, probablemente el porcentaje de
personas que tendrían la intención de compra es lo básico, mientras que si el objetivo es
determinar las rutas de recorrido de distribución y ventas, lo más probable que nos interese
como algo básico y esencial el promedio de consumo o demanda diaria que tienen los
detallistas de las zonas. Finalmente, el elegir un parámetro no significa que en la investigación
se excluirán otros parámetros, se elige con fines de determinar la técnica y tamaño de
muestra apropiada.
CAPITULO 2: El plan de muestreo José Loaiza Torres 55

Ejemplo hipotético:
Tema de estudio: Imagen y posicionamiento de una empresa de servicios de
telecomunicaciones3.
Objetivo: determinar la imagen y el posicionamiento actual que tiene la empresa ante
la sociedad y sus clientes/usuarios.

Población meta: Se tiene dos subpoblaciones, 1)Todos los usuarios/clientes de la


empresa, y 2) Personas con capacidad y criterio para poder brindar sus percepciones,
en este caso podrían ser personas de 15 años y más de edad de la sociedad en
general. Definiremos de la siguiente manera.

Cuadro 2.1: Ejemplo de definición de Población meta


Categoría Unidad Elemento Extensión Tiempo Parámetro
Usuarios: Persona que Persona que Tarija Septiembre Porcentaje de
telefonía fija mayormente mayormente de 2016 usuarios que tienen
usa el servicio y usa el una opinión
que realiza el servicio y favorable de la
pago respectivo que realiza empresa
el pago
respectivo
Usuarios de Persona que Persona que Tarija Septiembre Porcentaje de
Internet mayormente mayormente de 2016 usuarios que tienen
usa el servicio y usa el una opinión
que realiza el servicio y favorable de la
pago respectivo que realiza empresa
el pago
respectivo
Usuarios de Persona que Persona que Tarija Septiembre Porcentaje de
Tv por cable mayormente mayormente de 2016 usuarios que tienen
usa el servicio y usa el una opinión
que realiza el servicio y favorable de la
pago respectivo que realiza empresa
el pago
respectivo
Personas de Personas de 15 Personas de Tarija Septiembre Porcentaje de
15 años años adelante 15 años de 2016 personas que tienen
adelante (No adelante una imagen
usuarios) favorable de la
empresa de
servicios
Fuente: Elaboración propia

3
Se asume que ésta empresa ofrece los siguientes servicios fundamentales: Telefonía Fija,
Internet y televisión (tv) por cable.
56 José Loaiza Torres CAPITULO 2: El plan de muestreo

2.3.- Determinación del marco de la muestra

Representación de las unidades de la población que consiste en una lista o grupo de


indicaciones. Se puede utilizar como marco de muestra un directorio telefónico,
directorio de asociación comercial, plano de una Ciudad zonificado, etc. Esta referencia
permitirá identificar la población meta.

Lo ideal en un marco muestral es contar con una lista completa de todas las unidades
de la población, pues de allí se seleccionará la muestra.

Error en el marco de la muestra.- Se cometen algunos errores a la hora de definir


el marco muestral ya sea por inclusión de unidades que no pertenecen a la población
o simplemente se omiten o excluyen a algunas unidades que deberían formar parte
de la población meta. Para evitar o corregir estos errores existen algunas estrategias:

a).- Redefinir la población acorde al marco de la muestra.


b).- Seleccionar a las unidades que satisfagan los criterios de la población, en la etapa
de recopilación de información.
c).- Adaptar los datos recopilados mediante algún esquema de ponderación.

En el ejemplo de la empresa de servicios de telecomunicaciones:

Marco muestral para la categoría de usuarios: Listado de usuarios activos, según


archivos de la empresa.
Marco muestral para la categoría de población de 15 años adelante: Plano de la Ciudad
zonificado e identificado según población por zonas y manzanos de la Ciudad.

2.4.- Selección de un tipo y técnica de muestreo

Hay decisiones fundamentales a tomar en esta etapa del diseño de muestreo


CAPITULO 2: El plan de muestreo José Loaiza Torres 57

2.4.1.- Decisiones principales al elegir el tipo de muestreo

Malhotra (1997) se refiere a aquellas decisiones que se deben tomar al elegir una
técnica o tipo de muestreo, es decir:

 ¿Debe utilizarse la Estrategia Bayesiana o la Tradicional?


 ¿Debe aplicarse un Muestreo con o sin Reemplazo?
 ¿El Muestreo debe ser Probabilístico o No Probabilístico?

La Estrategia Bayesiana o Tradicional

La estrategia bayesiana es un método de selección en el que los elementos se


seleccionan de forma secuencial. Esta estrategia incorpora de manera explícita
información previa sobre los parámetros de la población, así como los costes y
probabilidades asociados a la toma de decisiones equivocadas. Su uso es restringido
porque gran parte de la información que se requiere sobre costes y probabilidades no
está disponible.

En la estrategia tradicional se selecciona toda la muestra antes de iniciar la


recopilación de datos. Esta estrategia es la que se usa con mayor frecuencia.

En el ejemplo de la empresa de servicios de telecomunicaciones: Se utilizaría


la estrategia tradicional por tratarse de una investigación de tipo tradicional y se va a
elegir la muestra antes de reunir los datos.

Muestreo con o sin Reemplazo.

El muestreo con reemplazo es una técnica en la cual un elemento puede incluirse en


la muestra más de una vez.
58 José Loaiza Torres CAPITULO 2: El plan de muestreo

El muestreo sin reemplazo es una técnica en la cual un elemento no puede incluirse


en la muestra más de una vez. Es decir, es una técnica de muestreo en la cual una
vez que el elemento se selecciona para su inclusión en la muestra, se elimina del
marco de la muestra y, por tanto, no puede elegirse de nuevo.

En el ejemplo de la empresa de servicios de telecomunicaciones: se utilizará


el muestreo sin reemplazo, porque se trata de aplicar una sola vez a cada unidad
muestral la encuesta diseñada para este fin y no tendría sentido aplicar dos veces la
misma encuesta a la unidad o persona lo que sería un muestreo con reemplazo.

Muestreo Probabilístico o No probabilístico

Es la decisión más importante en la Selección de la Técnica de Muestreo.

Muestreo no probabilístico.- Técnicas de muestreo que no utilizan procedimientos


de selección por casualidad, sino que más bien dependen del juicio personal del
investigador, este tipo de muestreo no garantiza la representatividad de la muestra.

Muestreo probabilístico.- Procedimiento de muestreo en el cual cada unidad de la


población tiene una oportunidad probabilística fija de ser seleccionada para la
muestra. Además el muestreo probabilístico, tiene las características siguientes:

 Todas las unidades muestrales de la población tienen la misma posibilidad o


probabilidad de elegirse.
 Se usan unos instrumentos o herramientas de aleatoriedad para seleccionar la
unidad en estudio. Tales como, calculadora, software, tablas de números
aleatorios.
 Es más objetivo que el no probabilístico, pero también es más costoso y requiere
de más tiempo y es más difícil de aplicar.
CAPITULO 2: El plan de muestreo José Loaiza Torres 59

 Su ventaja principal es que se puede estimar el error muestral, o grado de precisión


asociado con los datos recopilados. Todo el procedimiento está sujeto a leyes de
probabilidad, o sea, que se puede calcular el intervalo de confianza.

En general, se pueden considerar los siguientes criterios para elegir el muestreo


probabilístico y no probabilístico.

Cuadro 2.2: Factores a considerar en la elección del tipo de muestreo

SE DECIDE POR UN MUESTREO


FACTORES QUE SE CONSIDERAN PROBABILÍSTICO NO
PROBABILÍSTICO
1.- Tipo de investigación: Exploratoria o Concluyente4
Exploratoria
concluyente
2.- Precisión de las estimaciones de las No permite Permite tendencias
características de la población: Eliminación tendencias
de tendencias en la selección de unidades y
cálculo del error muestral.
3.- Importancia o peso del error muestral y el Si hay error Si hay error no
error no muestral. muestral muestral
4.- Homogeneidad de la población respecto a las Población Población homogénea
variables de interés heterogénea
Fuente: Elaboración propia en base a Malhotra (2004)

A lo anterior se puede añadir otros criterios tales como:

 Consideraciones estadísticas
 Consideraciones operativas

Al respecto Tull y Hawkins (1996) citado en Web (2002) ofrecen un listado de factores
y preguntas a considerar al adoptar una decisión de muestreo probabilístico o no
probabilístico:

4 La investigación concluyente, debido a que sigue el proceso de investigación científica,


permite tomar decisiones empresariales que involucran asignación de recursos importantes
para la organización, esta investigación puede ser de tipo descriptivo, explicativo o causal.
60 José Loaiza Torres CAPITULO 2: El plan de muestreo

 El tipo de información necesaria: ¿Se necesitan proporciones y/o promedios o


totales proyectables?
 El tamaño del error tolerado admitido por el problema: ¿Se necesitan estimaciones
precisas de la población?
 ¿De qué tamaño podría ser el error no muestral?: ¿Con qué probabilidad
aparecerán los errores debidos a la elección del marco muestral, a la falta de
respuesta, a la medida o a las especificaciones de la población?
 Variabilidad de la población: ¿Es la población homogénea o heterogénea en relación
con la característica de interés?
 ¿Cuáles son los costes asociados al error? ¿Cuáles serán los costes si los resultados
obtenidos están por encima o por debajo de los niveles tolerados del error?

Para estos autores “La necesidad de totales proyectables, niveles bajos de error
tolerado, una alta heterogeneidad de la población, bajos errores no muestrales y altos
costes esperados de error favorecen el uso de un muestreo probabilístico”. Lo que se
aproxima literalmente al cuadro expuesto por Malhotra.

En el ejemplo de la empresa de servicios de telecomunicaciones:

Se seleccionará el tipo de muestreo probabilístico, por ofrecer mayores ventajas para


elegir una muestra representativa de la población meta. Por tratarse de una
investigación concluyente, por considerarse la población relativamente homogénea en
cada categoría pero heterogénea en general, bajo error no muestral, no se aceptaran
tendencias en las estimaciones, entre otros motivos.

2.4.1.1. Muestreo mixto

Gorjup, María y otros (2012) se refieren a los métodos mixtos como un estudio en
donde se aplican diferentes abordajes en una o varias fases del proceso de
investigación, combinando métodos cualitativos y cuantitativos en diversas formas y
secuencias.
CAPITULO 2: El plan de muestreo José Loaiza Torres 61

En lo referente a la fase de muestreo, tanto en los estudios cuantitativos como


cualitativos los investigadores deben decidir el tamaño de la muestra y la forma de
seleccionar las unidades muestrales. Estas decisiones normalmente son más
complejas en las estrategias mixtas, debido a que el diseño muestral debe tener en
cuenta los criterios de muestreo tanto de la metodología cuantitativa y cualitativa.

A pesar de que los estudios de métodos mixtos han crecido en popularidad, el tema
de muestreo en estos diseños ha sido escasamente abordado. Habitualmente se ha
tomado una postura dicotómica en las cuestiones relacionadas al diseño de muestras.
De esta forma, se tiende a asociar el muestreo probabilístico a la metodología
cuantitativa y el no probabilístico a la investigación cualitativa. Sin embargo, tanto el
muestreo aleatorio y no aleatorio puede ser utilizado en estudios cuantitativos y
cualitativos (Onwuegbuzie & Leech, 2004). Del mismo modo, en lo referente a las
cuestiones relacionadas al tamaño de la muestra, se ha asociado pequeñas muestras
a la investigación cualitativa y grandes muestras a estudios cuantitativos. Ahora bien,
hay circunstancias en las que es conveniente utilizar pequeñas muestras en
investigación cuantitativa (por ejemplo, estudios de empresas con datos contables y
económicos), mientras que hay ocasiones en que está justificado el uso de muestras
grandes en la investigación cualitativa (por ejemplo, estudios de poblaciones
altamente heterogéneas, sistemas complejos o estudios longitudinales y multinivel)
(Collins, Onwuegbuzie & Jiao, 2006).

Teniendo en cuenta los anterior, Teddlie y Yu (2007) resumen las principales


características de las muestras mixtas en el siguiente cuadro.
62 José Loaiza Torres CAPITULO 2: El plan de muestreo

Cuadro 2.3: Características de las estrategias de muestreo mixtas

DIMENSIÓN DE MÉTODO DE MUESTREO MIXTO


CONTRASTE
Propósito general del Diseñado para generar una muestra que dé cuenta
muestreo de las preguntas de investigación
Cuestiones de En algunas fases del diseño de investigación se
generalización focaliza en aspectos de la validez externa y, en
otros, en aspectos de la transferibilidad
Número de técnicas Todas las aplicadas en el muestreo probabilísticos y
deliberadas.
Racionalidad en la selección En algunas líneas del diseño se focaliza en la
representatividad en otros en la riqueza de la
información
Tamaño de la muestra Hay múltiples muestras en el estudio. Las muestras
varían en tamaño de acuerdo a las preguntas de
investigación.
Profundidad/amplitud de la Focaliza en ambas
información
Cuando la muestra es La mayoría de las decisiones de muestreo se
seleccionada realizan antes de iniciar la investigación pero las
preguntas orientación cualitativa puede llevar al
surgimiento de nuevas muestras a medida que se
avanza el estudio
Como es realizada la Opinión de los expertos sobre las decisiones de
selección muestreo, especialmente porque se interrelacionan
entre sí. Los métodos cuantitativos puede requerir
fórmulas matemáticas
Marco muestral Marcos formales e informales son utilizados
Tipo de datos que genera Datos numéricos y narrativos. En algunos casos de
investigación mixta pueden generarse sólo datos
narrativos o numéricos

Fuente: Teddlie y Yu (2007)

En definitiva, el muestreo mixto considera tanto al muestreo probabilístico como al no


probabilístico, ya sea para investigación cualitativa o cuantitativa.
CAPITULO 2: El plan de muestreo José Loaiza Torres 63

2.4.2.- Clasificación de las técnicas de muestreo.

En primer lugar, hablamos de los tipos de muestreo que pueden clasificarse en dos:
Muestreo probabilístico y Muestreo No probabilístico; luego dentro de cada tipo de
muestreo se señala a las técnicas específicas de muestreo.

Figura 2.1: Tipos y técnicas de muestreo

Tipos y Técnicas de
muestreo

Muestreo no probabilístico Muestreo probabilístico

Muestreo Muestreo Muestreo Muestreo de


por por juicio por bola de nieve
conveniencia cuota

Muestreo Muestreo Muestreo Muestreo Otras


aleatorio sistemático estratificado por conglomerados técnicas de
simple muestreo

Fuente: Elaboración propia

Cada técnica de muestreo merece ser tratado en un capítulo específico de


este libro.

2.4.2.1.- Relación entre los tipos de investigación y las técnicas de


muestreo

Lo anterior se puede relacionar con los tipos de investigación de mercados; es


decir, con la investigación exploratoria y concluyente, tal como se muestra en
la siguiente figura
64 José Loaiza Torres CAPITULO 2: El plan de muestreo

Figura 2.2: Relación entre tipos de investigación y técnicas de muestreo

Tipos de investigación Técnicas de muestreo


Por conveniencia
Exploratoria Por juicio

Por cuotas

De bola de nieve

Aleatorio simple

Sistemático
Concluyente
Estratificado

Por conglomerados

Otros: Doble, secuencial, de centro comercial

Fuente: Elaboración propia

El motivo del por qué aplicar técnicas de muestreo no probabilísticas en una


investigación exploratoria, se fundamenta en el entendido de que la investigación
exploratoria tiene como propósito encontrar ideas y delimitar e identificar el problema
de investigación; consecuentemente no se requiere de un diseño de muestreo formal
que genere una muestra representativa, por cuanto los hallazgos serán preliminares.

En tanto que una investigación concluyente, permite diseñar e implantar estrategias;


por lo tanto, se necesita de un muestreo formal y una muestra representativa por lo
que se debería aplicar técnicas de muestreo probabilísticas que cumplan con estos
requisitos.
CAPITULO 2: El plan de muestreo José Loaiza Torres 65

2.4.2.2.- Factores a considerar en la selección de una técnica de muestreo


probabilística.

En primer lugar, se muestra en forma esquemática los criterios utilizados para elegir
entre un muestreo aleatorio simple, sistemático, estratificado, o por conglomerados.

Figura 2.3: Mapa conceptual sobre los criterios para seleccionar una
técnica de muestreo
MUESTREO PROBABILÍSTICO

Deducir

Técnicas de muestreo

Analizar

Factores para elegir una técnica de muestreo

1.- Objetivos de la 2.- Marco muestral 3.- La población 4.- Características de


Investigación los elementos

¿Ordenada o no?
¿Homogénea o
¿General o ¿Ideal(listado) o
heterogénea?
específico? estimado?

Relacionar
1-2-3-4

Seleccionar

Mejor técnica de
muestreo
Aplicar

PROBLEMAS ESPECÍFICOS DE
INVESTIGACIÓN POR MUESTREO

Fuente: Elaboración propia

En segundo lugar, tomando en cuenta estos criterios la técnica apropiada a aplicar,


es posible representar esquemáticamente en la siguiente figura.
66 José Loaiza Torres CAPITULO 2: El plan de muestreo

Figura 2.4: Técnica de muestreo y sus criterios determnantes

Se aplica…………… Si se cumple los siguientes criterios...

Objetivos Generales

Listado
Muestreo aleatorio Marco muestral
simple
La población Desordenada

Características de
las unidades Heterogénea

Objetivos Específicos

Listado
Muestreo aleatorio Marco muestral
estratificado
La población Indiferente
Técnicas
de Características de Homogénea dentro
muestreo las unidades de cada grupo

Objetivos Específicos

Muestreo Por
conglomerados Marco muestral Estimado

La población Desordenada
Características de
las unidades Indiferente

Objetivos Generales

Muestreo Marco muestral Listado


sistemático
La población Ordenada

Características de
Indiferente
las unidades

Fuente: Elaboración propia


CAPITULO 2: El plan de muestreo José Loaiza Torres 67

Otra forma de expresar la figura anterior podría ser.

Figura 2.5: Condiciones para aplicar una técnica de muestreo

Características de Técnica apropiada


Objetivos de la Marco muestral La población las unidades de la de muestreo
investigación población

Desordenada de
General Ideal (listado) acuerdo a su heterogénea Muestreo
magnitud Aleatorio simple

Ordenada o Heterogénea, Muestreo aleatorio


Desordenada de puede dividirse Estratificado
Específicos Ideal (listado) acuerdo a su en grupos
magnitud homogéneos

General Estimado (plano Ordenada o Heterogénea, Muestreo


o mapas) Desordenada de puede dividirse Por conglomerados
acuerdo a su en grupos
magnitud heterogéneos

Muestreo
General Ideal (listado) Ordenada de heterogénea sistemático
acuerdo a su
magnitud

Fuente: Elaboración propia


68 José Loaiza Torres CAPITULO 2: El plan de muestreo

Cada una de las técnicas específicas de muestreo se desarrollará en mayor detalle en


los capítulos siguientes del libro.

En el ejemplo de la empresa de servicios de telecomunicaciones:


Existe una población por categorías (usuarios de Telefonía Fija, Internet y televisión
por cable) cuyas características principales (opinión favorable o desfavorable) son
relativamente homogéneas por dentro y heterogéneas entre categorías dado los tipos
de servicio, además se cuenta con un marco muestral ideal (listado de usuarios); por
consiguiente, se sugiere seleccionar el muestreo estratificado como técnica de
muestreo más apropiada.

Otro ejemplo, si se desea determinar el ingreso por estratos o grupos sociales, se


puede optar por el muestreo estratificado, dividiendo a la población en estrato de
ingreso alto, medio y bajo. De esta manera se obtendrá resultados más precisos al
estudiar a la población de una forma estratificada.

2.5.- Determinación del tamaño de la muestra

Definición del número de elementos que se incluyen en el estudio. Se consideran


elementos cualitativos y cuantitativos, estos últimos se estudian en el capítulo 5.

Factores cualitativos relevantes:

 Importancia de la decisión: En decisiones operativas o de rutina, el tamaño de


la muestra se calculará a juicio, en decisiones estratégicas la muestra se calculará
estadísticamente, esto por su implicancia dentro de la empresa y la necesidad de
contar con una muestra representativa.
 Naturaleza de la investigación: En investigaciones exploratorias la muestra se
calculará a juicio, en investigaciones concluyentes, la muestra se calculará
estadísticamente mediante fórmula matemática.
CAPITULO 2: El plan de muestreo José Loaiza Torres 69

 Tamaños de muestras en estudios similares o anteriores: Pueden utilizarse


como referencia.
 Índice de incidencia: Se refiere al porcentaje de unidades que califican para
nuestro estudio.
 Índice de terminación: Se refiere al porcentaje de unidades muestrales que
colaboran exitosamente en la investigación.
 Limitaciones de recursos: Se debe equilibrar en determinado momento aunque
no es lo más aconsejable.

Tanto el índice de incidencia como el índice de terminación se consideran en el cálculo


del tamaño de la muestra inicial, que se abordará en el capítulo 5.

En el ejemplo de la empresa de servicios de telecomunicaciones:

La importancia de la decisión a tomar en base a los resultados, se considera


estratégica a la hora de fidelizar a sus clientes y por tanto es investigación
concluyente; consecuentemente, la muestra deberá determinarse estadísticamente.

Los factores cuantitativos se estudiarán en el capítulo referido a la estimación del


tamaño de muestra.

2.6.- Selección de la muestra y recolección de datos (ejecución).

Antes de ejecutar el trabajo de campo, la recolección de datos debe ser muy bien
pensada muy bien planificada. Pues podemos tener un excelente plan, sino realizamos
correctamente la recolección de los datos, la muestra no será representativa. De
manera que, debemos programar las actividades y el tiempo que consumirán cada
una de ellas que podría hacerse a través de un diagrama de gantt, también debemos
planificar la gestión de la fuerza de campo y estimar el presupuesto respectivo.
70 José Loaiza Torres CAPITULO 2: El plan de muestreo

Asimismo, se requiere de una especificación detallada de la forma en que se ponen


en práctica las decisiones del diseño de muestreo.

Para el trabajo de campo se pueden emplear distintos medios que sirven para obtener
datos como lo son:
- Entrevistas personales
- Cuestionarios por correo
- Encuestas telefónicas
- La observación directa
- La revisión documental
- Experimentos
- Grupo focal

U aspecto a tomar muy en cuenta en el trabajo de campo, es el error no muestral


específicamente errores del encuestador y del encuestado, por lo tanto, las tareas de
recolección de datos deben llevarse adelante tratando de minimizar los errores no
muestrales.

2.7.- Validación de la muestra (ejecución)

Se realiza con la finalidad de saber si la muestra que hemos escogido es una selección
transversal representativa de la población, quizá queramos comparar las
características de ella con las que existen en la población de donde se extrajo.

También se realiza la validación en términos de cotejar la varianza estimada en forma


anticipada (cuando se estima para determinar la muestra), con la varianza
determinada después de escoger la muestra, esto se realiza con la finalidad de saber
si la cantidad de datos que hemos recogido es la óptima; es decir, si la muestra
representa a la población, en caso que se compruebe que no es así, debemos
continuar con el muestreo hasta lograr la representatividad deseada.
En el capítulo 5, se aborda de manera práctica el tema de la validación.
CAPITULO 2: El plan de muestreo José Loaiza Torres 71

2.8.- Análisis de los datos y presentación de los resultados (Ejecución)

Es la etapa final en la que el proceso de muestreo coincide ligeramente con la


validación de la muestra, pues tal validación exige además un análisis.

Para el análisis de datos se deben aplicar todas las técnicas estadísticas apropiadas e
función a los objetivos de la investigación, entre las que se pueden aplicar tenemos:
- Medidas de tendencia central.
- Medidas de dispersión.
- Pruebas de hipótesis de una y dos muestras.
- Modelos de distribución de probabilidad.
- Métodos de tendencias.
- Técnicas bivariantes como: Prueba Chi-cuadrada, regresión y correlación, Anova,
etc.
- Técnicas Multivariantes como: Análisis factorial, conglomerados, análisis de
correspondencia, etc.

El estudio de cada una de las técnicas, está fuera del alcance del presente libro.

2.9.- Preguntas y problemas

1. ¿En qué consiste el muestreo con reemplazo y el muestreo sin reemplazo?

2. ¿Cuáles son las características del muestreo probabilístico?

3. Suponga que usa el muestreo para estimar el número total de palabras del
presente libro que contiene figuras.
a) ¿Hay algún problema para la definición de la población?
b) ¿Cuáles son los pros y los contras de 1) una página, 2) el renglón, como unidad
de muestreo?
72 José Loaiza Torres CAPITULO 2: El plan de muestreo

4. El problema para encontrar un marco muestral completo que permita la obtención


de una muestra es frecuentemente un obstáculo. ¿Qué clase de marcos
muestrales pudieran ser convenientes para las siguientes encuestas?
a) Personas mordidas por las víboras durante el último año.
b) Una encuesta de tiendas que venden memorias de cámaras fotográficas.
c) Una encuesta de artículos que se dejan(olvidan) en los autobuses
d) Clientes de restaurantes de comida rápida.
e) Propietarios de reproductoras de DVD.
f) Personas que han emigrado a España en el transcurso de los dos últimos
años.
g) Encuesta a personas con alergia.

5. Un directorio de la ciudad, de hace cuatro años, enlista las direcciones en orden


a lo largo de cada calle, y da los nombres de las personas que viven en cada
dirección. Para una encuesta que se lleva a cabo actualmente por medio de
entrevistas a la gente de la ciudad, ¿Cuáles son las deficiencias de este marco
muestral? ¿Pueden ser remediadas por los entrevistadores durante el desarrollo
de la encuesta?. Al usar el directorio, ¿sacaría usted una lista de direcciones
(domicilios) o una lista de personas?

6. Diseñe un plan de muestreo para el siguiente caso de estudio: La Aduana Nacional


desea medir la “percepción e imagen” que tiene en el país.

7. ¿En qué consiste la validación de la muestra en el proceso de diseño y ejecución


de muestreo?

8. Suponga que ha estimado una varianza inicial de 5, luego de escoger la muestra


resulta que la varianza calculada es de 7. ¿Podría concluirse que la muestra es
representativa? sin realizar cálculos ¿debe aumentarse el tamaño de muestra o
reducirse?
CAPÍTULO 3
MUESTREO NO
PROBABILISTICO
3.1.- Concepto y características
3.2.- Tipos de muestreo no probabilístico
3.2.1.- Muestreo por conveniencia o basado en la comodidad del investigador
3.2.2.- Muestreo por juicio o con fines especiales
3.2.3.- Muestreo por cuota
3.2.4.- Muestreo de bola de nieve
3.3.- Cuándo utilizar técnicas de muestreo no probabilísticas
3.4.- Preguntas y problemas
74 José Loaiza Torres CAPITULO 3: Muestreo No probabilístico
MAPA CONCEPTUAL

CAPÍTULO 3: MUESTREO NO PROBABILÍSTICO.

COMPETENCIA QUE SE PRETENDE LOGRAR: DIFERENCIA Y SELECCIONA LAS


TECNICAS DE MUESTREO NO PROBABILISTICAS MÁS APROPIADAS APLICABLES A
UNA REALIDAD CONCRETA.

El Muestreo

Deducir

Muestreo no probabilístico

Analizar Clasificar: técnicas

1.- Características 3.- Por juicio 4.- Por cuota 5.- Bola de nieve
2.- Por
conceptuales
conveniencia

Relacionar
1-2-3-4-5

Seleccionar

TÉCNICAS APROPIADAS
APLICABLES A UNA
INVESTIGACIÓN

Fuente: Elaboración propia


76 José Loaiza Torres CAPITULO 3: Muestreo No probabilístico
CAPITULO 3: Muestreo No probabilístico José Loaiza Torres 77

CAPÍTULO 3
MUESTREO NO PROBABILÍSTICO

3.1.- Concepto y características

Malhotra (2008) dice que son técnicas de muestreo que no utilizan procedimientos de
selección por casualidad, sino que más bien dependen del juicio personal del
investigador. En este tipo de muestreo no existe un método que permita determinar
la probabilidad de seleccionar un elemento que forme parte de la muestra. Por ello las
estimaciones son difícilmente extrapolables a la población de interés (Merino, 2010).

Es decir, que no todas las unidades muestrales tienen la misma probabilidad de formar
parte de la muestra, siendo mayormente el investigador el que decide cuáles forman
parte de la muestra y cuáles no. Por tanto, se desconoce la probabilidad de que
cualquier unidad o miembro de la población sea elegido.

La utilidad de las técnicas de muestreo no probabilísticas, radica esencialmente en las


investigaciones exploratorias5; es decir, ayudan a generar ideas, razonamientos o
hipótesis, definir problemas de investigación, variables a considerar en la
investigación, etc. Es una investigación a priori y no definitiva.

Entre las características más sobresalientes, podemos mencionar:

1.-Las probabilidades de selección de las unidades muestrales son desconocidas; por


tanto, las posibilidades de generalización de los resultados acerca de una
población se ven considerablemente reducidas (Jhon R. Web, 2002).
2.- El muestreo no probabilístico no requiere el uso riguroso de un marco muestral.
3.- El tamaño de muestra no se determina estadísticamente mediante fórmula
matemática.

5
En la etapa exploratoria son más importantes las ideas y conocimientos, más que la objetividad científica (Weiers,
1986).
78 José Loaiza Torres CAPITULO 3: Muestreo No probabilístico

Consecuentemente, la muestra es elegida a conveniencia del investigador o para


cumplir con los requerimientos de determinado propósito. No obstante, según
Kummar, Aaker y Day (1999), si el muestreo es realizado incorrectamente, los
resultados del muestreo no probabilístico pueden contener “errores e incertidumbres
peores que si no se tiene alguna información” lo cierto es también que, a la hora de
aplicar un determinado muestreo no probabilístico, siempre se aplicará algún
conocimiento y criterio a efectos de obtener resultados útiles.

En base a lo anterior, es menester señalar que si bien, el muestreo no probabilístico


generalmente no genera una muestra representativa, ello no significa que estas
técnicas deben ser utilizadas con fines de satisfacción personal del investigador, al
contrario, deben aplicarse en situaciones donde se pueda juzgar su utilidad razonable.

3.2- Tipos de muestreo no probabilístico

Existen básicamente los siguientes tipos de muestreo no probabilístico:


- Por conveniencia o basado en la comodidad del investigador
- Por juicio o con fines especiales
- Por cuota
- De bola de nieve

A continuación se explica brevemente en qué consiste cada uno de estos.

3.2.1.- Muestreo por conveniencia o basado en la comodidad del


investigador

También se denomina causal o incidental.

Según Zikmund (1998) es un procedimiento de muestreo en el que se obtienen


aquellas personas o unidades cuya disponibilidad es más conveniente.
CAPITULO 3: Muestreo No probabilístico José Loaiza Torres 79

Es una técnica de muestreo no probabilística, que trata de obtener una muestra de


elementos convenientes. La selección de las unidades muestrales se deja
principalmente al entrevistador. Con frecuencia, se selecciona a los entrevistados
porque se encuentran en el lugar adecuado en el momento oportuno. El caso más
frecuente de este procedimiento es utilizar como muestra los individuos a los que se
tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos). Un caso particular es el de los voluntarios.

Algunos ejemplos de aplicación de este muestreo tenemos:

- Estudiantes, grupos religiosos, miembros de organizaciones sociales.


- Entrevistas de intercepción en centros comerciales.
- Entrevistas a personas que pasan por una calle.
- Encuesta piloto.
- Sesiones de grupo, donde los integrantes se eligen en base a un criterio definido.
- Sondeos de opinión.
- Autoselección en llamadas telefónicas a un programa radial o televisivo (tele
encuesta).
- Autoselección para participar de encuestas en línea por internet.

Ventajas:

 Es la técnica menos costosa.


 Requiere de menos tiempo.
 Las unidades de muestra son accesibles, fáciles de medir y cooperativas.
 Tasa de rechazo baja o nula.

Limitaciones:

 Están presentes muchas fuentes potenciales de tendencia en la selección,


incluyendo la autoselección de los entrevistados.
80 José Loaiza Torres CAPITULO 3: Muestreo No probabilístico

 Las muestras no son representativas.


 Las muestras no son adecuadas para proyectos de investigación de mercados que
comprenden inferencias sobre la población.

3.2.2. - Por juicio o con fines especiales

El muestreo por juicio es un muestreo no probabilístico, en el que los elementos de la


población se seleccionan de manera intencional con base en el juicio del investigador.
Este con su juicio o experiencia, elige los elementos que incluirá en la muestra, porque
cree que son representativos de la población de interés o son de alguna manera
apropiados. En resumen se elige a criterio del investigador, los elementos son elegidos
sobre lo que él cree que pueden aportar al estudio.

Se eligen para cumplir con criterios previamente establecidos que se juzgan


importantes (Weiers, 1986). En este muestreo se realiza un intento por asegurar que
la muestra sea más representativa que en el muestreo por conveniencia.

Algunos ejemplos de Muestreo por juicio:

- Mercados de prueba seleccionados para determinar el potencial de un nuevo


producto. Ejemplo, niños que tienen tendencias a romper un juguete.
- Ingenieros de compra seleccionados en una investigación de mercados
industriales porque se consideran representativos de la compañía.
- Testigos expertos que participan en las cortes.
- Investigación de opiniones y comportamiento.
- Sondeos pre electorales de zonas que en anteriores votaciones han marcado
tendencias de voto.
- Cajeros de un banco o un supermercado.
CAPITULO 3: Muestreo No probabilístico José Loaiza Torres 81

Ventajas:

 Es económico
 Es conveniente y rápido
 Se utilizan con frecuencia en los proyectos de investigación de mercados, cuando
la población es pequeña y se tiene conocimiento, experiencia y juicio de quienes
se seleccionan las unidades son adecuadas.

Limitaciones:

 Es subjetivo, y su valor depende por completo de esta subjetividad, de la


experiencia y creatividad del investigador.
 En poblaciones grandes y complejas es menos fiable y alejado de generar
muestras representativas.

3.2.3. - Por cuota

Weiers (1986) esta técnica es un sistema de gran uso que trata, por lo menos, de
garantizar sistemáticamente que la muestra se parezca un poco a la población.

Procedimiento de muestreo no probabilístico que asegura que los diversos subgrupos


de una población estarán representados en las características pertinentes en el grado
exacto que desee el investigador (Zikmund, 1998).

El muestreo por cuotas puede considerarse un muestreo por juicio limitado en dos
etapas: La primera etapa consiste en el desarrollo de categorías de control, fijándose
cuotas que aseguran una composición en la muestra igual a la de la población respecto
a las características de interés. La categorización usada puede ser Unidimensional
(edades), bidimensional (estado civil y edades) o tridimensional (estado civil, edades
y escolaridad). La segunda etapa, se seleccionan los elementos de la muestra con
base en la conveniencia o el juicio.
82 José Loaiza Torres CAPITULO 3: Muestreo No probabilístico

Una vez que se asignan las cuotas existe amplia libertad en la selección de los
elementos que deberán incluirse en la muestra, lo cual indica que la selección no es
aleatoria o probabilística. De lo que se trata de hacer en la etapa de recolección de
datos es cumplir con la cantidad de cada cuota de la variable seleccionada.

Algunos ejemplos de aplicación en marketing:

- Estudios sobre hábitos de consumo, por ejemplo se puede dividir en función a la


frecuencia de consumo por año, y seleccionar la muestra de acuerdo a cada
categoría.
- Comportamientos de compra, por ejemplo, se puede dividir en función al sexo de
la población.
- Usos de productos, por ejemplo, en función si usa o no el producto

Un ejemplo más concreto, suponga que se está muestreando a 150 personas para
conocer su opinión respecto a la durabilidad de un electrodoméstico de música que es
usado tanto por hombres como por mujeres, se sabe que en la Ciudad que compone
la población meta existen, 50.000 hombres y 60.000 mujeres. Por tanto, para
seleccionar un muestreo por cuota se procedería de la siguiente manera:

1° Definir la variable denominada cuota, que en este caso es el sexo.


2° Determinar la estructura porcentual de las categorías de la variable, pero en la
población, tal como se muestra en el siguiente cuadro

Cuadro 3.1: Estructura poblacional de la variable para muestreo por


cuotas

Variable categórica(sexo) N° de personas que Estructura porcentual


componen la población
Hombres 50.000 50%
Mujeres 60.000 60%
Total 100.000 100%
Fuente: Elaboración propia
CAPITULO 3: Muestreo No probabilístico José Loaiza Torres 83

3° Asignar el tamaño de la muestra en función a la estructura porcentual de la


población. Previo a ello se determinó a juicio el tamaño de la muestra de 150 personas.

Cuadro 3.2: Ejemplo de asignación de una muestra por cuotas

Variable categórica o N° de personas Porcentaje Asignación de la


cualitativa (sexo) que componen la muestra
población
Hombres 50.000 50% 75
Mujeres 60.000 60% 90
Total 100.000 100% 150
Fuente: Elaboración propia

De esta forma se sabe que se debe seleccionar a 75 hombres y a 90 mujeres, y el


método de selección podría ser a juicio o a conveniencia, procediéndose a seleccionar
hasta completar 75 hombres (cuota) y 90 mujeres (cuota).

Ventajas:

 Costos más bajos.


 La estructura de la población es representada en la muestra según las variables
seleccionadas previamente.
 Mayor conveniencia para los entrevistadores al seleccionar los elementos para
cada cuota.
 Se puede realizar sin la necesidad de un marco muestral ideal.

Limitaciones

 A pesar de que la composición de la muestra refleja la de la población, no existe


ninguna certeza de que la muestra sea representativa, por la forma de selección
de las unidades muestrales y el cálculo del tamaño de la muestra.
 Puesto que los elementos se seleccionan con base en la conveniencia o el juicio,
muchas fuentes de tendencia en la selección están presentes en forma potencial.
84 José Loaiza Torres CAPITULO 3: Muestreo No probabilístico

 El muestreo por cuotas no permite la evaluación del error muestral, al calcularse


el tamaño de la muestra a juicio del investigador.

3.2.4.- Bola de nieve

Técnica de muestreo, en la que se selecciona un grupo inicial de entrevistados, por lo


general en forma aleatoria o probabilística. Después de la entrevista se pide a los
participantes que identifiquen a otros que pertenecen a la población meta, por tanto,
los entrevistados subsecuentes se eligen con base en referencias. Este proceso puede
llevarse a cabo en forma progresiva llevando así a un efecto de bola de nieve.

Es resumen, y según Malhotra (1997) el objetivo del muestreo de bola de nieve, es


estimar características raras de la población.

Algunos ejemplos de aplicación:

- Usuarios de servicios gubernamentales o sociales.


- Estudios con poblaciones "marginales", delincuentes, sectas religiosas,
determinados tipos de enfermos, preferencias sexuales, etc.
- Estudios cuyos nombres no pueden revelarse, por ejemplo, hombres viudos
menores de 35 años, preguntar empezando a otros que también lo son.
- Miembros de una población diseminada.
- Investigación de compradores y vendedores industriales para identificar parejas
de compradores y vendedores.
- Investigación sobre el consumo de drogas y estupefacientes.

Ventajas:

 Incrementa la probabilidad de encontrar la característica deseada en la población.


 Da como resultado una varianza de muestra relativamente baja.
 Costos reducidos.
CAPITULO 3: Muestreo No probabilístico José Loaiza Torres 85

 Minimiza el error por falta de respuesta.

Limitaciones:

 Sigue siendo muestreo no probabilístico.


 Las referencias de las unidades seleccionadas tendrán características
demográficas y psicográficas más parecidas a las personas que se selecciona
previamente, es decir, las unidades muestrales no se manejan por casualidad, lo
que hace a su vez que la muestra sea anómala. Aquí está presente lo que se
denomina el sesgo de punto de partida.

3.3.- Cuándo utilizar técnicas de muestreo no probabilísticas

Para finalizar este capítulo, podemos precisar algunos aspectos que ayudarán a decidir
cuándo se debería utilizar el muestreo no probabilístico.

Se mencionan cuatro aspectos importantes a tomar en cuenta:

1.- Tipo de investigación: Si la investigación es exploratoria, es posible utilizar el


muestreo no probabilístico a fin de comprender aspectos generales y básicos de
la población meta.

2.- Precisión de las estimaciones de las características de la población : Si la


precisión es baja, es decir se acepta o se permite tendencias en las estimaciones,
lo que significa que el error muestral es grande, entonces puede recurrirse al
muestreo no probabilístico.

3.- Importancia o peso del error no muestral, se utiliza el muestreo no


probabilístico cuando no hay control sobre el error no muestral.
86 José Loaiza Torres CAPITULO 3: Muestreo No probabilístico

4.- Homogeneidad de la población respecto a las variables de interés: este


aspecto es esencial para aplicar el muestreo no probabilístico, es decir, cuando la
población es homogénea, resulta eficiente y eficaz aplicar el muestreo no
probabilístico, en tales casos se obtendrá una muestra representativa. Ejemplo de
ello, se tiene en opiniones de personas especialistas en un tema, como juristas
que interpreten un artículo de la constitución del estado, es de esperar que sus
opiniones no diferirán significativamente por tanto bastará con preguntar a unos
cuantos y la selección se hará a juicio o a conveniencia.

3.4.- Preguntas y problemas

1. Enuncie las características del muestreo no probabilístico.

2. ¿Cuál es el objetivo principal del muestreo de Bola de Nieve?

3. ¿Cuál es la principal diferencia entre el muestreo por juicio y por conveniencia?

4. Analice la siguiente afirmación: “Debido a que los errores no muestrales son de


mayor magnitud que los errores muestrales, realmente no importa qué técnica de
muestreo se utilice”.

5. ¿Por qué cree que las muestras no probabilísticas son tan populares en la
investigación de mercados?

6. Suponga los siguientes datos referidos al número de Habitantes de una Zona


Urbana, que han sido divididos en base a una categorización bidimensional (Estado
Civil y si consume o no gaseosa). Diseñe cómo se seleccionaría una muestra por
cuotas, si el tamaño de muestra es igual a 200.
CAPITULO 3: Muestreo No probabilístico José Loaiza Torres 87

Cuadro 3.3: Estructura bidimensional de una población en muestreo por


cuotas
Estado Civil Población en la zona (Número de personas)

Consumo SI Consumo NO
Soltero 1.400 1200
Casado 1.300 1100
Divorciado 1.100 1000
Concubino 1.000 900
Viudo 600 400
TOTAL 5.400 4600

Fuente: Elaboración propia

Asigne en forma Proporcional a las variables.

7. Usted es gerente de marketing y desarrollo de nuevos productos en una importante


empresa de juguetería, y está en proceso de lanzar un nuevo juguete. Para realizar
la prueba del producto ha seleccionado un grupo de niños que acostumbran romper
fácilmente cualquier juguete. Usted está aplicando un muestreo:
a) Bola de nieve
b) Por conveniencia
c) Por juicio
d) Por cuotas
e) Ninguno

8. Identifique las técnicas de muestreo no probabilísticas en los siguientes casos:

a) Los nombres de 200 clientes de un centro de juegos de azar de una lista de


visitantes del mes pasado y se les administra un cuestionario.
b) Un conductor de un programa de entrevistas por la radio invita a la audiencia a
llamar y votar con un “sí” o con un “no” acerca de si se deben prohibir las armas
de fuego.
88 José Loaiza Torres CAPITULO 3: Muestreo No probabilístico

c) Un fabricante de alimento para perros quiere probar un nuevo alimento. Decide


seleccionar a 100 propietarios de perros que les dan a sus mascotas alimentos
enlatados, a 100 que les dan alimentos secos y a 100 que les dan alimentos semi
húmedos.
d) Se lleva a cabo una encuesta entre hombres que juegan rugbi para predecir el
resultado de unas elecciones presidenciales.

9. El Departamento de Marketing de una Universidad desea realizar una encuesta para


determinar las actitudes de los estudiantes hacia un programa de servicio
pedagógico para superar las dificultades de aprendizaje en matemáticas. Como
experto en muestreo, usted debe desarrollar una muestra por cuota. ¿Qué variables
de cuota y niveles de variables se deben utilizar? ¿Cuántos alumnos se deben incluir
en una celda?

10.- Estilistas de Calidad es una cadena de salones de belleza de Santa Cruz-Bolivia.


Durante los últimos cinco años ha aumentado considerablemente el número de
sucursales y sus ventas brutas y márgenes de utilidad neta. El propietario planea
brindar servicios gratuitos de análisis y consulta de cabello, servicio por el que otros
salones de belleza cobran. A fin de compensar el aumento de los gastos operativos,
también piensa aumentar 5% las tarifas de otros servicios. Antes de introducir el
nuevo servicio y aumentar las tarifas, el propietario quiere realizar una encuesta
en que tomará a sus clientes como muestra, con el método de muestreo de cuota.

Le pide su ayuda para planear el estudio.

a) ¿Qué variables recomendaría como base de las cuotas y por qué? Enumere esas
variables.
b) Durante cinco años, el propietario ha llevado un registro completo de las
características demográficas de sus clientes y decide que sería pertinente para
identificar los elementos de muestra que se usarán.
CAPITULO 3: Muestreo No probabilístico José Loaiza Torres 89

Cuadro 3.4: Registro de las características de una población para


muestreo por cuotas

Variable Nivel Porcentaje de


clientes
Edad 0-15 años 5
16-30 años 30
31-45-años 30
46-60 años 15
61-75 años 15
76 años o más 5
Total 100%
Género Masculino 24
Femenino 76
Total 100%
Ingreso (en dólares) 0-9999 10
10000-19999 20
20000-29999 30
30000-39999 20
40000 o más 20
Total 100%
Fuente: Elaboración propia

Indique, con base en estas tres variables de cuota, las características de una
muestra de 200 sujetos.

c) Analice las posibles fuentes de sesgo con el método de muestreo.


90 José Loaiza Torres CAPITULO 3: Muestreo No probabilístico
91 CAPITULO 4: Muestreo Aleatorio simple José Loaiza Torres

CAPÍTULO 4
MUESTREO ALEATORIO
SIMPLE
PARA VARIABLES
CUANTITATIVAS Y
CUALITATIVAS
4.1.- Concepto
4.2.- Procedimiento para la selección de una muestra aleatoria simple
4.3.- Ventajas y limitaciones del muestreo aleatorio simple
4.4.- Muestreo para variables cuantitativas: La distribución muestral de una media-
Definición y notación
4.5.- Propiedades de las estimaciones (el teorema central del límite)
4.6.- Estimaciones e Intervalos de confianza
4.6.1.- Para medias
4.6.2.- Para totales
4.7.- Muestreo para variables cualitativas-proporciones
4.7.1.- Concepto – Características
4.7.2.- Notación
4.7.3.- Estimadores de una proporción
4.7.4.- Intervalos de confianza
4.8.- Otras consideraciones
4.9.- Criterios para aplicar el muestreo aleatorio simple
4.10.- Preguntas y problemas
92 José Loaiza Torres CAPITULO 4: Muestreo Aleatorio simple
CAPITULO 4: Muestreo Aleatorio simple José Loaiza Torres 93

MAPA CONCEPTUAL

CAPÍTULO 4: MUESTREO ALEATORIO SIMPLE PARA VARIABLES


CUANTITATIVAS Y CUALITATIVAS

COMPETENCIA QUE SE PRETENDE LOGRAR: SELECCIONA UNA MUESTRA


ALEATORIA SIMPLE UTILIZANDO LOS PROCEDIMIENTOS ADECUADOS A LOS
OBJETIVOS DE LA INVESTIGACIÓN Y AL MARCO MUESTRAL.

MUESTREO PROBABILÍSTICO
Deducir

Muestreo Aleatorio simple para variables cuantitativas y cualitativas

Analizar Clasificar: Métodos de


selección

1.- Características
conceptuales del muestreo
aleatorio simple: Variables o 4.- Método de la tabla
2.- Método del 3.- Método del alfiler
atributos de números aleatorios
sorteo

Relacionar
1-2-3-4

Deducir

Procedimiento lógico para seleccionar la


muestra aleatoria simple

Aplicar

A LA SELECCIÓN DE UNA MUESTRA


ALEATORIA SIMPLE

Fuente: Elaboración propia


94 José Loaiza Torres CAPITULO 4: Muestreo Aleatorio simple
CAPITULO 4: Muestreo Aleatorio simple José Loaiza Torres 95

CAPÍTULO 4

MUESTREO ALEATORIO SIMPLE PARA VARIABLES CUANTITATIVAS Y


CUALITATIVAS

4.1.- Concepto

Por principio en el muestreo aleatorio se extrae las unidades de la población de manera


tal, que se garantiza a cada una de ellas, la misma oportunidad de ser incluidas en la
muestra.

El muestreo aleatorio simple es una técnica de muestreo probabilístico y por tanto, el


tamaño de la muestra se determina estadísticamente utilizando una
fórmula matemática.

El muestreo aleatorio simple es un método de selección de n unidades en un conjunto


de N de tal modo que cada una de las NCn muestras distintas tengan la misma
oportunidad de ser elegidas. En la práctica, un muestreo aleatorio se realiza unidad
por unidad. Se numeran las unidades de 1 a N, ya sea utilizando una tabla de números
aleatorios o mediante un programa de computación que produce una tabla semejante.
En cada extracción, el proceso debe otorgar la misma oportunidad de selección a todos
y cada uno de los números que no hayan salido. Las unidades que llevan estos n
números constituyen la muestra. (Cochran, 1995)

El muestreo aleatorio simple selecciona muestras mediante métodos que permiten


que cada posible muestra tenga una igual probabilidad de ser tomada y a cada
elemento de la población total tenga una oportunidad igual de ser incluido en la
muestra (Levin y Rubin, 1997).

El muestreo aleatorio simple se puede realizar tanto para estimar un parámetro


referido a una variable cuantitativa o un atributo referido a una variable cualitativa.
96 José Loaiza Torres CAPITULO 4: Muestreo Aleatorio simple

Una variable cuantitativa, se refiere a una característica numérica que puede tomar
distintos valores cuando se observan distintos objetos, por ejemplo, cantidad de
gaseosas consumidas, edad, ingreso, etc.

Una variable cualitativa, es un atributo o una característica, también se denomina a


éstas variables, variables categóricas o de atributo. Por ejemplo, número de personas
que prefieren una determinada marca de electrodoméstico, número de personas que
se interesan por un nuevo producto, personas que tienen un determinado color de
cabello, el estado civil, la marca que compra de un producto, etc.

4.2.- Procedimiento para la selección de una muestra aleatoria simple

El procedimiento sugerido es el siguiente:

1.- Seleccionar el marco muestral adecuado. Lo cual significa tener un marco muestral
ideal, es decir un listado completo de las unidades de la población meta.

2.- Asignar un número único de identificación a cada unidad muestral de la población


(entre 1 y N), para ello es imprescindible contar con un marco muestral ideal.

3.- Seleccionar las unidades hasta completar la muestra. Para esto existen métodos
desde el más rudimentario hasta el más sofisticado.

En cuanto a los métodos de selección, estudiaremos los más utilizados que son dos,
el método del sorteo y el método de la tabla de los números aleatorios, que a
continuación se explican:
CAPITULO 4: Muestreo Aleatorio simple José Loaiza Torres 97

a).- Método del sorteo.

Este método consiste en escribir primero el número que identifica a cada unidad de la
población en una papeleta y depositar en una caja todos los papeles. Después que se
han mezclado bien se realiza la primera selección. Este proceso se repite hasta
completar el tamaño de la muestra. Es decir, es como jugar a la suerte sin blanca en
los juegos de azar.

b).- Método de la tabla de los números aleatorios

Es un método más adecuado y más utilizado, se emplea primero un número de


identificación de las unidades de la población (entre 1 y N); luego se generan números
aleatorios, o se emplea una tabla ya generada de números aleatorios, los dígitos deben
ser igual a los dígitos de N; finalmente se seleccionan unidades que correspondan a
los números generados hasta completar la muestra.

Para comprender mejor los dos métodos presentados, hemos extractado un ejemplo
de Masón y Lind (1995) que se describe a continuación.

Una población consta de 845 trabajadores de una industria. Se seleccionará una


muestra de 52 a partir de esta población. Una forma de asegurar que todos los
empleados en la población tengan la misma oportunidad de ser elegidos es escribir
primero el nombre de cada uno en la papeleta y depositar en una caja todos los
papeles. Después que se han mezclado bien se realiza la primera selección. Este
proceso se repite hasta que se eligen 52, el tamaño de la muestra. En este caso sería
se estaría aplicando el método del sorteo.

Utilizando la tabla de números aleatorios, en este caso para definir una muestra
aleatoria sería emplear el número de identificación de cada empleado y luego aplicar
la tabla de números aleatorios. Como su nombre lo indica, estos números han sido
generados por un proceso aleatorio (en este caso, con una computadora). Para cada
98 José Loaiza Torres CAPITULO 4: Muestreo Aleatorio simple

dígito de un número, la probabilidad de 0,1,2...,9 es la misma. Así la probabilidad de


que el empleado número 011 sea elegido, es la misma que la del 722 o el 338. Por
tanto, se eliminan por completo los sesgos en el proceso de selección. En la siguiente
ilustración se muestra una parte de una tabla de números aleatorios. Para utilizar
dicha tabla a fin de seleccionar una muestra de trabajadores, primero debe elegirse
un punto de inicio en la tabla. Supóngase que la hora es 3:04. debe ver la tercera
columna y después bajar al cuarto conjunto de números. El resultado es 03759. Como
sólo hay 845 empleados, 037 es el número del primer empleado que será elemento
de la muestra. Para continuar seleccionando, se puede ir en cualquier dirección.
Supóngase que se decide recorrer a la derecha. Los primeros tres dígitos del número
a la derecha de 03759 son 447 el número del empleado que se escogerá como
segundo elemento de la muestra. El tercer número de tres dígitos a la derecha es 961.
No puede usar 961 ya que sólo hay 845 empleados. Se continúa hacia la derecha y se
selecciona al trabajador 784, al 189, y así sucesivamente. Otra forma de elegir el
punto de inicio es cerrando los ojos y señalando un número de la tabla.

50525 57454 28455 68226 34656 38884 39018


72507 53380 53827 42486 54465 71819 91199
34986 74297 00144 38676 89967 98869 39744
66851 27305 03759 44723 96108 78489 18910
06738 62879 03910 17350 49169 03850 18911
11448 10734 05837 24397 10420 16712 94496
Punto de partida Segundo Tercer empleado
(primero empleado empleado seleccionado
seleccionado) seleccionado

Este mismo procedimiento de la tabla de los números aleatorios se muestra en el


siguiente flujograma:
CAPITULO 4: Muestreo Aleatorio simple José Loaiza Torres 99

Figura 4.1: Síntesis del procedimiento con que se escoge una muestra
aleatoria simple empleando una tabla de números aleatorios.

Listar y asignar números a los integrantes de la población

Empezar en un punto previamente establecido en la tabla de


números aleatorios; por ejemplo tercer dígito en la primera columna

Si el tamaño de la población exige X dígitos para ser expresada (por


ejemplo, en una población de 150, X será igual a 3), se emplean los
siguientes X dígitos para incluir un número aleatorio.

¿Corresponde el número aleatorio al número


SI previamente asignado a cualquier miembro de
la población?

Asignar el miembro de la población a la muestra NO, es mayor que el


tamaño de la población

¿Tenemos todavía el tamaño Combinar los siguientes X


requerido de la muestra? NO
dígitos para formar otro
número aleatorio

SI Fin

Fuente: Ronald Weiers (1986)

También es posible utilizar una calculadora científica o una hoja de Excel y generar
los números aleatorios con el número de dígitos N y directamente seleccionar los que
se generan hasta completar la muestra.
100 José Loaiza Torres CAPITULO 4: Muestreo Aleatorio simple

4.3.-Ventajas y limitaciones del muestreo aleatorio simple

A continuación se muestra las ventajas y limitaciones del muestreo aleatorio simple:

Ventajas:
- Se comprende con facilidad.
- Los resultados de la muestra, pueden proyectarse o generalizarse a la población
meta.
- La mayor parte de los planteamientos para la inferencia estadística suponen que
los datos se recopilaron mediante el muestreo aleatorio simple (Malhotra, 2008).
- Cuando se cuenta con marco muestral ideal, es posible obtener una muestra
representativa.

Limitaciones:
- Es difícil con frecuencia construir un marco muestral ideal, o sea un listado
completo de las unidades de la población meta, que permita seleccionar una
muestra aleatoria simple.
- El muestreo aleatorio simple puede dar como resultado muestras muy extensas o
que están diseminadas en áreas geográficas, incrementando así el costo y el
tiempo de la recopilación de datos (Malhotra, 2004).
- El muestreo aleatorio simple puede dar como resultado menor representatividad
en la muestra de la población; por lo tanto menos precisión, si es que las unidades
de la población están ordenadas de acuerdo a su magnitud. Por ejemplo, si
estamos estimando el monto de facturación promedio mensual de empresas y se
tiene una población ordenada de empresas según su tamaño, en grandes,
medianas y pequeñas, con el muestreo aleatorio, es posible que salgan más
empresas grandes y por tanto los resultados no serán representativos de la
población. En tales casos, se puede optar por el muestreo sistemático, tema que
se abordará más adelante.
CAPITULO 4: Muestreo Aleatorio simple José Loaiza Torres 101

4.4.- Muestreo para variables cuantitativas: La distribución muestral de una


media-Definición y notación

Cuando se habla de variables cuantitativas, se trata de características medibles, estas


variables pueden ser discretas o continuas, por ejemplo cantidades consumidas de un
producto, estatura de las personas, ingreso mensual de las familias, tiempo recorrido
de un lugar a otro, etc.

Una variable cuantitativa discreta, es aquella variable que puede tomar valores
específicos y enteros. Generalmente en la práctica estas variables son resultado de un
conteo. Por ejemplo el número de alumnos por semestre en una universidad, número
de artículos defectuosos producidos en un periodo en una fábrica.

Una variable cuantitativa continua, es aquella variable que toma valores en una escala
continua, que pueden ser números enteros pero que son susceptibles de ser
fraccionados. Generalmente representa datos medidos es decir, es el resultado de una
medición. Ejemplo de esto tenemos, la temperatura en una región, las estaturas, el
gasto en un producto.

En este apartado se estudiará las variables cuantitativas, luego más adelante se


analizará las variables cualitativas.

Es importante definir la notación que servirá como base para realizar la interpretación
de datos y para el cálculo del tamaño de la muestra aleatoria, tal como se muestra en
el siguiente cuadro:
102 José Loaiza Torres CAPITULO 4: Muestreo Aleatorio simple

Cuadro 4.1: Notación para muestreo aleatorio simple

POBLACIÓN MUESTRA
TOTAL: TOTAL:
N n
(X) = X
i 0
i  X1  X 2  ........  X N . (x)= x
i 0
i  x 1  x 2  ........  x n

N= Tamaño de la población n= Tamaño de la muestra


Xi= Valor de la variable de la población xi= Valor de la variable de la muestra

Media(µ): Media(X):
N ( x )=
 Xi X  X 2  X 3  ...........  X N
N

µ= i 0
 1  Xi X1  X 2  X 3  ...........  X N
N N i 0

µ= media aritmética de la población n n

Proporción de dos totales(Razón): x = Media aritmética de la muestra

R=
Y

Y Fracción muestral (f)
X X n
f
R= razón de dos variables N

Fuente: Elaboración propia

La distribución muestral de una media, tiene como base al muestreo aleatorio simple.

Si tomamos varias muestras de una población, las estadísticas que calcularíamos para
cada muestra no necesariamente serían iguales, y lo más probable es que variarán de
una muestra a otra.

Podemos considerar todas las muestras posibles de tamaño n que pueden extraerse
de la población, y para cada muestra computar el estadístico. De esta manera
obtenemos la distribución del estadístico, que es su distribución muestral (Murray y
Spiegel, 1998)

Para Levin y Rubin (1996) “una distribución de muestreo de medias es una distribución
de probabilidad de todas las medias posibles de las muestras”
CAPITULO 4: Muestreo Aleatorio simple José Loaiza Torres 103

Sea f(x) la distribución de probabilidad de alguna población dada de la cual extraemos


una muestra de tamaño n. Entonces es natural buscar la distribución de probabilidad
del estadístico muestral, que se llama la distribución muestral para la media de la
muestra o la distribución muestral de medias (Murray y Spiegel, 1998).

4.5. - Propiedades de las estimaciones - el teorema central del límite

Cochran (1995) dice que la precisión de cualquier estimación basada en una muestra,
depende del método por el cual se calcula la estimación a partir de los datos de la
muestra y del plan de muestreo.

Al estudiar cualquier fórmula que se presenta, el lector debe asegurarse que conoce
el método específico de muestreo y el método de estimación para el cual se ha
establecido la fórmula.

Un método de estimación se llama consistente si la estimación se vuelve


exactamente igual al valor de la población cuando n = N, o sea, cuando la muestra
está constituida por la población total. Para el muestreo aleatorio simple, es obvio que
x y N x son estimaciones consistentes de la media de la población y del total,
respectivamente.

Por otro lado, un estimador inconsistente no necesariamente es inútil, ya que puede


dar una precisión satisfactoria cuando n, comparado con N, es pequeño.

Asimismo, un estimador es insesgado si el valor promedio de la estimación, que se


toma sobre todas las muestras posibles de un tamaño n dado, es exactamente igual
al valor verdadero de la población. Para verificar si un estimador es insesgado existe
el siguiente teorema.
104 José Loaiza Torres CAPITULO 4: Muestreo Aleatorio simple

Teorema:

La media muestral es un estimador insesgado de la media poblacional

Por definición:

Ex =
x 
 (X 1  X 2  .....  Xn) (1)

Cn n[N!/n! (N - n )! 
N

En donde la suma se extiende sobre todas las NCn muestra. Para evaluar esta suma,
buscamos en cuantas muestras aparece un valor específico cualquier, Xi. Como están
disponibles otras (N-1) unidades para el resto de la muestra y otros (n-1) lugares para
completar la muestra el número de muestras que contienen Xi, es

(N - 1)!
N-1 C n-1 = (2)
(n - 1)! (N - n)!

De donde:

(N - 1)!
 (X 1  X 2  ....  Xn) 
(n - 1)!(N - n)!
(X1  X 2  .....  Xn) (3)

Sustituyendo en la ecuación (1) tenemos:

(N - 1)! n!(N - n)!


Ex = x x (X1  X 2  ........  X N
(n - 1)!(N - n)! nN!

(X1  X 2  ..........  X N )
= =μ
N

Por tanto:

E x = μ es un estimador insesgado
CAPITULO 4: Muestreo Aleatorio simple José Loaiza Torres 105

O dicho de otro modo:

µ x = µ Esto es también por el teorema central del límite

Lo que tendría que ser también x = µ

De igual forma para el total:

X̂ =N x es insesgado

Lo anterior forma parte de un teorema muy conocido, que se denomina el teorema


central del límite, el cual consta de tres puntos principales:

1.- Respecto a la media de la distribución muestral:

µx= µ

2.- El error estándar de la media. Hay dos casos:


a) Si el muestreo es con reemplazo y / o la población es infinita, entonces el error
estándar de la media es:

σ
σx 
n

b) Si el muestreo es sin reemplazo y/o la f = n/N > 0,05 el error muestral es:

σ N-n
σx 
n N -1
106 José Loaiza Torres CAPITULO 4: Muestreo Aleatorio simple

3.- Las medias muestrales de la distribución de muestreo se distribuyen normalmente


sin importar la forma que tenga la población.

Ejemplo de demostración

Se tiene los siguientes valores referidos al consumo por mes de gas licuado de garrafas
de 10 kilos cada una, de una población de 5 familias: 2, 4, 6, 8, 10. Demostrar que µ

x = µ y X̂ = N x , para lo cual tome una muestra de tamaño 2 sin reemplazo.

1º Determinar número de muestras posibles = combinaciones posibles de n en n


a) Si el muestreo es con reemplazo, el número de muestras posibles es:

(N)n = (5)2 = 25 muestras posibles

b) Si el muestreo es sin reemplazo, el número de muestras posibles es:

N! 5!
N Cn= =  10 Muestras posibles que se distribuyen
n! (N - n)! 2!(5 - 2)!
en el cuadro 4.1

Cuadro 4.2: Distribución de muestras


Nº de Valores Media muestra
muestras Variable (x) (x )
posibles
1 2–4 3
2 2–6 4
3 2–8 5
4 2 – 10 6
5 4–6 5
6 4–8 6
7 4 – 10 7
8 6–8 7
9 6 – 10 8
10 8 - 10 9
Total 60
Fuente: Elaboración propia
CAPITULO 4: Muestreo Aleatorio simple José Loaiza Torres 107

Demostración del punto 1 del teorema:

Media de las medias (µ x )

=
 de las medias de cada muestra  60  6 por formula (1)
Número de muestras posibles 10

Media de la población ( μ )

=
 de todos los valores de la población  2  4  6  8  10  30  6
Número total de datos población 5 5

O sea

Media población (µ) = media de la distribución muestral de medias (µ x )


6 = 6 por lo que está demostrado

Para el caso de totales:

X̂ = N x
30= 5(6)
30= 30 igualmente queda demostrado

Demostración del punto 2 inciso b) del teorema, dado que el muestreo es


sin reemplazo:

Se trata de estimar la varianza y el error estándar de la media.


108 José Loaiza Torres CAPITULO 4: Muestreo Aleatorio simple

Varianza para los valores de la población:

σ 2

 (X - μ) 2

) (1)
N
Varianza de la muestra, caso general:

S 2

 (X - X) 2

) (2)
n 1 Corrección por finitud

Varianza de la media muestral: Para ello existe un teorema basado en la distribución


de muestreo:

Esta segunda parte de la raíz, se aplica


σ2 N- n
σ2x  (3) siempre que la fracción de muestreo sea
n N -1
mayor a 5%

n
Fracción de muestreo (f) = *100
N
También se puede determinar la varianza de la distribución de muestreo con la
siguiente fórmula, para efectos de demostración:

σ2x 
 (X - μx)2 (4)
nº de muestras

Con el ejemplo anterior (valores: 2, 4, 6, 8, 10) primero demostraremos que la


ecuación (3) igual a la ecuación (4)

Resultado de las operaciones:


40
σ2   8 es la varianza poblacional
5
CAPITULO 4: Muestreo Aleatorio simple José Loaiza Torres 109

40
σ  2,828 es la desviación estándar poblacional
5

Reemplazando en las ecuaciones (3) y (4) respectivamente se tiene:

σ2x 
σ2 N  n
σ2x 
 (X - μx)2
n N 1 nº de muestras

8 5-2 30
σ2x  σ2x  3
2 5 -1 10
Como f=2/5=0,4>0,05,
se aplica la corrección
por finitud

σ2x = 3 Son iguales σ2x = 3

Segundo, calculamos la desviación estándar de la distribución muestral:

σx 
σ N- n
(5) σ x
 (X - μx ) 2

(6)
n N -1 nº de muestras

Reemplazando:

2,828 5-2 30
σx  σ x
2 5 -1 10

Son iguales
σx =1,73 σx = 1,73
110 José Loaiza Torres CAPITULO 4: Muestreo Aleatorio simple

En consecuencia queda demostrado el punto 2 del teorema central del límite.

Demostración del punto 3 del teorema:

Se trata de graficar las medias muestrales en el eje de las “X” y la frecuencia en el eje
de las “Y” del ejemplo anterior, considerando el muestreo sin reemplazo:

Cuadro 4.3: Distribución de medias muestrales

Medias muestrales Frecuencia


3 1
4 1
5 2
6 2
7 2
8 1
9 1

Fuente: Elaboración propia

Graficando se tiene

Figura 4.2: Distribución de medias muestrales

3 4 5 6 7 8 9
Media

Fuente: Elaboración propia

Con lo cual también queda demostrado el punto 3 del teorema central del límite.
CAPITULO 4: Muestreo Aleatorio simple José Loaiza Torres 111

4.6. – Estimaciones e intervalos de confianza

Los intervalos de confianza, se elaboran con la finalidad de estimar entre qué valores
se encuentra un parámetro poblacional. En ese sentido se pueden construir intervalos
de confianza para promedios, totales, proporciones, razones, etc.

En este capítulo sólo se repasará los intervalos de confianza para medias y totales

4.6.1.- Para medias

La media es un promedio de un conjunto de valores. La fórmula para los intervalos de


confianza.

Con el signo positivo, se obtiene el límite superior del intervalo


X  Z σX

Con el signo negativo, se obtiene el límite inferior del intervalo

4.6.2.- Para totales

El total de un conjunto de datos, simplemente resulta de la suma de todos los valores


de la variable en estudio. La fórmula para intervalos de confianza es:

Con el signo positivo, se obtiene el límite superior del intervalo

NX  N Z σ X
Con el signo negativo, se obtiene el límite inferior del intervalo
112 José Loaiza Torres CAPITULO 4: Muestreo Aleatorio simple

4.7.- Muestreo para variables cualitativas-proporciones

4.7.1.- Concepto – Características

El muestreo para proporciones también se llama muestreo para atributos, dado que
se trabaja con variables cualitativas como el estado civil, marcas de productos, color
de empaque, etc.

Este muestreo tiene su fundamento en el muestreo aleatorio simple para la selección


de la muestra.

Lo mismo que para el caso de muestreo aleatorio para variables cuantitativas, para el
caso de estudio de una porción o porcentaje, una distribución de muestreo de
porciones es una distribución de probabilidad de todos los porcentajes posibles de las
muestras. Por lo tanto, en este apartado ya no se realizará la demostración del
teorema central del límite para proporciones, simplemente se utilizará las fórmulas
correspondientes.

El muestreo para proporciones, se aplica cuando deseamos estimar el número total,


la proporción o porcentaje de unidades en la población que poseen alguna
característica o atributo o que caen dentro de alguna clase definida.

Muchos resultados que se publican derivados de censos, encuestas son de esta forma,
por ejemplo, número de personas sin empleo, el porcentaje de población originaria de
un lugar, el porcentaje de edad que tienen 60 o más años cumplidos. Es decir, este
muestreo tiene que ver con datos cualitativos o categóricos.
CAPITULO 4: Muestreo Aleatorio simple José Loaiza Torres 113

Cuadro 4.4: Número de personas según empleo


Tipo de empleo Nº Porcentaje
Empleo ocasional 20 18%
Empleo permanente 80 73%
Desempleado 10 9%
TOTAL 110 100%
Fuente: Elaboración propia

Por tanto el porcentaje de personas sin empleo es 9%.

Ahora bien, suponga que existen 500 personas como población total, entonces el
número estimado de personas sin empleo es igual a 0,09 x 500 = 45 personas
estimativamente.

Como se podrá apreciar en el ejemplo, no se puede sacar promedios, sino únicamente


porcentajes.

En resumen, el muestreo aleatorio para variables cualitativas o atributos se aplica


cuando se desea estimar una proporción o un porcentaje de datos cualitativos, que
en términos de preguntas insertadas en una encuesta, constituyen aquellas preguntas
categóricas como lo son las preguntas dicotómicas, de opción múltiple, entre otras.

4.7.2.- Notación

Número de unidades poblacionales en C (caen dentro de una clase C) = A

Número de unidades Muestrales en C (caen dentro de una clase C) = a

Proporción de éxito de unidades Poblacionales en C (dentro de una clase) P = A/N

Proporción de éxito de unidades Muestrales en C (dentro de una clase) Ps = a/n


114 José Loaiza Torres CAPITULO 4: Muestreo Aleatorio simple

La proporción de éxito y de fracaso siempre debe sumar 1, o sea:

P+q=1

Su base se encuentra en la distribución de probabilidad binomial de acuerdo a la


teoría de probabilidades.

4.7.3.- Estimadores de una proporción

La estimación de una proporción poblacional (P) se la realiza a través de la proporción


muestral (Ps)

La estimación del total poblacional ( Â ) se la realiza a través de la estimación del total


muestral o sea:

Total = N* Ps

Estimación de las varianzas.

Para esto se aplica por analogía el teorema central del límite del muestreo aleatorio
simple, de lo cual resulta.

Varianza caso general:

De la población De la muestra

σ 2 p  NPQ S2 p  np s q s
CAPITULO 4: Muestreo Aleatorio simple José Loaiza Torres 115

De igual forma la varianza de la distribución muestral de una proporción:

De la población De la muestra

PQ PQ N - n
σ2 p  S2 p  Si f = n/N > 0,05
N n -1 N -1

Por consiguiente el error estándar se puede calcular de la siguiente manera:

PQ N-n
Sp  si no se conoce P y Q entonces se puede trabajar con Ps qs
n -1 N -1
respectivamente, y por tanto el error estándar sería estimado.

4.7.4.- Intervalos de confianza

Para una proporción

Con el signo positivo, se obtiene el límite superior del intervalo


Ps  Z Sp
Con el signo negativo, se obtiene el límite inferior del intervalo

Para totales en muestreo por proporciones:

Con el signo positivo, se obtiene el límite superior del intervalo

NPs  ZN Sp
Con el signo negativo, se obtiene el límite inferior del intervalo.

4.8.- Otras consideraciones

Antes de finalizar el tema, queremos abordar otros aspectos relacionados con el


muestreo aleatorio simple, dadas las características de esta técnica por ser la que más
se utiliza; es de relativa importancia, mencionar los siguientes aspectos:
116 José Loaiza Torres CAPITULO 4: Muestreo Aleatorio simple

1. Muestreo aleatorio sin reposición.

Consideremos una población E formada por N elementos. Si observamos un elemento


particular, e  E , en un muestreo aleatorio sin reposición se da la siguiente
circunstancia(Rius, 1999):
1
 La probabilidad de que e sea elegido en primer lugar es;
N

 Si no ha sido elegido en primer lugar(lo que ocurre con una probabilidad de N  1


N

), la probabilidad de que sea elegido en el segundo intento es de 1


N 1

 en el (i+1)-ésimo intento, la población consta de N-i elementos, con lo cual si e


no ha sido seleccionado previamente, la probabilidad de que lo sea en este

momento es de 1 .
N i

Si consideramos una muestra de n  N elementos, donde el orden en la elección de


los mismos tiene importancia, la probabilidad de elección de una muestra
M  (e1 , e2 ,......., en ) cualquiera es

PM   Pe1 , e2 ,....., en 


=P e1 xPe2 / e1 x.....xPen / e1 , e2 ,....., en1 
1 1 1
 x x......x
N N 1 N  (n  1)
( N  n)!

N!
1
 lo que corresponde en el sentido de la definición de probabilidad de
V N ,n
Laplace a un caso posible entre las VN,n posibles n-uplas de N elementos de la
población.
CAPITULO 4: Muestreo Aleatorio simple José Loaiza Torres 117

Si el orden no interviene, la probabilidad de que una muestra

M  e1 , e2 ,........, en   E sea elegida es la suma de las probabilidades de elegir

una cualquiera de sus n-uplas, tantas veces como permutaciones en el orden de sus
elementos sea posible, es decir:

PM   Pe1 , e2 ,....., en 


 n! xPe1 , e2 ,....., en 
n!( N  n)!

N!
1
 N
Cn

En las ciencias empresariales, mayormente se aplica este tipo de muestreo, pues no


hace mucho sentido el estudiar dos veces a una misma unidad de observación, por
ejemplo, realizar dos veces la misma encuesta a una persona, o analizar sus
propiedades de un producto dos o más veces.

2. Muestreo aleatorio con reposición

Sobre una población E de tamaño N podemos realizar extracciones de n elementos,


pero de modo que cada vez el elemento extraído es repuesto al total de la población.
De esta forma un elemento puede ser extraído varias veces. Si el orden en la
extracción de la muestra interviene, la probabilidad de una cualquiera de ellas,
formada por n elementos es:

1 1 1 1 1
x x......x x n 
N N N N VR N ,n

P(M) = 1/Nn
118 José Loaiza Torres CAPITULO 4: Muestreo Aleatorio simple

Si el orden no interviene, la probabilidad de una muestra cualquiera, será la suma de


la anterior, repitiéndola tantas veces como manera de combinar sus elementos sea
posible. Es decir,
 Sea n1 el número de veces que se repite cierto elemento e1 en la muestra;

 Sea n2 el número de veces que se repite cierto elemento e2;


 .....
 Sea nk el número de veces que se repite cierto elemento ek, de modo que
n  n1  ......  nk . Entonces la probabilidad de obtener la muestra

n  n1  ......nk
e1 ,..........e1 , e1 ,..........e2 ......., ek ,......., ek
n1 n2 nk

es

Probabilidad de una permutaciones de permutaciones de permutaciones de


Muestra cualquiera X los K modal. X las n1 observ. X……X las nk observ.
Ordenada observadas e1 ek

Es decir,

1 1
x k! x n1! x........ x nk! 
Nn CRnN1 ,n2 ,........nk

El muestreo aleatorio con reposición es un tipo de muestreo aleatorio simple, que


como hemos mencionado se caracteriza porque:

 Cada elemento de la población tiene la misma probabilidad de ser elegido, y


CAPITULO 4: Muestreo Aleatorio simple José Loaiza Torres 119

 Las observaciones se realizan con reemplazamiento. De este modo, cada


observación es realizada sobre la misma población (no disminuye con las
extracciones sucesivas).

3. Tablas de números aleatorios: Lotería Nacional

Un ejemplo de una tabla de números aleatorios consiste en la lista de los números de


Lotería Nacional premiados a lo largo de su historia, pues se caracterizan por que cada
dígito tiene la misma probabilidad de ser elegido, y su elección es independiente de
las demás extracciones.

Un modo de hacerlo es el siguiente. Supongamos que tenemos una lista de números


aleatorios de k=5 cifras (00000-99.999), una población de N=600 individuos, y
deseamos extraer una muestra de n=10 de ellos. En este caso ordenamos a toda la
población (usando cualquier criterio) de modo que a cada uno de sus elementos le
corresponda un número del 1 al 600. En segundo lugar nos dirigimos a la tabla de
números aleatorios, y comenzando en cualquier punto extraemos un número t, y
tomamos como primer elemento de la muestra al elemento de la población:

 t .N   t.600 
1  k  1  
10  100.000 

El proceso se repite tomando los siguientes números de la tabla de números aleatorios,


hasta obtener la muestra de 10 individuos.
Las cantidades
t
u
10 k

pueden ser consideradas como observaciones de una v.a. U, que sigue una
distribución uniforme en el intervalo [0,1]

U U (0,1)
120 José Loaiza Torres CAPITULO 4: Muestreo Aleatorio simple

4.9.- Criterios para aplicar el muestreo aleatorio simple

A manera de conclusión, damos algunos criterios para saber cuándo se debe aplicar
el muestreo aleatorio simple, dependiendo de los factores ya mencionados
anteriormente:
 Los objetivos de la investigación
 El marco muestral
 La población
 Las características de los elementos de la población

1) Objetivos de la investigación: General, es decir si los objetivos de la


investigación son generales, y no tienen mayor especificidad entonces se puede
aplicar el muestreo aleatorio simple ya sea para variables cuantitativas o
cualitativas.

2) Marco muestral: Listado, si se tiene un marco muestral ideal, facilitará la


aplicación de esta técnica de muestreo probabilístico, dado que se podrá aplicar la
aleatoriedad, ya sea mediante a tabla de números aleatorios o mediante un
software.

3) La población está conformada por un Grupo heterogéneo, en cuanto al


parámetro que se desea estimar, no es posible agrupar en subgrupos fácilmente.
En este caso se aplica el muestreo aleatorio simple.

4) Características de las unidades de la población: No ordenadas de acuerdo


a su magnitud, lo cual indica que las unidades a seleccionar no deben estar
ordenadas en la lista de acuerdo a su tamaño u otra característica, esto ayudará
a obtener una muestra representativa mediante el muestreo aleatorio simple.
CAPITULO 4: Muestreo Aleatorio simple José Loaiza Torres 121

4.10.- Preguntas y problemas

1.- Comente ejemplificando en qué consiste el muestreo aleatorio simple para


variables cuantitativas y para variables cualitativas.

2.- El propietario de una gasolinera desea estimar el número medio de litros de


combustible que vende a sus clientes. De sus registros selecciona una muestra
de 60 ventas y concluye que el número medio de litros es 40 litros por semana,
mientras que la desviación estándar es de 10 litros por semana.
a) Establezca un intervalo de confianza de 95% para la media poblacional.
b) Establezca un intervalo de confianza de 95% para el total poblacional. Si se
estima que esta gasolinera atiende a 5.000 clientes por semana.

3.- Suponga que una población de 6 personas consume 8, 3, 1, 11, 4 y 7 litros de


gaseosa por mes.
a) Calcular la media de la distribución muestral de medias para todas las muestras
posibles de tamaño 2 sin reemplazo.
b) Verificar que la media de la distribución muestral de medias es una estimación
insesgada de la media poblacional, según el teorema central del límite.
c) Calcular el error estándar de las muestras.
d) Estimar el error estándar a partir de la desviación estándar de la población y
del tamaño de muestra.
e) Demuestre los tres puntos del teorema central del límite.

4.- La siguiente tabla muestra el número de personas (X1), el ingreso semanal de la


familia (Y) y los gastos semanales en alimentos (X2) en una muestra aleatoria
simple de 10 familias.
122 José Loaiza Torres CAPITULO 4: Muestreo Aleatorio simple

Cuadro 4.5: relación entre el ingreso y gastos en alimentos


Nº de Nº de Ingreso Gasto en
familia personas(X1) en alimentos
$us.(Y) (X2)
1 2 62 14,3
2 3 62 20,8
3 3 87 22,7
4 5 65 30,5
5 4 58 41,2
6 7 92 28,2
7 2 88 24,2
8 4 79 30,0
9 2 83 24,2
10 5 62 44,4
Fuente: Elaboración propia
Se pide
a) Calcular el promedio de gastos semanales en alimentos por familia.
b) Calcular el gasto semanal en alimentos por persona
c) Calcular el error estándar del promedio del consumo de alimentos por familia.

5.- Una muestra aleatoria simple de 30 familias se obtuvo de un área de la ciudad,


que contiene 16848 familias, el número de personas por familia en la muestra
obtenida fue conocida como sigue:
5, 6, 3, 3, 2, 3, 3, 3, 4, 4, 3, 2, 7, 4, 3, 5, 4, 4, 3, 4, 3, 3, 1, 2, 4,
3, 4, 2, 4, 2.
Se pide estimar el número total de habitantes en el área.

6.- Se está muestreando las familias de una pequeña ciudad con el fin de estimar el
total de los depósitos en cuenta de ahorro y se dice que hay 10.000 familias. Una
muestra aleatoria simple de 1.000 familias indica un valor total de los depósitos de
900.000 $us, su varianza es de 324 $us.
a) Estimar el total de depósitos de ahorro en la población.
b) Calcular el error estándar de la media.
c) Hallar los límites de confianza a nivel del 95% para el total estimado.
CAPITULO 4: Muestreo Aleatorio simple José Loaiza Torres 123

7.- En una muestra de 568 academias con cursos de 2 años a nivel técnico medio se
sacó una muestra aleatoria simple de 100 (54 instalaciones públicas y 46
privadas). Los datos para el número de estudiantes (X1) y el número de
profesores (X2) se muestran a continuación.

Cuadro 4.6: Número de estudiantes y profesores por tipo de academia


Academia N Nº de estudiantes Nº de profesores
Pública 54 31.281 2.204
Privada 46 13.707 1.075
Fuente: Elaboración propia

a) Para cada tipo de instalación en la población estimar la razón (número de


estudiantes / número de profesores).
b) Para las instalaciones públicas, encontrar los límites de confianza al 90% para
la razón de estudiante / maestro en la población total. Si el error estándar de
la muestra es igual a 1,5.
c) Para las instalaciones públicas, estimar el número total de maestros, sabiendo
que el número total de instalaciones públicas en la población es 251.

8.- Dos dentistas A y B, hicieron una encuesta para investigar el estado de los dientes
de 200 niños en una colonia. El Dr. A seleccionó una muestra aleatoria simple de
20 niños y contó el número de dientes cariados de cada niño, con los siguientes
resultados.
Cuadro 4.7: Número de caries por niño
Nº de dientes Nº de
cariados / niño niños
0 8
1 4
2 2
3 2
4 1
5 1
6 0
7 0
8 0
9 1
10 1
Fuente: Willan Cochran (1995)
124 José Loaiza Torres CAPITULO 4: Muestreo Aleatorio simple

El Dr. B, usando las mismas técnicas dentales examinó a los 200 niños y solo registró
aquellos que no tenían los dientes cariados. Encontró que 60 niños no tenían dientes
dañados.

Se pide estimar el número total de dientes cariados en los niños de la colonia:


a) Usando solo los resultados de A
b) Usando los resultados de A y B

9.- Una oficina está interesada en determinar la proporción de 400 trabajadores de


una fábrica para conocer si están de acuerdo con el seguro de vida que reciben
éstos; el representante de la oficina seleccionó a 60 trabajadores y encontró que
15 de ellos están de acuerdo con el seguro de vida.
a) Estime la proporción de los empleados con el seguro de vida que la empresa
ofrece.
b) Encuentre el error estándar de la proporción.
c) Estime el total de los empleados que están de acuerdo con el seguro de vida.
d) Construya los intervalos de confianza para la proporción de empleados que
están de acuerdo con el seguro. Utilice un nivel de confianza del 95%
e) Construya los intervalos de confianza para el total de empleados que están de
acuerdo con el seguro. Utilice un nivel de confianza del 95%

10.- La encargada de publicidad para el nuevo postre garapiñado de lima-limón de los


productos “cochapampa” está intranquila por el bajo rendimiento del postre en el
mercado y por su futuro en la empresa. Preocupada porque su estrategia de
mercadeo no ha producido una identificación apropiada de las características del
producto, tomó una muestra de 1.500 consumidores y encontró que 956 de éstos
pensaban que el producto era una cera para pulir pisos.
a).- Estime el error estándar de la proporción de personas que tuvo esta grave
interpretación errónea sobre el postre.
b).- Construya un intervalo de confianza de 96% para la proporción real de la
población
CAPÍTULO 5
ESTIMACIÓN DEL TAMAÑO
DE LA MUESTRA
5.1.- Introducción
5.2.- Pasos principales para la elección del tamaño de la muestra
5.3.- La especificación de la precisión (Error de estimación)
5.4.- La estimación del nivel de confianza
5.5.- Estimaciones anticipadas de varianzas de la población
5.6.- La fórmula para n al hacer un muestreo para estimar una media
5.6.1.- En poblaciones infinitas
5.6.2.- En poblaciones finitas
5.7.- La fórmula para n al hacer un muestreo para estimar una proporción
5.7.1.- En poblaciones infinitas
5.7.2.- En poblaciones finitas
5.8.- Tamaño de la muestra con más de una característica
5.9.-Tamaño de la muestra cuando las estimaciones se quieren para subdivisiones de la
población (o poblaciones independientes)
5.10.- Ajuste del tamaño de la muestra determinado estadísticamente
5.11.- Validación de la muestra
5.11.1.- El papel del nivel de confianza y del error de estimación en la validación del
tamaño de muestra.
5.12.- Árbol práctico para elegir la fórmula del tamaño de muestra
5.13.- A manera de resumen: la relación de los elementos del tamaño de la muestra
y el valor de n
5.14.- Software para cálculo de tamaño de muestra
5.15.- Preguntas y problemas
126 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra
MAPA CONCEPTUAL

CAPÍTULO 5: ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA

COMPETENCIA QUE SE PRETENDE LOGRAR: APLICA CÁLCULOS PARA ESTIMAR


EL TAMAÑO DE MUESTRA, TOMANDO EN CUENTA LAS VARIABLES CRÍTICAS QUE
INTERVIENEN.

Muestreo probabilístico
Deducir a

Relacionar Medidas
Tamaño de la muestra
Técnica de muestreo de dispersión
Analizar

5.-Varianza,
3.- Error de 4.- Parámetro Relación Probabilidad
1.- Tamaño y 2.- Nivel de de éxito
características de la confianza estimación pertinente
población
¿Para medias o Métodos de
proporciones? estimación

Relación
1-2-3-4-5

Deducir
Deducir

Relacionar
Fórmula procedimiento
Calcular

Tamaño de muestra

Aplicar

PROBLEMAS ESPECÍFICOS
DE INVESTIGACIÓN POR
MUESTREO

Fuente: Elaboración propia


128 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 129

CAPÍTULO 5

ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA EN MUESTREO ALEATORIO


SIMPLE

5.1- Introducción

Las estrategias estadísticas para determinar el tamaño de la muestra se basan en la


estimación de los valores desconocidos de los parámetros de la población, por medio
de las estadísticas de la muestra(Malhotra, 2008).

Primero debe quedar claro que, se determina estadísticamente el tamaño


de la muestra sólo en los casos de muestreo probabilístico (Loaiza, 2010).

Hasta aquí se ha utilizado el símbolo de n en lugar de un número específico. Ahora


necesitamos saber cómo determinar el número que se debe usar. Cabe aclarar que
en este capítulo, solo se abordará el cálculo del tamaño de la muestra en los casos de
muestreo aleatorio simple; aunque, los principios son los mismos para las demás
técnicas de muestreo que se estudian a lo largo del libro.

Entonces la pregunta es: ¿Qué tan grande debería ser la muestra?

Si ésta es muy pequeña, podemos fallar en la obtención de los objetivos de nuestro


análisis. Pero si es demasiado grande, desperdiciamos recursos cuando tomamos la
muestra.

La teoría indica que tendremos algo de error de muestreo debido a que no hemos
estudiado a la población completa. Siempre que tomamos una muestra, perdemos
algo de información útil con respecto a la población. Si queremos tener un alto nivel
de precisión (esto es, si deseamos estar bastante seguros de nuestra estimación),
tenemos que tomar una muestra suficiente de la población para asegurarnos la
obtención de la información requerida. El error de muestreo se puede controlar si
130 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

seleccionamos una muestra cuyo tamaño sea el adecuado. En general, cuanta


más precisión se quiera, más grande será el tamaño de la muestra necesaria.

Asimismo, deben tomarse en cuenta varios factores cualitativos al determinar el


tamaño de la muestra (véase el capítulo uno). Estos incluyen la importancia de la
decisión, la naturaleza de la investigación, el número de variables, la naturaleza del
análisis, los índices de terminación e incidencia y las limitaciones de recursos.

En este capítulo se estudiará los factores cuantitativos.

5.2.- Pasos principales para la elección del tamaño de la muestra

En base a Cochran (1995) se puede describir a continuación los pasos principales


involucrados en la elección del tamaño de la muestra:

1.- Debe existir algún enunciado respecto a lo que se espera de la muestra.


Este puede darse en términos de límites de error deseados, por ejemplo, la media que
esté entre más y menos 2 unidades. O bien en términos de alguna decisión o acción
que debe tomarse una vez que se conocen los resultados de la muestra.
La responsabilidad de este enunciado es de las personas que van a usar los resultados
de la investigación; es decir, los que toman decisiones.

2.- Se debe encontrar una ecuación que relacione n con la precisión deseada de la
muestra.
La ecuación variará según el contenido del enunciado de precisión y el tipo de
muestreo propuesto. Una de las ventajas del muestreo probabilístico es que permite
la elaboración de esta ecuación.

3.- Especificar los parámetros de la ecuación.


Esta ecuación tendrá como parámetros ciertas propiedades desconocidas de la
población, que deben estimarse para obtener resultados específicos.
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 131

Al respecto Lohr (2000) indica que sí el tamaño de la muestra es mayor a lo permisible,


regrese y ajuste algunas expectativas de la encuesta y trate de nuevo.

4.- Con frecuencia sucede que los datos estipulan para ciertas subdivisiones mayores
de la población.
En estos casos los límites de error deseados se establecen para un cálculo separado
para el valor n en cada subdivisión y el n total se encuentra por adición.

5.- Generalmente se mide más de un atributo o característica en una encuesta por


muestreo.
En ocasiones, el número de atributos es grande. Si se estipula un grado de precisión
para cada atributo, los cálculos conducirán a una serie de valores conflictivos de n uno
para cada atributo. Por tanto, debe encontrarse un método para reconciliar estos
valores. Podríamos decir básicamente que hay dos métodos:
- Se determina el valor de n para cada atributo y se elige el n mayor siempre que los
recursos disponibles sean suficientes para llevar a cabo la investigación.
- Se determina el valor de n para cada atributo o parámetro por separado, luego se
obtiene un promedio de la n calculada y se aplica ese tamaño de muestra para
recoger la información.

6.- Debe apreciarse el valor elegido de n, para que sea consistente con los recursos
de muestreo disponibles.
Esto exige una estimación del costo, trabajo, tiempo y materiales que se necesitan
para obtener la muestra del tamaño propuesto. En ocasiones es claro que n debe
reducirse drásticamente, y entonces es necesario tomar una decisión difícil, que es la
de proceder con una muestra mucho más pequeña, lo que reduce la precisión o bien,
abandonar los esfuerzos hasta contar con mayores recursos.

Recogiendo lo anterior y como un aporte, a continuación se muestra el proceso


sistematizado y de manera científica los pasos a seguir en la determinación del tamaño
de muestra.
132 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

Figura 5.1: Proceso esquematizado de la estimación del tamaño de


muestra
ESTABLECER EL PARAMETRO Promedio
PERTINENTE
Proporción

Una sola técnica


SELECCIONAR LA TÉCNICA
DE MUESTREO
Combinación de
técnicas

Distribución normal estándar, Z


(Se calcula el valor de z según
ESTIMAR EL NIVEL DE
tablas)
CONFIANZA

Si la estimación es el promedio(o
medias), el error se expresa en las
mismas unidades de la variable.
ESTABLECER EL NIVEL DE
ERROR ASUMIDO DE
Si la estimación es una proporción,
ESTIMACIÓN
el error se expresa en porcentaje.

Muestreo piloto
- SI ES PARA MEDIAS
ESTIMAR LA Conocimiento de la población por
VARIANZA σ2 A estudios anteriores
PARTIR DE S 2

- SI ES PARA Estudios realizados en poblaciones


Métodos
PROPORCIONES P similares
ESTIMAR A PARTIR DE
PS Conjeturar respecto al valor de la
varianza.

Asumir igual probabilidad de éxito o


fracaso (sólo cuando es para proporciones

DETERMINAR A CUANTO
ASCIENDE EL TAMAÑO DE Depende de si la: Población es finita
LA MUESTRA, n
Población es infinita
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 133

APLICAR LA CORRECCIÓN DE Si el tamaño de la muestra Entonces aplicar


LA POBLACIÓN FINITA representa 10% o más de
nN
la población. n* 
N  n -1

CALCULAR LA MUESTRA De acuerdo al índice de


INICIAL incidencia y el índice de
terminación

Fuente: Elaboración propia

Realizaremos una breve descripción del gráfico anterior.

Primer paso: Establecer el parámetro pertinente, en términos de promedio o


proporción, esto ocurre cuando se define la población meta, aspecto ya estudiado en
este libro. De acuerdo al parámetro pertinente se seleccionará la ecuación del cálculo
de la muestra.

Segundo paso: Seleccionar la técnica de muestreo, en función a la técnica de muestreo


existen fórmulas específicas las que se aplicarán para determinar el tamaño de la
muestra.

Tercer paso: Estimar el nivel de confianza, siendo la probabilidad con que se estima
el intervalo de confianza, el nivel de confianza ha de permitir el cálculo del valor
estandarizado Z, el nivel de confianza generalmente varía entre 90% y 99% y
mayormente se elige el 95% para este valor Z es igual a 1,96

Cuarto paso: Establecer el nivel de error asumido de estimación, se refiere a la


precisión, este valor debe estar expresado en función al parámetro pertinente, si éste
es promedio, el error debe estar en unidades de la variable, si el parámetro es
porcentaje el error puede expresarse en porcentaje.
134 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

Quinto paso: Estimación de la varianza, en función al parámetro pertinente si éste


indica que es la media, entonces la varianza σ2 se puede estimar a partir de s2. Si la
el parámetro pertinente es una proporción, entonces la varianza será el producto de
PxQ, el valor de P, se estimará a partir de ps

Sexto paso: Determinar a cuánto asciende el tamaño de la muestra, n, estará en


función a la fórmula matemática que se ha seleccionado.

Séptimo paso: Aplicar la corrección de la población finita, siempre que la fracción


muestral sea mayor al 10% (f=n/N) entonces se puede aplicar la fórmula para reducir
el tamaño de la muestra, en el entendido de que una muestra mayor al 10% de la
población es innecesaria. Cabe aclarar que este cálculo se hace por única vez, no hasta
llegar al 10% o menos.

Octavo paso: Calcular la muestra inicial, significa calcular en función al índice de


incidencia y de terminación. Se explicará más adelante.

A continuación de desarrolla los pasos que aún no han sido abordados en detalle en
el presente libro.

5.3.- La especificación de la precisión (Error de estimación)

El nivel de precisión, también se conoce como el error de estimación, o el error en el


muestreo aleatorio, o el error estándar del parámetro, abordado en el punto 3 del
teorema central del límite.

La precisión deseada se puede establecer al definir el error tolerable en las


estimaciones muestrales. Esta cantidad se determina mejor a la luz de los usos a que
se destinan los resultados de la muestra (Cochran, 1995).
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 135

En ocasiones, es difícil saber qué tanto error debería tolerarse, particularmente cuando
los resultados se destinan a varios fines.

Es decir el límite de error es arbitrario de acuerdo a la experiencia, puede asignarse.

Al respecto Malhotra(1997) se refiere:


Nivel de precisión. Al estimar un parámetro de la población, mediante el uso de una
estadística de muestra, el nivel de precisión es el tamaño deseado del intervalo de
estimación. Esta es la diferencia máxima permisible entre la estadística de la muestra
y el parámetro de la población, por ejemplo la media entre más menos 2 unidades.

En muchas situaciones prácticas no podemos ir más adelante. Parte de la dificultad es


que no se sabe lo suficiente sobre las consecuencias que producirían errores de
diferentes magnitudes en las decisiones prácticas que se toman con base en los
resultados de la encuesta. Por lo tanto, es de esperarse que exista un cierto grado de
adivinanza en la especificación de la precisión para un futuro más o menos inmediato.
A manera de orientación, se puede decir que:
- Si el parámetro pertinente es una media, el error debe expresarse en las mismas
unidades de la variable de estudio de la cual se obtendrá la media. Por ejemplo,
si el parámetro pertinente es el promedio de gasto semanal en un determinado
producto expresado en dólares estadounidenses, entonces el error debe expresarse
también en dólares estadounidenses.
- Si el parámetro es una proporción, el error debe expresarse en términos de puntos
porcentuales; el cuál varía entre 1 y 10%, y mayormente se asume un 5% de
error de estimación.

Partiendo del intervalo de confianza de estimación de un parámetro como lo es la


media, se puede establecer que:

σ Error de estimación, e
Xz
n
136 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

Gráficamente se puede expresar el error de la siguiente manera:

Figura 5.2: Representación gráfica del error muestral

0
Valor estandarizado (Z)

LI µ LS Valores de la variable (Xi)

- e (error de estimación) + e (error de estimación)

Fuente: Elaboración propia

LI = límite inferior del intervalo de estimación


LS = límite superior del intervalo de estimación

A la derecha del parámetro está el error de estimación con el signo positivo y a la


izquierda del parámetro esta con el signo negativo.

Por tanto, cuando se trata de variables cuantitativas a estimar, la suma del nivel de
confianza y el error de estimación no darán de ninguna manera 100%. Dado que el
nivel de confianza se expresará en porcentajes pero e que es el error estándar de
estimación se expresará en unidades de la variable.

Como regla general, podría decirse que no es correcto sumar el nivel de


confianza con el error de estimación.

Ahora bien, ¿cómo se determina el error de estimación en variables cuantitativas para


efectos de reemplazo en la fórmula del tamaño de la muestra?.
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 137

1. Una forma seria asumir subjetivamente el valor de e; sin embargo podríamos


equivocarnos y asumir demasiado pequeño lo que daría una muestra grande o
contrariamente demasiado grande el valor de e lo que daría demasiada pequeña
la muestra.
2. Basarnos en datos secundarios o estudios similares.
3. Utilizar por analogía el valor de e, en proporciones, pero convirtiendo a las mismas
unidades de la variable. Por ejemplo, si estamos interesados en estimar el gasto
promedio familiar de carnes rojas a la semana, podríamos elegir una muestra
piloto, en base a cuyos resultados calcular el promedio de gasto familiar por
semana en carnes rojas, supongamos que el gasto promedio encontrado es de
pesos 40, de este valor podríamos obtener el 5%(error asumido en proporciones)
lo que resulta un error muestral e de pesos 2, con este valor ya podríamos
reemplazar en la fórmula y calcular el tamaño de la muestra.

Finalmente, se puede afirmar que el error muestral permitido, e tiene una relación
inversa con el tamaño de la muestra, cuanto mayor sea el error menor será el tamaño
de la muestra requerida, dado que se exige menor precisión. Esto se explica porque
a medida que el error crece en su tamaño, se requiere menor tamaño de muestra,
debido a que el ancho del intervalo será mayor y consecuentemente habrá mayores
probabilidades de que el parámetro que se esté estimando caiga dentro del intervalo
respectivo con una muestra relativamente pequeña y viceversa. Además de que el
valor de e en las fórmulas del cálculo de la muestra se encuentra en el denominador,
y por relación lógica matemática la relación es inversa.

Advertencia: No debe confundirse de que el error muestral en términos porcentuales es la


diferencia del 100% y el nivel de confianza, por ejemplo, pensar que si el nivel de confianza
es el 95% el error muestral debería ser el 5%, lo cual sin duda es un error que se comete en
algunas ocasiones. Por tanto, podría asumirse un nivel de confianza de un 95% y un error
muestral del 3%.
138 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

5.4.- La estimación del nivel de confianza

En cuanto al nivel de confianza es necesario decidir cuál ha de ser su valor; es decir


el nivel de confianza indica la probabilidad con que se van a realizar las estimaciones
de los parámetros de la población. En otras palabras, es la probabilidad de que un
intervalo de confianza incluya el parámetro de la población; como ya se mencionó este
valor varía entre 90% y 99%, y mayormente se asigna 95%

Asumiendo además que mientras más grande sea la población, es decir mayor a 30
se utiliza la distribución normal Z estándar.

Intervalo de confianza es el rango en el que se encontrará el parámetro de la


población real, suponiendo un nivel determinado de confianza.

Gráficamente se puede expresar el nivel de confianza en el siguiente gráfico:

Figura 5.3: representación gráfica del nivel de confianza

Nivel de confianza

0
Valor estandarizado (Z)

LI µ LS Valores de la variable (Xi)

- e (error de estimación) + e (error de estimación)


Fuente: Elaboración propia

LI = límite inferior del intervalo de estimación


LS = límite superior del intervalo de estimación
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 139

Ahora bien, el intervalo de confianza está dado por los valores del límite inferior y
límite superior.

La relación entre el nivel de confianza (con el cual se encuentra en valor de z) y el


valor n es directa, cuanto mayor sea el nivel de confianza mayor será el tamaño de la
muestra para tener mayor probabilidad de que el parámetro se encuentre dentro del
intervalo de confianza elegido. Además de que algebraicamente el valor de Z se ubica
en el numerador de las fórmulas del cálculo de tamaño de muestra.

5.5.- Estimaciones anticipadas de varianzas de la población

Para obtener el tamaño de la muestra se requiere estimar la variación en la población.


La desviación estándar o la varianza es una medida de tal condición. Por tanto, debe
calcularse tal desviación estándar poblacional. Esto puede hacerse según Mason y Lind
(1995) de dos formas:

1. Realizando una encuesta piloto y utilizando la desviación estándar de esa muestra


piloto (ya sea para media o para proporciones).
2. Calculando la desviación estándar con base en conocimientos en la población.

Al respecto Cochran (1995) dice que hay cuatro caminos para estimar las varianzas
de población en determinaciones de tamaño de muestra:

1. Al tomar la muestra en dos pasos, siendo el primero una muestra aleatoria simple

de tamaño n1 donde se estima S12 o p1 de  1 o P y se obtiene el valor requerido


2

de n.
2. Por los resultados de una encuesta piloto. Este método es el más utilizado en las
investigaciones de mercado, dada la poca información especializada disponible.
3. Por muestreo previo de la misma población o una semejante. Lo que significa
recurrir a datos secundarios de estudios pasados, en este caso hay que tener en
cuenta la actualidad de los datos.
140 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

4. Al conjeturar respecto a la estructura de la población y ayudarse con algunos


resultados matemáticos. No es lo más recomendable, dado que las conjeturas se
basan generalmente en juicios personales del investigador.

 La varianza en variables cualitativas

Cuando el parámetro de estimación es una proporción (P); es decir, un atributo, se


debe estimar la proporción de éxito o de ocurrencia y de fracaso o de no ocurrencia.
Para este fin se puede adoptar los siguientes métodos:

1.- Muestreo piloto, se considera el atributo bajo estudio y se calcula la proporción de


la muestra piloto con la cual se estima la proporción de éxito de la población. Por
ejemplo se puede elegir en una encuesta una pregunta con respuesta dicotómica
y una opción es éxito y la otra es fracaso.
2.- Por estudios anteriores y tomar ese porcentaje; siempre y cuando los datos tengan
relativa actualidad.
3.- Por estudios en poblaciones similares. Se puede recurrir a estudios de otras
poblaciones de temas similares.
4.- Tomar el valor conservador; o sea, suponer igual probabilidad o porcentaje tanto
para éxito como para fracaso del 50%. Tomando en cuenta que dará como
resultado la máxima varianza (0,5 x 0,50 = 0,25) consecuentemente la muestra
será la más grande posible. En tales casos, podría asumirse un error muestral
mayor a 5%, dado que el error no muestral se minimizará.

Es importante señalar que, la relación entre el tamaño de la varianza y el tamaño


de la muestra n es directa, debido a que si existe una alta variabilidad de la
característica bajo estudio, se requerirá un tamaño de muestra grande para garantizar
la representatividad de la misma, en cambio si la variabilidad de la característica es
baja lógicamente se requerirá menor tamaño de muestra. Por ejemplo, si medimos el
tamaño de un producto estandarizado con una varianza pequeña, bastará con medir
uno o dos para conocer el tamaño de todo un lote; mientras que si estamos estudiando
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 141

la opinión de los consumidores sobre el desempeño de un producto, es probable que


necesitemos consultar a muchos compradores, puesto que las opiniones serán
divergentes debido a sus hábitos, percepciones y su cultura, lo que significaría que la
varianza es grande.

5.6.- La fórmula para n al hacer un muestreo para estimar una media

La decisión del tamaño de la muestra cuando se quiere estimar el parámetro como es


la media poblacional, depende de si el interés único es determinar un promedio en la
investigación como parámetro base de estimaciones. Puede presentarse dos
situaciones: Cuando la población es finita e infinita, en función de ello se elegirá la
fórmula a aplicar.
Uno de los valores necesarios para calcular el tamaño de la muestra es el valor
estandarizado Z bajo la curva normal, conviene entonces, resaltar los siguientes
aspectos de la distribución normal:

 Es una curva de probabilidad estandarizada en forma de campana simétrica, en la


cual, las áreas bajo la curva representan la probabilidad de que ocurra una
observación en los límites del área.
 El punto central en la distribución normal es la media y las distancias de la media
se expresan en función de la desviación estándar.
 Se asocia siempre a una variable aleatoria continua de rango infinito (- ∞< x <
+∞)
 Cualquier variable aleatoria normal X puede convertirse en una variable aleatoria
normal estandarizada z (de media 0 y desviación estándar) mediante la fórmula:

x -μ
Z Nótese que z representa el número de desviaciones estándar a que se
σ
encuentra x de μ
142 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

 Las tablas de probabilidad normal se emplean con dos propósitos. 1) encontrar las
probabilidades de los valores conocidos de x ó z y 2) encontrar los valores de x ó z
que corresponden a las probabilidades conocidas. Para mayor detalle se sugiere
revise libros de estadística inferencial.
 El intervalo de 95% es el que suele emplearse en la determinación del tamaño de
la muestra y para esa probabilidad Z= + 1,96 ver apéndice 1 tabla z.

La distribución muestral de una media:

Si tomamos j muestras de una población obtendremos j estimaciones de la media de


la población. Cuanto más grande sea la muestra aleatoria que tomamos de la
población, más estrechamente las medias se agruparán alrededor del verdadero
parámetro de la población y el error estándar será menor; o sea, las medias de la
muestra tendrán menor variabilidad y se acercarán más a la media de la población.
La distribución muestral de la media, como ya dijimos en el caso de muestras grandes,
tendrá una distribución normal de acuerdo al teorema central del límite.

E( x ) = μ media de las medias muestrales igual a media de la población


σ
σx  Desviación estándar de la media muestral (error estándar) igual a
n
desviación estándar de la población entre raíz del tamaño de muestra.

Cuando el tamaño de la muestra es del 5% o más en relación con el tamaño de la


población, las fórmulas del error estándar sobreestimarán la desviación estándar de
la media de la población. Por consiguiente, debe ajustarse mediante un factor de
corrección de población finita, dicho factor está definido por:

N-n
N -1
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 143

En este caso el error estándar de la media seria:

σ N-n
σx 
n N -1

Entonces z en distribuciones muestrales adopta la forma:

x -μ
Z
σ/ n

Pero afortunadamente se ha desarrollado tablas de unidades estandarizadas Z (ver


apéndice 1 tabla Z), que permite calcular estos valores para determinadas
probabilidades. Así por ejemplo, para un nivel de confianza del 95% (probabilidad del
95%) el valor de Z es 1,96; mientras que para un nivel de confianza del 98% el valor
de Z es 2,33

5.6.1. – En poblaciones infinitas

Una población es infinita cuando no se conoce el tamaño de la población o


simplemente es demasiado grande. Ejemplo de esto tenemos, los peces del río
Pilcomayo, los fumadores de cigarrillos de un país, los consumidores de café en una
Región.

La fórmula para determinar el tamaño de la muestra se obtiene de la siguiente manera


(Berenson y Levine, 1992):

Si se conoce la σ, la estimación del intervalo de confianza para la media de la población


se obtiene con la siguiente ecuación.

σ
Xz
n
144 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

Recuérdese que z = ( x - μ)/ σ x , por tanto, se tiene ( x - μ) = Z σ/n. Como se explicó

anteriormente, el error muestral es igual a la diferencia entre la estimación de la


muestra x y el parámetro μ que se va a estimar. Este error muestral “e” se puede
definir como.
𝜎
𝑒= 𝑍
√n
Al resolver esta ecuación para n, o sea despejando n de la ecuación, se tiene
desglosado en los siguientes pasos:

√n e=Z2 σ2

Como e, está multiplicando pasa a dividir

Z 2 σ2
√n =
e
Elevando al cuadrado cada miembro de la ecuación se tiene:

2
Z 2 σ2 2
( √n ) = ( )
e

De manera que, simplificando el cuadrado se obtiene que n es igual a:

Z2σ 2
n
e2

Donde:
n = Tamaño de la muestra
Z = Valor estandarizado de la variable, bajo la curva normal, dado un nivel de
confianza asumido por el investigador.
e = Error de estimación asumido o estimado en base a la muestra piloto. Debe
expresarse en las mismas unidades de la variable y la desviación estándar. Una
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 145

vez más; depende de si el parámetro es proporción, el error se expresará en


porcentaje, pero, si el parámetro es promedio, el error se expresará en unidades
de variable por ejemplo pesos.
σ = Desviación estándar poblacional o estimada utilizando algún método explicado
anteriormente.

Podemos decir que, para determinar el tamaño de la muestra, se debe conocer tres
elementos de manera anticipada: El nivel de confianza, z (tiene una relación directa
con n), el error muestral permitido, e (tiene relación inversa con el tamaño de la
muestra n), la desviación estándar, σ (tiene relación directa con el tamaño de la
muestra n).

Ejemplo:

La gerencia del “RODEO PARRILLADA” quiere determinar la cantidad mensual


promedio que las familias que gastan en restaurantes de lujo. Con una encuesta piloto
se determinó que la desviación estándar es de 40 Bolivianos por mes. La gerencia
desea tener una confianza del 95% de los descubrimientos y no quiere que el error
sea mayor a + 5 Bolivianos.
a) ¿Qué tamaño de muestra debería emplearse para determinar el gasto familiar
mensual promedio?
b) Después de conducir la encuesta, se encontró que el gasto promedio era de 900
Bolivianos y la desviación estándar era de 45 Bolivianos. Elabore un intervalo de
confianza del 95%. ¿Qué puede decirse acerca del nivel de precisión?

Solución:
Datos
α = 95%
Z = 1,96 (dado un nivel de confianza del 95%)
S = 40 Bolivianos/mes σ = 40
e + 5 Bolivianos/mes
146 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

a) Reemplazando en la fórmula se tiene:

(1,96) 2 (40) 2
n  245,86  246 familias a muestrear
(5) 2

b) Resultado de la investigación S= 45 Bolivianos/mes y X = 900 Bolivianos/mes

45
900  1,96 900 + 5,62
246

En este caso el error permitido ha sido subestimado, porque el cálculo es mayor, o


sea 5,62 > 5,0. También se dice que la desviación ha sido sub-estimada.

5.6.2.- En poblaciones finitas

Una población finita es aquella que tiene un tamaño limitado, conocido o determinado.

Es decir, se conoce con exactitud el tamaño de la población, o también se puede decir


que es posible estimar, o finalmente se puede contar los números de observaciones
de la población o universo. Así por ejemplo, son poblaciones finitas el número de
estudiantes de una Carrera universitaria; los clientes de crédito de un Banco, los
contribuyentes activos de impuestos de una zona, el número de familias que viven en
una región, etc.

Como se ha indicado, la distribución de muestreo de medias sigue una distribución


normal y si la muestra es apreciable de la población (f =n/N>5%), entonces el error
estándar es:

σ N-n
σx 
n N -1
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 147

O dicho de otro modo, utilizando la estrategia del intervalo de confianza:

σ N-n
̅
X ± Z √
√n N-1 Error de estimación ( e )

Entonces e, es igual a:

σ N-n
e
n N -1

Para obtener n, aplicamos el siguiente procedimiento:

Primero elevamos ambos términos

σ
N−1 2
(e)2 =( z √ )
√n N − n

Luego, simplificamos la raíz cuadrada del segundo término y nos queda

2
σ2 N − n
2
e =z
n N−1

Podemos multiplicar las fracciones:


z 2 σ2 (N − n)
e2 =
n (N − 1)

Traemos el denominar al primer término a multiplicar

n(N − 1)e2 =z 2 σ2 (N − n)
148 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

Re expresamos:

e2 nN - e2 n =z 2 σ2 N − z 2 σ2 n

Pasamos al primer término el componente donde se encuentra n

e2 nN - e2 n + z 2 σ2 n=z 2 σ2 N

Factorizamos n
n( e2 N - e2 + z 2 σ2 )=z 2 σ2 N

Dejamos solamente n en el primer término


z 2 σ2 N
n=
e2 N - e2 + z 2 σ2

Finalmente se factoriza e para obtener la fórmula final de n

z 2 σ2 N
n= 2
e (N - 1) + z 2 σ2

Donde:
n = Tamaño de muestra
N = Tamaño de la población
σ2 = Varianza poblacional
e = Cuota de error
Z = Unidades estándar bajo la curva normal (dado un nivel de confianza)

Ejemplo:

La Compañia INGENIO, desea promocionar un nuevo producto para el cual procedió


a la elaboración y diseño de la encuesta que permitirá auscultar el mercado de
gaseosas; el diseño de la encuesta está referido a recabar los datos necesarios sobre
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 149

el consumo promedio por mes del mencionado producto; la encuesta está dirigida a
personas de 16 a 60 años de edad. Para tal efecto se cuenta con una población de
90.000 personas, una vez establecida la población meta desea conocer cuál será el
tamaño de la muestra que necesita para la aplicación de su encuesta. Para ello cuenta
con los siguientes datos adicionales, la varianza poblacional es igual a 64 litros / mes,
la cuota de error asumida es de 1,5 litros / mes, y el nivel de confianza deseado del
95%.

Solución:

Datos

N = 90.000 Personas
σ2 = 64 litros / mes
e = 1,5 litros / mes
Z = 1,96

Reemplazando se tiene:

(1,96)2 (90.000) (64)


n = 109,14 = 109 encuestas a realizar
(1,5)2 (90.000 - 1)  (64)(1,96)2

5.7.- La fórmula para n al hacer un muestreo para estimar una proporción

Se toma esta decisión cuando los parámetros a ser estimados son proporciones, y
provienen de datos cualitativos. Pueden presentarse dos situaciones: En poblaciones
infinitas y en poblaciones finitas.

Los métodos para la determinación del tamaño de la muestra que se utilizan en la


estimación de una proporción real son similares a los empleados en la estimación de
una media y también parten de la estrategia del intervalo de confianza.
150 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

La estimación de una proporción es:

E(p)=P ó Ps P̂

El error estándar de la proporción es:

P ( 1 - P) N  n
σp 
n N -1

La segunda parte de la raíz se aplica siempre y cuando f = n/N >5% y la población es


finita.

En la determinación del tamaño de la muestra para estimar una proporción, se


necesita tres componentes:
1. El nivel de confianza, del cual se obtiene el valor de “Z”
2. El error permitido “e” de estimación.
3. La proporción (o probabilidad de éxito) de ocurrencia real estimada “P”

La proporción real (verdadera) de éxito en la población P es la cantidad que se querría


estimar al tomar la muestra. En este caso hay dos caminos alternos relacionado con
lo que ya vimos en el punto de estimaciones anticipadas de las varianzas.
1. Estimar P con base en los datos (ejemplo encuesta piloto, trabajos similares) o
experiencias pasadas.
2. Estimar P como valor más conservador, es decir P= 0,5; lógicamente esto puede
dar por resultado una sobreestimación del tamaño de la muestra.

5.7.1.- En poblaciones infinitas

El concepto de poblaciones infinitas es igual al que ya se dio en poblaciones infinitas


para medias.
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 151

La estimación del intervalo de confianza de la proporción P real se obtiene con:

P (1 - P)
Ps  Z
n
Se recordará, de la distribución muestral de proporciones que el valor estandarizado
es:
Ps - P
Z
P(1 - P)
n

Se tiene:

P(1 - P)
Ps - P  Z
n

Al ser (Ps – P) el error e; entonces:

P(1 - P)
e Z
n

Al resolver para n se obtiene la siguiente ecuación:

Z 2 P(1 - P)
n
e2

Donde:
n = Tamaño de muestra.
P = Probabilidad de éxito o de ocurrencia del evento, que en investigación de las
ciencias empresariales, generalmente es el porcentaje de estimación de alguna
característica poblacional.
e = Cuota de error, o error de estimación, en este caso expresado en porcentaje.
Z = Unidades estándar bajo la curva normal (dado un nivel de confianza)
152 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

Ejemplo:

Suponga que el actual presidente del País desea estimar la proporción de la población
que apoya su política actual. El presidente desea que la estimación esté dentro del
0,04 de la proporción verdadera. Considere que se usa un nivel de confianza de 0,95.
El ministro de estado estimó que en un estudio anterior la proporción que apoya la
política actual es de 0,60.
a) ¿Qué tan grande debe ser la muestra?
b) ¿Cuán grande debería ser la muestra si no se contara con la estimación del
secretario de Estado?

Solución:

Datos

e =0,04
Z = 1,96 (dado el nivel de confianza del 0,95)
P = 0,60

Reemplazando se tiene:

(1,96) 2 (0,60)(1 - 0,60)


n = 576
(0,04) 2

b). Si no se conocería la estimación de P, entonces se asume 0,50 como valor más


conservador. Por tanto el tamaño de muestra sería:

(1,96) 2 (0,50)(1 - 0,50)


n = 601.
(0,04) 2
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 153

Vale la pena señalar que, cuando se asume un valor de p =0,50 (valor conservador)
entonces el tamaño de muestra resultará siempre lo más grande posible, dado que
ninguna otra combinación del producto de la probabilidad de éxito (p) y la probabilidad
de fracaso (q) daría mayor a 0,25 (0,50 x 0,50). Está claro, que se está tomando una
varianza amplia y como se sabe hay una relación directa entre la varianza y el tamaño
de la muestra, lo que significa que al tomar una varianza grande como límite de 0,25
dará como resultado un tamaño de muestra mayor.

5.7.2.- En poblaciones finitas

Cuando se quiere estimar una proporción y se conoce el tamaño de la población, la


muestra se determina a partir de la estrategia del intervalo de confianza de la siguiente
manera:

El intervalo es:

P (1 - P) N  n P(1 - P) N-n
Ps  Z de ahí que e Z
n N 1 n N -1

Despejando n de manera similar para el caso de estimación de una media, la fórmula


para estimar una proporción, luego de despejar, sería:

Z2 N P Q
n= 2
e (N-1)+Z 2 P Q

Donde:
n = Tamaño de muestra
N = Tamaño de la población
P = Probabilidad de éxito o de ocurrencia del evento, generalmente es el porcentaje
de estimación de alguna característica poblacional.
154 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

e = Cuota de error, o error de estimación, en este caso expresado en porcentaje.


Z = Unidades estándar bajo la curva normal (dado un nivel de confianza)

Ejemplo:

Un egresado de la Carrera de Ingeniería Comercial, se encuentra elaborando su


trabajo de grado. Ha elegido como objeto de estudio un hospital de una Ciudad, cuyo
tema de investigación es el desarrollo de un plan de marketing de servicios. Con el
objetivo de conocer el grado de satisfacción de los clientes que reciben el servicio se
ha diseñado un cuestionario dirigido a una población objetivo de aproximadamente
8.000 pacientes por mes en todos los servicios. Con la finalidad de determinar la
proporción estimada se procedió a realizar una encuesta piloto a 10 personas con la
siguiente pregunta “Si en el futuro requiere de los servicios hospitalarios regresaría
otra vez? Se obtuvo las siguientes respuestas: Si, Si, No, Tal vez, No, Si, Tal vez, Si,
No, Tal vez. A un nivel de confianza del 95% qué tamaño de muestra se debe
seleccionar, si se desea obtener un error no más de 6%.

Solución:

Datos

N = 8.000
Z = 1,96
e = 0,06

Para estimar “P” se utiliza Ps = a/n donde “a” es el número de personas que
respondieron TAL VEZ y NO y “n” es el número de personas entrevistadas de manera
que:

Ps= 6/10 = 0,6 P = 0,6


CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 155

Reemplazando en la fórmula:

(1,96)2 (8.000)(0,60)(0,40)
n=
(0,06)2 (8.000-1)+(1,96)2 (0,60) (0,40)

n = 248,19 = 248 encuestas a realizar, como muestra final determinado


estadísticamente.

5.8.- Tamaño de la muestra con más de una característica

En la mayoría de las encuestas se recoge información sobre más de una característica.

Un método para determinar el tamaño de la muestra es la especificación de los


márgenes de error para las características que se consideran vitales en la encuesta.
Una estimación inicial del tamaño requerido de la muestra se hace separadamente
para cada una de estas características importantes.

Al completar la estimación de n para cada característica, se concreta la situación.


Puede ser que los n requeridos estén bastante próximos. Si el valor más grande de
n está dentro de los límites del presupuesto, se toma este valor. Pero con frecuencia,
hay suficiente variación entre los n y, por tanto, no se selecciona el más grande, ya
sea por consideraciones presupuestarias o porque este valor dará una precisión global
sustancialmente más elevada que la considerada en un principio. En este caso, el
estándar de precisión deseado puede relajarse un poco para algunas características,
lo que permite utilizar un valor más pequeño de n.

Otro método para encontrar “n” puede hacerse calculando un promedio de las “n”
de cada característica calculada.

Algunas características requerirán tipos diferentes de muestreo en comparación con


otras, en tales casos es un problema serio a resolver.
156 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

5.9.-Tamaño de la muestra cuando las estimaciones se quieren para


subdivisiones de la población (o poblaciones independientes)

Cochran (1995) indica que se planea a menudo para presentar estimaciones no sólo
de la población como un todo, sino también para ciertas subdivisiones. Si éstas pueden
identificarse por adelantado, como es el caso de las regiones geográficas se hace un
cálculo separado de n para cada región. Supóngase que la media de cada subdivisión
se debe estimar con una varianza específica V. Para la i-ésima subdivisión, tenemos
ni = Si2/V, por lo tanto, el tamaño de la muestra total n =  Si2/V. Las Si2
individuales serán en promedio más pequeñas que S2, la varianza de la población,
pero a menudo sólo un poco más pequeñas. De modo que si existen k subdivisiones,
n = kS2/V, en tanto que si sólo se desea obtener la estimación para la población
como un todo, se toma n = S2/V.

Lo más aconsejable es calcular un tamaño de muestra para cada subdivisión y luego


obtener el n total simplemente por adición.

5.10.- Ajuste del tamaño de la muestra determinado estadísticamente

Es el paso final en el proceso planteado para el cálculo del tamaño de la muestra,


hablamos desde dos perspectivas:

Primero, si el tamaño de muestra que se obtiene es el 10% o más de la población,


entonces se introduce el factor de corrección para población finita y se reduce el
tamaño de la muestra, con la siguiente fórmula:

nN
n* 
N  n -1
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 157

El fundamento de esta corrección es que teóricamente una muestra más de 0,10 o


10% de la población resulta ya innecesaria, también se basa en la teoría de la
saturación del muestreo.

Ejemplo:

En una población de 500 clientes, se obtiene una muestra de 150 para estudiar el
grado de satisfacción o insatisfacción. En este caso debe realizarse el ajuste de la
muestra, dado que la fracción muestral es (f= 150/500 = 0,30) mayor a 0,10;
consecuentemente el resultado será:

nN
n* 
N  n -1

n* = (150x500)/(500+150-1) = 115,56 = 116 clientes para muestrear.

Segundo, se trata de realizar el ajuste del tamaño de muestra tomando en cuenta


los índices de terminación e índices de incidencia.

Tamaño de muestra final determinado estadísticamente


Tamaño de muestrainicial 
Índice de Incidencia x Índice de Terminación

Con la fórmula anterior nos da el total de contactos necesarios para lograr el objetivo
de unidades que contengan el parámetro o característica poblacional.

Según Malhotra (1997) El índice de incidencia y de terminación se define de la


siguiente manera:

Índice de incidencia.- Índice de ocurrencia de las personas calificadas para


participar en el estudio, expresada como porcentaje.
158 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

Índice de terminación.- Porcentaje de entrevistados calificados que terminan la


entrevista. Permite a los investigadores tomar en cuenta las negativas anticipadas de
quienes califican.

Ejemplo:

Supóngase de que se ha calculado con la fórmula del muestreo aleatorio simple para
estimar una proporción el tamaño de la muestra en 165 unidades, al mismo tiempo
se conoce6 que el 90%de la población no está calificada para responder las encuestas
que se van a realizar, y del total de unidades que sí pueden responder, solo terminan
en forma exitosa el 80% debido a la complejidad de las preguntas que se formulan.
Por tanto el tamaño de la muestra inicial sería:

Tamaño de muestra inicial = 165/(0,90 x 0,80) = 220 unidades.

Lo anterior significa que debe hacerse 220 contactos para lograr 165 entrevistas que
tengan las características deseadas y terminen en forma exitosa la entrevista
respectiva.

Ahora bien; los dos problemas principales de falta de respuesta en el muestreo, son
el mejoramiento de los índices de respuesta y el ajuste para la falta de respuesta que
sintéticamente abordamos a continuación:

1.- Mejoramiento de los índices o tasas de respuesta.

Para esto existen métodos de acuerdo a las circunstancias de cada proyecto de


investigación se puede aplicar uno o más métodos respectivos.

6 Tanto el índice de incidencia como el índice de terminación, es posible estimar mediante una
muestra piloto utilizando una técnica de muestreo no probabilística.
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 159

Figura 5.4: Métodos para mejorar los índices o tasas de respuesta

Métodos para mejorar las tasas de


respuesta

Reducir las negativas Reducir los


“nadie en casa”

Notificación Motivar a Incentivos Diseño y Seguimiento Otros Llamadas


previa los aplicación del facilitadores repetidas
encuestados cuestionario (Envío de cartas)

Fuente: Malhotra Naresh (2004: 354)

2.- Ajuste para la falta de respuesta- Métodos:

- Submuestreo de los no encuestados.- Se contacta una submuestra de los no


encuestados, en general mediante entrevistas telefónicas o personales. Esto a
menudo origina una alta tasa de respuesta dentro de una submuestra.

- Sustitución.- Se sustituye a las personas que no contestan por otros elementos del
marco de la muestra que se espera si contesten.

- Análisis de las tendencias.- El investigador trata de deducir una tendencia entre los
entrevistados iniciales y posteriores. Esta tendencia se proyecta a las personas que
no respondieron a fin de estimar su característica de interés.

- Ponderación.- Procedimiento estadístico que trata de tomar en cuenta la falta de


respuesta al asignar distintos valores ponderados a los datos, dependiendo de los
índices de respuesta.
160 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

- Imputación.- Se asigna la característica de interés a las personas que no


respondieron con base en la similitud de las variables disponibles tanto para las
personas que no respondieron como para quienes sí lo hicieron. Sin embargo, este
método es el menos aconsejable, dado que daría lugar a la manipulación subjetiva
de parte del investigador.

5.11.- Validación de la muestra

En una investigación de campo en el área empresarial, la validación se realiza tomando


como referencia tres aspectos:

1. Por parte de la supervisión llamando entre el 10 y el 25% de los encuestados para


verificar que las entrevistas se hayan realizado y con qué calidad se realizaron.

2. Comparando el parámetro poblacional y el estadístico de la muestra, para conocer


si el estadístico es un estimador insesgado, por ejemplo, comparando la media
poblacional con la media muestral si estos valores son iguales, entonces se dice
que la muestra es válida. Este método es poco práctico, generalmente en una
investigación se desconoce el parámetro poblacional, consecuentemente no será
posible comparar estos valores.

3. Calculando la varianza inicial y la varianza muestral. Ya en el capítulo 2, se mencionó


que uno de los pasos del proceso de diseño y ejecución del muestreo, consiste en
validar la muestra, este paso se realiza comparando la varianza inicial estimada en
forma anticipada y la varianza calculada después del muestreo, es decir:

Varianza Inicial anticipada Vs. Varianza calculada después del


muestreo

Esto se compara, ya sea de la varianza de variables cuantitativas o de variables


cuantitativas o atributos (proporciones).
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 161

Ejemplo de variable cuantitativa, retornando al caso del Rodeo Parrillada:

Datos

α = 95%
Z = 1,96 (dado un nivel de confianza del 95%)
S = 40 Bs/mes σ = 40 Varianza anticipada
e + 5 Bs/mes

a) Reemplazando en la fórmula con la Varianza anticipada se tiene:

(1,96)2 (40)2
n  245,86  246 familiasa muestrear
(5)2

b) Resultado de la investigación por muestreo S= 45 Bs/mes Varianza calculada


después del muestreo, se tiene un tamaño de muestra:

(1,96)2 (45)2
n  311,17  311
(5)2

Se deberían haber muestreado 311 familias en lugar de 246 que se realizó con la
varianza anticipada, esto puede ocurrir dado que los métodos de estimación de la
varianza anticipada como se ha dicho responde a métodos no probabilísticos, por lo
que pueden no ser insesgados. En este caso, la muestra no está validada, se considera
que la información es insuficiente y se debe aumentar la cantidad de encuestas hasta
llegar a 311 unidades.

Caso opuesto sería que el tamaño de muestra resulte ser menor, es decir, que se haya
desperdiciado recursos, por haber estimado un tamaño de muestra mayor. En tales
casos, se sugiere mantener la cantidad de unidades recogidas.
162 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

De manera similar debe realizarse la validación para datos cualitativos; es decir,


cuando el parámetro es una proporción la validación se lo hace comparando la
proporción de éxito inicial y la proporción de éxito después de recoger la muestra.

5.11.1.- El papel del nivel de confianza y del error de estimación en la


validación del tamaño de muestra.

Es importante en la estimación del tamaño de la muestra, analizar el papel del nivel


de confianza y del error de estimación.

Dado el nivel de confianza, como esa probabilidad que se asume en la estimación del
parámetro poblacional; se debe establecer el intervalo de confianza, para analizar la
amplitud y poder emitir un juicio de valor, es decir si se seleccionó un nivel de
confianza elevado, dará como consecuencia un intervalo de confianza amplio y
viceversa. La relación entre el nivel y el intervalo de confianza es directa.

El error de estimación tal como se mencionó, tiene una relación inversa con el tamaño
de muestra y a la vez influye en el intervalo de confianza de manera directa ya que si
se asume un error de estimación elevado dará como consecuencia un intervalo de
confianza amplio y viceversa.

5.12.- Árbol práctico para elegir la fórmula del tamaño de muestra

A manera de ilustración, a continuación presentamos un gráfico guía que ayuda a


seleccionar la fórmula adecuada considerando el parámetro pertinente, el tipo de
muestreo, la técnica de muestreo y el tipo de población.
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 163

Figura 5.5: Árbol práctico para elegir la fórmula del tamaño de muestra

Z2σ 2
Muestreo Población
Infinita
n
aleatorio e2
simple Z2  2 N
Población Finita n
e 2 ( N  1)  Z 2 2
Medias Utiliza la fórmula del
Sistemático Población finita Muestreo aleatorio simple

z 2 N Wh σ h
2

estratificado n
Población Finita e 2 (N  1)  Z 2  Wh σ h
2

Parámetro
pertinente Por conglomerados Utiliza la fórmula del
Población Finita Muestreo aleatorio simple

Muestreo Población Z 2 P(1 - P)


Infinita n
aleatorio e2
simple
Población Finita

Proporciones
Sistemático Población Finita Utiliza la fórmula del
Muestreo aleatorio simple

1
n 2
  h.h.Qh
estratificado Población Finita e
. 
Z
Utiliza la fórmula del
Por conglomerados Población Finita Muestreo aleatorio simple

Fuente: Elaboración propia

Como se observa el gráfico anterior, son seis las fórmulas del muestreo probabilístico,
aunque hay algo de ocho técnicas de muestreo dependiendo del parámetro a estimar.
Lo que quiere decir que el muestreo por conglomerados y el muestreo sistemático no
poseen fórmula propia para calcular el tamaño de muestra, más bien se apoyan
generalmente en las fórmulas del muestreo aleatorio simple.

La relación existente entre las técnicas de muestreo puede expresarse mediante la


siguiente figura
164 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

Figura: 5.6: Relación entre las técnicas de muestreo probabilísticas

MUESTREO
SISTEMÁTICO

MUESTREO
POR
CONGLOMERADOS
ALEATORIO
SIMPLE

MUESTREO
ESTRATIFICADO

Fuente: Elaboración propia

Relación entre:

 Muestreo aleatorio simple y muestreo estratificado.- El muestreo aleatorio


simple sirve al estratificado para seleccionar las unidades de muestreo, como así
también puede servir para determinar el tamaño de muestra si se opta por una
post- estratificación.

 Muestreo aleatorio simple y muestreo sistemático.- El muestreo aleatorio


simple se utiliza al aplicar el muestreo sistemático, primero en la determinación
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 165

del tamaño de la muestra, segundo, en la selección del punto de inicio de la


muestra sistemática a través de los números aleatorios.

 Muestreo aleatorio simple y muestreo por conglomerados.- El muestreo


aleatorio simple, sirve para determinar el tamaño de muestra del total de
conglomerados, como así también puede utilizarse en la selección de las unidades
de muestra dentro de cada conglomerado.

 Muestreo sistemático y muestreo estratificado.- Fundamentalmente el


sistemático sirve para seleccionar las unidades de muestra dentro de cada estrato.

 Muestreo sistemático y muestreo por conglomerados.- idéntico al anterior


caso; es decir sirve el muestreo sistemático en primer lugar, para seleccionar los
conglomerados, y en segundo lugar para seleccionar las unidades dentro de cada
conglomerado

5.13.- A manera de resumen: la relación de los elementos del tamaño de la


muestra y el valor de n

Para entender la relación que hay entre los componentes de la fórmula del tamaño
de la muestra en poblaciones finitas, a continuación se muestra en dos cuadros
hipotéticos como ejemplo de cálculo, primero para el caso de proporciones, luego
para el caso de medias.
166 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

Cuadro 5.1: Diferentes tamaños de muestra, dados un valor de n, p, e y un


nivel de confianza del 95% para el cual z toma 1,96

N P (Probabilidad de éxito) e
(Tamaño de la (error
población) 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 muestral)

500 437 462 471 474 475 474 471 462 437 0,01

1.000 464 606 669 698 706 698 669 606 464 0,02

10.000 370 639 823 929 964 929 823 639 370 0,03

20.000 214 377 492 560 583 560 492 377 214 0,04

50.000 138 245 321 366 381 366 321 245 138 0,05

200.000 96 169 222 253 263 253 222 169 96 0,06

500.000 70 125 164 187 195 187 164 125 70 0,07

1.000.000 54 96 126 144 150 144 126 96 54 0,08

10.000.000 43 76 100 114 119 114 100 76 43 0,09

Fuente: Elaboración propia

En este caso podemos observar por ejemplo, que para un tamaño de población N de
1.000 unidades, una probabilidad de éxito p 0,1 y un error e de 0,02 (2%) nos da un
tamaño de muestra n de 464 unidades muestrales. A medida que aumenta el tamaño
de e y de p el tamaño de muestra n disminuye, así tenemos que para un valor de N
1.000.000 una p de 0,8 y un e de 0,09 nos da un n de 76 unidades.
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 167

Cuadro 5.2: Diferentes tamaños de muestra dados un valor de n, σ, e y un


nivel de confianza del 95% para el cual z toma 1,96

σ (Desviación estándar poblacional, en unidades e


absolutas) (error
N muestral, en
(Tamaño de la unidades de
población) 1 2 6 10 15 20 30 50 100 la variable)

500 217 377 483 494 497 498 499 500 500 0,1

1.000 4 15 122 356 464 606 776 906 975 1

10.000 1 4 34 95 212 370 796 1936 4899 2

20.000 1 1 2 24 54 96 214 583 2144 4

50.000 1 1 1 4 9 15 35 96 381 10

200.000 1 1 1 1 2 4 9 24 96 20

500.000 1 1 1 1 1 1 1 4 15 50

1.000.000 1 1 1 1 1 1 1 1 4 100

10.000.000 1 1 1 1 1 1 1 1 1 500

Fuente: Elaboración propia

De manera similar, cuando estimamos el tamaño de la muestra para el caso de medias,


tenemos que para una población N de 1.000 unidades, una desviación estándar σ de
2 unidades, y un error e de 1 unidad, el tamaño de muestra n es de 15 unidades
muestrales. Mientras mayores sean los valores del error muestral e y de la σ, el
tamaño de muestra disminuye, así pues, para un N de 1.000.000 de unidades, una σ
de 100 unidades y un e de 100, el tamaño n es 4 unidades muestrales.
168 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

5.14.- Software para cálculo de tamaño de muestra

Existe software que ayuda al cálculo del tamaño de la muestra, aunque a criterio del
autor, son todavía incompletos, algunos que se encuentran en el mercado se
mencionan a continuación:

1. Posdem: Programa para Optimizar la Selección en el Diseño de Encuestas por


Muestreo véase: http://www.posdem.esy.es/(octubre 2015) a nuestro juicio es
uno de los programas más amplios, su potencialidad radica en la selección de
unidades muestrales, aunque limitado a 30.000 unidades.

Figura 5.7: Página principal del POSDEM

Fuente: Posdem.com
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 169

2. SOFTME: Software de Muestreo estadístico diseñado por José Loaiza Torres y


programado por Jhony Fernández Poma, este programa estándar de muestreo
permite seleccionar tipo de muestreo, técnica de muestreo probabilístico, calcular
el tamaño de muestra considerando parámetros y otras variables y finalmente
permite seleccionar unidades muestrales a través de números aleatorios y salto
sistemático. El programa ha sido elaborado en lenguaje Delphi.

Figura 5.8: Ventana principal del SOFTME

Fuente: Loaiza José, Fernández Jhony (2015).

3. Stats 2000: Un software estadístico, véase más detalles en http://stats-


2000.archivospc.com/ (octubre 2015).
170 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

Figura 5.9: Ventana del Stats 2000

Fuente: ww.contactplus.com

4. SurveyIM®(Software para investigación de mercados): Software que


permite diseñar, procesar encuestas con ciertas restricciones, y permite además
calcular el tamaño de muestra bajo la técnica de muestreo aleatorio simple para
estimar proporciones, tanto en poblaciones finitas como en infinitas. Este software
se distribuye conjuntamente con el libro de Mercadotecnia competitiva S.C.,
(espejo, Jorge, 2002)
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 171

Figura 5.10: Ventana del SourveyIM

Fuente: Espejo, Jorge (2002)

5. Tammuestralonline: Simulador que te permite obtener diferentes tamaños


de muestra, solo aplica muestreo aleatorio simple ya sea para medias o para
proporciones. Véase:
http://www.dccia.ua.es/~violeta/calculadoras/tammuestralonline.html (junio
2017)
172 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

Figura 5.11: Ventana de Tammuestralonline

Fuente: Migallon (2017)

6. Otros: MAS II, es un software que permite calcular el tamaño de la muestra para
estimar una media, además permite calcular un componente de la fórmula de n
conociendo los demás. STATA, software estadístico véase: <http://www.software-
shop.com/in.php?mod=ver_producto&prdID=392#fragment-1> (agosto2012).
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 173

5.15.- Preguntas y problemas

1. ¿Cómo se determina el tamaño de la muestra cuando la estimación se quiere para


más de una característica?

2. En estudios previos se determinó que 30% de los turistas que van a Punta Cana
a apostar durante un fin de semana, se gastaron más de 1.000 dólares. La
administración desea actualizar ese porcentaje.
a). Usando un grado de confianza de 0,90, la administración desea estimar el
porcentaje de turistas que gastan más de dólares 1.000 dentro de 1%. ¿Qué
tamaño de muestra debería emplearse?
b). La administración indicó que el tamaño de muestra que se sugirió en la parte
a es demasiado grande. Sugiera qué podría hacerse para reducir el tamaño
de muestra. Con base en su sugerencia, vuelva a calcular el tamaño de la
muestra.

3. Si la desviación estándar de la población es de 78, encuentre el tamaño de


muestra necesario para estimar la media real dentro de 50 puntos, para un nivel
de confianza de 95%.

4. Para un mercado de prueba, encuentre el tamaño de muestra necesario para


estimar la porción real de consumidores satisfechos con un cierto producto nuevo,
dentro de ±0,04 a un nivel de confianza de 90%. Suponga que no tiene una
buena idea del valor de la proporción.

5. Dada una población con una desviación estándar de 8,6, ¿qué tamaño de muestra
es necesario para estimar la media de la población dentro de ±0,5 con un nivel
de confianza de 99%?
174 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

6. Tenemos fuertes indicios de que la proporción de la población es


aproximadamente de 0,7. Encuentre el tamaño de muestra necesario para estimar
la proporción dentro de ±0,02 con un nivel de confianza de 90%.

7. La administración de la empresa Tajzara Textiles, recientemente ha sido atacada


por la prensa debido a los supuestos efectos de deterioro en la salud que ocasiona
su proceso de fabricación. Un sociólogo ha aventurado la teoría de que los
empleados que mueren de causas naturales muestran una remarcable
consistencia en la duración de su vida: Los límites superior e inferior de la duración
de su vida son de 580 y 520 respectivamente. Para un nivel de confianza de 95%,
¿qué tan grande debe ser la muestra, dentro de ±30 semanas, que deberá ser
examinada para encontrar la vida promedio de estos empleados?. Si la varianza
es de 900 y el tamaño de la población de 40.000.

8. Tiger, una tienda local, vende bolsas de plástico para basura y ha recibido unas
cuantas quejas con respecto a la resistencia de tales bolsas. Parece ser que las
bolsas que se venden en la tienda son menos resistentes que las que vende su
competidor y, en consecuencia, se rompen más a menudo. John C. Tiger, gerente
encargado de adquisiciones, está interesado en determinar el peso máximo
promedio que puede resistir una de las bolsas para basura sin que se rompa. Si
la desviación estándar del peso límite que puede aguantar una bolsa es de 1,2
kg, determine el número de bolsas que deben ser probadas con el fin de que el
señor Tiger tenga una certeza de 95% de que el peso límite promedio está dentro
de 0,5 Kg del promedio real.

9. Un curso de lectura rápida garantiza un cierto incremento en la rapidez de lectura


en dos días. El maestro conoce unas cuantas personas que no serán capaces de
lograr este aumento, de modo que, antes de anunciar el incremento en la
velocidad de lectura garantizado, desea tener una certeza de 98% de que el
porcentaje ha sido estimado dentro de ±4% del valor real. ¿Cuál es el tamaño de
muestra más conservador que se necesita para resolver este problema?
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 175

10. Ticks, una tienda local especializada en lámparas y relojes está interesada en
obtener una estimación de intervalo para el número medio de clientes que entran
a la tienda diariamente. Los dueños están razonablemente seguros de que la
desviación estándar real del número diario de clientes es 15. Ayude a Ticks a salir
de un bache, determinando el tamaño de muestra que deberá utilizar con el fin
de desarrollar un intervalo de confianza de 96% para el número medio real de
clientes, con un ancho de solamente ocho personas.

11. Se realizará un estudio de muestreo para determinar el ingreso familiar medio en


una región. La pregunta es, ¿cuántas familias deberán muestrearse? Para tener
más información sobre el área, se realizó un pequeño estudio piloto y se calculó
que la desviación estándar de la muestra es $500 (dólares). El patrocinador de la
investigación desea usar el coeficiente de confianza de 0,95. Además, si se
encuentra que el ingreso familiar medio es de, por ejemplo, $22.500, se podría
plantear una afirmación como ésta: "Estoy seguro que el ingreso familiar medio
de la población está en el intervalo entre $22.400 y $22.600". O si se sabe que la
media muestral es de, por ejemplo, $31.800, se plantearía con 95% de confianza
que la media poblacional está en el intervalo entre $31.700 y $31.900.

Con base en la información del estudio piloto y las condiciones del patrocinador,
¿cuántas familias deben ser entrevistadas?. Considere que existen 25.000 familias
y que el índice de incidencia es 0,95 y el de terminación de 0,80.

12. Se planea realizar una encuesta para determinar qué proporción de una fuerza
de trabajo tiene dos o más empleos. Se decide utilizar el coeficiente de confianza
de 0,95 y se determina que la proporción estimada debe estar entre más o menos
2% de la proporción poblacional. Un estudio piloto revela que 5 de los 50
trabajadores considerados tienen dos o más empleos. ¿Cuántos de los integrantes
de la fuerza laboral deben entrevistarse para cubrir los requisitos especificados?.
Si existen 5.000 trabajadores.
176 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra

13. El departamento de investigación de mercados de una empresa que fabrica


aparatos electrodomésticos diseño una encuesta. El objetivo general era evaluar
la satisfacción de los clientes con los lavavajillas de la empresa. Como parte de
ese objetivo general, los directivos querían medir los gastos anuales promedio de
mantenimiento por vivienda, el promedio de fallas o descomposturas por año y el
número de veces que se limpia el lavavajillas en un año. Se pretendía tener
confianza del 95% en los resultados. Además, la magnitud del error no debía
exceder de + $4 en los gastos de mantenimiento, + $1 en las fallas o
descomposturas y + $4 en el número de limpiezas. El departamento de
investigación señaló que, si bien en algunos hogares no había gastos de
mantenimiento en absoluto, en otros se gastaba hasta 120 dólares. Además,
mientras que algunos lavavajillas no sufrían fallas en un año dado, el número
máximo esperado no debía exceder de tres. Por último, al tiempo que algunos
clientes no limpiaban en absoluto el lavavajillas durante el año, otros la limpiaban
cada mes.

a) ¿Qué tan grande debe ser la muestra que recomiende si se consideran por
separado cada una de las tres variables? Detalle todos sus cálculos.
b) ¿Qué tamaño de muestra recomendaría en general, dado que los directivos
sienten que los gastos de reparaciones son los más importantes y que el
número de limpiezas es el dato cuya exactitud reviste menos trascendencia?
c) La encuesta indicó que los gastos promedio de mantenimiento fueron de 30
dólares, con desviación estándar de 15 dólares. Calcule el intervalo de
confianza del parámetro poblacional,  ¿Qué podría decirse acerca del grado

de precisión?

d) En base al valor de la desviación estándar del inciso c) calcule nuevamente el


tamaño de muestra, e indique si la muestra es válida.
CAPITULO 5: Estimación del tamaño de la muestra José Loaiza Torres 177

14. Un proveedor de energía eléctrica domiciliaria de una Ciudad inició recientemente


una campaña para motivar en sus clientes el consumo eficiente de energía. Los
directivos pretenden realizar una encuesta para evaluar la eficacia de la campaña
y determinar la proporción de personas que ha adoptado las medidas
recomendadas de ahorro de energía.

a) ¿Qué tamaño de muestra recomendaría si el error no debe exceder de + 2


puntos porcentuales y el intervalo de confianza debe ser de 90%? Muestre sus
cálculos.

b) La encuesta indicó que la proporción que adoptó las medidas fue 40%. Estime
el intervalo de confianza de 90%. Comente el nivel de precisión y muestre sus
cálculos.

c) ¿Podría decirse que la muestra está validada?

15. Un empresario quiere invertir su capital en una fábrica de lácteos para lo cual
requiere la investigación de mercado que sustente dicha decisión. Como la
población es demasiado grande consistente en 18.000 familias; sería muy costoso
estudiar a todas, por tanto se hace necesario seleccionar una muestra. No se
cuenta con el dato de la varianza y se procede a aplicar una muestra piloto para
conocer el valor de la misma; la pregunta que se realizó a 10 familias fue sobre
la cantidad de consumo de leche por mes expresado en litros/familia, los datos
resultantes fueron: 2, 1, 3, 8, 7, 4, 5, 1, 2, 6.
a) ¿Cuántas familias se tendrá que muestrear para obtener toda la información
necesaria? Si la estimación no debe tener un error de más de 0,25 litros del
promedio de la población, con un nivel de confianza del 95%.
b) Luego de obtener los datos se calculó la varianza muestral cuyo valor resultó
en 5,5 litros. ¿Qué podría decirse acerca del error muestral? ¿Es la muestra
válida?
178 José Loaiza Torres CAPITULO 5: Estimación del tamaño de la muestra
CAPÍTULO 6
MUESTREO ALEATORIO
ESTRATIFICADO
6.1.- Concepto
6.2.- Razones para la estratificación
6.3.- Notación
6.4.- Determinación del tamaño de muestra
6.4.1.- Asignación proporcional al tamaño del estrato:
6.4.2.- Asignación proporcional al tamaño de las varianzas
6.4.3.- Asignar en forma igualitaria y luego ponderar los resultados de la encuesta.
6.4.4.- Asignación óptima
6.5.- Propiedades de las estimaciones
6.6.- Límites de confianza
6.7.- Muestreo estratificado para proporciones
6.8.- Otros aspectos del muestreo estratificado
6.9.- Criterios para aplicar el muestreo aleatorio estratificado
6.10.- Preguntas y problemas
180 José Loaiza Torres CAPITULO 6: Muestreo aleatorio Estratificado
MAPA CONCEPTUAL

CAPÍTULO 6: MUESTREO ALEATORIO ESTRATIFICADO

COMPETENCIA QUE SE PRETENDE LOGRAR: DISEÑA LA SELECCIÓN DE UNA


MUESTRA ESTRATIFICADA, CONSIDERANDO LAS VARIABLES QUE LIMITAN Y
DEFINEN SU APLICACIÓN

Muestreo probabilístico

Deducir

Muestreo Aleatorio Estratificado

Analizar Clasificar: Métodos de


tamaño de muestra

1.- Base teórica 2.- Razones 4.- Para proporciones


3.- Para medias
para estratificar

Relacionar
1-2-3-4

Deducir Deducir

5.- Procedimiento para seleccionar la Relacionar 6.- Fórmula y procedimiento de


muestra estratificada cálculo de tamaño de muestra

Relacionar
5-6

Diseñar
LA SELECCIÓN DE UNA MUESTRA
ALEATORIA ESTRATIFICADA

Fuente: Elaboración propia


182 José Loaiza Torres CAPITULO 6: Muestreo aleatorio Estratificado
CAPITULO 6: Muestreo aleatorio Estratificado José Loaiza Torres 183

CAPÍTULO 6

MUESTREO ALEATORIO ESTRATIFICADO

6.1.- Concepto

Una población se divide primero en subgrupos, denominados estratos, y se selecciona


una muestra de cada estrato (Mason y Lind, 1995).

Al respecto Cochran(1995) dice:


En el muestreo estratificado, la población de N unidades se divide primero en
subpoblaciones de N1, N2,................NL unidades, respectivamente. Estas
subpoblaciones, no se traslapan en su conjunto comprenden a toda la población, por
lo tanto, N1 + N2 + ...........+NL = N. Las subpoblaciones se denominan estratos.

En consecuencia, podemos decir que el muestreo estratificado divide a la población


en grupos relativamente homogéneos dentro de cada grupo pero diferentes entre
grupos, de acuerdo a la característica que se estudia, luego se selecciona una muestra
de cada estrato para conformar la muestra global.

El punto crítico de este muestreo, es elegir las variables de estratificación que pueden
ser las siguientes:
- Edad
- Ingresos
- Sexo
- Estado civil
- Volumen de consumo
- Gastos
- Conocimiento de la marca
- Etc.
184 José Loaiza Torres CAPITULO 6: Muestreo aleatorio Estratificado

Con base de la elección de la variable de estratificación, se define los grupos y el


tamaño de los mismos. Siendo una característica de cualquier estratificación, que una
unidad muestral debe pertenecer solamente y únicamente a un estrato.

6.2.- Razones para la estratificación

Si se toma una muestra aleatoria simple en cada estrato, el procedimiento total se


describe como un muestreo aleatorio estratificado. La estratificación es una técnica
común. Para esto hay muchas razones; las principales son las siguientes (Cochran,
1995).

1. Si los datos deseados deben tener una precisión conocida en algunas


subdivisiones de la población, es aconsejable tratar cada subdivisión como una
"población" por derecho propio.
2. Por conveniencia administrativa, puede ser necesario el uso de la estratificación;
así, por ejemplo, la agencia que realiza una encuesta, podría tener sucursales en
el campo, cada una de las cuales supervisará la encuesta de una parte de la
población.
3. Los problemas de muestreo pueden tener marcadas diferencias en diversas partes
de la población. Con poblaciones humanas, las personas que viven en
instituciones (como hoteles, hospitales, cárceles) se colocan en un estrato
diferente de las que viven en casas ordinarias, ya que otro método de muestreo
es el apropiado para cada una de estas dos situaciones. Al muestrear negocios,
podríamos tener una lista de las grandes firmas que se deben colocar en un
estrato diferente. Quizá algún tipo de muestreo por áreas debe usarse para las
firmas más pequeñas.
4. La estratificación puede dar lugar a una ganancia en precisión de las estimaciones
de características de la población total. Quizá sea posible dividir una población
heterogénea en subpoblaciones, en las que cada una sea internamente
homogénea. Esto es lo que sugiere el nombre de estratos, con su implicación de
una división en capas. Si cada estrato es homogéneo, en cuanto a que las medidas
CAPITULO 6: Muestreo aleatorio Estratificado José Loaiza Torres 185

varíen ligeramente de una unidad a otra, una estimación precisa de cualquier


media de estrato se puede obtener a partir de una pequeña muestra en dicho
estrato. Y posteriormente podrán combinarse estas estimaciones en una
estimación precisa para toda población.

6.3.- Notación

La simbología a utilizar es la siguiente:

N = Número total de unidades de la población.

h = Estrato correspondiente.

Nh = Número total de unidades (o tamaño de población de cada estrato).

n = Número de unidades en la muestra(o tamaño de la muestra global).

nh = Número de unidades en la muestra de cada estrato.

Xh = Valor obtenido para la i-ésima unidad dentro del estrato.

Wh = Ponderación o peso del estrato = Nh/N

f = nh/Nh (fracción de muestreo en el estrato h).

6.4.- Determinación del tamaño de muestra

Para la determinación del tamaño de la muestra en el muestreo estratificado, se


requiere conocer los siguientes componentes:
- El nivel de confianza
- El error asumido o nivel de precisión
186 José Loaiza Torres CAPITULO 6: Muestreo aleatorio Estratificado

- La varianza estimada de cada estrato, para esto se pueden aplicar los mismos
métodos que se explicaron el capítulo anterior.

Si la estimación es para medias, las fórmulas son:

Según Cochran(1995)

2 2
Wh σ h
 W
n 2 h
(1)
e 1
  Wh σ h
2
2
Z N

Donde:

Wh = Nh/N
e = Error de estimación o nivel de precisión.
Z = Unidades estándar (dado un nivel de confianza)
N = Tamaño de la población total
σ 2 h = Varianza de cada estrato

Según Jany(2005), distingue dos fórmulas:

1. Si el muestreo estratificado es con afijación proporcional.

- Si la población es finita.

z 2 N Wh σ h
2

n
e 2 (N  1)  Z 2  Wh σ h
2 (2)
CAPITULO 6: Muestreo aleatorio Estratificado José Loaiza Torres 187

Donde:

n = Tamaño de la muestra.
Wh = Peso relativo del estrato h.
Wh = Nh/N.
σ2h = Varianza del estrato h.
Z = Margen de confiabilidad en la curva normal.
e = Error de estimación.
N = Población o universo.
(N-1) = Factor de corrección por finitud.

- Si la población es infinita.

W σ
2

n
h h
(3)
W σ
2
e2

h h

Z2 N

Como se observa esta fórmula es idéntica a la fórmula (1)

2. Si el muestreo estratificado es con afijación óptima

- Para población finita

z 2 N( Wh σ h ) 2
n
e 2 (N  1)  Z 2  Wh σ h
2

(4)
188 José Loaiza Torres CAPITULO 6: Muestreo aleatorio Estratificado

- Para población infinita:

( Wh σ h )
2

n
W (5)
2 2
e2 σh

h

Z2 N

Consecuentemente, consideramos que las fórmulas dadas anteriormente se deben


tomar con cuidado, ya que su aplicación irracional podría conducir a tamaños de
muestras erróneos, pues la ecuación (1) para poblaciones finitas es igual a la ecuación
(3) para poblaciones infinitas; por tanto en su resultado tendrán variación. Asimismo
el autor Jany toma como población infinita si la fracción muestral es significativa,
entonces se debe hacer el ajuste del tamaño de muestra.

En el presente texto se tomará como ecuaciones básicas la ecuación (1) y la ecuación


(2), por cuanto ambas ecuaciones son para poblaciones finitas, si bien, muestran
diferencias en términos de resultados, tales diferencias no son significativas como se
muestra en el siguiente ejemplo:

Ejemplo:

La comercializadora Márquez, en la semana santa del año 2017 desea diseñar una
muestra, para estimar el consumo medio de pescado en una Ciudad. Para tal efecto
se dispuso de la siguiente información:
N1= Clase de ingresos altos = 6.230 familias
N2= Clase de ingresos medios = 14.965
N3= Clase de ingresos bajos = 9.255

Las varianzas poblacionales fueron:

σ21= 8,25 σ22 = 9,40 σ23= 15,20


CAPITULO 6: Muestreo aleatorio Estratificado José Loaiza Torres 189

Se quiere un error no más de 0,175 gramos.

a) Determine el tamaño de muestra y realice la asignación proporcional.


b) Luego de realizar el trabajo de campo, se calculó las siguientes varianzas:

S21= 8.95 S22 = 6,40 S 21= 19,10

Con estos datos, ¿se podría decir que la muestra obtenida en el inciso a) es
representativa?,

Cuadro 6.1: Datos para el cálculo del tamaño de la muestra estratificada


para medias

Estrato Nh σ2 Wh Wh2 Wh2σ2 Whσ2


1 6.230 8,25 0,2046 0,04186116 0,3454 1,69
2 14.965 9,40 0,4915 0,24157225 2,2708 4,62
3 9.255 15,20 0,3039 0,09235521 1,4038 4,62
Total 4,0199 10,93
Fuente: Elaboración propia

Reemplazando en la ecuación (1) se tiene:

10,93
n 2
(0,175) 1 =1.311,98 =1.312 familias se debe muestrear o
2
 10,93
(1,96) 30.450 seleccionar

Reemplazando en la ecuación (2) se tiene:

(1,96) 2 30.450(10,93)
n
(0,175) 2 (30.450  1)  (1,96) 2 (10,93)
=1.312,02 = 1312 familias a
seleccionar
190 José Loaiza Torres CAPITULO 6: Muestreo aleatorio Estratificado

Como se observa, la diferencia es mínima; estadística y económicamente la diferencia


no es significativa ya que al final de cuentas se debe realizar la misma cantidad de
encuestas en ambos casos; por tanto, cualquiera de los dos resultados se puede tomar
como válido.

Una vez determinado el tamaño de muestra global, el siguiente paso es determinar el


tamaño de muestra por estrato, para ello existen cuatro métodos, que se explica a
continuación.

6.4.1.- Asignación proporcional al tamaño del estrato

Esta forma toma el principio de que aquel estrato que es más grande también debe
participar con mayor cantidad de elementos en la muestra global; se calcula de la
siguiente manera:

Nh
nh  n( )
N
Reemplazando:
6.230
Estrato 1 = nh  1312( ) = 268 Familias
30.450

Estrato 2 = 645 familias

Estrato 3 = 399 familias

De manera que, la suma de los nh debe ser iguala n en este caso sería
268+645+399=1312.
CAPITULO 6: Muestreo aleatorio Estratificado José Loaiza Torres 191

6.4.2.- Asignación proporcional al tamaño de las varianzas

Aquí se toma en cuenta ya no el tamaño del estrato sino la variabilidad dentro de cada
estrato, es decir, aquel estrato que tiene mayor varianza debe participar con mayor
cantidad de elementos en la muestra, y de esta manera garantizar la
representatividad. Se calcula de la siguiente manera:

2
σh
nh  n( )
σ

Donde:

σ h = Varianza de cada estrato


2

σ = Es la suma de las varianzas de los estratos

Reemplazando en el ejemplo:

8,25
nh  1.312( )
Estrato 1 = 32,85 329 familias

Estrato 2 = 375 familias

Estrato 3 = 607 familias

De igual manera la suma de los nh debe ser siempre igual a n

6.4.3.- Asignación en forma igualitaria y ponderación de los resultados.

nh = n/ Nº de estratos

Estrato 1 = 1312/3 = 437 igualmente para el estrato 2 y el estrato 3.


192 José Loaiza Torres CAPITULO 6: Muestreo aleatorio Estratificado

6.4.4.- Asignación óptima

En esta variedad, podemos obtener el error muestral más pequeño posible aplicando
la fórmula de la asignación óptima del tamaño de la muestra total Weiers(1986):

nN A σ A
nA 
(N A σ A  N B σ B  ........................)

Donde:

nA = Tamaño óptimo de la muestra que se extrae del estrato A (o el estrato 1)


n = Tamaño total de la muestra
NA = Número de elementos en el estrato A
σ A = Desviación estándar de los elementos en el estrato A
NB = Número de elementos en el estrato B
σ B = Desviación estándar de los elementos en el estrato B
Reemplazando en el ejemplo de la comercializadora Márquez, se tiene:

1312(6.230x2,87)
Estrato 1: n A  =234,92=235 familias
(6.230x2,87)  (14.965x 3,066)  ( 9.255x3,90)

1312(14.965x3,066)
Estrato 2: nB  = 602,84 = 603
(6.230x2,87)  (14.965x 3,066)  ( 9.255x3,90)

1312(9.255 x3,90)
Estrato 3: n C  = 474,19 = 474
(6.230x2,87)  (14.965x 3,066)  ( 9.255x3,90)

Si sumamos los tamaños de muestra de cada estrato obtendremos el valor de n


CAPITULO 6: Muestreo aleatorio Estratificado José Loaiza Torres 193

n = nA + nB + nC
1312 = 235 + 603 + 474
1312 = 1312

Una vez determinado el tamaño de muestra total y por estratos, el siguiente paso es
escoger las unidades muestrales, para lo cual se puede utilizar dos procedimientos:

- Los números aleatorios, que se utiliza en el muestreo aleatorio simple. Dependerá


de si las unidades están desordenadas de acuerdo a su magnitud.
- El salto sistemático, del muestreo sistemático. Solo si las unidades están ordenadas
de acuerdo a su magnitud.

6.5.- Propiedades de las estimaciones

En este punto de lo que se trata es de realizar estimaciones de las medias y las


varianzas tanto poblacionales como muestrales.

- Media poblacional estratificada estimada

μ st 
N μ
h h

Donde:
μ st = Media poblacional estratificada estimada

μ h = Media poblacional del estrato h


N h = Tamaño población del estrato h
N = Tamaño población total
194 José Loaiza Torres CAPITULO 6: Muestreo aleatorio Estratificado

- Media muestral estratificada

X
n h xh
n

Donde:

X = Media muestral estratificada


nh = Tamaño de muestra de cada estrato

X h = Media muestral de cada estrato = Σ Xh / nh


n = Tamaño de muestra global

- Media poblacional de cada estrato

μh 
 Xh
N

- Varianza estimada estratificada poblacional

1 σ 2h
σ 2
st  2
N
 Nh (Nh  nh ) n
h

Cada símbolo ya se conoce

- Varianza muestral de cada estrato

S 2

 (X h - Xh )2
nh  1
CAPITULO 6: Muestreo aleatorio Estratificado José Loaiza Torres 195

- Total Poblacional estimado

ˆ  Nμ
X st

6.6.- Límites de confianza

La estimación por intervalos de confianza se realiza tanto para medias como para
totales:

- Intervalo para medias

μst  Z S ( Xst)

Donde:

L L 2 2 2
W S WS
S ( Xst)   h h -  h h
2
sacando la raíz cuadrada se obtiene S ( Xst)
h 1 nh h 1 N

- Total poblacional

Nμst  ZN S ( Xst)

Ejemplo:

Una población consta de 200 habitantes con un ingreso medio estratificado de 280
Dólares y una varianza de la distribución muestral de la media estratificada de 120
Dólares. A un nivel de confianza del 95% encuentre los límites para la media y el total.
196 José Loaiza Torres CAPITULO 6: Muestreo aleatorio Estratificado

Solución:

Datos

μ st = 280 Dólares.

σ st = 10,95 resulta de sacar la raíz cuadrada de 120 que es la varianza


Z = 1,96 (dado un nivel de confianza del 95%)

- Para medias

301,41 Dólares es el límite superior

280  (1,96)(10,95)
258,54 Dólares es el límite inferior

Lo que quiere decir que el ingreso medio puede encontrarse entre 258,4 Dólares y
301,41 Dólares, con un nivel de confianza del 95%.

- Para total

60.282 Dólares es el límite superior

(200)(280) (1,96)(200)(10,95)
51.708 Dólares es el límite inferior

En este caso el ingreso total o producto total del grupo de 200 habitantes puede
encontrarse entre 51.708 Dólares y 60.282 Dólares, con un nivel de confianza del
95%.
CAPITULO 6: Muestreo aleatorio Estratificado José Loaiza Torres 197

6.7.- Muestreo estratificado para proporciones

Si queremos estimar la proporción de unidades en la población que pertenecen a una


clase definida C, la estratificación ideal se obtiene si colocamos en el primer estrato
toda unidad que pertenezca a C y en el segundo toda unidad que no pertenezca a C.
Si esto falla, tratamos de construir estratos tales que la proporción en la clase C varíe
tanto como sea posible de estrato a estrato Cochran (1995).

La notación que se utiliza es la siguiente:

- Proporción de unidades de éxito en el k-ésimo estrato.

Población Muestra
Ah ah
Ph  ph 
Nh nh
- Proporción estimada de la población

NhPh
Pst  
N
- Varianza estimada proporcional

1 N 2 h (N h - n h ) Ph Q h
σ 2 st 
N2
 N 1 nh
h

- Varianza para cada estrato


Poblacional Muestral

Nh nh
σ2h  Ph Q h S2 h  ph qh
Nh -1 n h -1
198 José Loaiza Torres CAPITULO 6: Muestreo aleatorio Estratificado

- Total estimado

Poblacional Muestral

  N P â  n p

- Estimación del tamaño de muestra con proporciones

Las fórmulas pueden deducirse de las más generales. Sea V la varianza deseada en la
estimación de la proporción P en la población total. Las fórmulas para los dos tipos
principales de asignación son las siguientes:

no 
W p h h qh
, n
no
V n
1 o
N
Donde no es la primera aproximación, y n es el valor corregido tomando en
consideración la fracción muestral. En el desarrollo de estas fórmulas, los factores
Nh/(Nh –1) se han considerado como la unidad.

Se supone que la estimación se ha especificado con varianza V. Si en lugar de ello, se


especifica el margen de error e, V =(e/z)donde Z es el desvío correspondiente a la
probabilidad que podemos conceder que el error exceda el margen deseado. En
definitiva la fórmula queda de la siguiente manera:

1
n 2
  h.h.Qh
e
. 
Z
CAPITULO 6: Muestreo aleatorio Estratificado José Loaiza Torres 199

Donde:
n = Tamaño de la muestra total o global
N = Tamaño de la población total
Nh = Tamaño de la población del estrato h
Ph = Probabilidad de éxito en el estrato h
Qh = probabilidad de fracaso en el estrato h
Z = Margen de confiabilidad en la curva normal
e = Error de estimación

Luego se debe calcular el tamaño de muestra en cada estrato; para esto se puede
utilizar ya sea el método de asignación proporcional o el de asignación igualitaria.

Ejemplo:

La empresa Transporte “El Chapaco”, con el propósito de mejorar su desempeño


y aumentar la satisfacción de sus clientes quiere determinar el nivel de servicio
ofertado y el grado de satisfacción de los clientes actuales y usuarios de otras
empresas de la competencia (clientes potenciales). Para lo cual ha definido la siguiente
población:

Unidades de análisis: Clientes de la empresa (149 clientes, considerando solo


en el periodo de tiempo de enero a Junio de 2016) y Potenciales clientes (72
clientes potenciales)
Elemento de estudio: Cliente (el que contrata el servicio)
Extensión: Ciudad de Tarija
Tiempo: Mes de Octubre de 2016.
Parámetros de medición: Determinar el porcentaje de clientes que se encuentran
satisfechos con el servicio actual de nuestra empresa, e insatisfechos con el servicio
de la competencia.
200 José Loaiza Torres CAPITULO 6: Muestreo aleatorio Estratificado

¿Cuál será el tamaño de muestra requerido?

Solución:

Datos recolectados

P1 = 0,60 (porcentaje de clientes actuales que asignan al servicio de regular, pésimo


y malo, de acuerdo a una encuesta aplicada)
Q1 = 0,40 (porcentaje de clientes actuales que asignan al servicio de Muy Bueno,
Bueno, en base a una encuesta)
P2 = 0,47 (porcentaje de clientes potenciales que se sienten insatisfechos, no
satisfechos y regularmente satisfechos con el servicio ofertado en base a una
encuesta)
Q2 = 0,53 (porcentaje de clientes potenciales que se sienten Satisfechos y muy
satisfechos con el servicio de acuerdo a una encuesta)
e = 0,10
Z = 1,96 dado un 95% de confianza

Reemplazando en la fórmula se tiene:

1
n 2
  (149 x0,60 x0,40)  (72 x0,47 x0,53)  75,26  75encuestas
 0,10 
221. 
 1,96 

Luego se debe calcular el tamaño de muestra en cada estrato; para esto se puede
utilizar el método de asignación proporcional o el de asignación igualitaria, ambos
casos se estudió anteriormente.

6.8.- Otros aspectos del muestreo estratificado

Se refiere a algunos aspectos que se deben tomar en cuenta a la hora de utilizar el


muestreo estratificado.
CAPITULO 6: Muestreo aleatorio Estratificado José Loaiza Torres 201

1.- El problema de la asignación óptima con más de una característica

Dado que generalmente, la mejor asignación para una característica no será la mejor
para otra, debe llegarse a algún compromiso en un reconocimiento con características
numerosas.

El primer paso es reducir las características consideradas en la asignación a un número


relativamente pequeño donde se consideran las más importantes. Si se dispone de
buenos datos anteriores, podemos entonces calcular la asignación óptima para cada
característica separadamente y ver hasta qué punto existe desacuerdo.

En una encuesta de un tipo especializado las correlaciones entre las características


pueden ser altas y las asignaciones pueden diferir relativamente poco.

Por ejemplo, en una encuesta de explotaciones lechera en fincas, las tres


características de mayor interés son el número de vacas ordeñadas por día, el número
de galones de leche por día y los ingresos totales anuales por productos lácteos.
En estos casos, puede optarse por una de las dos alternativas siguientes:

a) Elegir la características base o más amplia, y calcular el valor de n en base a esa


característica.
b) Calcular el tamaño de muestra para cada característica y calcular el promedio de
los n, o también tomar el n más grande si están disponibles los recursos.

2.- La construcción de los estratos

Este es uno de los aspectos más críticos del muestreo estratificado, y debemos
responder varias preguntas: ¿Cuál es la mejor característica para la construcción de
los estratos?. ¿Cómo se determinan los límites entre cada estrato? ¿Cuántos estratos
debería haber?. Son preguntas que no son fáciles de responder, pero que a la hora
de la verdad, debemos resolver seleccionando una sola característica o variable en
202 José Loaiza Torres CAPITULO 6: Muestreo aleatorio Estratificado

función al tema que se investiga, los objetivos, las características de la población entre
otros factores.

Recordemos que se usa el muestreo estratificado, cuando cada grupo tiene pequeñas
variaciones por dentro, pero hay una gran variación entre grupos.

3.- El número de estratos

Es otro aspecto sobre el cual se debe decidir, no existe una regla que ayude a
determinar el número óptimo de estratos que se debe construir; por tanto se debe
tratar de construir por criterio y llegar al número de estratos de tal manera que se
minimice el error estándar y permita manejar de mejor manera los grupos o
segmentos a estudiar.

4.- Post estratificación

En casos de que no es posible hacer una estratificación antes de recopilar los datos,
entonces se puede ir por una post estratificación.

Se realiza con algunas variables adecuadas para la estratificación, el estrato al que


pertenece una unidad no se conoce sino hasta después de recoger los datos. Por
ejemplo edad, sexo, estatura, nivel de educación.

Si bien, se puede tener datos en las estadísticas oficiales, pero las unidades se pueden
clasificar en estratos después de conocer los datos de la muestra.

El procedimiento consiste en:

1º Tomar n mediante el muestreo aleatorio simple


CAPITULO 6: Muestreo aleatorio Estratificado José Loaiza Torres 203

2º Después de recoger los datos clasificar las unidades de acuerdo a las variables de
estratificación.

3º procesar de acuerdo al muestreo estratificado.

6.9.- Criterios para aplicar el muestreo aleatorio estratificado

A manera de conclusión, proporcionamos algunos criterios para saber cuándo se debe


aplicar el muestreo aleatorio estratificado, que a nuestro juicio influye los siguientes
factores o variables:

 Los objetivos de la investigación


 Marco muestral
 La población
 Características de las unidades de la población

1) Objetivos de la investigación: Específicos o por segmentos, es decir si


los objetivos de la investigación son específicos, por grupos o segmentos
determinados, entonces se puede aplicar el muestreo aleatorio estratificado.

2) Marco muestral: Listado, si se tiene un marco muestral ideal, facilitará la


aplicación de esta técnica de muestreo probabilística; caso contrario, no podría
aplicarse debido a que no se sabría el límite de cada estrato.

3) La población: Si está conformada por un Grupo heterogéneo, en


cuanto al parámetro que se desea estimar; pero es susceptible de dividir en
grupos de manera tal, que cada grupo es homogéneo por dentro y
heterogéneo por fuera o entre grupos. En este caso si se puede aplicar el
muestreo estratificado.
204 José Loaiza Torres CAPITULO 6: Muestreo aleatorio Estratificado

4) Características de las unidades de la población: Indiferente, pueden


estar ordenadas o desordenadas. Puesto que se puede utilizar tanto la
aleatoriedad como el salto sistemático en la selección de las unidades
muestrales.

6.10.- Preguntas y problemas

1. Indique, ¿cuáles son las razones por las que se hace una estratificación?

2. En una cadena de centros comerciales, trabajan 150 personas en departamento de


recursos humanos, 450 en el departamento de marketing, 200 en el de contabilidad
y 100 en el de atención al cliente. Con el objetivo de realizar una encuesta laboral,
se desea seleccionar una muestra de 180 trabajadores.
a) ¿Qué tipo de muestreo se debe emplear para que en la muestra estén
representados todos los departamentos?
b) ¿Qué número de trabajadores de cada departamento habrá en la muestra?
Justifique sus respuestas

3. ¿Qué variable (o variables) de estratificación utilizaría para cada una de las


siguientes situaciones?
a) Una encuesta política para estimar el porcentaje de votantes registrados en el
departamento de Tarija-Bolivia que aprobarían el trabajo realizado por el
Gobernador.
b) Una encuesta telefónica realizada por alumnos de la universidad donde usted
estudia, tiene como objetivo estimar la cantidad total de dinero que los
estudiantes gastan en libros.
c) Una encuesta de pescadores que visitan un lago de agua dulce, para saber
cuáles son las especies de peces preferidas.
d) Una muestra del horario estelar de los programas de televisión (lunes a sábado,
de 7 a 10 p.m. y domingo de 6 a 10 p.m.), para estimar el número promedio
de spots publicitarios por hora de transmisión.
CAPITULO 6: Muestreo aleatorio Estratificado José Loaiza Torres 205

4. Suponga que una ciudad tiene 90.000 viviendas, de las cuales 35.000 son casas,
45.000 son departamentos y 10.000 son condominios. Usted piensa que el uso
promedio de la electricidad es casi el doble en las casas que en los departamentos
o condominios y que la desviación estándar es proporcional a la media.

a) ¿Cómo distribuir una muestra de 900 observaciones si desea estimar el consumo


promedio de electricidad de todas las familias en la Ciudad?
b) Ahora suponga que quiere estimar la proporción global de las familias en donde
se practica el ahorro de energía. Usted tiene fuertes razones para creer que el
45% de las viviendas usan cierto tipo de ahorro de energía y que los
porcentajes correspondientes son de 25% para viviendas tipo departamentos
y 3% para viviendas tipo condominios, ¿Cuál sería la ventaja de la distribución
proporcional sobre el muestreo aleatorio simple?.

5. Una encuesta con tres estratos se ha planeado para estimar el porcentaje de


familias que tienen cuentas de ahorros en el Banco. Los siguientes son estimaciones
de los porcentajes ph, Wh, con una variabilidad deseada en la estimación P de 5%,
estime el tamaño de muestra aproximada y final, como así también la asignación
por estratos. La población total es de 25.000

Cuadro 6.2: Familias con cuentas de ahorro


ESTRATO Wh(%) Ph(%) psh(%) Donde:
1 60 20 25 Ph = Proporción poblacional del
2 30 40 35
estrato h
3 10 70 85
Fuente: Elaboración propia Psh = Proporción muestral del
estrato h, luego de recoger la
muestra.

Finalmente, ¿es posible concluir que la muestra es representativa?

6. Suponiendo que se quiere encontrar el número promedio de miembros por familia,


se ha clasificado a la población en 4 estratos de acuerdo al siguiente cuadro:
206 José Loaiza Torres CAPITULO 6: Muestreo aleatorio Estratificado

Cuadro 6.3: Familias por estratos


ESTRATO Tamaño del Varianza
estrato
(Familias)
1 1190 2,5
2 593 0,5
3 215 1,2
4 98 2,0
Fuente: Elaboración propia
Con una cuota de error de estimación de 0,5. Estime el tamaño de muestra y realice
la asignación por estratos.

7. Una universidad, está interesada en saber la proporción de estudiantes que


ingresaran a sus distintas facultades para el año 2018; con este objetivo ha dividido
en 6 estratos a los 196 colegios existentes en esa ciudad como también ha obtenido
el número de bachilleres que saldrán por colegio y estrato. Se sabe el número
promedio de alumnos por estrato en años anteriores que ingresaron a esta
universidad. La información se resume en el siguiente cuadro.

Cuadro 6.4: Número de bachilleres según colegios

Estrato Nº de Nº de Nº de bachilleres años anteriores


colegios bachilleres Si ingresaron No Total
potenciales ingresaron
1 14 700 150 450 600
2 16 800 75 675 750
3 28 1400 65 1235 1300
4 40 2000 585 1365 1950
5 75 3750 740 2960 3700
6 23 1150 315 735 1050
196 9800 1930 7420 9350
Fuente: Elaboración propia

Se pide:
c) Determinar el tamaño de muestra con una varianza deseada de estimación de
la proporción de estudiantes que ingresarán a esta universidad.
d) Realizar la asignación proporcional para cada estrato.
CAPITULO 6: Muestreo aleatorio Estratificado José Loaiza Torres 207

8. El gerente de una empresa quiere realizar un análisis estadístico del salario que
ganan sus empleados, con la finalidad de tener bases para establecer la política
salarial. Para esto ha dividido en tres estratos (nivel estratégico, nivel intermedio
y nivel operativo) a los 225 empleados que tiene bajo su mando y se registra los
siguientes valores en $us.
Cuadro 6.5: salario por niveles de la organización
Estratégico($us) Intermedio($us) Operativo($us)
900 1200 650 200 295 450 150
1100 1000 590 180 320 250 280
950 900 700 300 250 220 270
1200 1000 680 450 295 200 150
900 1100 720 250 320 180 280
1000 950 610 220 250 300 270
1100 1200 580 150 200 450 190
950 1000 650 280 180 250 310
1200 900 590 270 300 220 320
1000 1100 700 190 450 150 285
900 950 680 310 250 280 200
1100 1200 720 320 220 270 180
950 1000 610 285 150 190 300
1200 900 580 200 280 310 450
1000 680 180 270 320 450
900 720 300 190 285 250
1100 610 450 310 315 220
950 580 250 320 350 150
1200 650 220 285 225 280
1000 590 150 315 240 270
900 700 280 350 200 190
1100 680 270 225 260 310
950 520 190 240 305 320
1200 610 310 200 215 285
1000 580 320 260 201 200
900 650 285 305 450 180
1100 590 315 215 250 300
950 700 350 201 220 450
1200 680 225 450 150 305
1000 580 240 250 280 215
900 720 200 220 270 201
1100 610 260 150 190 450
950 580 305 280 310 250
1200 550 215 270 320 220
1000 605 201 190 285 150
Fuente: Elaboración propia
208 José Loaiza Torres CAPITULO 6: Muestreo aleatorio Estratificado

a) Calcular el tamaño de la muestra, con un error de 60 y realizar la asignación


por estratos.
b) Calcular la media poblacional de cada estrato
c) Estimar la media de la población
d) Estimar la varianza de la población
e) Estimar la masa salarial de toda la empresa
f) Encontrar los límites de confianza al 95%.

9. El número de habitantes (en miles) en 64 grandes ciudades del país, se colocó en


2 estratos, el primero que contiene las 16 ciudades más grandes y el segundo las
48 restantes. La información se muestra en la siguiente tabla.

Cuadro 6.6: Habitantes por ciudades


Xh1 Xh2
784 370 209 113
773 317 183 115
748 328 163 123
734 302 253 154
588 288 232 140
577 291 260 119
507 253 201 130
507 291 147 127
457 308 292 100
438 272 164 107
415 284 143 114
401 255 169 111
387 270 139 163
381 214 170 116
324 195 150 122
315 260 143 134
8336 4498 3018 1988
Fuente: Elaboración propia

Se pide:

a) Calcular la media poblacional de cada estrato


b) Estimar la media poblacional estratificada
CAPITULO 6: Muestreo aleatorio Estratificado José Loaiza Torres 209

c) Estimar la varianza de la población


d) Estimar el total poblacional a partir de los datos de los incisos anteriores

10. Una facultad de Ciencias Empresariales consta de 500 alumnos distribuidos en


tres estratos que son Auditoria, Economía y Administración de Empresas. Se
estima el tamaño de la muestra en 50 alumnos y luego se selecciona en cada
estrato para evaluar el aprovechamiento académico en base a las calificaciones
promedio; la información se resume en el siguiente cuadro:

Cuadro 6.7: Número de estudiantes por carrera en la facultad

Estrato 1: Auditoría Estrato 2: Economía Estrato 3:


Administración de
Empresas
88 68 95 55 67 72 68
75 61 80 80 80 73 66
70 62 85 70 50 65
65 50 90 49 45 71
70 42 97 77 56 64
75 92 82 72 62 69
80 87 69 62 60 70
60 88 58 75 66 77
Σ 583 550 656 540 147 484 550
Fuente: Elaboración propia

Calcular:

a) La media muestral de cada estrato


b) La media muestral estratificada global
c) Varianza muestral de cada estrato.

11. Una población de 200 personas, fue dividida en 4 estratos, con base al nivel de
educación. Se muestreó a 50 personas luego se registró su edad como sigue:
210 José Loaiza Torres CAPITULO 6: Muestreo aleatorio Estratificado

Cuadro 6.8: Número de personas según nivel de educación

Estrato 1 Estrato 2 Estrato 3 Estrato 4


35 50 18 30
40 59 60 53
51 21 55 33
45 60 50 43
60 30 58 34
21 40 62 54
18 42 25 45
52 32 30 48
47 52 28 49
40 62 65 56
49 28 38
61 46 39
38 41
35
36
Fuente: Elaboración propia

Se pide calcular:
a) La media muestral de cada estrato
b) La media muestral estratificada
c) Varianza muestral de cada estrato

12. Supermercados "Ketal" estudia la posibilidad de entrar al mercado de una gran


zona metropolitana. Sin embargo, antes de tomar la decisión los directivos desean
estimar los metros cuadrados promedio de piso de ventas de sus competidores
potenciales, con el fin de planear más adecuadamente la nueva tienda propuesta.
Una muestra estratificada de supermercados de dicha zona produjo los resultados
siguientes:
CAPITULO 6: Muestreo aleatorio Estratificado José Loaiza Torres 211

Cuadro 6.9: Número de personas según nivel de educación

Tamaño Número Número de Media de Desviación


total en la cada tamaño tamaño de estándar de las
ciudad en la muestra tiendas de tiendas de la
la muestra muestra
Supermercados 1000 20 371,6 m2 185,8 m2
pequeños
Supermercados 600 12 929 m2 92,9 m2
intermedios
Supermercados 400 8 5574 m2 278,7 m2
grandes
Fuente: Elaboración propia

a) Estime el tamaño promedio de los supermercados en la zona metropolitana.


Detalle sus cálculos.
b) Genere un intervalo de confianza de 95% en relación con dicho valor. Muestre
nuevamente sus cálculos.
c) ¿Se usó un diseño de muestra estratificada proporcionada o desproporcionada
para determinar el número de observaciones de muestra en cada estrato?.
Explique su respuesta.
d) ¿Se usó un diseño de muestra estratificada proporcional o desproporcional
para determinar el número de observaciones o unidades de muestra en cada
estrato? Explique su respuesta.
212 José Loaiza Torres CAPITULO 6: Muestreo aleatorio Estratificado
CAPÍTULO 7
MUESTREO POR
CONGLOMERADOS O DE
RACIMO
7.1.- Concepto
7.2.- Diferencias entre el muestreo por Conglomerados y el muestreo Estratificado
7.3.- Procedimiento en la selección de la muestra
7.4.- Ventajas y desventajas
7.5.- Estimaciones
7.6.- Muestreo conglomerado para proporciones
7.7.- Otras consideraciones
7.8.- Preguntas y problemas
214 José Loaiza Torres CAPITULO 7: Muestreo por conglomerados o de racimo
MAPA CONCEPTUAL

CAPÍTULO 7: MUESTREO POR CONGLOMERADOS O DE RACIMO

COMPETENCIA QUE SE PRETENDE LOGRAR: DISEÑA LA SELECCIÓN DE UNA


MUESTRA CONGLOMERADA, CONSIDERANDO LAS CARACTERÍSTICAS DE LA
POBLACIÓN.

Muestreo probabilístico
Fórmulas del muestreo
Deducir aleatorio simple para el
tamaño de la
Muestreo Aleatorio Conglomerados muestra

Analizar Clasificar: Métodos de


selección

1.- Base teórica 2.- Razones para utilizar 5.- De etapas 6.- Tamaño
3.- De una 4.- De dos
el muestreo por múltiples de muestra
etapa etapas
conglomerados

Relacionar
1-2-3-4-5-6

Diseñar

LA SELECCIÓN DE UNA MUESTRA


CONGLOMERADA

Fuente: Elaboración propia


216 José Loaiza Torres CAPITULO 7: Muestreo por conglomerados o de racimo
CAPITULO 7: Muestreo por conglomerados o de racimo José Loaiza Torres 217

CAPÍTULO 7

MUESTREO POR CONGLOMERADOS O DE RACIMO

7.1.- Concepto

El muestreo por conglomerados llamado también muestreo de grupo, Malhotra (1997)


se refiere a lo siguiente:

Técnica de muestreo probabilístico de dos pasos en la que la población meta se divide


primero en subpoblaciones o grupos mutuamente excluyentes y colectivamente
exhaustivos, y después se selecciona una muestra aleatoria de grupos con base en
una técnica de muestreo probabilístico como el muestreo aleatorio simple. Para cada
grupo seleccionado, se incluyen todos los elementos en la muestra o se toma una
muestra de elementos en forma probabilística. Si todos los elementos en cada grupo
seleccionado se incluyen en la muestra, el procedimiento se conoce como muestreo
de grupo de una etapa. Si una muestra de los elementos se toma en forma
probabilística de cada grupo seleccionado, el procedimiento es un muestreo de grupo
de dos etapas, como se muestra en la figura siguiente.

Figura 7.1: Tipos de Muestreo de grupo

Muestreo de grupo

Muestreo de una Muestreo de dos Muestreo de etapas


etapa etapas múltiples

Muestreo de grupo Probabilidad proporcional al


sencillo tamaño de la muestra

Fuente: Elaboración propia, en base a Malhotra (1997)


218 José Loaiza Torres CAPITULO 7: Muestreo por conglomerados o de racimo

Podemos decir, que el muestreo por conglomerados divide a la población en grupos


con elementos diferentes dentro de cada grupo y homogéneos entre grupos. Así por
ejemplo, barrios en un determinado distrito, calles o avenidas en una ciudad,
estudiantes en una universidad dividida por carreras, áreas geográficas con
características similares como manzanos en una zona de la ciudad, etc.

7.2.- Diferencias entre el muestreo por Conglomerados y el muestreo


Estratificado

Cuadro 7.1: Diferencias del muestreo por conglomerados con el muestreo


estratificado

Detalle Muestreo estratificado Muestreo por


conglomerados
1. Unidad muestral Unidades que componen Cada conglomerado forma una
cada estrato. El número unidad muestral. El número
total de unidades es el valor total de conglomerados es el
de N. valor de N.
2. Selección Todas las subpoblaciones De algunos grupos.
(estratos) para un muestreo
posterior.
3. Objetivo Incrementar la precisión. Aumentar la eficiencia del
muestreo al reducir los costos.
4.Característica de Homogénea. Diferentes.
las unidades
dentro del grupo
5. Característica Heterogénea. Similares.
entre grupos
6. Fórmula que Propia. Del muestreo Aleatorio simple.
utiliza en la
determinación del
tamaño de
muestra

Fuente: Elaboración propia


CAPITULO 7: Muestreo por conglomerados o de racimo José Loaiza Torres 219

Veamos un ejemplo:

Supóngase que se va a estudiar una universidad grande, cuya variable principal de


estudio es la edad, entonces podría considerarse el siguiente cuadro como ayuda

Cuadro 7.2: Ejemplo de diferencias del muestreo por conglomerados con el


muestreo estratificado

Carreras (conglomerados)
Semestres(Estratos) Ing. Ing Administración …… …… ….. Derecho
comercial .
civil
Primero
Segundo
Tercero
Cuarto
Quinto
Sexto
Séptimo
Octavo
Noveno
Décimo

Fuente: Elaboración propia

Ahora veamos cómo sería el muestreo por conglomerados y como el muestreo


estratificado.

- Considerar a los estudiantes por semestres serian ESTRATOS, puesto que las
edades en un semestre particular serán relativamente homogéneas y entre
semestres serán diferentes.

- Considerar a los estudiantes por Carreras seria CONGLOMERADOS, puesto


que en una carrera desde el primer semestre hasta el último habrá estudiantes
de diferentes edades, pero entre carreras sería similares.
220 José Loaiza Torres CAPITULO 7: Muestreo por conglomerados o de racimo

7.3.- Procedimiento en la selección de la muestra

Se siguen los siguientes pasos:

1. Construir los conglomerados cuidadosamente y listarlos de 1 a N, de manera


que se delimite bien cada conglomerado.

2. Considerar el número de conglomerados como el tamaño de la población para


la determinación del tamaño de muestra, es decir N = Nº total de
conglomerados.

3. Determinar el tamaño de muestra con las fórmulas del muestreo


aleatorio simple, ya sea para medias o proporciones en ambos casos para
poblaciones finitas únicamente.

4. Seleccionar los n conglomerados, mediante:


- Los números aleatorios del muestreo aleatorio simple, o
- El salto sistemático

5. Estudiar las unidades dentro de cada conglomerados:


- Por completo (censo). Lo que se denomina muestreo de una etapa.
- Muestrear, es decir considerar a los elementos dentro de cada conglomerado
seleccionado como una población y seleccionar una muestra de cada uno con
el muestreo aleatorio simple. Lo que se denomina muestreo de dos etapas.
- Si es posible seguir seleccionando muestras hasta la última unidad
particionada, esto se llama muestreo polietápico.

Ejemplo:

Si se considera como un conglomerado aquellas poblaciones con habitantes mayores


a 20.000 en toda Bolivia, entonces:
CAPITULO 7: Muestreo por conglomerados o de racimo José Loaiza Torres 221

Primera etapa: Determinar cuántas poblaciones seleccionar, y luego estudiar a todos


sus habitantes de aquellas seleccionadas.

Segunda etapa: Seleccionar Barrios de aquellas poblaciones seleccionadas en la etapa


uno y estudiar a los habitantes de dichos barrios.

Tercera etapa: Seleccionar manzanas o calles dentro de cada barrio seleccionado en


la etapa dos y estudiar a todos sus habitantes.

Cuarta etapa: Seleccionar a casas o viviendas dentro de cada manzana seleccionada


en la etapa tres y estudiar a sus habitantes.

Quinta etapa: Seleccionar dentro de cada casa o vivienda seleccionada en la etapa


cuatro a las personas.

El procedimiento anterior se denomina muestreo polietápico

Si los conglomerados son subdivisiones geográficas como en el ejemplo anterior, el


muestreo también se llama muestreo por áreas.

7.4.- Ventajas y desventajas

Ventajas
1. Es útil cuando no se cuenta con una lista completa de todos los elementos de la
población.
2. También es útil cuando una población está muy dispersa y es heterogénea se
puede tomar los elementos de muestreo.
3. Su costo puede ser reducido al muestrear solo algunos conglomerados.
222 José Loaiza Torres CAPITULO 7: Muestreo por conglomerados o de racimo

Desventajas
1. Los datos pueden ser sesgados por tratarse de algunos conglomerados que son
estudiados, o sea los conglomerados seleccionados pueden no ser representativos
de la población.

7.5.- Estimaciones

Las estimaciones y cálculos muestrales en el muestreo por conglomerados varían de


acuerdo al número de etapas que se estudian, estimaciones más sencillas o fáciles si
es de una etapa o dos etapas, en cambio si el muestreo es más de dos etapas las
estimaciones son más complejas.

Las fórmulas más utilizadas para realizar las estimaciones son las siguientes:

- Estimación del total

N N
X̂   Xi
n i 1

Donde:
N = Población (Total de conglomerados)
n = Nº de conglomerados de la muestra
Xi = Elementos del conglomerado

- Media Muestral para la subunidad conglomerada

X
 Xi
 ni
CAPITULO 7: Muestreo por conglomerados o de racimo José Loaiza Torres 223

- Media muestral de cada conglomerado

Xc 
 Xi
n

- Varianza estimada poblacional

σ 
N 2 (1  f)
2  (Xi - μ) 2

con esta fórmula la varianza es muy grande


n N 1

μ = Media conglomerada poblacional


f = Fracción de muestreo =n/N

7.6.- Muestreo conglomerado para proporciones

Las mismas técnicas de muestreo aleatorio simple para proporciones se aplican al


muestreo conglomerados para proporciones, simplemente varían en las fórmulas para
realizar las estimaciones.

- Estimación de la proporción por conglomerados.

Supóngase que M elementos en cualquier conglomerado se pueden clasificar en dos


clases y que: pi = ai/M es la proporción en la clase C en el i-ésimo conglomerado. Se
toma una muestra aleatoria simple de n conglomerados y se usa el promedio de las
pi observadas en la muestra como la estimación de la proporción P en la población
(Cochran, 1995).

- Varianza proporcional estimada del conglomerado

 M - n   ai - Pc Mi2 
σ p
2 
 M n  Mi   (n  1) 
   
224 José Loaiza Torres CAPITULO 7: Muestreo por conglomerados o de racimo

Donde:
M = Elementos en cualquier conglomerado

Si no puede utilizar la teoría binomial entonces se debe utilizar la fórmula para


variables continuas a las pi, esto da:

V(p) 
Nn  (pi - P) 2

Nn N 1

Alternativamente, si tomamos una muestra aleatoria simple de nM elementos, la


varianza de p se obtiene por teoría binomial

(NM  nM PQ
Vbin(p) 
NM - 1 nM

Si los tamaños Mi de los conglomerados son variables, la estimación

P
 ai
 Mi
ai = Nº de elementos característicos en cada conglomerados
ni = Nº de elementos de cada conglomerado.

Su varianza es

V(p) 
Nn  Mi (pi - P)
2 2

NnM 2 N 1

Donde M 2 =Σ Mi/N es el tamaño promedio del conglomerado


CAPITULO 7: Muestreo por conglomerados o de racimo José Loaiza Torres 225

- Intervalos de confianza

P  Z V(p)

7.7.- Otras consideraciones

Algunos apuntes más con relación al muestreo por conglomerados.

- Las unidades de conglomerados pueden ser con tamaños iguales o desiguales,


generalmente en la práctica son de tamaños desiguales.

- El muestreo por conglomerados puede realizarse en la selección de elementos en


proporción al tamaño de cada conglomerado.

- El muestreo por conglomerados puede ser polietápico (de varias etapas) o


muestreo de áreas (si se refiere a áreas geográficas).

- No existe una regla bien definida para delimitar el tamaño que debe tener un
conglomerado, es más a criterio, siempre cuidando la representatividad de la
muestra.

7.8.- Criterios para aplicar el muestreo por conglomerados

A manera de conclusión, damos algunos criterios para saber cuándo se debe aplicar
el muestreo por conglomerados o de racimo, dependiendo de los factores ya
mencionados anteriormente:
 Los objetivos de la investigación
 Marco muestral
 La población
 Características de las unidades de la población
226 José Loaiza Torres CAPITULO 7: Muestreo por conglomerados o de racimo

1) Objetivos de la investigación: General o específicos por grupos, entonces se


puede aplicar el muestreo por conglomerados.

2) Marco muestral: Estimado, si se tiene un marco muestral estimado o por


mapas de un área geográfica, facilitará la aplicación de esta técnica de muestreo
probabilístico.

3) La población está conformada por un Grupo heterogéneo, pero se puede


dividir en grupos heterogéneos por dentro y similares entre grupos.

4) Características de las unidades de la población, no ordenadas u ordenadas;


es decir, indiferente.

7.9.- Preguntas y problemas

1. Describa con un ejemplo en qué consiste el muestreo por conglomerados

2. Explique con un ejemplo las diferencias que existen entre el muestreo por
conglomerados y el muestreo estratificado.

3. Una encuesta realizada para estudiar el número de niños que tiene a su alcance
armas en sus hogares. Se distribuyeron cuestionarios a todos los padres que
asistieron a ciertas clínicas en el área de La Paz-Bolivia, durante un periodo de una
semana para consultas de niños (sanos o enfermos).

a) Suponga que la cantidad de interés es el porcentaje de familias que cuentan


con armas. Diga por qué ésta es una muestra por conglomerados. ¿Cuál es la
unidad primaria? ¿Cuál es la unidad secundaria? ¿Es una muestra por
conglomerados en una etapa o en dos etapas? ¿Cómo estimaría el porcentaje
de familias que cuentan con armas?
CAPITULO 7: Muestreo por conglomerados o de racimo José Loaiza Torres 227

b) ¿Cuál es la población de muestreo de este estudio? ¿Cree que el procedimiento


de muestreo produce una muestra representativa de las familias con hijos?
¿Por qué?

4. En una ciudad existen 80 Barrios (Conglomerados) y cada barrio representa un


conglomerado se toma 10 muestras aleatoriamente y se registran la cantidad de
casas de cada barrio y el Número total de personas en cada casa, los resultados
son los siguientes.

Cuadro 7.3: Número de personas según número de casas


Barrios Nº de casas Nº de personas
Ni Xi
1 62 395
2 55 450
3 50 486
4 71 555
5 70 403
6 70 540
7 58 613
8 57 517
9 64 480
10 60 380
Fuente: Elaboración propia
Se pide:
a) Estimar el número promedio de personas para cada casa y conglomerado
b) La varianza poblacional
c) Estimar el total poblacional

4. El gerente de una empresa desea estimar la proporción de un tipo particular


de bombillas eléctricas defectuosas enviadas a su almacén con un nivel de
confianza del 95%, las bombillas se envían en paquetes de 10 cajas cada una
de las cuales contiene 4 bombillas el gerente considera a las cajas de bombillas
como conglomerados y selecciona aleatoriamente 6 cajas de entre 50
paquetes, el número de bombillas defectuosas encontradas en cada caja es la
siguiente:
228 José Loaiza Torres CAPITULO 7: Muestreo por conglomerados o de racimo

Cuadro 7.4: Bombillas defectuosas por caja

ai Elementos del
conglomerado
1 4
2 4
1 4
0 4
1 4
0 4
Fuente: Elaboración propia

Estimar:
a) La proporción por conglomerados
b) La varianza
c) Los límites de confianza
CAPÍTULO 8
MUESTREO SISTEMÁTICO
8.1.- Concepto
8.2.- Procedimiento para la selección de la muestra
8.3.- Ventajas y desventajas
8.4.- Estimaciones basadas en el muestreo sistemático
8.5.- Relación con otros métodos de muestreo
8.6.- Criterios para aplicar el muestreo sistemático
8.7.- Preguntas y problemas
230 José Loaiza Torres CAPITULO 8: Muestreo sistemático
MAPA CONCEPTUAL

CAPÍTULO 8: MUESTREO SISTEMÁTICO

COMPETENCIA QUE SE PRETENDE LOGRAR: SELECCIONA UNA MUESTRA


SISTEMÁTICA APLICADA A UNA INVESTIGACIÓN POR MUESTREO, CONSIDERANDO
LAS CARACTERÍSTICAS DE LA POBLACIÓN

Muestreo probabilístico
Fórmulas
para el
Deducir
tamaño de la
muestra según
Muestreo Aleatorio Sistemático
M.A.S.

Clasificar: Métodos de selección Cálculo


Analizar
de la unidad de inicio

1.- Base teórica 2.- Razones y ventajas de 4.- Elegir entre 1 y K 5.- Tamaño
3.- Números
utilizar el muestreo de muestra
aleatorios
sistemático

Relacionar
1-2-3-4-5

Diseñar

LA SELECCIÓN DE UNA MUESTRA


SISTEMÁTICA APLICADA A UNA
INVESTIGACIÓN

Fuente: Elaboración propia


232 José Loaiza Torres CAPITULO 8: Muestreo sistemático
CAPITULO 8: Muestreo sistemático José Loaiza Torres 233

CAPÍTULO 8
MUESTREO SISTEMÁTICO

8.1.- Concepto

Levin y Rubin (1996: 319) en el muestreo sistemático, los elementos son


seleccionados de la población dentro de un intervalo uniforme que se mide con
respecto al tiempo, orden o al espacio. Si quisiéramos entrevistar a cada vigésimo
estudiante de universidad, escogeríamos un punto de inicio aleatorio entre los
primeros 20 nombres del directorio estudiantil y luego escogeríamos veinteavo
nombre de allí en adelante.

Muestra aleatoria sistemática.- Los integrantes de la población se ordenan


alfabéticamente, en un archivo según la fecha en que se reciben, o por algún otro
método. Se selecciona al azar un punto de inicio y después se elige cada k-ésimo
elemento de la población para la muestra (Masón y Lind, 1995: 313)

Lo que significa que el muestreo sistemático, para aplicarse, pone de condición


indispensable el contar con un marco muestral ideal, es decir, el listado completo de
las unidades muestrales.

Ahora bien, el muestreo sistemático difiere del muestreo aleatorio simple; en el


muestreo sistemático, cada elemento tiene igual probabilidad de ser seleccionado,
pero cada muestra no tiene una posibilidad igual de ser seleccionada, por la sencilla
razón de que las unidades a ser seleccionadas dependen de la unidad inicial, ya que
a partir de allí se seleccionan las restantes unidades con un intervalo uniforme.

8.2.- Procedimiento para la selección de la muestra

Consta de los siguientes pasos:


234 José Loaiza Torres CAPITULO 8: Muestreo sistemático

1. Realizar un listado de los elementos de la población de 1 a N. Obtener un marco


muestral ideal.
2. Ordenar de menor a mayor o en orden alfabético, es decir; de acuerdo a su
magnitud. Por ejemplo, un listado de empresas, podría hacerse empezando con la
pequeñas, luego las medianas y luego las grandes.
3. Determinar el tamaño de muestra a través de las fórmulas del muestreo
aleatorio simple.
4. Calcular el salto sistemático K = N/n
5. Seleccionar las unidades muestrales, para esto se debe elegir el punto de inicio, lo
que es posible hacer dos formas:
- Elegir el punto de inicio entre 1 y K, luego elegir cada K-ésimo hasta completar
el tamaño de muestra.
- Elegir aleatoriamente el punto de inicio, luego seguir hasta completar el tamaño
de muestra requerido.

Por ejemplo, considere el siguiente caso hipotético:

Un tamaño de población de 20 unidades.

Enumerados de 1 a 20

1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20

Si el tamaño de muestra n = 5, determinado con las fórmulas del muestreo aleatorio


simple.

El intervalo K = 20/5 = 4, es decir el salto debe ser de cada 4, previo se debe elegir
el punto de inicio, para lo cual existen dos opciones:
- Entre 1 y 4 y luego seguir cada 4 hasta completar los 5, es decir podría ser el 3, 7,
11, 15, 19
CAPITULO 8: Muestreo sistemático José Loaiza Torres 235

- Aleatoriamente cualquier número, por ejemplo el 15, luego será el 19, 3, 7, 11.
Con lo cual se ha elegido las 5 unidades muestrales.

Se puede encontrar en la red de internet hojas de cálculo que ayudan a aplicar el


procedimiento anterior, una de ellas es la siguiente:

Figura 8.1: Simulador del muestreo sistemático

Fuente: Migallón (2017)

Otro ejemplo de muestreo sistemático (Migallon, 2017), se acercan las Navidades y


cierta empresa de turrones cree que no va a poder entregar todos los pedidos a
tiempo, a no ser que aumente la plantilla. La empresa dispone de un listado ordenado
alfabéticamente de 20 personas con las mismas características para el puesto y que
236 José Loaiza Torres CAPITULO 8: Muestreo sistemático

actualmente están en paro. Puesto que el tiempo apremia y no es posible hacer una
entrevista para seleccionar al personal, se decide elegir cinco trabajadores de forma
aleatoria usando el muestreo sistemático.

Tenemos que elegir 5 elementos sistemáticamente de un total de 20, por tanto se


debe elegir uno de cada k=20/5=4.

Se elige el punto de partida eligiendo un número al azar entre 1 y 4. Si obtenemos,


por ejemplo h=2, los elementos de la muestra serán 2, 2+4, 2+2·4, 2+3·4, es decir:

2, 6, 10, 14, 8.

8.3.- Ventajas y desventajas


a) Ventajas

- Es fácil de aplicar cuando se dispone de un listado de las unidades de la


población, por ejemplo listado de clientes, listado de trabajadores, guía
telefónica.

- El procedimiento de muestreo aleatorio sistemático selecciona una muestra más


representativa que el muestreo aleatorio simple si la población está ordenada, y
dicho orden se relaciona con la característica de interés. Por ejemplo; si las
empresas de una industria se encuentran por orden progresivo en relación con
las ventas anuales, un muestreo sistemático incluirá algunas empresas
pequeñas y algunas grandes, una muestra aleatoria puede no ser representativa
porque contenga por ejemplo, sólo empresas pequeñas o una cantidad menor.

- De manera intuitiva, el muestreo sistemático parece ser más preciso que el


aleatorio simple ya que estratifica la población en n estratos que consisten de
las primeras K unidades las segundas K unidades y así sucesivamente. Por lo
tanto, podemos esperar que la muestra sistemática sea tan precisa como la
CAPITULO 8: Muestreo sistemático José Loaiza Torres 237

muestra aleatoria estratificada correspondiente con una unidad por estrato. La


diferencia es que con la muestra sistemática, las unidades ocurren en la misma
posición relativa del estrato, mientras que con el muestreo aleatorio
estratificado, la posición dentro del estrato se determina por aleatorización
dentro de cada estrato, Cochran(1995) (véase la siguiente figura).

l__x___o_l_xo___l_x___o_l__x__o_l_x____lox_______l
k 2k 3k 4k 5k 6k
Número de unidad

X = Muestra sistemática o= Muestra aleatoria estratificada

La muestra sistemática se reparte más uniforme sobre la población, y este hecho,


algunas veces ha dado al muestreo sistemático una precisión considerablemente
mayor que la del muestreo aleatorio estratificado o el muestreo aleatorio simple
inclusive.

b) Desventajas

- La principal desventaja de este muestreo yace en que la muestra sistemática es


menos representativa que la muestra aleatoria simple en situaciones en que hay
periodicidad oculta en la población.

Esta situación vale la pena comentar; a la que el autor Cochran(1995) se refiere. Si la


población consiste en una tendencia periódica, como sería, por ejemplo, una curva
sinusoidal simple, la efectividad del muestreo sistemático depende del valor de k. Esto
se puede ver en la siguiente figura
238 José Loaiza Torres CAPITULO 8: Muestreo sistemático

Figura: 8.2: Periodicidad oculta del muestreo sistemático

A
A A B
B B A

B B B

Variación cíclica

Fuente: Elaboración propia, en base a Cochran (1995)

En esta representación, la altura de la curva es la observación Xi. Los puntos de


muestra A representan el caso menos favorable al muestreo sistemático, este caso se
da siempre que k es igual al periodo de la curva sinusoidal o es un múltiplo entero del
periodo. Todas las observaciones dentro del muestreo sistemático son exactamente
iguales, de modo que la muestra no ofrece más precisión que una sola observación
tomada al azar de la población.

El caso más favorable (muestra B) se da cuando k es un múltiplo impar del


semiperiodo. Cada muestra sistemática tiene una media exactamente igual a la media
verdadera de población dado que las desviaciones sucesivas arriba y debajo de la línea
media se cancelan. La varianza muestral de la media es por lo tanto nula. Entre estos
dos casos, la muestra tiene varios grados de efectividad que dependen de la relación
entre k y la longitud de onda.
CAPITULO 8: Muestreo sistemático José Loaiza Torres 239

Las poblaciones que exhiben sinusoidal exacta no se espera que se den en la práctica.
Las poblaciones con una tendencia periódica definida sí son bastante comunes.
Ejemplos de ellas son el flujo de tráfico que pasa por un punto dado de una carretera
las 24 horas del día y las ventas de un almacén en un periodo de siete días. Para
estimar un promedio sobre un cierto periodo de tiempo, no es aconsejable tomar la
observación de la muestra todos los día a las 4 p.m. o cada martes; en lugar de esto,
la estrategia apropiada sería la de espaciar la muestra a lo largo de la curva periódica,
asegurándose que cada día de la semana recibe la misma representación.

Otro ejemplo de la periodicidad considere las ventas mensuales de tiendas grandes a


partir de un marco de muestra que contiene las ventas mensuales de los últimos 30
años. Si se elige un intervalo de muestra de 12 y coincide con el mes de fin de año
donde generalmente las ventas tienen un pico alto del año, la muestra que resulte no
reflejará la variación mensual en las ventas.

8.4.- Estimaciones basadas en el muestreo sistemático

Primero veremos cuál es la notación convencional que se utiliza

- Para el total poblacional

Ts   Xi * K

Donde:
Ts = Total estimado
Xi = Nº de elementos de la población
K = intervalo de la muestra o salto sistemático K= N/n

- Fracción muestral

f = 1/K
240 José Loaiza Torres CAPITULO 8: Muestreo sistemático

- Media poblacional

Ts
μ st 
N

Donde:
μ st = Media sistemática Poblacional
Ts = Total estimado
N = Tamaño total de la población

- Varianza estimada poblacional

1 K 1 1
σ 2 st  * * *  (xi  μ st ) 2
n K (n  1)

Donde:

σ 2 st = Varianza sistemática estimada Poblacional


Ts = Total estimado
N = Tamaño total de la población
n = Tamaño de muestra

- Media muestral

X 
 Xi
n

Varianza muestral.

S 2

 (X - X) 2

n -1
CAPITULO 8: Muestreo sistemático José Loaiza Torres 241

8.5.- Relación con otros métodos de muestreo

- Con el muestreo aleatorio simple se relaciona porque es un método de muestreo


probabilístico, y hace uso del muestreo aleatorio simple en la determinación del
tamaño de la muestra como así también en la elección del elemento inicial del
salto sistemático.

- Con el método de muestreo conglomerado.

Existe otra manera de considerar el muestreo sistemático con N = n* K las K muestras


sistemáticas posibles aparecen en las columnas. En él es evidente que la población se
ha dividido en K grandes unidades de muestra, cada una de las cuales cuenta con n
unidades originales. La operación de elegir una muestra sistemática aleatoriamente
localizada, es sólo la de elegir una de estas grandes unidades de muestreo al azar.
Por lo tanto, el muestreo sistemático viene a ser la elección de una sola unidad de
muestra compleja, que constituye la muestra total. Una muestra sistemática es una
muestra aleatoria simple de una unidad conglomerada tomada en una población de K
unidades conglomeradas.

Nº de muestras
1 2 i K
X1 X2 Xi Xk
Xk+1 Xk+2 Xk+i X2k
. . . .
. . . .
. . . .
. . . .

X(n-1) k+1 X(n-1)K+2 X(n-1)K+i Xnk


242 José Loaiza Torres CAPITULO 8: Muestreo sistemático

Ejemplo:

N = 20
n=5
Cuadro 8.1: Ejemplo hipotético de muestra sistemática
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15 16
17 18 19 20
Fuente: Elaboración propia

* Las filas son estratos y las columnas conglomerados

- Con el muestreo estratificado

A veces puede ser más preciso el muestreo sistemático ya que por una parte divide a
la población en estratos y elige a los elementos de la muestra en orden secuencial; es
decir, estratifica a la población en n estratos que consisten de las primeras K y así
sucesivamente. Por lo tanto podemos esperar que la muestra sistemática sea tan
precisa como la muestra aleatoria estratificada correspondiente con una unidad por
estrato. La diferencia es que con la muestra sistemática las unidades ocurren en la
misma posición relativa del estrato, mientras que con el muestreo aleatorio
estratificado, la posición dentro de cada estrato se determina separadamente por
aleatorización dentro de cada estrato.

X X X X X X
X = Sistemático
O = Estratificado
CAPITULO 8: Muestreo sistemático José Loaiza Torres 243

Veamos un ejemplo:

Los siguientes datos corresponden a la tenencia de la tierra en una pequeña población


con N = 40 familias y n = 4, cada columna representa una muestra sistemática y las
hileras o filas son estratos; se pide:
a) Determinar la varianza de la media estimada para la muestra sistemática.
b) La varianza estimada a partir de muestras estratificadas.
c) La varianza estimada a partir de la muestra aleatoria simple.

Cuadro 8.2: Muestra estratifica y muestras sistemática

Estratos Nº de muestras sistemáticas Xj


Total estratificada
1 2 3 4 5 6 7 8 9 10
I 0 1 1 2 5 4 7 7 8 6
II 6 8 9 10 13 12 15 16 16 17
III 18 19 20 20 24 23 25 28 29 27
IV 26 30 31 31 33 32 35 37 38 38
Totales

Fuente: Elaboración propia

Fórmulas para aplicar en la solución:

* Para el inciso a)

1  (K * μ) 2 
σ 2 st   
2
* (n * Xi ) 
n2 *K  K 

μ
X
Nº de muestras sistematicas

* Para el inciso b)

N - n S ws t
σ 2 estrat  *
N n
244 José Loaiza Torres CAPITULO 8: Muestreo sistemático

n K
1
Swst   (Xij  Xj)
n(K - 1) j1 i 1

8.6.- Criterios para aplicar el muestreo sistemático

A manera de conclusión, damos algunos criterios para saber cuándo se debe aplicar
el muestreo sistemático, dependiendo de los factores ya mencionados anteriormente:
 Los objetivos de la investigación
 Marco muestral
 La población
 Características de los elementos de la población

1) Objetivos de la investigación: Pueden ser generales o específicos, debido


a que no se requiere hacer estimaciones específicas.

2) Marco muestral: Se debe contar necesariamente con un listado, para saber


de cada cuanto debe ser el salto sistemático. El marco muestral debe ser el
ideal (listado) caso contrario no es posible aplicar el muestreo sistemático.

3) La población está conformada: Por un grupo heterogéneo. A fin de evitar


tendencias ocultas en la población, ésta debe estar en lo posible ordenada,
pero heterogénea.

4) Características de las unidades de la población: En este caso debe estar


ordenada de acuerdo a su magnitud, por ejemplo, por tamaño, por volumen,
por antigüedad etc. de manera tal que se garantiza la representatividad de la
muestra al elegir mediante el salto sistemático.
CAPITULO 8: Muestreo sistemático José Loaiza Torres 245

8.7.- Preguntas y problemas

1.- Según su opinión, cual criterio de los mostrados en el punto 8.6 sería el más
importante para aplicar el muestreo sistemático.

2.- ¿A qué se refiere cuando en el muestreo sistemático puede existir periodicidad


oculta en la población? Explique con un ejemplo.

3.- En una ciudad hay 169 establecimientos industriales que emplean 20 o más
personas; las siguientes cifras muestran el número de empleados en cada
establecimiento. Estimar el total poblacional, la fracción muestral, la media
poblacional y la varianza para la media muestral.

Cuadro 8.3: Número de empleados por establecimiento industrial


35 88 35 36 156 25 24 237 26
468 22 139 163 37 37 27 25 49
38 24 62 331 28 31 81 121
23 34 23 22 53 50 50 80
Fuente: Elaboración propia

4.- Se tiene información sobre el rendimiento de una cosecha de maíz (expresado en


quintales) en cada uno de las 80 parcelas en que se ha dividido un área. A
continuación se presenta las 10 muestras sistemáticas de cada 8 parcelas, cada
una dan los totales siguientes:

Cuadro 8.4: Rendimiento de maíz en 10 parcelas


930 943 955 973 935
968 980 1099 1042 1022
Fuente: Elaboración propia
Se pide:
a) Estimar el total poblacional
b) La fracción muestral
c) La varianza
246 José Loaiza Torres CAPITULO 8: Muestreo sistemático

5.- Se tiene 300 facturas enumeradas de 3.387 al 3.688, usted seleccione


sistemáticamente una muestra de 20 facturas y luego anote el número de errores,
asigne arbitrariamente en el registro de cada factura; para después calcular el
total de errores cometidos, y la varianza.

6.- Suponga que hay 820 estudiantes en una escuela en la que se toma una muestra
de 10 estudiantes, los estudiantes se enumeran de 1 a 820. Seleccionar los
números para la muestra.
CAPÍTULO 9
TÉCNICAS DE MUESTREO
COMBINADAS
9.1.- Introducción
9.2.- Muestreo Doble
9.3.- Diseño de etapas múltiples
9.4.- Muestreo secuencial
9.5.- Muestreo por Rutas Aleatorias
9.6.- Muestreo de centro comercial
9.7.- Preguntas y problemas
248 José Loaiza Torres CAPITULO 9: Técnicas de Muestreo Combinadas
MAPA CONCEPTUAL

CAPÍTULO 9 TÉCNICAS DE MUESTREO COMBINADAS

COMPETENCIA QUE SE PRETENDE LOGRAR: APLICA EN EL ÁREA


EMPRESARIAL, TÉCNICAS DE MUESTREO COMBINADAS ENTRE EL MUESTREO
PROBABILÍSTICO Y NO PROBABILÍSTICO

Muestreo

Deducir

Otras técnicas de muestreo

Analizar las técnicas alternativas

1.- Muestreo 2.- Diseño de 3.- Muestreo 4.- Muestreo por rutas 5.- Muestreo de centro
doble etapas múltiples secuencial aleatorias comercial

Relacionar
1-2-3-4-5

Aplicar

TÉCNICA ESPECÍFICA DE
MUESTREO

Fuente: Elaboración propia


250 José Loaiza Torres CAPITULO 9: Técnicas de Muestreo Combinadas
CAPITULO 9: Técnicas de Muestreo Combinadas José Loaiza Torres 251

CAPÍTULO 9

TÉCNICAS DE MUESTREO COMBINADAS

9.1.- Introducción

Este capítulo tiene por objetivo abordar otras técnicas de muestreo, que se pueden
aplicar en casos especiales, como último recurso antes situaciones que así lo amerita;
se trata entonces de utilizar el muestreo probabilístico y el muestreo no probabilístico,
ante casos en que no se cuenta con un marco muestral ideal y objetivos exploratorios
de investigación.

9.2.- Muestreo Doble

También se llama muestreo de dos etapas, ocurre cuando ciertos elementos de la


población se incluyen dos veces en la muestra. En la primera etapa, se selecciona una
muestra y se recopila cierta información de todos los elementos de la muestra. En la
segunda etapa, se toma una submuestra de la muestra original y se obtiene
información adicional de los elementos de la submuestra. El proceso puede extenderse
a tres o más etapas, y las distintas etapas pueden tener lugar en forma simultánea o
en momentos diferentes. Malhotra (1997).

El muestreo doble puede ser útil cuando no está disponible ningún marco de
muestra para poder seleccionar las unidades de muestra finales pero cuando se sabe
que los elementos del marco se incluyen en un marco de muestra más amplio. Por
ejemplo, un investigador quiere seleccionar las familias de una ciudad determinada
que consumen jugo de manzana, las familias de interés se incluyen en el grupo de
todas las familias, pero el investigador no sabe cuáles son. Al aplicar el muestreo
doble, se obtiene un marco de muestra de todas las familias en la primera etapa. Este
se elabora a partir del directorio de la ciudad o puede comprarse. Después se toma
una muestra de la familia utilizando el muestreo aleatorio sistemático para determinar
252 José Loaiza Torres CAPITULO 9: Técnicas de Muestreo Combinadas

la cantidad de jugo de manzana que se consume. En la segunda etapa, las familias


que consumen jugo de manzana se seleccionan y estratifican de acuerdo con la
cantidad de jugo que consumen. Después, se toma una muestra aleatoria estratificada
y se hacen preguntas detalladas sobre el consumo.

9.3.- Diseño de etapas múltiples

Si se usan otros diseños muestrales, la lógica usada para generar el tamaño óptimo
de la muestra aún se mantendrá; sin embargo, la fórmula puede complicarse. Por
ejemplo, en un diseño por áreas el primer paso podría ser seleccionar comunidades al
azar. De este modo el procedimiento podría ser escoger porciones de censos, luego
manzanas y finalmente familias. En tal diseño, la expresión para determinar el error

estándar de la X se vuelve sumamente compleja. La solución consiste en repetir la


totalidad del plan de muestreo y obtener dos, tres o cuatro estimaciones

independientes de la X . Estas diferentes estimaciones pueden ser usadas para

estimar el error estándar de X .

9.4.- Muestreo secuencial

Algunas veces un investigador puede querer tomar una muestra modesta, observar
los resultados, y posteriormente decidir si es necesaria más información, bajo la forma
de una muestra más grande. Tal procedimiento se denomina muestreo secuencial. Si
un nuevo producto industrial estuviera siendo evaluado, una muestra probabilística
más pequeña de usuarios potenciales podría contactarla. Suponga que encontrara que
su nivel anual promedio de consumo a un nivel de confianza del 95% estuviera entre
10 y 30 unidades, y que se supiera que para que el producto fuera económicamente
viable, el promedio tendría que ser de 50 unidades. Esta es suficiente información
para la decisión de eliminar el producto. Sin embargo, si la estimación del intervalo de
la muestra original fuera de 45 a 65, entonces la información sería inadecuada para
tomar esa decisión y podría obtenerse una muestra adicional. Las muestras
combinadas proporcionarían entonces una estimación de intervalos más pequeña. Si
CAPITULO 9: Técnicas de Muestreo Combinadas José Loaiza Torres 253

el intervalo resultante fuera aun inadecuado, el tamaño de la muestra podría ser


incrementado una tercera vez. Desde luego, aunque el muestreo secuencial
proporciona el potencial para reducir en forma apreciable los costos, puede dar como
resultado incrementos en los costos y demoras en las decisiones. Aaker y Day (1989)

El concepto de muestreo secuencial es útil porque recuerda al investigador que la


meta de investigación de mercado consiste en proporcionar información de ayuda para
la toma de decisiones. La calidad de la información debe ser evaluada en el contexto
de la toma de decisiones. Con demasiada frecuencia, la información tiende a ser
evaluada en forma absoluta(es intelectualmente como tener “razón”). En lugar de ello,
debe ser juzgada con respecto a su uso.

También podría ocurrir un muestreo secuencial, cuando en la validación del tamaño


de la muestra, se obtiene que sea insuficiente aún su tamaño, por tanto, no es
representativa, entonces se procede a aumentar unidades muestrales bajo el mismo
esquema de la técnica de muestreo indicado en el plan de muestreo inicial.

9.5.- Muestreo por Rutas Aleatorias

Este muestreo tiene las siguientes características:

 La selección de los miembros de la muestra se realiza como parte del trabajo


de campo.
 Establecida un área de muestreo, se define un punto de partida, sobre el que
se aplica una ruta predefinida en la que se van seleccionando los miembros de
la muestra con arreglo a un procedimiento heurístico.
 Busca asegurar una cobertura geográfica de la muestra y/o suplir la falta de
censo.
 No es aconsejable en planos no lineales o poco homogéneos en manzanas y
edificación.
254 José Loaiza Torres CAPITULO 9: Técnicas de Muestreo Combinadas

9.6.- Muestreo de centro comercial

En investigación de mercados, el muestreo de centro comercial puede ser muy útil,


sobre todo a la hora de evaluar preferencias de marcas, intención de compra de
nuevos productos, criterios de elección de productos, etc.

Según Aaker y Day (1989) los estudios en los centros comerciales en los cuales los
compradores son interceptados o abobados presentan algunos problemas difíciles de
muestreo.

Una limitación con las encuestas en el centro comercial es el sesgo introducido por los
métodos usados para seleccionar la muestra. En particular, los sesgos que son
potencialmente dañinos para un estudio pueden ser causados por la selección del
centro comercial, la parte del centro comercial de la cual los entrevistados son
extraídos, la hora del día y el hecho de que los compradores más frecuentes tendrán
más probabilidades de ser seleccionados.

Sudman (1980) sugiere enfoques para minimizar estos problemas y, al hacerlo así,
aclara la naturaleza de estos sesgos:

- Selección del centro comercial

Una muestra de centro comercial reflejará principalmente aquellas familias que viven
en el área. Obviamente, puede haber grandes diferencias entre la gente que vive en
un barrio de bajos ingresos de aquellas que vive en un barrio de altos ingresos con
profesionistas como residentes. Generalmente, es una buena política utilizar varios
centros comerciales en diferentes barrios, para que las diferencias entre ellos puedan
ser observadas.
CAPITULO 9: Técnicas de Muestreo Combinadas José Loaiza Torres 255

- Lugares de muestreo dentro de un centro comercial

La meta es obtener una muestra aleatoria de las visitas a centros de compras. Debido
a las rutas de tráfico y a los estacionamientos, una entrada puede provenir de barrios
muy diferentes a los de otra. Una solución consiste en estratificar por lugar de entrada
y tomar una muestra separada de cada entrada.

Suponga que se emplea una encuesta para determinar la compra promedio durante
un viaje de compras. Considere que existieran dos entradas en la instalación de
compras. La entrada A, que provendría de un barrio de la clase trabajadora,
promediaba 200 compradores por hora; mientras que la entrada B la cuál procedería
de un suburbio profesional, promediaba 100 compradores por hora. Por consiguiente,
el 67% de los compradores usaban la entrada A y el 33% de los compradores usaban
la entrada B.

Algunas veces es necesario muestrear dentro de un centro comercial porque las


entradas son inapropiadas como lugares para interceptar a los entrevistados. La
localidad usada para interceptar a los compradores puede afectar a la muestra. Un
conglomerado de tiendas exclusivas de mujeres atraerá a un comprador muy diferente
al de la tienda del otro extremo del centro comercial. Una solución consiste en
seleccionar varios lugares “representativos”, determinar a partir de los conteos de
tránsito aproximadamente cuántos compradores pasan por cada lugar, y
posteriormente ponderar los resultados de acuerdo a ello.

- Muestreo de tiempo

Otro punto de discusión es el periodo. Por ejemplo, las personas que trabajan,
generalmente compran en la noche y en los fines de semana o durante las horas de
la comida. De este modo, es razonable estratificar por segmentos de tiempo – como
días de la semana, las noches de días de la semana y fines de semana – y entrevistar
durante cada segmento. Nuevamente, los conteos de tránsito pueden proporcionar
256 José Loaiza Torres CAPITULO 9: Técnicas de Muestreo Combinadas

estimaciones de la proporción de compradores que estarían en cada estrato, para que


los resultados finales puedan ser ponderados en forma apropiada.

- Muestreo de personas contra visitas de compras.

Obviamente, algunas personas compran con mayor frecuencia que otras y será más
probable que sean seleccionadas en una muestra de centro comercial, si el interés es
muestrear a los individuos que compran más. Sin embargo, si la meta es desarrollar
una muestra que represente a la población total, entonces se vuelve importante
ajustar la muestra para que refleje tanto a los compradores poco asiduos como los
frecuentes.

Un enfoque consiste en preguntar a los entrevistados cuántas veces visitaron el centro


comercial durante un periodo especificado, en las últimas cuatro semanas. Aquellos
cuya visita actual fue la única durante el periodo recibirán un valor de uno. Los que lo
visitaron dos veces tendrían un peso de un medio; aquellos que visitaron tres veces
tendrían un peso de un tercio; y así sucesivamente.

Otro enfoque consiste en usar cuotas, las cuales sirven para reducir los sesgos a
niveles que puedan ser aceptables. Un factor obvio a ser controlado es el sexo de los
encuestados, puesto que las mujeres compran más que los hombres.

A la hora de aplicar un muestreo de centro comercial, fíjese entonces los datos


históricos, y si no los tiene, observe y construya usted las tendencias, frecuencias, etc.
para que a partir de allí pueda muestrear y obtener mayor representatividad en su
muestra.

A manera de conclusión, podemos mencionar, que para la aplicación de cualquier


sistema, método o técnica de muestreo, se debe analizar muchos factores, tanto
cuantitativos como cualitativos, inclusive el juicio de valor del investigador, teniendo
CAPITULO 9: Técnicas de Muestreo Combinadas José Loaiza Torres 257

siempre en cuenta que el fin último es obtener una muestra lo más representativa
posible.

9.7.- Preguntas y problemas

1. Describa, cómo se aplica el muestreo doble.

2. Señale, en qué situaciones puede ser útil el muestreo doble.

3. Indique las aplicaciones principales del muestreo secuencial.

4. Señale, cuáles son las características del muestreo de rutas aleatorias.

5. ¿Cómo se realiza una selección de Muestreo de personas contra visitas de


compras?

6. En una investigación, dirigida a personas que acostumbran comprar ropa


usada, se desea conocer el gasto promedio mensual que éstas realizan. En el
área elegida no existe una lista de aquellas personas que compran este tipo
de producto. Indique qué método utilizaría para la selección de una muestra
particular, y ¿cómo lo haría?
258 José Loaiza Torres CAPITULO 9: Técnicas de Muestreo Combinadas
CAPÍTULO 10
SISTEMAS DE SELECCIÓN DE
UNIDADES MUESTRALES
10.1.- Introducción
10.2.- Tabla de números aleatorios y el sorteo
10.3.- Salto sistemático
10.4.- Esquina Noreste
10.5.- Mitad de manzana
10.6.- Serpentina
10.7.- Zigzag
10.8.- Salto de Caballo
10.9.- Trébol
10.10.- Preguntas y problemas
260 José Loaiza Torres CAPITULO 11: El muestreo en internet
MAPA CONCEPTUAL

CAPÍTULO 10: SISTEMAS DE SELECCIÓN DE UNIDADES MUESTRALES

COMPETENCIA QUE SE PRETENDE LOGRAR: APLICA SISTEMAS ALTERNATIVOS


DE SELECCIÓN DE UNIDADES MUESTRALES EN FUNCIÓN A LAS CARACTERÍSTICAS
DE LA POBLACIÓN Y AL MARCO MUESTRAL DISPONIBLE.

Muestreo probabilístico

Deducir

Sistemas de selección de muestras

Analizar métodos de selección

1.- Zigzag 2.- Serpentina 3.- Salto 4.- Esquina 5.- Mitad de 6.- Números
sistemático noreste manzana aleatorios

Relacionar
1-2-3-4-5-6

Aplicar

SISTEMAS DE SELECCIÓN DE UNIDADES


MUESTRALES

Fuente: Elaboración propia


262 José Loaiza Torres CAPITULO 11: El muestreo en internet
CAPITULO 10: Sistemas de selección de unidades muestrales José Loaiza Torres 263

CAPÍTULO 10

SISTEMAS DE SELECCIÓN DE UNIDADES MUESTRALES

10.1.- Introducción

Este capítulo tiene por objetivo abordar las técnicas de selección de las unidades
muestrales, tanto a nivel de técnicas probabilísticas como no probabilísticas.

10.2.- Tabla de números aleatorios y el sorteo

Esta modalidad de selección ya se explicó en el capítulo de muestreo aleatorio simple,


y se aplica cuando se cuenta con un marco muestral ideal; es decir, cuando se tiene
un listado de todas las unidades de la población.

10.3.- Salto sistemático

De igual forma se explicó en el capítulo de muestreo sistemático, de cuál es el


procedimiento de este muestreo, y se aplica cuando se cuenta con un buen marco
muestral.

10.4.- Esquina Noreste

Este método es utilizado cuando no se cuenta con un buen marco muestral (listado),
en tal caso, se recurre a un mapa o plano de la zona o ciudad, inicia la selección en la
esquina noreste de una manzana en mapa o plano de una ciudad, luego en dirección
de las manecillas del reloj, prosigue hasta completar el número deseado en cada
manzana. También suele utilizarse sólo seleccionando las esquinas; es decir, cuatro
unidades por manzana, este procedimiento, es útil cuando la investigación es dirigida
264 José Loaiza Torres CAPITULO 11: El muestreo en internet

a establecimientos comerciales, dado que mayormente en las esquinas se ubican de


preferencia los puntos de venta.

10.5.- Mitad de manzana

La selección es de manera similar que el anterior con la diferencia de que la unidad


muestral es seleccionada en la mitad de cada manzana, lo que da un total de cuatro
selecciones. Es utilizado cuando se selecciona unidades que son familias, por ejemplo
para investigar consumo de un determinado producto, dado que mayormente en la
mitad de manaza es más frecuente encontrar hogares o viviendas con personas que
habitan allí.

10.6.- Serpentina

La serpentina, su nombre evoca en el sentido de elegir un punto inicial y proseguir en


forma de espiral, en dirección de las manecillas del reloj, es muy similar al método de
la esquina noreste, la diferencia está, que en la serpentina no necesariamente el punto
de partida es en la esquina noreste; sino que puede ser cualquier punto al azar, como
se muestra en la figura:

Figura 10.1: Método serpentina

Fuente: Elaboración propia

= Punto de partida de la selección.


CAPITULO 10: Sistemas de selección de unidades muestrales José Loaiza Torres 265

10.7.- Zigzag

Se utiliza en la selección de unidades a lo largo de una calle, siendo el punto de partida


al azar y se prosigue en Zigzag, como se muestra en la siguiente figura, Jany (2005).

Figura 10.2: Método zigzag

Encuestador
X = Casa o vivienda seleccionada.
Fuente: Elaboración propia, en base a Jany (2005)

10.8.- Salto de Caballo

Este método es similar al anterior, con la diferencia de que se va formando una L de


caballo de ajedrez en movimiento, las distancias de un punto de selección a otro,
podrían ser uniformes, lo que la haría diferente al método zigzag.
266 José Loaiza Torres CAPITULO 11: El muestreo en internet

Figura 10.3: Método de salto de caballo

Encuestador

X = Casa o vivienda seleccionada

10.9.- Trébol

Es un método que se utiliza en situaciones de calles sin salida, se selecciona un punto


de partida y se forma un trébol. Como se muestra en al siguiente figura.

Figura 10.4: Método del trébol

X X X

X X

X X

Encuestador

X = Casa o vivienda seleccionada


CAPITULO 10: Sistemas de selección de unidades muestrales José Loaiza Torres 267

10.10.- Preguntas y problemas

1.- Indique, cómo se realiza la selección de unidades muestrales mediante una tabla
de números aleatorios.

2.- Describa la forma o el procedimiento de cómo se realiza la selección de unidades


muestrales, mediante el método del sorteo. Ejemplifique su respuesta.

3.- ¿Por qué se dice el método de los números aleatorios y el método del sorteo son
métodos probabilísticos de selección de muestras?

4.- De un ejemplo hipotético para ilustrar la selección sistemática de una muestra.

5.- La comuna de una Ciudad está buscando actualizar su base de datos cartográfica
con el objetivo hacer un levantamiento real de cuántas construcciones se han
realizado en los últimos cinco años sin autorización de la unidad competente. ¿Qué
método de selección utilizaría?. Justifique su respuesta.

6.- El gobierno está interesado en determinar el ingreso mensual promedio de las


familias del país que residen en áreas urbanas, con la finalidad de fijar un impuesto
sobre los ingresos generados, no se cuenta con un listado de familias que residen
en una determinada ciudad. Describa cómo seleccionaría una muestra para este
fin.

7.- Una empresa que distribuye bebidas alcohólicas está interesada en determinar qué
porcentaje de tiendas de Barrio expenden su producto. Especifique qué método
de selección utilizaría, justifique su respuesta.
268 José Loaiza Torres CAPITULO 11: El muestreo en internet
CAPITULO 11: El muestreo en internet José Loaiza Torres 269

CAPÍTULO 11
EL MUESTREO EN INTERNET
11.1.- Introducción
11.2.- Las encuestas por internet
11.3.- Métodos aplicables en el muestreo por internet
11.4.- Ventajas y desventajas del muestreo por internet
11.5.- Redes sociales y muestreo
11.6.- Preguntas y problemas
270 José Loaiza Torres CAPITULO 11: El muestreo en internet
CAPITULO 11: El muestreo en internet José Loaiza Torres 271

MAPA CONCEPTUAL

CAPÍTULO 11: MUESTREO EN INTERNET

COMPETENCIA QUE SE PRETENDE LOGRAR: APLICA MUESTREO EN INTERNET


EN FORMA SELECTIVA Y CRÍTICA

Muestreo

Deducir

Muestreo probabilístico Muestreo No


probabilístico

Analizar qué técnica se adecua


más

1.- a 2.- a 3.- Bola de 4.- por 5.- Aleatorio 6.Estratificado 7.Por 8.Otras
Juicio conveniencia nieve cuota simple conglomerados técnicas

Relacionar
1-2-3-4-5-6-8

Aplicar

Muestreo en internet

Fuente: Elaboración propia


272 José Loaiza Torres CAPITULO 11: El muestreo en internet
CAPITULO 11: El muestreo en internet José Loaiza Torres 273

CAPÍTULO 11

MUESTREO EN INTERNET

11.1.- Introducción

El muestreo utilizando el internet tiene sus características particulares. De hecho la


investigación utilizando la red de internet es diferente a lo que se realizaba años atrás.

Una de las aplicaciones más frecuentes del muestreo por internet es cuando se realiza
encuestas utilizando el internet, a saber: Videoconferencia, chat, correo electrónico,
encuestas en línea o a través de sitios especializados en aplicación de encuestas.

11.2.- Las encuestas por internet

La forma en que se hace investigación por encuestas ha cambiado para siempre


debido al internet (McDaniels y Gates, 2005). Quienes toman decisiones a nivel
gerencial se están viendo obligados a tomar decisiones complejas y rápidas, y la
investigación por Internet puede ayudar proporcionando información oportuna.

Las ventajas específicas de las encuestas por internet son las siguientes:

 Despliegue rápido, reporte en tiempo real.


 Costos increíblemente reducidos.
 Fácil personalización.
 Los participantes meta pueden completar la encuesta a su conveniencia.
 Índices de respuesta elevados.
 Capacidad de ponerse en contacto con personas con quienes es difícil poder
comunicarse.
 Atractivos rendimientos para las empresas investigadoras.
274 José Loaiza Torres CAPITULO 11: El muestreo en internet

Desventajas de las encuestas en línea

 Los usuarios de internet no son representativos de la población.


 Las muestras no son representativas, existe autoselección de los encuestados.
 La seguridad en internet de que la unidad muestral sea la que participe.
 Otros: falta de explicación adicional, falta de ancho de banda, etc.

11.3.- Métodos aplicables en el muestreo por internet

Para la población de Internet: Se puede aplicar un muestreo probabilístico (se


consideran como unidades muestrales de primera etapa y como unidades de segunda
etapa los propios internautas) o bien un muestreo con marcos múltiples (en el caso
de que el número de sites que recubre la población sea un número reducido).

Para la población de internet especializada: se utilizarán los mismos métodos de


muestreo, con monitoreo para controlar la especialización.

EL MÉTODO MÁS UTILIZADO, SE DENOMINA MUESTREO ALEATORIO POR


INTERSECCION EN LINEA

Recordemos que una muestra se dice que es extraída al azar cuando la manera de
selección es tal, que cada elemento de la población tiene igual oportunidad de ser
seleccionado. Los tipos comunes de muestreo aleatorio son el muestreo aleatorio
simple, muestreo sistemático, muestreo estratificado y muestreo de conglomerados.

A medida que la red internet crece y multiplica el número de usuarios muchas


investigaciones utilizan internet como soporte para la realización del trabajo de campo.
Aunque más adecuado para algún tipo de investigaciones que para otras, la realidad
es que se puede adaptar con relativa facilidad a la mayoría de las investigaciones.
CAPITULO 11: El muestreo en internet José Loaiza Torres 275

La pregunta es ¿cómo realizar el muestreo por internet? Mishel Franco Gonzales


(2011) responde de la siguiente manera:

- SI LA INVESTIGACIÓN ES CUALITATIVA

a) Herramientas estándar

Existen diversas herramientas estándar, encuadradas bajo la denominación de


herramientas cooperativas, ya que permiten realizar grupos de discusión on-line de
manera muy efectiva y asequible. Una de las herramientas de este tipo más extendidas
y de fácil acceso es NetMeeting de Microsoft, Messenger de Microsoft, Messenger de
yahoo, etc. Entre sus principales funcionalidades se encuentran:

 Chat o mensajería instantánea: Permite establecer una discusión privada entre un


conjunto seleccionado y restringido de personas por medio del intercambio de
mensajes escritos entre los participantes admitidos o invitados.
 Audio: Permite intercambiar audio con los demás participantes en la reunión.
 Videoconferencia: Se permite el intercambio de imágenes de videoconferencia
simultáneamente entre dos participantes.
 Herramientas compartidas: Existe la posibilidad de compartir una pizarra sobre la
cual todos los participantes de la sesión grupal pueden escribir, dibujar, realizar
diagramas, etc.
 Programas compartidos: Se puede compartir cualquier programa que exista en uno
de los equipos sin necesidad de que esté instalado en los demás, mostrando su
utilización o cediendo el control.

b) Herramientas especializadas

Existen programas diseñados específicamente para la realización de grupos on-line.


Un buen ejemplo lo tenemos en la herramienta Virtual Reseca Room desarrollada por
276 José Loaiza Torres CAPITULO 11: El muestreo en internet

una compañía americana y que ofrece un servicio completo de ayuda a la realización


de investigación cualitativa on-line incluyendo los siguientes servicios:
 Alquiler de salas virtuales.
 Alquiler de software.
 Reclutamiento de los participantes.
 Preparación del material digital a presentar.

Estas herramientas, diseñadas especialmente para realizar reuniones de grupo on-


line, incorporan algunas características que recuerdan al entorno habitual de las
reuniones de grupo tradicionales, como son:
 La sala de espera para los participantes citados.
 La sala de discusión de los participantes.
 La sala de visionado de los clientes.

Los grupos de discusión on-line suelen tener la desventaja de la brevedad de las


respuestas que impone la limitación de tener que escribirlas. Además el grupo debe
de ser menos numeroso que en las sesiones grupales físicas, admitiendo un máximo
de 8 a 10 integrantes.

Como segunda herramienta especializada tenemos los Grupos por correo electrónico
y las redes sociales; junto a la realización de grupos on-line existen diversas
alternativas que sacan partido de otras de las capacidades de internet. Estos son los
grupos por correo electrónico y las redes sociales. Implican la realización del grupo
durante un período de tiempo más o menos prolongado.

Para ello disponemos de infinidad de alternativas:


 Las listas de correo, estableciendo una al que todos los integrantes envían sus
mensajes.
 Los foros privados, se invita a los participantes a que accedan y dejen sus mensajes
en el espacio destinado.
CAPITULO 11: El muestreo en internet José Loaiza Torres 277

 Grupos de e-mail moderados, evitan la que la discusión sea monopolizada por


ciertos usuarios con afán de protagonismo.
 Grupos creados en redes sociales.

- SI LA INVESTIGACIÓN ES CUANTITATIVA:

Al igual que ocurre con la investigación cualitativa, internet ha supuesto una revolución
para las estructuras de la investigación cuantitativa. Nuevas e interesantes
posibilidades de reclutamiento, entrevistas y análisis aparecen con las nuevas
tecnologías. Uno de los tipos de muestreo por internet es el denominado muestreo
por reclutamiento (Gonzales, 2011)

 MUESTREO POR RECLUTAMIENTO

Consiste en aplicar una diversidad de procedimientos y fuentes para la selección de


entrevistados a los que se invita a contestar:

- Paneles reclutados para investigación de mercados: Similares a los paneles de


consumidores, admiten colaborar y formar parte de una base de datos a cambio
de una compensación, generalmente se reclutan con anuncios en determinados
sites.
- Listados opcionales: Los usuarios de un determinado site, pueden admitir formar
parte de una lista a la que el site puede llamar para realizar entrevistas a cambio
de determinados servicios suministrados en el site.
- Paneles opcionales: Forman parte del denominado permission marketing, ya que
provienen de las mismas bases de datos y fuentes.

 OTRAS TECNICAS

 Los estudios por e-mail


278 José Loaiza Torres CAPITULO 11: El muestreo en internet

Implica recibir el cuestionario como parte de un correo electrónico. Existen tres


posibles alternativas:
1. Escribir el cuestionario como un fichero plano de texto que constituye el cuerpo del
mensaje.
2. Producir el cuestionario a partir de un programa de correo electrónico como los
utilizados en marketing directo.
3. Descarga de programas de encuesta, como ficheros ejecutables adjuntos al
mensaje de correo que contiene un programa encuesta que se ejecutará en el
equipo receptor del e-mail.

Podemos acotar que además hoy existen diversas herramientas como las que
proporciona el mismo Hotmail o el Gmail, que permiten aplicar
documentos/formularios (cuestionarios) y tabularlos al mismo tiempo, solo hay que
tener una base de datos o enviarlos a contactos para que los completen, es decir, se
puede aplicar las técnicas tradicionales de muestreo.

 Muestreo a través de un website u online

Generalmente adoptan la forma de páginas HTML o PHP. Se pueden crear con un


editor común de HTML, aunque lo normal en la actualidad es que los fabricantes de
software para entrevistas asistidas por ordenador suministren utilidades de conversión
a páginas HTML PHP o Java (Ochoa, 2016).

A todas las posibilidades anteriormente comentadas que se están viendo favorecidas


por la incorporación de las redes sociales temáticas al entorno web, donde podemos
localizar personas afines con un perfil sociodemográfico determinado para un
determinado estudio, tenemos que sumarle el desarrollo de aplicaciones para estudios
de mercado gratuitas que comienzan a proliferar por la red.
CAPITULO 11: El muestreo en internet José Loaiza Torres 279

Hay varios sites que ofrecen administración de encuestas por internet y que facilitan
la aplicación de las encuestas y su procesamiento en tiempo real, podemos citar
algunos de ellos:

https://drive.google.com
https://es.surveymonkey.com
http://www.encuestafacil.com
http://www.pollowers.com
http://www.questionpro.com
http://manager.e-encuesta.com
http://www.createsurvey.com
http://zoomerang.com
http://www.websurveyor.com
http://www.perseus.com
http://www.apian.com
http://www.surveysite.com
https://www.onlineencuesta.com
http://www.interrogantes.com/encuestas.asp

Las encuestas online que pretendan ser representativas del total de usuarios de
Internet, deberían utilizar métodos de captación “offline” con técnicas de seguimiento,
para ayudar y conseguir una muestra representativa. No se puede realizar una
selección o captación aleatoria utilizando la Web como medio en tanto no existen
listados de usuarios ni páginas Web cuya estructura de visitas sea representativa del
total de usuarios de la Red.

La selección por cuotas de los participantes únicamente tendrá sentido cuando existan
estudios fidedignos sobre la estructura de los usuarios de Internet que sirvan de
referente para dichas cuotas. La selección o captación de los participantes ha de
llevarse a cabo mediante una serie de fuentes que optimicen los resultados, es decir,
que consigan una máxima extensión de la muestra de usuarios. Es necesario ofrecer
280 José Loaiza Torres CAPITULO 11: El muestreo en internet

al cliente los datos de la distribución por cuotas, y en el caso de que sea relevante
para la investigación, la distribución regional o sectorial de la muestra o segmento de
internautas al que se hace referencia.

La captación de participantes para las muestras en encuestas online que pretendan


ser representativas de grupos especiales de internautas, puede realizarse mediante
listas de direcciones de correo electrónico/ e-mail siempre y cuando éstas estén
actualizadas y filtradas de tal manera que se garantice que corresponden al perfil en
cuestión.

En encuestas online representativas de los usuarios de una determinada página Web,


la selección de participantes puede realizarse o bien mediante un algoritmo que calcule
la frecuencia de visita y ofrezca la participación a cada N-ésimo visitante, o bien con
un código que seleccione y ofrezca la participación a los visitantes con intervalos
aleatorios. Para ello hay que tener en cuenta los distintos criterios de probabilidad de
selección tanto de participantes que visitan la Web por primera vez como de los
visitantes habituales y controlar que un individuo no tenga acceso dos veces a la
misma encuesta.

Una vez recolectados los datos por internet, tal vez sea necesario hacer una
ponderación de los resultados, porque en las encuestas online, pueden existir
desviaciones sistemáticas de la muestra aleatoria simple con respecto a los valores
poblacionales. Para adaptar la estructura de la muestra a los rasgos sociodemográficos
y de uso de Internet de la población, puede ser necesario o cuanto menos útil realizar
una ponderación de los resultados. A la hora de hacer una ponderación es
imprescindible conocer información secundaria sobre la población de ínter nautas o
grupo de análisis.

Como conclusión, se puede decir, que gracias a este nuevo entorno, cualquier
empresa por pequeña que sea podrá realizar un estudio de mercado y despejar
CAPITULO 11: El muestreo en internet José Loaiza Torres 281

muchas incógnitas comerciales mediante el muestreo por internet, aunque sea a nivel
exploratorio.

Finalmente, se debe recordar que para la aplicación de cualquier sistema, método o


técnica de muestreo, se debe analizar varios factores, tanto cuantitativos como
cualitativos, incluido el juicio de valor del investigador, estos temas fueron
ampliamente abordados en el presente texto.

11.4.- Ventajas y desventajas del muestreo en Internet

Desafortunadamente, no hay una gran cantidad de investigación científica


concerniente a la representatividad de las muestras en Internet, como lo hay para
otros enfoques a la recopilación de datos. El muestreo en Internet puede tener ciertas
ventajas y limitaciones

Ventajas:
 Fácil acceso a los entrevistados.
 Buen marco muestral por medio de correos electrónicos o bases de datos.
 Selección probabilística, ya sea por números aleatorios o por salto sistemático,
si se cuenta con marco muestral ideal.
 Cada vez más personas utilizan por medio de redes sociales.

Limitaciones:
 No se garantiza la representatividad de la población, está condicionada a
personas que tienen acceso al servicio de internet.
 El marco muestral puede ser incompleto, debido a que la gente cambia
constantemente su dirección de internet o en algunos casos tiene cuentas
falsas.
 Otra limitación del muestreo por internet está relacionado a ciertos errores
frecuentes al usar cuotas (Ochoa, 2016), el medio online tiene sus
particularidades y es frecuente que algunos investigadores no las tengan en
282 José Loaiza Torres CAPITULO 11: El muestreo en internet

cuenta, limitándose a reproducir técnicas empleadas en medios offline. Esta


práctica puede producir resultados de menor calidad y en algunos casos
mayores costes. Por ejemplo la región del respondiente ya no es importante
en el muestreo por internet, cosa contraria puede ocurrir con el nivel de
ingreso.

11.5.- Redes sociales y muestreo

Otra alternativa, dentro del marco de obtención de información a través de internet,


es en foros y redes sociales. En estos medios, existe mucha información referente a
opiniones, comentarios y datos relativos a los propios usuarios, tales como, su nombre
(o nick de usuario), procedencia, fecha de nacimiento, e incluso información de sus
propios familiares (caso de Facebook, donde en cada perfil, se indica, a discreción del
propio usuario, el número de familiares y el nombre de cada uno, además de su rasgo
de parentesco). La utilidad que tienen estas nuevas fuentes de información, cada vez
más explotadas, es la de omitir el paso de encuestar a los consumidores sobre un
tema en concreto; ya que en la mayoría de los casos, es información que éstos han
proporcionado con anterioridad en las plataformas sociales. La información obtenida
a través de este tipo de canales puede resultar de mucha utilidad en diferentes
estudios de marketing y, particularmente, en investigación de mercados (Fernández,
2016).

Existen variadas redes sociales tales como Facebook, you Tube, Twitter, whatsapp,
Istagram.

Asimismo, hay múltiples herramientas que permiten analizar redes sociales, desde
versiones gratuitas en línea como aplicaciones y software que tienen costo para su
uso, por ejemplo, Hootsuite, TwitterCounter, Twitteranalyzer, TweetReach, Klout,
Social Mention, HowSociable, IceRocket, analytics de Google.
CAPITULO 11: El muestreo en internet José Loaiza Torres 283

Ventajas:
 Los datos pueden ser más fidedignos, en función a lo declarado con anticipación al
muestreo por el dueño de la cuenta en la red social.
 Mayor rapidez y accesibilidad, solo se requiere conexión a internet.
 Mayor posibilidad del uso de data mining.
 Útil para investigaciones exploratorias y cualitativas, por ejemplo para
reclutamiento de personal.

Limitaciones:
 El mayor inconveniente, es conocer cuáles pueden ser útiles en la investigación,
debido a que no todas las redes sociales pueden ser aptas para los experimentos
que se pretendan llevar a cabo. Por lo tanto, el establecimiento de un perfil básico
de usuario se torna muy útil y necesario en el momento de emprender
investigaciones de estas características.

 Aunque la información que allí se encuentra es de carácter público, existe


determinados datos de naturaleza sensible, cuya difusión supondría un verdadero
problema, a tenor las legislaturas que cada país contemple en estos casos
(Fernández, 2016).

 Existen cuentas creadas que no corresponden a personas reales, de hecho en


algunas ciudades existen el doble o triple de cuentas que el número de habitantes,
lo cual puede dificultar y segar la investigación por muestreo.

11.6.- Preguntas y problemas

1.- ¿Cuáles son las ventajas y desventajas de las encuestas en internet?

2.- ¿Cuáles son las ventajas y limitaciones del muestreo por internet?
284 José Loaiza Torres CAPITULO 11: El muestreo en internet

3.- Si no se contara con un marco muestral ideal para hacer un muestreo en internet,
¿Qué métodos de selección aplicaría Ud.? Ejemplifique su respuesta.

4.- Describa brevemente, en qué consiste el método por reclutamiento del muestreo
por internet.

5.- ¿Qué ventas y limitaciones tiene el muestreo por medio de redes sociales?

6.- Elabore una encuesta y luego utilice cualquiera de las páginas de la web que
ofrecen para aplicar y procesar encuestas, describa el procedimiento de selección
de la muestra de las personas que responderán su encuesta.
BIBLIOGRAFÍA
BIBLIOGRAFÍA / WEBGRAFÍA

1. Azorín, F; Sánchez-Crespo J. L.( (1986). Métodos y aplicaciones del muestreo.


Alianza Universidad textos: Editorial Alianza.

2. Berenson y Levine (1992). Estadística para administración y economía: conceptos


y aplicaciones. México: Editorial McGraw-Hill/Interamericana S.A.

3. Cochran, Willam G.(1995). Técnicas de muestreo. México: Editorial Cecsa,


Decimoprimera reimpresión.

4. David Aaker y George S. Day(1989). Investigación de mercados. México: Mc Graw


Hill Interamericana S.A.

5. Escuder valls, r. (1992). Manual de Teoría de probability es con nociones de


muestreo e inferencia. Valencia: Tirant la blanche.

6. Espejo, Jorge(2002). Mercadotecnia competitiva S.C. SurveyIM®(Software para


investigación de mercados), México.

7. Fernández, F.R. y Mayor, J.A.(1994). Muestreo en poblaciones finitas: curso


básico. Barcelona: PPU.

8. Fernandez troconiz, A (1987). Probabilidad Estadistica Muestreo. Tebar Flores.

9. Fernández, F.R. y Mayor, J.A(1994). Ejercicios y prácticas de muestreo en


poblaciones finitas. Barcelona: PPU.

10. Fernández, David Abad (2016) Técnicas Estadísticas aplicadas a Redes Sociales y
Análisis de Sentimiento: el caso Volkswagen, Trabajo de Fin de Grado,
Universidade da Coruña, facultad de economía y empresa.
11. Freund y Simon (1995). Estadística elemental. México: Prentice Hall, México.

12. Gorjup, María Tatiana, Baltar, Fabiola(2012), Muestreo mixto online: Una
aplicación en poblaciones ocultas Intangible Capital [en linea] 2012, 8 (Sin mes)
Recuperado el 3 de marzo de 2017, Disponible en:
http://www.redalyc.org/articulo.oa?id=54924517006> ISSN 2014-3214

13. Hair, Bush y Ortinau (2010). Investigación de mercados: En un ambiente de


información cambiante. Cuarta edición, México: Mc Graw Hill.

14. http://www.solucionesnetquest.com/papers/Onlinestandards_ES.pdf

15. http://www.ra-ma.es

16. http://www.cica.es/aliens/destious/Asignaturas/DE2ME2.html

17. http://www.posdem.esy.es

18. http://posdem.blogspot.com/p/descargar-el-programa.html

19. http://stats-2000.archivospc.com

20. http://www.software-
shop.com/in.php?mod=ver_producto&prdID=392#fragment-1

21. http://www.buenastareas.com/ensayos/Muestreo-Por-Internet/2628532.html

22. Jany, José Nicolás(2005). Investigación integral de mercados: decisiones sin


incertidumbre. Colombia: McGraw-Hill Interamericana S. A.
23. Jany, José Nicolás(2000). Investigación integral de mercados: un enfoque para el
siglo xxi. Colombia: McGraw-Hill Interamericana S. A.

24. Jany, José Nicolás(1996). Investigación integral de mercados: un enfoque


operativo. Bogotá – Colombia: McGraw-Hill / interamericana S.A.

25. Jonson, Richard(1997). Estadística para ingenieros de miller y freund. México:


Prentice Hall Hispanoamericana S.A.

26. Kazmier, Leornard J.(1981). Estadística aplicada a la administración y la


economía: Teoría y problemas resueltos. México: Mc Graw Hill, México.

27. Kummar, Aaker y Day (1999). Essentials of marketing research. New York: John
Wiley y Sons.

28. Levin y Rubin (1996). Estadística para administradores. México: Prentice-Hall


Hispanoamericana S.A.

29. Lislv, L.(1972). Muestreo de encuestas. Editorial: Trillar.

30. Lininger, C. A. (1984). La encuesta por muestreo: Teoría y práctica. México:


Continental.

31. Lohr; Sharon L.(2000). Muestreo: diseño y análisis. España: Thompson.

32. Malhotra, Naresh(2008). Investigación de mercados: un enfoque práctico.


México: Editorial Pearson-Prentice Hall.

33. Malhotra, Naresh(2004). Investigación de mercados un enfoque práctico. México:


Pearson-Prentice Hall.
34. Malhotra, Naresh(1997). Investigación de mercados: un enfoque práctico.
México: Prentice Hall.

35. Masón y Lind(1995). Estadística para administración y economía. México:


Alfaomega grupo editor S.A.

36. Merino, Mª J., Pintado, T., Sánchez, J., Grande, I y Estévez, M. (2010).
Introducción a la Investigación de Mercados. Madrid: ESIC.

37. McDaniels, Carl y Roger Gates (2005). Investigación de mercados. sexta edición,
Buenos Aires, Argentina: Thompson.

38. Migallon, Violeta (2017). Recuperado el 23 de febrero de 2017de 2016, disponible


en:
http://www.dccia.ua.es/~violeta/aplicaciones/muestreosistematico.html#temari
o_ancla

39. Miras, J.(1985). Elementos de muestreo para poblaciones finitas. INE.

40. Murray y Spiegel(1991). Estadística serie Schaum. Editorial: Mc Graw Hill.

41. Ochoa, Carlos (2016) MUESTREO NO PROBABILÍSTICO: MUESTREO POR


CUOTAS. Recuperado el 03 de marzo de 2017, disponible en:
https://www.netquest.com/blog/es/blog/es/muestreo-por-cuotas

42. ONWUEGBUZIE, A.J.; JOHNSON, R.B. (2004). Validity issues in mixed methods
research. Proceedings of American Educational Research Association, San Diego,
CA.

43. ONWUEGBUZIE, A.J.; LEECH, N.L. (2004). Enhancing the interpretation of


significant findings: The role of mixed methods research. Proceedings of Annual
Meeting of the Eastern Educational Research Association, Clearwater, FL.
44. Pardinas, Felipe (1972). Metodología y técnicas de investigación en ciencias
sociales. México: Siglo XXI.

45. Pérez, Cesar(1991). Técnicas de muestreo estadístico, teoría, práctica y


aplicaciones informáticas. España: RA-MA.

46. Pérez López, C. (2005). Muestreo estadístico: Conceptos y problemas resueltos.


Editorial: Pearson Prentice Hall.

47. Rius Diaz Francisca, Barón López Francisco Javier, Sánchez E., Parras Guijosa Luis
(1999) Bioestadística: Métodos y aplicaciones. Ed: SPICUM, Málaga. 3ª Edición,
ISBN: 84-7496-579-9

48. Rodríguez, Francisco y otros(1994). Introducción a la metodología de las


investigaciones sociales. La Habana: Política.

49. Rodríguez Osuna, J.(1993). Métodos de muestreo. casos prácticos. Madrid,


España: CIS.

50. Rodríguez Osuna, J.(1991). Métodos de muestreo. casos prácticos. Madrid,


España: CIS.

51. Sierra Bravo; Citado por Gonzalo Aneiva(1991). Metodología de la investigación.


Tarija.

52. Scheaffer, R. L.; Mendenhall, W; Ott, L.(1987). Elementos de muestreo. Editorial:


Iberoamérica.

53. Seymour Sudman (1980). improving the quality of shopping center sampling.
54. Teddlie Fen Charles (2007) Mixed Methods Sampling, A Typology With Examples.
Vol 1, Issue 1, pp. 77 – 100. Recuperado el 03 de marzo de 2017, disponible en:
Yuhttp://journals.sagepub.com/doi/10.1177/2345678906292430

55. Torres Bardales (1982). metodología de la investigación científica. Lima, Perú.

56. Walpole y Myers(1992). Probabilidad y estadística. México: McGraw-


Hill/Interamericana de México S.A.

57. Weiers, Ronald(1986). investigación de mercados. México: Prentice Hall.

58. Webb R. John(2002). Investigación de marketing: aspectos esenciales. Editorial:


Thompson.

59. Zikmund, Willam G. (1998). Investigación de mercados. México: Prentice Hall,


México.

60. Migallon, Violeta (2017). Recuperado el 23 de febrero de 2017, disponible en:


http://www.dccia.ua.es/~violeta/aplicaciones/muestreosistematico.html#temari
o_ancla

61. Migallon, Violeta (2017) publicado por la Universidad de Alicante, Curso de


introducción a la estadística. Recuperado el 17 de junio de 2017, disponible en:
http://www.dccia.ua.es/~violeta/aplicaciones/muestreosistematico.html
APENDICE
APENDICE 1: TABLA Z

0,4750

0 1,96 Valor estandarizado (Z)

Para obtener un valor de Z= 1,96 se deduce de una probabilidad de 0,95 dividido entre 2, lo que resulta 0,4750

Area bajo la curva Normal entre 0 y z

z 0 1 2 3 4 5 6 7 8 9
0.0 0,00000 0,00399 0,00798 0,01197 0,01595 0,01994 0,02392 0,02790 0,03188 0,03586
0,1 0,03983 0,04380 0,04776 0,05172 0,05567 0,05962 0,06356 0,06749 0,07142 0,07535
0,2 0,07926 0,08317 0,08706 0,09095 0,09483 0,09871 0,10257 0,10642 0,11026 0,11409
0,3 0,11791 0,12172 0,12552 0,12930 0,13307 0,13683 0,14058 0,14431 0,14803 0,15173
0,4 0,15542 0,15910 0,16276 0,16640 0,17003 0,17364 0,17724 0,18082 0,18439 0,18793

0,5 0,19146 0,19497 0,19847 0,20194 0,20540 0,20884 0,21226 0,21566 0,21904 0,22240
0,6 0,22575 0,22907 0,23237 0,23565 0,23891 0,24215 0,24537 0,24857 0,25175 0,25490
0,7 0,25804 0,26115 0,26424 0,26730 0,27035 0,27337 0,27637 0,27935 0,28230 0,28524
0,8 0,28814 0,29103 0,29389 0,29673 0,29955 0,30234 0,30511 0,30785 0,31057 0,31327
0,9 0,31594 0,31859 0,32121 0,32381 0,32639 0,32894 0,33147 0,33398 0,33646 0,33891

1.0 0,34134 0,34375 0,34614 0,34849 0,35083 0,35314 0,35543 0,35769 0,35993 0,36214
1,1 0,36433 0,36650 0,36864 0,37076 0,37286 0,37493 0,37698 0,37900 0,38100 0,38298
1,2 0,38493 0,38686 0,38877 0,39065 0,39251 0,39435 0,39617 0,39796 0,39973 0,40147
1,3 0,40320 0,40490 0,40658 0,40824 0,40988 0,41149 0,41309 0,41466 0,41621 0,41774
1,4 0,41924 0,42073 0,42220 0,42364 0,42507 0,42647 0,42785 0,42922 0,43056 0,43189

1,5 0,43319 0,43448 0,43574 0,43699 0,43822 0,43943 0,44062 0,44179 0,44295 0,44408
1,6 0,44520 0,44630 0,44738 0,44845 0,44950 0,45053 0,45154 0,45254 0,45352 0,45449
1,7 0,45543 0,45637 0,45728 0,45818 0,45907 0,45994 0,46080 0,46164 0,46246 0,46327
1,8 0,46407 0,46485 0,46562 0,46638 0,46712 0,46784 0,46856 0,46926 0,46995 0,47062
1,9 0,47128 0,47193 0,47257 0,47320 0,47381 0,47441 0,47500 0,47558 0,47615 0,47670

2 0,47725 0,47778 0,47831 0,47882 0,47932 0,47982 0,48030 0,48077 0,48124 0,48169
2,1 0,48214 0,48257 0,48300 0,48341 0,48382 0,48422 0,48461 0,48500 0,48537 0,48574
2,2 0,48610 0,48645 0,48679 0,48713 0,48745 0,48778 0,48809 0,48840 0,48870 0,48899
2,3 0,48928 0,48956 0,48983 0,49010 0,49036 0,49061 0,49086 0,49111 0,49134 0,49158
2,4 0,49180 0,49202 0,49224 0,49245 0,49266 0,49286 0,49305 0,49324 0,49343 0,49361

2,5 0,49379 0,49396 0,49413 0,49430 0,49446 0,49461 0,49477 0,49492 0,49506 0,49520
2,6 0,49534 0,49547 0,49560 0,49573 0,49585 0,49598 0,49609 0,49621 0,49632 0,49643
2,7 0,49653 0,49664 0,49674 0,49683 0,49693 0,49702 0,49711 0,49720 0,49728 0,49736
2,8 0,49744 0,49752 0,49760 0,49767 0,49774 0,49781 0,49788 0,49795 0,49801 0,49807
2,9 0,49813 0,49819 0,49825 0,49831 0,49836 0,49841 0,49846 0,49851 0,49856 0,49861

3 0,49865 0,49869 0,49874 0,49878 0,49882 0,49886 0,49889 0,49893 0,49896 0,49900
3,1 0,49903 0,49906 0,49910 0,49913 0,49916 0,49918 0,49921 0,49924 0,49926 0,49929
3,2 0,49931 0,49934 0,49936 0,49938 0,49940 0,49942 0,49944 0,49946 0,49948 0,49950
3,3 0,49952 0,49953 0,49955 0,49957 0,49958 0,49960 0,49961 0,49962 0,49964 0,49965
3,4 0,49966 0,49968 0,49969 0,49970 0,49971 0,49972 0,49973 0,49974 0,49975 0,49976

3,5 0,49977 0,49978 0,49978 0,49979 0,49980 0,49981 0,49981 0,49982 0,49983 0,49983
3,6 0,49984 0,49985 0,49985 0,49986 0,49986 0,49987 0,49987 0,49988 0,49988 0,49989
3,7 0,49989 0,49990 0,49990 0,49990 0,49991 0,49991 0,49992 0,49992 0,49992 0,49992
3,8 0,49993 0,49993 0,49993 0,49994 0,49994 0,49994 0,49994 0,49995 0,49995 0,49995
3,9 0,49995 0,49995 0,49996 0,49996 0,49996 0,49996 0,49996 0,49996 0,49997 0,49997

Fuentre: Elaboración propia en base a: http://epaeconuba.galeon.com/tablas/normal.xls

Вам также может понравиться