Вы находитесь на странице: 1из 18

Jimnez Zavaleta, Ramiro. (2012). Muestreo aleatorio simple [Notas de clase]. Mxico: Universidad Autnoma de Chiapas.

Muestreo aleatorio simple


La definicin de este mtodo y el proceso de seleccionar una muestra aleatoria simple dependen de si la poblacin bajo estudio es finita o infinita. En el ejemplo de Dominos Pizza, visto en la subcompetencia anterior, la poblacin es finita.

Muestreo para poblaciones finitas Una muestra aleatoria simple para poblaciones finitas de tamao n, de una poblacin finita de tamao N, es una muestra seleccionada de tal manera que cada muestra posible de tamao n tenga la misma probabilidad de ser seleccionada.

Supongamos que se desea realizar una encuesta a todos los estudiantes de la Facultad de Pedagoga de la Unach, los cuales en total suman 1 350.

Un procedimiento para seleccionar una muestra aleatoria simple de esta poblacin es seleccionar uno por uno los elementos que conformarn a la muestra, de tal forma que cualquiera de los elementos que vayan quedando en la poblacin, tras seleccionar al primero, tengan la misma probabilidad de ser seleccionados.

Para el ejemplo de los estudiantes de la Facultad de Pedagoga, primero se debe enumerar a cada uno de los estudiantes, asignndole un nmero progresivo (1, 2, 3,, 1 349, 1 350) en el orden en que aparecen sus expedientes archivados. Luego, auxilindonos de la tabla de nmeros aleatorios, seleccionamos los elementos de la muestra:

Fuente: Anderson, Sweeney y Williams (1999, p. 252).

Esta tabla est elaborada de tal forma que los dgitos que componen a los diferentes nmeros tienen la misma probabilidad de poder ser seleccionados. Como el nmero mximo de estudiantes de la Facultad de Pedagoga es 1 350 y este nmero tiene 4 dgitos, entonces utilizaremos nmeros aleatorios de 4 dgitos. Por ejemplo, al usar el primer rengln, se consideraran los nmeros: 6 327, 1 599, 8 671, 7 445, 1 102, 1 514, 1 807, etctera. Como los nmeros de esta tabla son aleatorios, entonces estos nmeros tambin lo son.

Al utilizar estos nmeros conformados por 4 dgitos se puede proceder a seleccionar los elementos de la muestra. Los nmeros que superen en valor al nmero mximo de elementos de la poblacin (1 350) se desechan y se utiliza el siguiente nmero aleatorio. Del conjunto de nmeros ejemplificados anteriormente, slo nos servira el nmero 1 102, por lo que se seleccionara al estudiante con ese nmero como un elemento de la muestra y se continuara con este proceso hasta completar el nmero total de elementos que debe tener la muestra.

El posible que durante el proceso de seleccin de la muestra probabilstica un nmero aleatorio que ya haya sido utilizado aparezca de nuevo. Esto da origen a dos tipos de muestreo: Muestreo sin reemplazo es aquel en el cual un mismo nmero aleatorio no debe de utilizarse dos o ms veces debido a que el elemento asociado al mismo ya forma parte de la muestra y no deben tenerse repeticiones de elementos. Muestreo con reemplazo es aquel en el que se permite repetir nmeros aleatorios ya usados y, por lo tanto, repetir los elementos que conforman la muestra.

El tipo de muestreo ms utilizado al seleccionar una muestra probabilstica o muestra aleatoria simple es el muestreo sin reemplazo.

Muestreo para poblaciones finitas

Cuando la poblacin que se desea muestrear no es finita, o bajo ciertas circunstancias puede considerarse infinita, se utiliza el siguiente criterio para seleccionar una muestra:

Muestra aleatoria simple para poblaciones infinitas Una muestra aleatoria simple de una poblacin infinita es aquella que se selecciona de tal forma que se satisfacen las siguientes condiciones:

1. Cada elemento seleccionado proviene de la misma poblacin. 2. Cada elemento se selecciona en forma independiente.

Por ejemplo, si se desea conocer el nivel acadmico y grado de estudio: 1, 2, 3... de primaria, secundaria, etctera, de las personas que asisten a ver una pelcula a un cine, la muestra podra seleccionarse de la siguiente manera:

1. Considerar nicamente personas que compran su boleto y entran a una sala a ver una pelcula. 2. Por cada persona que lleve puesta una camisa o blusa blanca, se le pregunta el grado de estudios al acompaante o la siguiente persona en la fila de asistentes.

Las dos condiciones anteriores para seleccionar una muestra aleatoria simple cumplen con las dos condiciones establecidas en la definicin de muestra aleatoria simple para una poblacin infinita.

Como fue mencionado anteriormente, para que de una muestra de una poblacin puedan obtenerse estimadores puntuales insesgados, eficientes y consistentes, el tamao de una muestra debe ser de al menos 30 elementos de la poblacin y ser seleccionada de manera aleatoria para ser representativa.

La estimacin en el muestreo aleatorio simple

En la mayora de las encuestas no se conoce la forma de la distribucin de probabilidades. Sin embargo, el teorema del lmite central asegura que en caso de que una muestra aleatoria contenga al menos 30 elementos, la muestra proporciona estimadores puntuales insesgados.

La media aritmtica se define de la siguiente manera:

(1)

Donde: = es la media aritmtica de la muestra = es el elemento de la muestra

n = el nmero de elementos que contiene la muestra

La desviacin estndar de la muestra se define as:


(2)

Donde: s = desviacin estndar de la muestra = es la media aritmtica de la muestra = es el elemento de la muestra

n = el nmero de elementos que contiene la muestra

Error estndar de la media

Cuando se selecciona una muestra aleatoria simple de tamao n de una poblacin finita de tamao N, un estimador del error estndar de la media es:

( )

(3)

Donde:

= es el estimador del error estndar de la media poblacional

= es la desviacin estndar de la muestra N = el nmero total de elementos de la poblacin n = el nmero de elementos de la muestra

Estimado del intervalo aproximado de 95% de confianza para la media poblacional

Cuando en la aplicacin de una encuesta se utiliza una muestra aleatoria simple y se desea obtener un intervalo de confianza aproximado de un 95% para la media poblacional, el estimador de tal intervalo se calcula as:

(4)

Donde: = es la media aritmtica de la muestra aleatoria simple seleccionada

= es el error estndar de la media aritmtica

Total de la poblacin

Una vez estimada la media aritmtica poblacional () se puede utilizar para representar a cualquier elemento de la poblacin, y conociendo el nmero total de elementos de la poblacin, se puede obtener un estimador puntual del total de la poblacin (X). Este estimador se obtiene multiplicando el nmero total de elementos de la poblacin N por el valor de la media de la poblacin ( ), por lo que un estimador puntual de un total de la poblacin es: (5)

Donde: = es el estimador puntual del total de la poblacin N = es el nmero total de elementos de la poblacin = es la media aritmtica de la muestra aleatoria simple seleccionada Un estimador del error estndar del estimador es:

(6)

Donde:

= es el error estndar del estimador

N = nmero total de elementos de la poblacin

= es el error estndar de la media aritmtica (el cual ya fue definido anteriormente)

Un estimador aproximado de 95% del intervalo de confianza para el total de la poblacin es:

(7)

Donde: = es el estimador puntual del total de poblacin N = es el nmero total de elementos de la poblacin = es la media aritmtica de la muestra aleatoria simple seleccionada

= es el error estndar del estimador

Proporcin de la poblacin

La proporcin p de la poblacin es la fraccin de los elementos que tienen cierta caracterstica de inters. Por ejemplo, durante la presentacin del examen de admisin a la Unach se podra tener inters de conocer cul es la proporcin de estudiantes que prefieren la licenciatura de Medicina humana. Esto es, si se tiene una poblacin total de N elementos en los cuales m elementos tienen una caracterstica similar, entonces se define la proporcin p as: (8)

Donde: p = a la proporcin que m elementos representan del total de elementos N de la poblacin m = nmero de elementos de la poblacin que tienen una caracterstica similar N = nmero total de elementos de la poblacin

Estimador de la proporcin de la poblacin La proporcin , de n1 elementos pertenecientes a una muestra aleatoria simple de n elementos, es un estimador puntual insesgado de la proporcin de la poblacin, y se define as: (9)

Donde: = es la proporcin de n1 elementos de la muestra aleatoria simple de n elementos n1 = es el nmero de elementos de la muestra aleatoria simple que tienen una caracterstica similar n = es el nmero de elementos de la muestra aleatoria simple

Estimador del error estndar de la proporcin

Cuando se utiliza una muestra aleatoria simple de tamao n, de una poblacin con un total de N elementos, un estimador insesgado del error estndar de la proporcin es:

)(

(10)

Donde:

= es el estimador del error estndar de la proporcin

N = nmero total de elementos de la poblacin n = es el nmero de elementos de la muestra aleatoria simple = es la proporcin de n1 elementos de la muestra aleatoria simple de n elementos

Estimado aproximado de 95% de un intervalo de confianza para la proporcin de la poblacin

Cuando se utiliza una muestra aleatoria simple y se desea obtener un intervalo de confianza aproximado de un 95% para la proporcin de la poblacin, un estimador insesgado se calcula as:

(11)

Donde: = es la proporcin de n1 elementos de la muestra aleatoria simple de n elementos

= es el estimador del error estndar de la proporcin

Ahora bien, como ya fue mencionado con anterioridad, como resultado de la experiencia a travs del trabajo con diferentes tipos de poblaciones y muestras, el nmero mnimo de elementos de una muestra aleatoria simple debe ser de 30 elementos para que se obtengan estimadores insesgados. Esto realmente es un punto de partida. A continuacin vamos a presentar un procedimiento con el cual se puede determinar el tamao de una muestra utilizando el resultado emprico anterior.

Procedimiento para determinar el tamao de una muestra aleatoria simple para una poblacin finita de N elementos

Supongamos que se tiene una poblacin de N elementos, de la cual se desea conocer el tamao para una muestra aleatoria simple de n elementos que permita obtener estimadores insesgados. En esta situacin, el error estndar de la media poblacional ( ,) de la media aritmtica (), que an no se conoce, de acuerdo a la frmula (3) se calcula as:

= es el estimador del error estndar de la media poblacional

= es la desviacin estndar de la muestra N = el nmero total de elementos de la poblacin n = el nmero de elementos de la muestra

El error estndar de la media aritmtica representa la mitad del ancho del intervalo alrededor de la media aritmtica de la muestra, dentro del cual se asegura que se encuentra el valor de la media aritmtica de la poblacin. Esto es: el error estndar de la media aritmtica es una medida de la precisin entre los valores numricos de la media aritmtica poblacional y la media aritmtica muestral. Esta ltima la proporciona la muestra aleatoria simple que se seleccione con el tamao de muestra n que se determine.

Al despejar la variable n, se tiene la siguiente frmula para calcular el valor del tamao de la muestra:

(12)

Donde: N = el nmero total de elementos de la poblacin n = el nmero de elementos de la muestra

= es el estimador del error estndar de la media poblacional

= es la desviacin estndar de la muestra

En esta ltima frmula se encuentra inmersa la desviacin estndar de la muestra (s), y nuevamente se cae en el crculo vicioso de expresar el tamao de la muestra (n) en funcin de la desviacin estndar de la muestra, la cual an no se ha determinado. Sin embargo, aqu es cuando se utiliza el resultado emprico en el cual se asegura que, como una primera aproximacin, una muestra aleatoria simple debe estar conformada de al menos 30 elementos. A continuacin se presenta el procedimiento para obtener un tamao de muestra adecuado:

1. Se toma la muestra en dos etapas. Primero una muestra aleatoria simple de 30 elementos, la cual proporciona estimadores insesgados, y con esta muestra se calcula el valor de la desviacin estndar de la muestra (s). 2. Una vez determinado el valor de la desviacin estndar de la muestra (s), se establece el grado de precisin que se desea alcanzar con el tamao de muestra que se requiere calcular, dndole un valor al error estndar de la media aritmtica ( ). Si por suerte se cuenta con el valor de la desviacin estndar (s), gracias a un estudio anterior realizado sobre la misma poblacin, o bien, se instrumenta una encuesta preliminar para determinar dicha desviacin estndar, tambin estos valores pueden ser utilizados en el proceso antes presentado para el clculo del tamao de una muestra aleatoria simple.

A continuacin se desarrolla un ejemplo para precisar el procedimiento anterior.

Planteamiento del problema

Se va a realizar un estudio referente a la estatura medida en centmetros de una poblacin total de 185 estudiantes del Centro de Estudios en Fsica y Matemticas Bsicas y Aplicadas (Cefymap) de la Universidad Autnoma de Chiapas. Para ello se desea conocer el tamao de una muestra aleatoria simple que permita conocer los estimadores puntuales que se requieren con un

error de muestreo mximo de 2 cm; esto es, con un intervalo de confianza de 4 cm.

El procedimiento que debe realizarse para determinar el tamao de una muestra estadstica que cumpla con los requerimientos indicados es el siguiente:

1. Se parte del supuesto de que los datos precisos de los 185 estudiantes se desconocen, y que sera costoso y tardado tratar de medir con una cinta mtrica a todos y cada uno de los 185 estudiantes. 2. Por lo anterior, se hara la lista de los estudiantes de todos los grupos, tomando en consideracin una sola vez a cada estudiante, y se elaborara una lista secuencial a partir del primer estudiante, asignndole el nmero 1, y a los subsecuentes los nmeros 2, 3, 4, etctera. 3. Con la lista anterior se procedera a seleccionar una muestra de 30 estudiantes, para lo cual se utilizara la tabla de nmeros aleatorios, aplicando el mtodo de seleccin de nmeros aleatorios de 3 dgitos, ya que la poblacin total es de 185. Aquellos nmeros aleatorios que sean mayores que 185 se desechan y se procede a utilizar el siguiente, hasta reunir los 30 datos (este tamao de muestra, de acuerdo al teorema del lmite central, produce estimadores insesgados). 4. Para efectos de este ejercicio se supondr que los datos reales de las estaturas de los 185 estudiantes, conforme a la lista elaborada, son los que se muestran en la tabla de abajo (es importante recordar que para el caso prctico estos datos se desconocen, como ocurre en la mayora de los estudios estadsticos).

Datos de una poblacin de 185 estudiantes del Cefymap de la Unach Num 1 2 3 Dato Num Dato Num Dato Num Dato Num Dato 160,5 166,9 186,7

152,0 41 171,6 42 153,2 43

177,5 81 159,3 82 166,6 83

183,2 121 165,9 122 166,5 123

180,6 161 167,0 162 154,7 163

4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27

167,4 44 150,6 45 182,5 46 186,2 47 152,1 48 175,2 49 157,0 50 170,6 51 147,3 52 173,6 53 165,2 54 163,8 55 175,3 56 172,3 57 187,8 58 183,2 59 164,3 60 182,0 61 155,2 62 145,8 63 168,9 64 164,6 65 166,9 66 157,1 67

151,1 84 184,9 85 146,7 86 152,6 87 168,2 88 188,3 89 151,5 90 156,1 91 182,5 92 174,6 93 159,9 94 151,5 95 178,7 96 174,7 97 164,2 98 179,4 99 172,9 100 183,8 101 186,6 102 177,1 103 167,3 104 151,0 105 168,2 106 178,5 107

173,3 124 146,0 125 148,7 126 166,6 127 148,7 128 173,3 129 152,5 130 152,3 131 189,4 132 165,3 133 168,3 134 165,9 135 151,3 136 185,0 137 146,6 138 165,4 139 165,0 140 171,2 141 176,3 142 177,7 143 159,1 144 178,3 145 171,4 146 164,4 147

178,3 164 159,3 165 173,2 166 174,1 167 186,3 168 145,5 169 184,9 170 146,7 171 178,4 172 183,4 173 146,8 174 174,4 175 159,8 176 150,1 177 184,2 178 166,8 179 146,4 180 164,4 181 164,3 182 162,3 183 171,3 184 179,7 185 161,5 155,0

159,7 168,4 175,4 176,5 177,8 149,9 162,3 178,6 150,0 171,0 160,0 154,1 168,5 145,2 157,3 149,3 156,3 176,7 158,2 180,0 145,6 183,0

Num 28 29 30 31 32 33

Dato

Num

Dato

Num

Dato

Num

Dato 166,3 148,8 188,0 169,8 156,7 184,1

Num

Dato

158,9 68 169,7 69 175,5 70 162,2 71 150,6 72 174,8 73

181,8 108 167,4 109 157,7 110 186,6 111 166,4 112 185,0 113

147,0 148 169,0 149 149,9 150 185,3 151 161,4 152 154,6 153

34 35 36 37 38 39 40

184,1 74 184,2 75 159,5 76 163,2 77 174,1 78 185,1 79 187,3 80

159,6 114 156,1 115 154,1 116 183,4 117 185,6 118 179,5 119 168,2 120

173,9 154 151,4 155 170,5 156 183,1 157 158,0 158 181,3 159 189,5 160

173,4 170,7 180,6 188,9 150,4 163,2 168,0

5. Cuando se realiza el proceso de seleccin por medio de la tabla de nmeros aleatorios se seleccionan los estudiantes seriados con los nmeros: 27, 164, 40, 96, etctera, tal como se muestra en la tabla de datos, en la cual los nmeros en color rojo nos indican el nmero serial que le fue asignado en la lista de los 185 estudiantes a cada uno de ellos.

Entonces se procede al trabajo de campo de realizar la medicin directa con una cinta mtrica a estos estudiantes (en nuestro ejemplo, la estatura de estos estudiantes debe ser la misma que la que aparece en la tabla de los 185 datos presentada con anterioridad, ya que se supone que esas son sus estaturas).

Muestra aleatoria simple de 30 elementos Num 27 164 40 96 158 22 126 88 26 142 Dato 157,1 159,7 187,3 151,3 150,4 155,2 173,2 148,7 166,9 164,3 Num 76 116 166 162 123 174 58 90 48 101 Dato 154,1 170,5 175,4 166,9 154,7 160,0 164,2 152,5 168,2 171,2 Num 73 181 29 61 183 2 150 38 14 23 Dato 185,0 176,7 169,7 183,8 180,0 171,6 188,0 174,1 165,2 145,8

6. Con estos datos, utilizando la frmula 1, se procede a calcular la media aritmtica de la muestra (de 30 elementos):

7. Con la utilizacin de la frmula 2, se calcula la desviacin estndar de la muestra. Esta da lo siguiente:

8. Ahora bien, para el requerimiento de que el error de muestreo mximo sea de 2 cm, es decir, que la media aritmtica de la poblacin () y la media aritmtica de la muestra que se desea conformar( ) estn entre s a una longitud mxima de 2 cm (| del error muestral: | , aplicamos la frmula 3

Al aplicar la frmula 12, se calcula el tamao de muestra deseada:

( )

9. Al sustituir los valores de la media aritmtica, de la desviacin estndar y del error mximo de muestreo se obtiene el resultado siguiente:

Este ltimo resultado significa que con una muestra aleatoria simple de 80 elementos de la poblacin de 185 estudiantes, pueden obtenerse estimadores insesgados dentro de un intervalo de confianza de 2 cm.

Tal es el procedimiento que se recomienda para cuando en algn caso prctico, en el cual generalmente se desconoce el total de elementos que conforman a una poblacin bajo estudio, se desean determinar estadsticos insesgados de la poblacin.

Un ejemplo integrador

Si se toma como punto de partida a la muestra aleatoria simple de 30 elementos que fue seleccionada en el procedimiento para determinar el tamao de una muestra aleatoria simple para una poblacin finita de N elementos, se puede calcular el estimador del error estndar de la media aritmtica utilizando la frmula 3:

Este resultado era de esperarse, ya que precisamente este valor de utilizado para determinar el tamao de la muestra.

fue el

Con este valor de

y con el valor de la media aritmtica de la muestra

, se puede calcular, por medio de la frmula 4, un intervalo de

confianza de 95% para la media poblacional:

Esto es, el intervalo de confianza va de 162.39 a 170.39

Con el valor de la media aritmtica de la muestra se puede calcular, al utilizar la frmula 5, el estimador puntual del total de la poblacin:

Este estimador del total de la poblacin debe interpretarse correctamente. No se refiere al nmero total de elementos de la poblacin, ya que ese es N, sino que si el valor numrico de todos los elementos de la poblacin (de la caracterstica de inters que se est estudiando) tuviera el valor de , entonces la suma estimada de todos los elementos de la poblacin es .

Tambin se puede calcular, utilizando la frmula 6, el estimador puntual del error estndar del total de la poblacin:

Un estimador de un intervalo de confianza de 95% para el total de la poblacin, utilizando la frmula 7, se calcula as:

Esto es, que el intervalo de confianza va de 30042.15 a 31522.15

Ahora bien, supn que deseas responder la siguiente pregunta: cul es la proporcin de la poblacin de estudiantes que miden ms de 170 cm? Para responderla, primero debes recordar la definicin de proporcin segn lo establece la frmula 8. Adems, sabiendo que la proporcin de una muestra aleatoria simple es un estimador insesgado de la proporcin de la poblacin y considerando que en nuestro ejemplo el nmero de estudiantes de la muestra cuya estatura es mayor a 170 cm, es de 12, utilizando la frmula 9, un estimado de la proporcin de la poblacin se calcula as:

Una vez calculado este estimador se puede calcular, al utilizar la frmula 10, el estimador del error estndar de la proporcin de la poblacin:

)(

Un estimador del 95% del intervalo de confianza para la proporcin de la poblacin, utilizando la frmula 11, se calcula as:

Esto es, que el intervalo de confianza va de 0.23 a 0.56

Referencia

Anderson, David R., Dennis J. Sweeney y Thomas A. Williams. (1999). Estadstica para administracin y economa (Francisco Snchez Fragoso, trad.). Mxico: International Thomson Editores.