Вы находитесь на странице: 1из 15

1.

ALGUNAS DEFINICIONES BÁSICOS

Para dar comienzo al módulo virtual relacionado con la distribución de muestreo de la media
aritmética ( ), a continuación se presentan las definiciones básicas que a juicio del tutor son
x
pilar fundamental para abordar el curso.

Población. Es la totalidad de los elementos los cuales contienen las características de interés

Muestra. Es un subconjunto de observaciones que se seleccionan de una población y que


tienen las características de interés.

Elemento. Es la unidad por la cual se solicita información o que son medidas. El elemento
depende del objetivo que persiga el estudio

Unidad de muestreo. Corresponde al elemento o los elementos disponibles en la población


susceptibles de ser seleccionados en alguna etapa del proceso de muestreo.

Unidades de enumeración. También conocidos como conglomerados, se utilizan cuando no


es factible muestrear las unidades de enumeración directamente.

Conglomerado. Es un conjunto de unidades que se encuentran físicamente cerca.

Población estadística. Es un conjunto de mediciones sobre todos los elementos del universo
resultando en lo que se conoce como poblaciones multivariadas

Marco muestral. Es un listado de todas las unidades de muestreo disponibles para su


selección en una etapa del muestreo.

ESTADÍSTICO: es cualquier función de las observaciones de una muestra.

Desde otro punto de vista son valores que describen las características de una muestra, estos
valores son variables pues dependen de las fluctuaciones de la muestra. Entre los estadísticos
más conocidos se tienen:
la media muestral
x
la varianza muestral
s2
la desviación estándar muestral
s
la proporción muestral P.

Estos estadísticos tienen amplio uso en los procesos de muestreo cuando el interés es sacar
conclusiones en poblaciones con base en la información de muestras.
PARÁMETRO: Es un valor constante que describe las características propias de una población
estadística, Generalmente los parámetros en estadística se denotan con letras griegas como la
media poblacional y la desviación estándar poblacional .
µ σ

UN ESTIMADOR: Es una regla o método que dice como calcular la estimación de un parámetro
basándose en la información de una muestra, generalmente se expresa como una fórmula. Por

UNA ESTIMACIÓN: Es un valor particular de un parámetro obtenido de los valores de una


muestra.

Para mostrar la relación entre estadístico, parámetro y estimador en los procesos inferenciales
se presenta el siguiente cuadro:

Cuadro 1.
ESTADÍSTICO PARÁMETRO ESTIMADOR
Media muestral Media poblacional Media poblacional estimada
N
n
∑ Xi n
∑X i µ= i =1
∑X i
x = i =1 N µ̂ = i =1
n n
Varianza muestral Varianza poblacional Varianza poblacional
estimada
n N

∑ (X j − X ) 2
∑ ( X j − µ )2
S2 = i =1
σ2 = i =1 n

n −1 N ∑ ( X j − X )2
σˆ 2 = i =1
n −1
Desviación estándar Desviación estándar Desviación estándar
muestral N
poblacional estimada
n ∑ ( X i − µ )2 n

∑ (Xi − X ) 2
σ= i =1 ∑ (X i − X )2
S= i =1 N σˆ = i =1

n −1 n −1

3. CONCEPTOS PRELIMINARES DE MUESTREO

En investigación científica muchas de las veces es imposible hacer un estudio exhaustivo de los
elementos de la población o lo que se conoce como un estudio poblacional o censo, para este
caso, se hace necesario valerse de las técnicas de muestreo para tomar sólo una parte la cual
debe ser representativa de la población de estudio.

En este punto vale aclarar que el objetivo del curso no corresponde a realizar diseños de
muestreo para investigación científica sino en conocer la distribución que sigue la media
muestral siendo necesario conocer algunos tópicos iniciales de muestreo.
3.1 MUESTREO PROBABILISTICO

Para enmarcarlo en este tipo de muestreo debe cumplir con las siguientes condiciones

 Se puede definir el conjunto de muestras posibles


 Conocer para cada una de las muestras posibles la probabilidad
 El procedimiento seleccionado debe dar a cada elemento de la población una
probabilidad diferente de cero
 La selección debe ser aleatoria

3.2 MUESTREO NO PROBABILISTICO

Es aquel muestreo que no cumple con las condiciones citadas del muestreo aleatorio. Se vale
del conocimiento y la opinión personal para identificar los elementos de la población que se van
a incluir en la muestra. Son de este tipo: (Muestreo por conveniencia, por juicios, por prorrateo)

Cuando se hace muestreo probabilístico se tienen 3 casos que son los siguientes

MUESTRAS ORDENADAS CON REPETICIÓN

Si se tiene una población de tamaño N y se quiere tomar una muestra de tamaño n. El número
de muestras ordenadas con repetición de N elementos tomados de a n esta dado por:

Nn

N: Número de elementos distintos disponibles en la población


n: Número de elementos escogidos en la muestra

MUESTRAS ORDENADAS SIN REPETICIÓN)

Si se tiene una población de tamaño N y se quiere tomar una muestra de tamaño n. El


número de muestras ordenadas sin repetición de N elementos tomados de a n esta dado por:
. Cuando , entonces .
N! N=n P = N!
N P n
=
( N − n )!
N N

El término se lee N permutado n y se relaciona con el número de permutaciones u


N P n

ordenaciones que se pueden hacer de N elementos tomados de a n.

El símbolo se lee N factorial y esta representado por el producto de los enteros positivos
N!
desde N hasta 1.
N ! = ( N )( N −1)( N − 2)( N − 3)...  ( N − N )
Se asume que 0! = 1

Ejemplo: el resultado de cuatro factorial es.

4! = (4)(3)( 2)(1)(0! )

4! = 24

MUESTRAS NO ORDENADAS SIN REPETICIÓN

Si se tiene una población de tamaño N y se quiere tomar una muestra de tamaño n. El número
de muestras no ordenadas si repetición de N elementos tomados de a n esta dado por:

N!
N C n
=
( N − n )!(n!)
El término se lee N combinado n y se relaciona con el número de combinaciones o
N C n

muestras no ordenas sin repetición que se pueden obtener de N elementos de la población


tomados de a n.

Visto de otra forma es el número de diferentes agrupaciones de N objetos tomados de a n que


pueden ocurrir sin tener en cuenta el orden.

Ilustración: para mostrar de forma simple los resultados para cada uno de los casos
mencionados anteriormente se presenta el siguiente ejemplo.

Ejemplo 1. Suponga que se tiene el conjunto S=(A, B, C, D) una población de N=4 elementos.
Si el interés es tomar una muestra de tamaño 2 de esa población se tienen los siguientes
resultados.

a) MUESTRAS ORDENADAS CON REPETICIÓN

Elemento de la población (A, B, C, D)


Tamaño de la población N=4
Tamaño de la muestra n = 2
Número de muestras posibles ordenadas con repetición

N n = 42
= 16
Muestras posibles

AA BA CA DA
AB BB CB DB
AC BC CC DC
AD BD CD DD

b) MUESTRAS ORDENADAS SIN REPETICIÓN

Elemento de la población (A, B, C, D)


Tamaño de la población N=4
Tamaño de la muestra que se quiere tomar n = 2

Número de muestras posibles ordenadas sin repetición

N! 4!
N P n
= =
( N − n )! (4 − 2)!

4!
4 P 2
=
( 4 − 2)!

(4)(3)( 2)(1)
=
(2)(1)
= 12 Muestras posibles

AB BA CA DA
AC BC CB DB
AD BD CD DC

c) MUESTRAS NO ORDENADAS SIN REPETICIÓN

En la literatura estadística es conocido también como muestreo sin reposición

Elemento de la población (A, B, C, D)


Tamaño de la población N=4
Tamaño de la muestra que se quiere tomar n = 2

Número de muestras posibles no ordenadas sin repetición

.
N!
N C n
=
( N − n )!(n!)
4!
N C n
=
( 4 − 2)! (2!)

( 4)(3)(2)(1) 24
= = =6
( 2)(1)( 2)(1) 4

Muestras posibles cuyas parejas se muestran como sigue

AB BC
AC BD
AD CD

Note que a diferencia del muestreo ordenado sin repetición, si ya fue elegida la muestra AB no
puede ser elegida la muestra BA.

DEDUCCIÓN DEL VALOR ESPERADO DE LA MEDIA MUESTRAL

Si se tiene la variable X de una población de tamaño N cuya media es y varianza es .A


µ σ 2

las letras griegas se les denomina respectivamente media poblacional y varianza


µ yσ 2
poblacional.

Sea una muestra de n valores de esta población. La media muestral se


X 1 , X 2 , X 3 .......,X n
define mediante

X 1 + X 2 + X 3 + ........ + X n
X =
n
Como el valor de la media muestral esta determinado por los valores de las variables
X
aleatorias en la muestra, se tiene que es también una variable aleatoria.
X

El valor esperado de una media de muestra se calcula como sigue:

 X + X 2 + X 3 + ........+ X n 
E( X ) = E  1 
 n 

E ( X 1 ) + E ( X 2 ) + E ( X 3 ) + ........ + E ( X n )
E( X ) =
n

1
E( X ) = E ( X 1 ) + E ( X 2 ) + E ( X 3 ) + ........ + E ( X n )
n

n( µ)
E( X ) =
n

E( X ) = µ

Se espera que la media muestral sea igual a la media poblacional

DEDUCCIÓN DE LA VARIANZA DE LA MEDIA MUESTRAL


Si se tiene la variable X de una población de tamaño N cuya media es y varianza es .A
µ σ2
las cantidades se les denomina media poblacional y varianza poblacional,
µ yσ 2

respectivamente.

Sea una muestra de n valores de esta población. La varianza de la media


X 1 , X 2 , X 3 .......,X n
muestral se define por.

 X + X 2 + X 3 + ........+ X n 
Var( X ) = Var  1 
 n 

Por independencia se puede expresar como

1
Var( X ) = [Var( X 1 ) + Var( X 2 ) + Var( X 3 ) + ........+ Var( X n ) ]
n2

(σ 12 + σ 22 + σ 32 + ...... + σ n2 )
Var( x) =
n2

nσ 2
Var( X ) = 2
n

σ2
Var( X ) =
n

La varianza de la media poblacional es igual a la varianza poblacional dividida en el tamaño de


muestra.

Se ha demostrado que y .
E (X ) = µ σ2
Var ( X ) =
n
En adelante para estar en sintonía con la mayoría de textos de estadística, al referirnos a la
varianza de la media muestral se utilizará la notación

σ2
σ =
2
x
n
Con relación a su puede concluir que esta centrada alrededor de la media poblacional ,
X µ
pero su dispersión se reduce conforme aumenta el tamaño de la muestra.

ERROR ESTÁNDAR DE LA MEDIA MUESTRAL

Partiendo de muestras en poblaciones infinitas. El error estándar es la raíz cuadrada de la


varianza muestral expresado por

Si la población es infinita o el
σ
σx = Muestreo es con repetición
n

Si la población es finita
σ N −n 
σx = 
n  N −1 

El término se llama factor de corrección por finitud


 N − n
 N − 1 

El error estándar de estimación de la media muestral. se puede interpretar como el grado de


variabilidad que tiene la media muestral con respecto a la media poblacional. En otras palabras
es una medida de la incertidumbre que existe al estimar la media poblacional a partir de la
media muestral.

Cuando el muestreo se hace en poblaciones finitas o el muestreo es sin repetición visto


anteriormente, la varianza de la media muestral se obtiene mediante la formula

¿Cuándo usar el factor de corrección?


En muestreo se utiliza el factor de corrección si la relación
n
> 0.05
N

En adelante para no utilizar con el factor de corrección se trabajará sobre poblaciones infinitas

DISTRIBUCIÒN DE LA MEDIA MUESTRAL

Cuando el interés de una investigación es analizar por muestreo una característica cuantitativa,
tal como el peso de un producto, la longitud de una pieza manufacturada, o la estatura de cierta
especie. Es indispensable conocer la distribución de la media de esa muestra.

En general para este proceso se parte de una población de tamaño N con


parámetro y se toma una muestra de tamaño n de donde se puede obtener el
µ
estadístico , hay que observar que es una variable aleatoria porque resulta de
x x
calcular la media muestral de sólo una de todas las muestras posibles de tamaño
n que pueden resultar.

Este proceso de muestreo se puede esquematizar como se muestra en la


siguiente figura.

Población de tamaño N con media


Se toma una muestra aleatoria de n elementos de esa población
=?
A partir de los datos de la muestra se obtiene el estadístico
El valor se utiliza para estimar el valor del parámetrode la población

Como el interés recae en el comportamiento de la variable aleatoria , su distribución se


x
señala en la siguiente definición:

Si es una muestra aleatoria de tamaño n, proveniente de una población


x1 , x2 ,....., xn
normal con media y varianza . Si es la media de esa muestra, la distribución de
µ
σ2 x x

es aproximadamente normal con media y varianza . ER


µ σ2

De manera equivalente se puede decir que al tomar una muestra grande de una población
normal, la distribución de la media muestral ( ) sigue una distribución normal y se espera
xi
que la media de esa muestra sea igual a la media poblacional lo que se simboliza por
, y que la varianza muestral sea igual a la varianza poblacional dividida en n, lo
E (x ) = µ
que se simboliza por
σ2
V (X ) =
n

TEOREMA DEL LÍMITE CENTRAL

Este es uno de los teoremas más importantes en probabilidad y en general en estadística

Si es la media de una muestra de tamaño n que se toma de una población normal con
x
media y varianza finita , entonces la variable tiende a la distribución
µ x −µ
σ 2
z =
σ
n
normal estándar a medida que n tiende a infinito

El teorema del límite central es importante en estadística porque permite

Observación: cuando se desconoce la varianza poblacional y se tiene que estimar a partir de


los datos de la muestra como , entonces la estadística ,
n
S 2 =∑ i
( x −x ) 2 x −µ
n −1
T =
i =1
s n
tiene una distribución t de Student con n –1 grado de libertad.

TALLER 1.
Caso 1. En un estudio para medir preferencias de sabor de cierta marca de jugos, una
importante empresa de investigación de mercados seleccionó sistemáticamente una muestra de
400 personas de un centro comercial en un fin de semana. Los encuestados corresponden a
personas que compraron algún tipo de producto de esa marca y que accedieron a contestar el
un formulario.

Caso 2.

En el hospital regional de una pequeña ciudad se han registrado en los últimos dos meses 18
casos de personas procedentes del sector rural que han sido afectadas por un virus mostrando
graves trastornos intestinales lo que ha causado la muerte a un menor de edad. Para averiguar
posibles causas la secretaria de salud ordena una investigación contratando con una firma
particular su realización, para su ejecución de un total de 250 hogares se diseñó un muestreo
aleatorio simple con un tamaño de 80 hogares.

Caso 3

Usted ha sido encargado para realizar en la población de niños menores de 10 años de un


sector marginado socialmente un estudio tendiente ha conocer las condiciones de salud oral en
que se encuentran. En época de vacaciones escolares planea tomar una muestrea de 85
hogares del sector y realizar la recolección de al información en compañía de un odontólogo.

Caso 4

Una compañía que quiere penetrar en el mercado local esta interesada en conocer los hábitos
de compra en artículos de limpieza que tienen los hogares de una ciudad. Considerando que la
población tiene hábitos de compra similares, la compañía planea adelantar un estudio por
muestreo aleatorio simple indagando a 140 hogares.

Caso 5

Con el objeto de conocer características socioeconómicas y motivo de viaje, una aerolínea


planea para el presente año hacerle seguimiento a una muestra aleatoria de 60 aviones
indagando a la totalidad de viajeros mediante la aplicación de un cuestionario diseñado para
cumplir con el objetivo del estudio.

Para cada caso desarrolle los siguientes puntos.

1. Para cada caso identifique los siguientes puntos:

• Población
• Muestra
• Unidad elemental
• Unidad de muestreo
• Marco muestral

2. Según el objeto de estudio de cada caso, haga un listado de las posibles variables por las
cuales se puede indagar y diga a que tipo corresponde cada una y en que escala de medida se
pueden obtener.

3. Elabore una encuesta de tal forma que puede recolectar la información sobre las
características que mencionó anteriormente.
Teorema del límite central

1. Suponga que una máquina dispensadora de refrescos la cantidad que envasa es una
variable aleatoria que tiene distribución normal con media 10 onzas y desviación estándar de 1
onza, si se propone realizar 66 mediciones del líquido dispensado.

a) Exprese el significado de
x
b) ¿qué distribución tiene ?
x
c) ¿cuál es error estándar e interprételo?
d) ¿Cual es la probabilidad de que sea por lo menos 10.3
x

2. En la fabricación de cojinetes para motores, se sabe que el diámetro promedio es de 5 cm


con una desviación estándar de 0,005 cm. El proceso es vigilado en forma periódica mediante
la selección aleatoria de 64 cojinetes, midiendo sus correspondientes diámetros. El proceso no
se detiene mientras que la media muestral se encuentre entre dos límites especificados, sea de
0,95. Determine el valor de esos límites. ¿Cuál es la distribución de y con que parámetros?
x

3. Suponga que el contenido de nicotina de cierta marca de cigarrillos tiene distribución normal
con media µ = 25 miligramos y desviación estándar de σ = 4 miligramos. Se toma una
muestra de aleatoria de 50 cigarrillos que arroja una media muestral de = 26 miligramo.
x
Halle la probabilidad de que una muestra de este tamaño arroje una media muestral de la
magnitud dada o mayor.

4. Sea la calificación promedio de grupo de estudiantes seleccionados al azar en cierta

x
universidad. Se sabe que la distribución de tiene media 2.5 y desviación estándar de 0.4. Si
x
se toma una muestra de 36 y se obtiene el valor de . ¿Cuál es la probabilidad de que
x

a) sea menor que 2,4,


b) esté en el intervalo (2,4 - 2,7).
5. Un fabricante de bombillas dice que su producto tiene una vida media de duración de 700
horas con una varianza de 14400 horas. El dueño de un taller le compró a dicho fabricante 144
bombillas con la idea de hacer más compras en el futuro si la duración media de la muestra la
resulta superior a 680 horas. ¿Qué probabilidad hay de que el dueño del taller no vuelva ha
realizar compras de bombillas de esa marca?

6. Los paquetes de cartón que contienen un determinado artículo fabricado por un


establecimiento industrial, tienen un peso medio de 300 kg y una varianza de 2500 kg. ¿Cuál es
la probabilidad de que 25 paquetes, tomados al azar, y cargados en un camión de distribución
del producto, excedan la capacidad del camión que es de 8200 kg?.

Вам также может понравиться