Вы находитесь на странице: 1из 23

Muestreo

• La ley de distribución normal es el modelo probabilístico más


empleado en la Estadística, debido a la aplicación de Teorema del
Límite Central; sin embargo, este resultado no es aplicable en todos
los casos. Existen leyes de probabilidad que siguen ciertas medidas
estadísticas, obtenidas a partir de las muestras, que nos permitirán
construir modelos inferenciales sobre los datos.
Muestreo. Conceptos
Razones para realizar el muestreo de una población.
• Los resultados de una muestra permiten calcular adecuadamente el valor del parámetro poblacional, con lo cual se ahorra tiempo
y dinero.
• Entrar en contacto con todos los miembros de la población consume demasiado tiempo.
• Resulta imposible verificar y localizar a todos los miembros de la población.
• El costo de estudiar a todos los elementos de la población resulta prohibitivo.
• En una prueba con frecuencia se destruye el elemento de la muestra y no se puede regresar a la población.

En una muestra sin sesgo, todos los miembros de la población tienen la posibilidad de ser seleccionados para la muestra. Existen
diversos métodos de muestreo de probabilidad.
• Muestra aleatoria simple, todos los miembros de la población tienen la misma posibilidad de ser seleccionados para la muestra.
• Muestra sistemática, se selecciona un punto de partida aleatorio y después se selecciona cada k-ésimo elemento subsiguiente de
la población para formar la muestra.
• Muestra estratificada, la población se divide en varios grupos, a los que se denominan estratos, y en seguida se selecciona una
muestra aleatoria de cada estrato.
• Muestreo por conglomerados, la población se divide en unidades primarias; después se toman las muestras de las unidades
primarias.
Distribuciones de muestreo

Colección completa de
Población personas, animales, plantas Grupo entero al que queremos describir o
(Universo) o cosas de los cuales se del que deseamos sacar conclusiones
desea recolectar datos.

Es un grupo de unidades
Muestra seleccionadas de un grupo Con su estudio, se espera obtener
mayor (población) conclusiones sobre la población

Es un valor (usualmente
Parámetro desconocido) que debe ser Usado para representar cierta característica
estimado de la población
La media µ, el total Ƭ, la varianza Ơ2 , la
desviación estándar Ơ, la proporción ƿ o π
Distribuciones de muestreo

Es una cantidad que se


Estadístico calcula a partir de una Proporciona información sobre los valores
muestra de datos desconocidos de la población

Dentro de una población, un parámetro


es un valor fijo que no varía; mientras que
sea posible extraer más de una muestra
de la misma población y el valor de un Un estadístico es una variable aleatoria que
estadístico variará de muestra a muestra sigue una ley de probabilidad
1
Varianza muestral 𝑠 2 = 𝑛−1 σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 2
σ𝑛
𝑖=1 𝑥𝑖
Media muestral o promedio 𝑥ҧ = 𝑛 1
Desviación estándar muestral s = σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 2
Total muestral Ƭ෠ = N𝑥ҧ 𝑛−1
𝑦
Proporción muestral pො = 𝑛 ; y es número de éxitos en n intentos
1. Distribuciones de muestreo de la media
Supongamos que se obtiene una muestra𝑋1, 𝑋2 , … 𝑋𝑛 de una población con media µ y varianza Ơ2 .
A partir de la muestra calculamos el promedio 𝑋ത

Ơ
La desviación estándar de la media muestral se denomina error estándar Ơ𝑥ҧ = 𝑛
2. Distribuciones de muestreo de la proporción

Supongamos que se obtiene una muestra𝑋1, 𝑋2 , … 𝑋𝑛 de una población que sigue una ley de
Bernoulli, Ber(p). Se define:

𝑌 = σ𝑛𝑖=1 𝑥𝑖 donde 𝑋𝑖 = 1 con probabilidad p y 𝑋𝑖 = 0 con probabilidad q=1-p; i=1,2,3… n


𝑌 1
La proporción de éxitos en la muestra es: pො = 𝑛 = 𝑛 σ𝑛𝑖=1 𝑥𝑖

La variable aleatoria Y tienen una


distribución binomial de
parámetros (n,p)
Donde: µ𝑌 = 𝑛𝑝; y Ơ2 𝑌 = 𝑛𝑝q
3. Distribuciones de muestreo de la varianza
En el Teorema del límite central la convergencia de la ley 𝑥ҧ está asegurada y es independiente de la ley que
siguen las observaciones. Para otros estadísticos, se necesitan hipótesis adicionales para asegurar la
convergencia hacia una ley de distribución, este es el caso de la varianza muestral

3.1 Ley de distribución 𝝌𝟐

Sean 𝑋1, 𝑋2 , … 𝑋𝑛 n variables aleatorias independientes que siguen una distribución normal estándar, la variable aleatoria
definida por T = σ𝑛𝑖=1 𝑋𝑖2 tiene una distribución χ2 (chi-cuadrado) con n grados de libertad (gl) detonada por χ2 (𝑛)
3. Distribuciones de muestreo de la varianza

3.2 Ley de distribución 𝒔𝟐

Supongamos que se obtiene una muestra 𝑋1, 𝑋2 , … 𝑋𝑛 de una población que sigue una ley normal N(µ, Ơ2 ). A partir de la
1
muestra calculamos la varianza muestral 𝑠 2 = 𝑛−1 σ𝑛𝑖=1 𝑋𝑖 − 𝑋ത 2 . Se cumple lo siguiente:
4. Distribuciones de muestreo de la media
con varianza desconocida
Se puede suponer que debido al TLC, siempre se tiene la convergencia hacia la ley normal; pero esto no
siempre sucede, como por ejemplo cuando la varianza poblacional es desconocida.

4.1 Ley de distribución t de Student

Los valores tabulados dependen de los grados de libertad, porque la ley de probabilidad t cambia si n varía.
Cuando n aumenta, la distribución t se aproxima a la distribución normal estándar.
4. Distribuciones de muestreo de la media
con varianza desconocida


4.2 Ley de distribución 𝑿

Supongamos que se obtiene una muestra 𝑋1, 𝑋2 , … 𝑋𝑛 de una población que sigue una ley normal N(µ, Ơ2 ) donde Ơ2 es

𝑋−µ
desconocida. Entonces, se cumple que la variable aleatoria 𝑇 = sigue una ley t de student con (n-1) grados de
𝑠/ 𝑛
libertad
5. Distribuciones de muestreo de la diferencia
de dos medias con varianzas conocidas
Supongamos que se dispone de dos poblaciones que tienen medias µ1 y µ2 y varianzas Ơ12 y Ơ22 ,
respectivamente. Sean 𝑋ത1 y 𝑋ത2 las medias muestrales de dos muestras aleatorias independientes de
tamaños 𝑛1 y 𝑛2 , seleccionadas respectivamente de las poblaciones 1 y 2. Entonces 𝑋ത1 − 𝑋ത2 , cumple que:

Para la mayoría de aplicaciones, se


obtiene una buena aproximación si
𝑛1 ≥ 25 y 𝑛2 ≥ 25
6. Distribuciones de muestreo de la diferencia
de dos medias con varianzas desconocidas
Supongamos que se dispone de dos poblaciones que siguen una ley normal: la población 1 con (µ1 , Ơ12 ) y
población 2 con (µ2 , Ơ22 ). Sean 𝑋ത1 y 𝑋ത2 las medias muestrales de dos muestras aleatorias independientes
de tamaños 𝑛1 y 𝑛2 , seleccionadas respectivamente de las poblaciones 1 y 2.
Caso 1. Varianzas poblacionales iguales Ơ𝟐𝟏 = Ơ𝟐𝟐 = Ơ𝟐

Caso 2. Varianzas poblacionales diferentes Ơ𝟐𝟏 ≠ Ơ𝟐𝟐

Cuando g no es un número natural, se redondea al entero más cercano


7. Distribuciones de muestreo de la diferencia
de dos proporciones
Supongamos que se dispone de dos poblaciones independientes que siguen distribuciones de Bernoulli de
parámetros 𝑝1 y 𝑝2 , respectivamente. De la primera población escogemos una muestra de tamaño 𝑛1 :
𝑋1, 𝑋2 , … 𝑋𝑛1 y de la segunda población escogemos una muestra de tamaño 𝑛2 : 𝑌1, 𝑌2 , … 𝑌𝑛2 . Construimos
las proporciones muestrales de “éxitos”:

Entonces 𝑝Ƹ1 − 𝑝Ƹ 2 cumple que:

Sigue aproximadamente una ley normal estándar por TLC:


8. Distribuciones de muestreo de la razón de
dos varianzas
8.1 La ley de Distribución F
Sean 𝑋1 y 𝑋2 dos variables aleatorias independientes que tienen distribución χ2 con 𝑛1 y 𝑛2 grados de
𝑋 /𝑛
libertad respectivamente; entonces la variable aleatoria 𝑉 = 𝑋1/𝑛1 sigue una distribución F (de Snedecor)
2 2
con (𝑛1 , 𝑛2 ) grados de libertad, que se notará como F (𝑛1 , 𝑛2 )

Los valores de las probabilidades vienen tabulados. Se


presenta el valor x para el cual la variable 𝑉~𝐹 𝑛1 , 𝑛2 es
igual a una probabilidad 𝛼: 𝑃 𝑉 > 𝑥 = 𝛼
8. Distribuciones de muestreo de la razón de
dos varianzas
8.2 La ley de Distribución 𝒔𝟐𝟏 /𝒔𝟐𝟐
Supongamos que se dispone de dos poblaciones que siguen una ley normal: la población 1 con (µ1 , Ơ12 ) y
población 2 con (µ2 , Ơ22 ). Sean 𝑠12 y 𝑠22 las varianzas de dos muestras aleatorias independientes de
tamaños 𝑛1 y 𝑛2 , seleccionadas respectivamente de las poblaciones 1 y 2.

𝑠12 /Ơ21
Entonces la variable aleatoria F = sigue una distribución F con (𝑛1 − 1, 𝑛2 − 1) grados de libertad
𝑠22 /Ơ22

Tengamos presentes que si: Ơ𝟐𝟏 = Ơ𝟐𝟐 = Ơ𝟐


𝑠12
entonces F = ~𝐹 𝑛1 − 1, 𝑛2 − 1
𝑠22
Ejemplos
Distribución
Muestral de la
media
Ejemplos
Distribución
Muestral de la
media

𝐸 𝑋ത = µ Desviación estándar de la media muestral


2
𝜎
𝑉𝑎𝑟 𝑋ത = 𝜎𝑋2ത =
𝑛

µ = ෍ 𝑋𝑖 . 𝑝𝑖

𝜎 2 = ෍ 𝑋𝑖2 . 𝑝𝑖 − 𝜇2
Ejemplos
Distribución
Muestral de la
proporción
Ejemplos Un jugador profesional de dardos decide tratar de mejorar su técnica de lanzamiento
y va a estudiar la varianza de las distancias al centro del blanco a las que cae el
dardo. Para una cierta técnica de lanzamiento que sabe que esas distancias tienen
Distribución una distribución normal cuya desviación estándar es 4cm. Realiza 30 lanzamientos y
Muestral de la calcula la varianza de las distancias entre el sitio de impacto y el centro.
varianza A) Calcular la probabilidad de que la desviación estándar de los lanzamientos sea
mayor a 3cm,
B) Calcular la media y la varianza de 𝑠 2 .
Ejemplos
Distribución
Muestral de la
media con
varianza
desconocida


𝑋−µ
𝑇= sigue una
𝑠/ 𝑛
ley t de student
con (n-1) grados de
libertad
Estimación e Intervalos de Confianza
Un estimador puntual es un solo valor (estadístico) para estimar un valor de la población (parámetro).

Un intervalo de confianza es un conjunto de valores entre los cuales se espera que ocurra el parámetro
de la población.

Los factores que determinan la magnitud de un intervalo de confianza de una media son:

• El número de observaciones en la muestra, n.


• La variabilidad en la población, normalmente calculada por la desviación estándar de la muestra (s)
• El nivel de confianza
𝜎
a) Cuando se conoce la desviación estándar de la población se utiliza la distribución z. 𝑋ത ± 𝑧 𝑛
𝑠
b) Cuando no se conoce la desviación estándar de la población se utiliza la distribución t. 𝑋ത ± 𝑡
𝑛

Una proporción es una razón, fracción o porcentaje que indica la parte de la muestra o población que posee una
característica particular.
𝑝(1−𝑝)
El intervalo de confianza de una proporción muestral con la siguiente fórmula: 𝑝 ± 𝑧 𝑛
Tamaño de una muestra
Es posible determinar un tamaño apropiado de muestra para calcular tanto medias como proporciones.
Factores que determinan el tamaño de una muestra cuando desea calcular la media.
• El margen de error máximo, E.
• El nivel de confianza deseado.
• La variación en la población.
𝑧𝜎 2
Para determinar el tamaño muestral de la media es: 𝑛 = 𝐸

Factores que determinan el tamaño de una muestra cuando desea calcular una proporción.
• El margen de error, E.
• El nivel de confianza deseado.
• Un valor de π para calcular la variación en la población.
𝑧 2
Para determinar el tamaño muestral de una proporción es: 𝑛 = 𝜋(1 − 𝜋) 𝐸

𝑁−𝑛
En el caso de una población finita, el error estándar se ajusta con el factor 𝑁−1
Estimación e Intervalos de Confianza

Вам также может понравиться