T12 Inferencia Estadistica

Tema.12.
Inferencia estadística
Principales conceptos.
Muestreo. Distribución
muestral de un estadístico.
Principales distribuciones
muestrales.
Principales conceptos en inferencia estadística
Idea básica: Hacer inferencias sobre la población a

partir de la muestra que hemos extraído de la misma.
Ello nos lleva a tratar (brevemente) el tema del

muestreo. Pensemos que la muestra habrá de ser
representativa de la población, para que podamos
efectuar inferencias que tengan sentido.
Muestreo
Definición: Proceso que nos permite la extracción de
una muestra a partir de una población
Hay dos tipos básicos de muestreo:

1. Muestreo probabilístico. En este tipo de muestreo, la
probabilidad de aparición en una muestra de cualquier elemento
de la población es conocida (o calculable). Es el único
científicamente válido, y es sobre el que nos extenderemos
especialmente.
2. Muestreo no probabilístico. Es aquel en el que la selección de
los elementos de la muestra no se hacen al azar.
Muestreo probabilístico
Este muestreo garantiza que, a la larga, las muestras que se van

obteniendo de la población sean representativas de la misma. Vamos a
ver varios tipos de muestreo probabilístico.
1. Muestreo aleatorio simple

2. Muestreo estratificado
3. Muestreo por conglomerados
4. Muestreo por etapas (o polietápico)
5. Muestreo sistemático (?)
1. Muestreo aleatorio simple
Es aquel en el que, a priori, todos los elementos de la muestra tienen la

misma probabilidad de aparición.
Supongamos que tengamos una población de 50.000 individuos, y que

tenemos un listado con sus nombres. Si queremos elegir 100 personas,
lo que necesitamos es que el ordenador elija al azar a 100 individuos de
esos 50.000.
2. Muestreo estratificado
En el muestreo estratificado, los investigadores han de

dividir a los sujetos en diferentes subpoblaciones (o
estratos), en función de cierta característica relevante, y
después lo que hacen es un muestro aleatorio simple de
cada estrato.
Evidentemente, cada individuo debe pertenecer a un estrato
(y solo uno), y cada individuo del estrato habrá de tener la
misma probabilidad de ser escogido como parte de la
muestra.
Ejemplo: Supongamos que, en Valencia, 70% de los niños
de primaria van a escuela pública y el 30% a concertada. Si
queremos 1,000 niños, lo que haremos es dividir los
alumnos en 2 estratos (pública y concertada) y se eligen
aleatoriamente 700 niños de la pública y aleatoriamente 300
de la concertada.
3. Muestreo por conglomerados
En el muestreo por conglomerados, en lugar de considerar

cada elemento de la población, lo que consideramos son
“conglomerados de elementos”. El proceso es elegir
aleatoriamente uno o varios conglomerados y la muestra
estará formada por TODOS los elementos de los
conglomerados.
Ejemplos:
-En las encuestas durante las elecciones, los
conglomerados pueden ser las mesas electorales, y lo que
se hace es escoger algunas mesas al azar (y de ahí se toman
todos los votos de las mesas seleccionadas).
-En otros ejemplos, los conglomerados pueden ser los
bloques de viviendas, los municipios, etc.
4. Muestreo por etapas
En este caso se combina el muestreo aleatorio

simple con el muestreo por conglomerados:
Primero se realiza un muestreo por conglomerados (v.g., si

los conglomerados son colegios en Valencia, se seleccionan
aleatoriamente varios de ellos).
Segundo, no se eligen todos los alumnos (como ocurriría en
un muestro por conglomerados), sino que se elige una
muestra aleatoria. (Dicha muestra puede ser obtenida por
muestreo aleatorio simple o puede ser estratificado.)
Es decir, hemos tenido 2 etapas de muestreo. Y claro está,
es posible tener más de 2 etapas...
5. Muestreo aleatorio sistemático

Supongamos que tengamos una lista de N elementos
(e.g., estudiantes de secundaria) y queramos una
muestra de tamaño “n”. En este caso, lo que se hace
es ordenarlos (v.g., en función de los apellidos) y
después se elige aleatoriamente un elemento entre los
N/n=k primeros, y luego se elige de manera sistemática
el que esté k lugares después del primer elemento, y
así sucesivamente.
Ejemplo: Tenemos 10000 estudiantes (en una lista) y
queremos obtener una muestra de 100 estudiantes.
Primero elegimos al azar un estudiante entre los
10000/100=100 primeros (supongamos que salga el
26), el segundo elemento será el estudiante 100+26
(126), el siguiente será el 226, luego el 326, etc.
Muestreo no probabilístico
1. Muestreo sin norma (o de conveniencia)

Se elige a una muestra por ser conveniente, fácil,
económica. Pero no se hace en base a un criterio de
aleatoridad.
Ejemplo: las encuestas en los periódicos
electrónicos; el muestreo habitual en los trabajos en
psicología.
2. Muestreo intencional
En este caso, si bien el muestreo no es
probabilístico, los investigadores procuran que se
garantice la representatividad de la muestra
Distribución muestral de un estadístico
Supongamos que tenemos una variable aleatoria,

cuya distribución es f(x)
Supongamos, por simplicidad, que obtenemos una
muestra aleatoria simple con tamaño n
X1, X2, ... Xn
Entonces, un estadístico es cualquier función h

definida sobre X1, X2, ... Xn y que no incluye parámetro
desconocido alguno:
Y=h(X1, X2, ... Xn)
La distribución de dicho estadístico Y la vamos a denominar g(y)
Distribución muestral de un estadístico
Observad:
f(x) es la distribución de la v.a. bajo estudio
g(y) es la distribución del estadístico que tenemos
Es vital conocer la distribución muestral del

estadístico de interés para poder efectuar
inferencias sobre el parámetro correspondiente.
Esto es, para efectuar inferencias sobre la media

poblacional µ , necesitamos conocer la distribución
muestral de X
Distribución muestral de la media
Veremos primero el caso de que la distribución

subyacente sea normal, con media µ y varianza σ 2
La media de la distribución muestral de medias es

µ
La varianza de la distribución muestral de medias es σ2 /n
La forma de la distribución muestral de la media es normal.
Nota: La desviación típica de la distribución muestral suele ser denominada:

error típico de tal estadístico (v.g., “error típico de la media”, etc.)
Distribución muestral de la media. Ejemplo 1
Distribución poblacional
400
La línea (en este y sucesivos ejemplos) es una curva
subyacente (dist. Normal):
normal
Media=100
300 (Varianza=225)
Desv.Típica=15
200
100 Distribución muestral de la

media:
Desv. típ. = 4.75
Media = 99.9 Tamaño muestral=10
0 N = 3600.00
Media=100
82
84
86
88
90
92
94
96
98
10
10 .0
10 .0
10 .0
10 .0
11 .0
11 .0
11 .0
11 .0
.0
.0
0
6
8
4
.0
.0
.0
.0
.0
.0
.0
2
4
0
2
6.
(Varianza=225/10=22.5)
0
N10 En este y sucesivos gráficos: Número de réplicas Desv.típica= 22.5 = 4.74

500 subyacente (dist. Normal):
Media=100
400 Desv.Típica=15
300
200
Distribución muestral de la
media:
100
Desv. típ. = 3.36 Tamaño muestral=20
Media = 100.0
0 N = 3600.00 Media=100
(Varianza=225/20=11.3)
88
90
92
94
96
98
10
10
10
10
10
11
11
11
.0
.0
.0
.0
.0
.0
0.
2.
4.
6.
8.
0.
2.
4.
0
N20 Desv.típica=3.35
700 subyacente (dist. Normal):
600
Media=100
Desv.Típica=15
500
400
300
200 Distribución muestral de la

media:
100 Desv. típ. = 2.12
Media = 99.95 Tamaño muestral=50
0 N = 3600.00
Media=100
93
95
97
99
10
10
10
10
10
(Varianza=225/50=4.5)
.2
.2
.2
.2
1.
3.
5.
7.
9.
5
25
25
25
25
25
N50 Desv.típica=2.12
Distribución muestral de la media
Veremos ahora el caso de que la distribución

subyacente sea arbitraria, si bien sabemos que la
media es µ y la varianza sea σ 2
La media de la distribución muestral de medias es µ

La varianza de la distribución muestral de medias es σ 2 / n
La forma de la distribución muestral de la media TAMBIÉN tiende a ser normal.

En concreto, la distribución muestral se acercará más y más a la distribución
normal (media µ y varianza σ 2/n) a medida que se aumente el tamaño de cada
muestra.
Distribución poblacional La distribución GAMMA tiene 2 parámetros:

subyacente (dist. GAMMA): λ que es un parámetro de escala (1)
p 100
Media=100= = = 100
λ 1 p que es un parámetro de forma (100)
p 100
Varianza=100= = = 100
λ 2 12
0.045
0.04
0.035
0.03
0.025
0.02
0.015
0.01
0.005
0
80 85 90 95 100 105 110 115 120
subyacente (dist. GAMMA):
500
Media=100
Varianza=100
400
300
200
media:
100
Desv. típ. = 3.12 Tamaño muestral=10
Media = 100.0
0 N = 3600.00 Media=100
90
92
94
96
98
10
10
10
10
10
11
(Varianza=100/10=10)
.0
.0
.0
.0
.0
0.
2.
4.
6.
8.
0.
0
0
DISGAMMA Desv.típica= 10 = 3.16

Distribución poblacional (dist.

EXPONENCIAL): La distribución EXPONENCIAL tiene 1
Media=0.1=1/λ parámetro: λ (en el ejemplo: 10)
Varianza=0.01=1/λ 2
12
10
0
0 0.1 0.2 0.3 0.4 0.5 0.6
Ejemplo de distr.exponencial en psicología: v.g., tiempo transcurrido entre 2

pulsaciones de una rata en una caja de Skinner.
Distribución muestral de la media. Ejemplo 5a

400
EXPONENCIAL):
Media=0.1=1/λ
300 Varianza=0.01=1/λ 2
200
100
Desv. típ. = .03 media:
Media = .100
0 N = 3600.00 Tamaño muestral=10

Media=.100
.0
.0
.0
.0
.0
.0
.1
.1
.1
.1
.1
.1
.1
.1
.2
.2
.2
.2
31
44
56
69
81
94
06
19
31
44
56
69
81
94
06
19
31
44
EXPON10 (Varianza=0.01/10=.001)
Observad que la dist. muestral se aproxima a la normal Desv.típica=.03

Distribución muestral de la media. Ejemplo 5b
500
EXPONENCIAL):
400
Media=0.1=1/λ
300
Varianza=0.01=1/λ 2
200
100
Desv. típ. = .02
Media = .099 Distribución muestral de la
0 N = 3600.00 media:
Tamaño muestral=20
.0
.0
.0
.0
.0
.1
.1
.1
.1
.1
.1
.1
.1
44
56
69
81
94
06
19
31
44
56
69
81
94
EXPON20 Media=.100
Observad que la distribución muestral se aproxima

(Varianza=0.01/20=.0005)
más a la normal (al elevar el tamaño muestral). Desv.típica=.022
OTRAS DISTRIBUCIONES MUESTRALES (1)
Distribución muestral de X −µ
s%/ n
Cuando la distribución de la que obtenemos las medias muestrales es
gaussiana (“distr.normal”), la expresión anterior se distribuye según la
distribución t de Student con tn-1 grados de libertad. (Esta distribución es
básica para efectuar inferencias entre dos medias.)
s%2
Asumiendo varianzas
Distribución muestral de 1
s%
2
poblacionales iguales
2
Cuando las distribuciones de la que obtenemos las varianzas muestrales

son gaussianas, la expresión anterior se distribuye según la distribución
F de Fisher con n1-1 grados de libertad en el numerador y n2-1 grados
de libertad en el denominador. (Recordad que la distribución F es básica
para la razón de varianzas: ANOVA.)
OTRAS DISTRIBUCIONES MUESTRALES (2)
Distribución muestral de ns 2 / σ 2
Cuando las distribución de la que obtenemos la varianza muestral es

gaussiana, la anterior expresión se distribuye según la distribución chi-
cuadrado con n-1 grados de libertad.

T12 Inferencia Estadistica

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

T12 Inferencia Estadistica

Загружено:

Авторское право:

Доступные форматы

Tema.12.

Idea básica: Hacer inferencias sobre la población a

Ello nos lleva a tratar (brevemente) el tema del

Hay dos tipos básicos de muestreo:

Este muestreo garantiza que, a la larga, las muestras que se van

1. Muestreo aleatorio simple

1. Muestreo aleatorio simple

Es aquel en el que, a priori, todos los elementos de la muestra tienen la

Supongamos que tengamos una población de 50.000 individuos, y que

En el muestreo estratificado, los investigadores han de

3. Muestreo por conglomerados

En el muestreo por conglomerados, en lugar de considerar

4. Muestreo por etapas

En este caso se combina el muestreo aleatorio

Primero se realiza un muestreo por conglomerados (v.g., si

5. Muestreo aleatorio sistemático

1. Muestreo sin norma (o de conveniencia)

Supongamos que tenemos una variable aleatoria,

Entonces, un estadístico es cualquier función h

Es vital conocer la distribución muestral del

Esto es, para efectuar inferencias sobre la media

Veremos primero el caso de que la distribución

La media de la distribución muestral de medias es

La varianza de la distribución muestral de medias es σ2 /n

La forma de la distribución muestral de la media es normal.

Nota: La desviación típica de la distribución muestral suele ser denominada:

100 Distribución muestral de la

N10 En este y sucesivos gráficos: Número de réplicas Desv.típica= 22.5 = 4.74

200 Distribución muestral de la

Veremos ahora el caso de que la distribución

La media de la distribución muestral de medias es µ

La forma de la distribución muestral de la media TAMBIÉN tiende a ser normal.

Distribución poblacional La distribución GAMMA tiene 2 parámetros:

DISGAMMA Desv.típica= 10 = 3.16

Distribución poblacional (dist.

Ejemplo de distr.exponencial en psicología: v.g., tiempo transcurrido entre 2

Distribución poblacional (dist.

0 N = 3600.00 Tamaño muestral=10

Observad que la dist. muestral se aproxima a la normal Desv.típica=.03

Observad que la distribución muestral se aproxima

Cuando las distribuciones de la que obtenemos las varianzas muestrales

Cuando las distribución de la que obtenemos la varianza muestral es

Вам также может понравиться