Академический Документы
Профессиональный Документы
Культура Документы
Tema5.InferenciaEstads3ca
ngelBarnCaldera
ngelCoboOrtega
MaraDoloresFrasDomnguez
JessFernndezFernndez
FranciscoJavierGonzlezOr@z
CarmenMaraSordoGarca
DEPARTAMENTODEMATEMTICAAPLICADAY
CIENCIASDELACOMPUTACIN
UNIVERSIDADDECANTABRIA
License:
Crea3veCommonsBYNCSA3.0
1. Muestreo:
Tamao y calidad de la muestra
Muestreo aleatorio
2. Inferencia estadstica:
Estimacin de una proporcin
Estimacin de una media
Estimacin de una varianza
3. Contraste de hiptesis usando
intervalos de confianza
Muestreo
muestra
estudiantes
de
la
Muestreo Aleatorio
Todos los elementos tienen la misma probabilidad de ser
incluidos en la muestra.
Sin reposicin de los elementos: no se permite que un mismo
individuo sea seleccionado ms de una vez.
Con reposicin: un elemento puede ser extrado varias veces.
Cuando la poblacin es grande la diferencia entre ambos casos
es mnima.
1-1
1-2
1-3
.
3-1
.
6-5
6-6
Inferencia Estadstica
El problema que aparece con ms frecuencia en la prctica es
el de la estimacin de parmetros de la poblacin, que son
desconocidos.
Existe una
utilizados para describir la
parmetros
poblacin
POBLACIN
utilizados
para estimar
de donde se
extrae una
muestra
aleatoria
la muestra
genera
utilizados
para evaluar
datos
numricos
estadsticos
Inferencia Estadstica
Se desea conocer la altura de los alumnos de la Universidad de
Cantabria
V.A. Altura
utilizados para describir la
POBLACIN:
alumnos de la
U.C
parmetro
poblacin
utilizados
para estimar
de donde se
extrae una
muestra aleatoria:
Alumnos
de 1 de
Grupo alumnos
Ingenieria Civil
utilizados
para evaluar
la muestra
genera
1.72,1.69,1.57...
23,18,20,1.90
2 0 .5
x = 1.71
S n = 0.53
1.7
Inferencia Estadstica
Estimacin puntual: Obtener un pronstico numrico
nico sobre un parmetro de la distribucin
Estimacin por intervalos: Obtener un margen de
variacin para un parmetro de la distribucin
Poblacin, parmetro
proporcin P
media
varianza 2
Objetivo:min
p1
p2
p3
p4
x
z=
N(0, 1)
P-e
P+e
P(a p b) = 1
P(P e p P + e) = 1
P-e
-
P+e
+
P+e
P(P e p P + e) = FN ( , )( P + e) FN ( , )( P e) = FN ( 0,1)
e
e
e
Pe
FN ( 0,1)
= FN ( 0,1) 1 FN ( 0,1) = 2 FN ( 0,1) 1 = 1
2
FN (0,1)(e / ) = 1 / 2
Donde
P-z/2
P+z/2
Pe
nP > 5
n(1 P) > 5
n / N < 0.9
Condiciones
de validez
nP > 5
n(1 P) > 5
Pe
nP > 5
n(1 P) > 5
n / N < 0.9
Ejemplo:
Condiciones
de validez
nP > 5
n(1 P) > 5
P(a P b) = 1
P(a P b) = 1
Partiendo del intervalo de probabilidad (1- ):
P(P e p P + e) = 1
Esta expresin se puede escribir como:
P(p e P p + e) = 1
Por lo que el intervalo [p-e, p+e] tiene una probabilidad
asociada de (1- ) de contener al parmetro P.
pe
Muestreo sin reemplazamiento y
poblacin finita
n ( p e) > 5
n(1 p e) > 5
n / N < 0.9
Condiciones
de validez
n ( p e) > 5
n(1 p e) > 5
Ejercicio
Ejemplo: Se quiere estimar la proporcin de zurdos en una poblacin con una
confianza del 95% y una precisin de 0.01.
1. Cul debe ser el tamao de la muestra escogida?
2. Mediante un muestreo previo se estima que p0.1, qu tamao debe tener la
muestra si para calcularlo se utiliza la estimacin de p obtenida?
Ejercicio
x4
x2
x3
P(a x b) = 1
Al igual que para proporciones, para la media el intervalo de
especial inters es el simtrico respecto de la media de la
poblacin.
P( e x + e) = 1
[ e, + e]
N n
z / 2
n(N 1 )
Varianza de la poblacin desconocida y n es pequea.
No se puede emplear 2/n, en su lugar se toma S2/n a partir de la muestra, por lo
que la distribucin ya no es exactamente una distribucin normal.
En este caso, si la distribucin de partida es normal, se considera el estadstico t
que se distribuye segn una t de Student con n-1 grados de libertad.
t de Student, t(n)
Forma de campana, simtrica y unimodal.
Eje de simetra en la recta X=0, por lo que su mediana = 0
n =1, 4, 16,
t de Student, t(n)
Los cuantiles de la
distribucin t(n)
aparecen en muchas
frmulas de inferencia
estadstica y se
aproximan mediante
tablas o mediante
programas de
ordenador.
> qt(0.95, 9)
[1] 1.833113
Ejercicio
En un instituto se sabe que la estatura de los
alumnos se ajusta a una N(165,82) en cm. Calcular la probabilidad
de que la altura media de 64 alumnos, elegidos al azar, est entre
163 y 167 cm.
x-
P(a b) = 1
P(a b) = 1
Usando la hiptesis de normalidad y de la misma manera que se
hizo para las proporciones:
xe
Varianza de la poblacin conocida y n grande (n30):
Muestreo sin reemplazamiento y
poblacin finita
N n
e = z / 2
n(N 1 )
e = z / 2
e = tn1, / 2
S
n
e = z / 2
n = z/2 2
e
Ejercicio
Si la vida en horas de una bombilla elctrica de 75 watios se
distribuye de forma normal con una desviacin tpica de 5 horas
y elegimos una m.a.s. de 30 bombillas cuya vida media es de
1014 horas, se pide:
1. Construir un intervalo de confianza para la vida media de las
bombillas con un nivel de significacin del 0.05.
2. Si queremos tener un nivel de confianza del 95% de que el
error en la estimacin de la vida media fuera menor de una hora,
Qu tamao de la muestra elegiramos?
Ejercicio
x142
Sx
2
24
2
1
2
3
S 2 , S n2
P(a S b) = 1
2
n
Por tanto:
n=30
n1 S
-2
S
P(a b) = 1
2
Ejercicio
Se sabe que el peso por bloque de un cierto preparado de
hormign se distribuye de forma normal. Con el objeto de
estudiar la varianza de la distribucin, se extrae una m.a.s de 6
bloques. Sabiendo que la varianza muestral es igual a 40,
estimar la varianza poblacional mediante un intervalo de
confianza al 90%.
Ejercicio
La resistencia a fractura X, en kg/cm2, de unas placas de acero
fueron:
69.5; 71.9; 72.6; 73.3; 73.5; 75.5; 75.7; 75.8; 76.1; 76.2;
77; 77.9; 78.1; 79.6; 79.7; 79.9; 80.1; 82.2; 83.7; 93.7
Calcular un intervalo de confianza para la desviacin tpica de la
distribucin de la resistencia a fractura al nivel de confianza 0.99
es vlido este intervalo cualquiera que sea el tipo de
distribucin de la v.a. X?
Ejemplo:
La proporcin de mujeres en Madrid toma un valor determinado:
P = 50.58%
Contraste paramtrico
Contraste no paramtrico
Contrastes paramtricos:
Si:
H0 : = 0.5,
entonces H1 puede ser: H1 : > 0.5 Contraste unilateral derecho
H1 : < 0.5 Contraste unilateral izquierdo
H1 : 0.5 Contraste bilateral
H0 : = 0
H1 : 0
Contraste bilateral
Ejercicio
Una muestra aleatoria de 36 cigarrillos de una marca
determinada dio un contenido promedio de nicotina de 3mg.
Suponga que el contenido de nicotina de este tipo de cigarrillos
sigue una distribucin normal con una desviacin estndar de
1mg.
1. Obtenga e interprete un intervalo de confianza del 95% para
el verdadero contenido promedio de nicotina en estos cigarrillos.
2. El fabricante garantiza que el contenido promedio de nicotina
es de 2.9 mg, qu puede decirse de acuerdo con el intervalo
hallado?
Ejercicio