Академический Документы
Профессиональный Документы
Культура Документы
ESTADÍSTICA II
AUTOR: Rogelio Alvarado Martinez
ÍNDICE
ÍNDICE
1.1. Introducción
1.3. Diferencia de medias con varianzas poblacionales desconocidas y (n1 y n2 ) > 30 (con n1 ≈ n2)
1.4. Diferencia entre medias de dos poblaciones normales con varianzas poblacionales desconocidas Acceso rápido
1.5. Diferencia entre medias de dos poblaciones normales con varianzas poblacionales desconocidas
GLOSARIO REFERENCIAS
1.1. INTRODUCCIÓN n1= 36 n2= 64 𝑋𝑋 " = 75 𝑋𝑋$ = 60 𝜎𝜎"$ = 41,16 𝜎𝜎$$ = 28,59
Un
problema
que
es
tan
importante
como
la
estimación
de
una
sola
media
poblacional
para
una
población
cuantitativa
es
la
comparación
de
dos
medias
poblacionales.
En
forma
similar
una
extensión
de
la
estimación
de
una
proporción
para
una
población
cualitativa,
es
la
estimación
de
Se
ubica
el
valor
de
la
distribución
normal
con
nivel
del
98%,
Z=
2,33,
(si
alguna
duda,
revisar
los
la
diferencia
entre
dos
proporciones.
ejemplos
de
la
lectura
de
la
semana
3).
El
intervalo
de
confianza
de
nivel
(1-‐ 𝛼𝛼 )
para
la
diferencia
de
medias
de
dos
distribuciones
41,16 28,59
normales
de
varianzas
conocidas
es:
(75
–
60)
±
2.33 +
36 64
15
±
2,33(1,26)
Ejemplo
1
La
diferencia
de
medias
está
entre
12,06
y
17,94
con
una
confiabilidad
del
98%.
Es
decir,
que
en
promedio
el
número
de
artículos
producidos
por
el
primer
proceso
es
superior
al
del
Segundo
proceso.
Esto
porque
el
intervalo
da
diferencias
positivas.
Se
comparan
dos
procesos
de
fabricación,
los
dos
procesos
tienen
distribución
normal
y
con
base
en
registros
pasados
se
determina
que
las
varianzas
eran
41,16
y
28,59,
respectivamente.
Se
toman
dos
muestras,
una
de
36
artículos
de
la
primera
producción
y
otra
de
64
de
la
segunda
obteniendo
medias
de
75
y
60,
respectivamente.
1.3. DIFERENCIA
DE
MEDIAS
CON
VARIANZAS
POBLACIONALES
DESCONOCIDAS
Y
(N1
Y
N2
)
>
30
(CON
N1
≈
N2)
Encontrar
los
límites
de
confianza
del
98%
para
la
diferencia
de
las
medias
poblacionales.
Los
valores
de
las
varianzas
poblacionales
no
necesariamente
podrán
ser
conocidos,
pero
si
las
muestras
son
grandes,
las
varianzas
muestrales
son
generalmente
una
buena
aproximación
a
las
𝑆𝑆"$ 𝑆𝑆$$
𝐼𝐼 = 𝑋𝑋" − 𝑋𝑋$ ± 𝑍𝑍0/$ +
𝑛𝑛" 𝑛𝑛$
1.5. DIFERENCIA
ENTRE
MEDIAS
DE
DOS
POBLACIONES
NORMALES
CON
VARIANZAS
POBLACIONALES
DESCONOCIDAS
PERO
IGUALES
Y
MUESTRAS
PEQUEÑAS
(N1
+
N2
<30)
Este
aproximación
es
válida
para
muestras
grandes.
El
criterio
que
usaremos
es
𝑛𝑛" + 𝑛𝑛$ > 30
con
Cuando
las
varianzas
de
las
poblaciones
son
desconocidas
y
las
varianzas
poblacionales
son
la
condición
de
que
ambos
tamaños
muestrales
𝑛𝑛" ≈ 𝑛𝑛$
diferentes
para
muestras
pequeñas,
se
podrá
asumir
un
estadístico
equivalente:
Para
muestras
pequeñas,
y
considerando
en
primer
lugar
que
las
dos
varianzas
poblacionales
son
iguales
𝜎𝜎"$ = 𝜎𝜎$$
aunque
con
valor
desconocido.
Puede
construirse
la
siguiente
variable
normal
tipificada:
Se
trabaja
con
las
varianzas
en
la
muestra,
este
estadístico
sigue
aproximadamente
una
distribución
t
de
Student
con
f
grados
de
libertad,
donde
f
es
el
entero
más
próximo
a
la
𝑋𝑋" − 𝑋𝑋$ − 𝜇𝜇" − 𝜇𝜇$ aproximación
de
Welch:
𝑍𝑍 =
$
𝜎𝜎"$ 𝜎𝜎$$ 𝑆𝑆"$ 𝑆𝑆$$
− +
𝑛𝑛" 𝑛𝑛$ 𝑛𝑛" 𝑛𝑛$
𝑓𝑓 = $ $ − 2
𝑆𝑆"$ 𝑆𝑆$$
𝑛𝑛" 𝑛𝑛
+ $
𝑛𝑛" + 1 𝑛𝑛$ + 1
El
intervalo
de
confianza
de
nivel
1 − 𝛼𝛼
para
la
diferencia
de
medidas
de
dos
poblaciones
normales
de
varianza
desconocidas
pero
iguales
es:
Z = 1,96 (si alguna duda de cómo identificar este valor ir a la lectura semana 3)
si
partimos
del
hecho
de
que
las
muestras
son
grandes,
por
lo
tanto,
la
distribución
muestral
de
la
diferencia
de
proporciones
es
aproximadamente
normal,
luego,
el
intervalo
de
confianza
de
nivel
1 − 𝛼𝛼
para
la
diferencia
de
proporciones
es:
𝑃𝑃" 1 − 𝑃𝑃" 𝑃𝑃$ 1 − 𝑃𝑃$
𝐼𝐼 = 𝑃𝑃" − 𝑃𝑃$ ± 𝑍𝑍0/$ ∙ +
𝑛𝑛" 𝑛𝑛$
Ejemplo
2
Con
un
nivel
de
confianza
del
95%
se
puede
decir
que
la
diferencia
en
la
proporción
de
productos
defectuosos
está
entre
0,0079
y
0,0721.
Este
resultado
indica
que
la
proporción
de
defectuosos
El
departamento
de
control
de
calidad
de
una
gran
industria
quiere
establecer
con
un
nivel
de
es
mayor
en
el
turno
A,
la
conclusión
se
da
porque
los
dos
límites
del
intervalo
son
positivos.
confianza
del
95%
si
existe
alguna
diferencia
entre
el
número
de
productos
defectuosos
que
son
encontrados
en
la
producción,
en
dos
turnos
de
trabajo.
El
departamento
toma
muestras
de
1000
productos
en
cada
turno,
el
turno
A
encuentra
un
18%
de
productos
defectuosos
mientras
que
en
el
turno
B
este
porcentaje
era
del
14%.
La
diferencia
de
medias
tratada
anteriormente,
corresponde
a
muestras
independientes.
En
este
Se
tienen
los
puntajes
de
la
prueba
de
10
empleados
antes
y
después
de
habérseles
impartido
caso
se
trata
de
establecer
la
diferencia
para
muestras
dependientes
o
relacionadas
en
capacitación
laboral
adicional.
Se
quiere
establecer
un
intervalo
de
confianza
del
90%
para
la
situaciones
en
donde
se
analiza
el
mismo
sujeto
o
la
misma
unidad
en
dos
momentos,
como
en
media
de
la
diferencia
en
los
puntajes
antes
y
después
de
la
capacitación.
los
casos
antes
y
después
o
pre
y
post.
El
intervalo
de
confianza
de
nivel
1 − 𝛼𝛼
para
la
diferencia
de
medidas
de
observaciones
pareadas
con
𝑛𝑛 > 30
puede
expresarse
como:
Los
puntajes
aparecen
en
la
tabla:
Solución:
𝑆𝑆O
𝐼𝐼 = 𝐷𝐷 ± 𝑍𝑍0/$
𝑛𝑛
𝒙𝒙𝟏𝟏𝒊𝒊 𝒙𝒙𝟐𝟐𝒊𝒊
𝑆𝑆O
𝐼𝐼 = 𝐷𝐷 ± 𝑡𝑡0,D("
1
9.0
9.2
-‐0.2
−0.2 − (−0.5) $
= 0.09
$ 𝑛𝑛
donde
2
7.3
8.2
-‐0.9
0.16
𝐷𝐷
es
la
diferencia
entre
el
valor
de
antes
y
el
valor
después,
es
decir,
D D
ST" 𝑥𝑥"R − 𝑥𝑥$R ST" 𝑑𝑑S 4
5.3
4.9
0.4
0.81
𝐷𝐷 = =
𝑛𝑛 𝑛𝑛
5
8.7
8.9
-‐0.2
0.09
𝑆𝑆O
es
la
desviación
estándar
de
las
diferencias,
es
decir,
6
6.3
5.8
0.5
1.0
7
7.9
8.2
-‐0.3
0.04
D
ST" 𝑑𝑑S − 𝐷𝐷 $
𝑆𝑆O =
𝑛𝑛 − 1
8
7.3
7.8
-‐0.5
0.00
𝑆𝑆O 0.73
-‐5.0
4.88
𝐼𝐼 = 𝐷𝐷 ± 𝑡𝑡0,D("
$ 𝑛𝑛
= −0.5 ± 1.833
10
𝐼𝐼 = −0.5 ± 0.42
Tabla 1: Ejemplo 3, diferencia de muestras pareadas
Fuente: Elaboración propia
• Límite
superior
de
confianza
= −𝟎𝟎. 𝟎𝟎𝟎𝟎
• Límite
inferior
de
confianza
= −𝟎𝟎. 𝟗𝟗𝟗𝟗
La
media
de
las
diferencias
es:
𝑛𝑛 Debido
a
que
se
restan
los
puntajes
posteriores
al
entrenamiento
de
los
puntajes
anteriores
al
𝑖𝑖=1 𝑑𝑑𝑖𝑖 −5.0
entrenamiento,
produciendo
valores
negativos,
se
puede
estar
90%
seguro
de
que
la
media
de
𝐷𝐷 = = = −0.5
𝑛𝑛 10 los
puntajes
posteriores
al
entrenamiento
está
entre
0.08
y
0.92
más
altos.
Por
lo
tanto,
se
puede
decir
que
los
puntajes
después
del
entrenamiento
son
mayores
a
los
puntajes
de
antes
del
departamento.
𝑆𝑆O
es
la
desviación
estándar
de
las
diferencias,
es
decir,
D $
ST" 𝑑𝑑S − 𝐷𝐷 4.88 4.88
𝑆𝑆O = = = = 0.54 = 0.73
𝑛𝑛 − 1 10 − 1 9
por
lo
que
la
muestra
𝑛𝑛 < 30
usamos
la
distribución
t,
siendo
el
intervalo
de
confianza:
𝑆𝑆O
𝐼𝐼 = 𝐷𝐷 ± 𝑡𝑡0,D("
$ 𝑛𝑛
• Dougla
A.
Lind,
W.
G.
(2012).
Estadística
aplicada
a
los
negocios
y
la
economía
(13ª
ed.).
MCGRAW-‐HILL.
• Paul
Newbold,
W.
L.
(2008).
Estadistica
para
administracion
y
economia
(6ª
ed.).
Madrid:
PRENTICE-‐HALL.
• Javier
Gorgas
García,
N.
C.
(2009).
Estadística
básica
para
estudiantes
de
ciencias
(1ª
ed.).
Editorial
Universidad
Complutense
de
Madrid.
LECTURA
1:
Marulanda
Fraume,
M.
C.
(2013).
Modelación
probabilista
de
pérdidas
económicas
por
sismo
para
la
estimación
de
la
vulnerabilidad
fiscal
del
estado
y
la
gestión
financiera
del
riesgo
soberano.
LECTURA
2
Newcombe,
R.
G.,
&
Soto,
C.
M.
(2006).
INTERVALOS
DE
CONFIANZA
PARA
LAS
ESTIMACIONES
DE
PROPORCIONES
Y
LAS
DIFERENCIAS
ENTRE
ELLAS.
Interdisciplinaria:
Revista
De
Psicología
Y
Ciencias
Afines,
23(2),
141-‐154.