Вы находитесь на странице: 1из 12

Unidad IV

 Estimación puntual y por intervalos de confianza

 Estimación de la media, de la diferencia de medias, de la proporción y de la


diferencia de proporciones
 Determinación del tamaño de la muestra
 Prueba de hipótesis
 Pruebas unilaterales y bilaterales pruebas para medias y diferencia de
medias
 Distribución t de student
 Distribución de ji cuadrada
Estimación de intervalos de confianza
Sean Ms: media de la distribución de muestreo.
𝜎: Desviación típica de la distribución de muestreo.
Si el número de muestreos es N≥30, entonces podemos confiar en encontrar Ms en
los siguientes intervalos.
Intervalos intervalo de confianza límite de confianza para s
Intervalos Intervalo de confianza Límite de confianza para
s

Ms – 𝝈
a 68,27%
Ms + 𝝈

Ms -2 𝝈 95.45% 5+1.95 𝝈s
a
Ms +2 𝝈

Ms -3 𝝈 99.73% 5+2.58 𝝈s
a
Ms + 3 𝝈

Nivel de 99.73 99 98 96 95.45 95 90% 80 68.27 50%


confianz % % % % % % % %
a
Zc 3.0 2.5 2.3 2.0 2.00 1.9 1.64 1.2 1.00 0.674
8 3 5 6 5 8 5

Los límites extremos de cada intervalo se denominan “Límites de confianza” o


fiduciales.
Zc = coeficiente de confianza o valores críticos.
Límites de confianza para proporciones.

𝑝𝑞 √𝑃(1−𝑝)
P± 𝑍𝐶 √ 𝑛 = P ± 𝑍𝑐 𝑁
PARA MUESTRA DE POBLACIÓN INFINITA Ó FINITA CON REPOSICIÓN
p= probabilidad de éxitos.
Q= probabilidad de fracasos.
P= proporción de éxitos.
N=tamaño de la muestra.
PARA POBLACIÓN FINITA Y SIN REPOSICIÓN.

𝑝𝑞 𝑁𝑝−𝑁
P ±𝑍𝑐√ 𝑛 √ 𝑁−1

INTERVALOS DE CONFIANZA PARA SUMAS.


S1 y S₂= estadísticas muéstrales con distribución de muestreos aproximadamente
normales.
LIMITES DE CONFIANZA PARA DIFERENCIAS DE LOS PARÁMETROS DE LA
POBLACIÓN. CORRESPONDIENTES A S₁ Y S₂

s₁ - s₂ ± Zc 𝜎s₁ - s₂=s₁ - s₂ ± Zc √𝜎² + 𝜎²


LIMITES DE CONFIANZA PARA SUMAS.

s₁ - s₂ ± Zc 𝜎 s₁ + 𝜎s₂= s₁ + s₂ ± Zc √𝜎s₁2 + 𝜎s₂2


Límites de confianza para la diferencia de Z proporciones poblacionales con
poblaciones infinitas.
√P₁+1−P₁ P2 (1−P₂
P₁ -P₂ ± Zc 𝜎 P₁ -P₂= P₁ -P₂+ 𝑍𝑐 +
𝑁₁ N₂

P₁, P2 = 2 proporciones muéstrales.


N₁, N₂= Tamaño de las 2 muestras.
p₂ y p2 = Proporciones en la 2 poblaciones.
Ejemplo 1.
En una muestra existen 5 medidas: 6.33, 6.37, 6.36, 6.32 y 6.37 cm.
Determina la media y la varianza.
6.33+6.32+6.36+6.32+6.37
a) Media X = = 6.35 𝑐𝑚.
5

b) La estimación sin sesgo y coeficiente de la media verdadera (de la población)


es:
𝑁 Σ (𝑥 −𝑋̅ )²
ŝ²= 𝑁−1 s² = 𝑁−1
(6.33−6.35)2 +(6.37−6.35)2 +(6.36−6.35)2 +(6.32−6.35)2 +(6.37−6.35)²
ŝ²= = 0.00055
5−1

Estimación sin sesgo e ineficiente para la verdadera media.


La mediana en una buena medida; ordenando por magnitud Md= 6.36
EJEMPLO DEL CALCULO PARA INTERVALOS DE CONFIANZA PARA MEDIAS
Las medias de los diámetros de una muestra aleatoria de 200 bolas de rodamiento
(balines) producidas por una maquina en una semana dieron una medida de 0.824
cm. Con una desviación típica de 𝜎 = 0.042 cm. Hallar el limite confianza para el
limite medio, para todas las bolas.
a) 95%
b) 99%
a) Los límites de confianza para 95% son:
1.96𝜎𝑠 𝑠
X ±= = 𝑥 ± 1.96 √𝑁
√𝑁
1.96∗0.042
a) = 0.824± = 0.824± 0.0058 cm
√200
2.58∗0.042
b) = 0.824± = 0.824± 0.0077 cm
√200

c) Limite por 98%, 90%, 99.73%


2.33∗0.042
0.824± = 0.820± 0.0069 cm
√200
1.645∗0.042
0.824± = 0.824± 0.0048 cm
√200
3.0∗0.042
0.824± = 0.824± 0.0089 cm
√200

EJEMPLO PARA INTERVALO DE CONFIANZA PARA PROPORCIONES.


Un sondeo de 100 votantes elegidos al azar indican que el 55% de ellos estaba a
favor de cierto candidato. Encuentre los limites de confianza para la proporción de
todos los votantes para ese candidato con 95%, 99%, 99.73%
a) 95% de la población p son

𝑝(1−𝑝)
P ± 1.96 𝜎 =p = p±1.96√ 𝑁

√0.55∗0.45
= 0.55±1.96 = 0.55 ±0.10
100

 se utiliza la población maestral P para encontrar p.


√0.55∗0.45
b) 99%→0.55±2.58 = 0.55±0.13
100

√0.55∗0.45
c) 99.73%→0.55±3 = 0.55±0.15
100

EJEMPLO INTERVALOS DE CONFIANZA PARA DIFERENCIA Y SUMAS.


En una muestra de 150 lámparas tipo A Con una Media de 1,400 hrs. y desviación
típica de 120 hrs.
Otra muestra de 200 lámparas tipo B con una Media 1,200 hrs. y desviación típica
de 80 hrs.
Encuentra los límites de confianza para.
a) 95%
b) 99%
Para la diferencia de las vidas medias de la población de ambos tipos.
Límites de confianza para la diferencia entre medias tipo A y B

𝜎2 𝜎𝐵²
XA-XB ± Zc√𝑁𝐴 + 𝑁𝐵

a) Para 95%

1202 80²
1400-1200±1.96 √ 150 + 200 = 200 ± 24.8

Existe un límite de confianza de que la diferencia de medidas de las poblaciones


está entre 175 y 225 horas.
b) Para 99%

1202 80²
1400-1200±2.58 √ 150 + 200 = 200± 32.6. Existe un 99% de confianza de que la
diferencia de las medias de las poblaciones esté entre 169 y 233 horas.
Tamaño de la muestra:
La teoría de la muestra estudia la relación existente entre una población y las
muestras tomadas de ellas; se obtienen magnitudes (media y varianza) y/o las
diferencias entre muestras (significativas o fortuitas).
Para que las conclusiones de la teoría de muestreo sean válidas y la inferencia
estadística sea verdadera, se necesita que las muestras sean representativas.
Diseño del experimento: Es el análisis de los métodos del muestreo, las muestras
representativas de obtienen por muestreo aleatorio con o sin reposición.
Muestreo aleatorio: Cada miembro de la población tiene la misma probabilidad de
ser incluido en la muestra.
Muestra con o sin reposición: Se hace extracción de un elemento de la población y
se devuelve o no antes de la segunda extracción.
Población finita: Cuando existe un número de elementos.
Población infinita: Cuando no existe un número de elementos.
Prueba de hipótesis: En la práctica tomamos decisiones sobre poblaciones basadas
en el conocimiento en que se tiene la muestra; estas son decisiones estadísticas,
para ello se realizan hipótesis estadísticas (conjeturas) que pueden ser ciertas o
no.
H0 Hipótesis nula: Son hipótesis que se formulan para ser rechazadas o invalidarlas;
por ejemplo “no hay diferencia entre los métodos A y B”, “las monedas son buenas”.
H1 Hipótesis alternativas:
Es la que difiere de la hipótesis nula, por ejemplo, si existe una probabilidad 0.5 la
hipótesis alternativa seria de H1= 0.75 o p= 0.4
Si se asume una hipótesis y los resultados obtenidos muestran una diferencia muy
grande, entonces las diferencias observadas son significativas y la hipótesis debe
ser rechazada.
Contraste de hipótesis Procedimientos que ayudan a determinar si
Contrastes de significación las muestras observadas difieren significativamente
Reglas de decisión de los resultados esperados.

H0 es verdadero H0 es falso

No rechace H0 Decisión correcta Error tipo II

Rechace H0 Error tipo I Decisión correcta

Error tipo I: Rechaza una hipótesis cuando debió ser aceptada.


Error tipo II: Acepta una hipótesis que debió ser aceptada.
Nivel de significancia: Es la probabilidad de cometer un error tipo I ∝
Toda buena decisión minimiza los errores; siempre que disminuye un error, existe
otro que aumenta el tamaño de la muestra y esto no siempre es posible.
NIVEL DE SIGNIFICACIÓN DE SIGNIFICACIÓN DEL CONTRASTE ∝
En cuando damos la máxima probabilidad a una hipótesis y estamos dispuestos a
correr el riesgo de cometer un error tipo I; este nivel se especifica antes de tomar la
muestra (los resultados no influyen nuestra decisión) en la práctica se usa entre el
5% y el 1%.
Por ejemplo si se elige el 5% del nivel de significación entonces hay 5 oportunidades
entre 100 de rechazar la hipótesis cuando debía ser aceptada, es decir 95% de
confianza que se adoptó la decisión correcta.
Hipótesis con nivel de significancia 5%- 95% de confianza que se adoptó la decisión
correcta.
Existe 5% de oportunidades de rechazar la hipótesis.
CONTRASTES CON LA DISTRIBUCIÓN NORMAL
Supongamos que cierta hipótesis tiene una distribución de muestreo S con
distribución normal, con una media Ms y una desviación 𝜎. Entonces distribución de
𝑆−𝑀𝑆
la variable tipificada. Z = 𝜎𝑆

Si Z esta fuera de 1.96 el estadístico estaría afuera del rango y diferiría


significativamente y la hipótesis debería ser rechazada en este caso; el área
sombreada 0.025 es el nivel de significancia del contraste, es la posibilidad de
equivocarnos al rechazar la hipótesis, decimos que la hipótesis se realiza a un nivel
de significación del 5%; o que el valor z de estadística muestral dado es significativo
al nivel de 0.05.
Z dentro del rango menor -1.96 a 1.96= región de la aceptación de la hipótesis o
región de no significancia.
Z fuera del rango -1.96 a 1.96= región critica de hipótesis, región de rechazo de
hipótesis, región de significancia.
Basados en esto se formula la regla de decisión:
1. Rechazar la hipótesis al nivel de significancia 0.05 si el valor de Z para el
estadístico S, esta fuera del rango -1.96 a 1.96; Equivale a decir que el
estadístico muestral es significativo al nivel 0.05.
2. Aceptar la hipótesis en caso contrario (o no tomar una decisión)
Z es un estadístico de contraste; se puede utilizar niveles de significación. Cuando
el nivel de interés del contraste está a ambos lados de la curva se llama prueba
bilateral o de dos colas.
Cuando el nivel de contraste a un lado se llama prueba unilateral o de una cola.
Nivel de significancia 0.10 0.05 0.01 0.005 0.002

-1.28 -1.645 -2.33 -2.58 -2.88


Valores críticos de Z ó ó ó ó ó
para test unilateral
1.28 1.645 2.33 2.58 2.88

-1.645 -1.96 -2.58 -2.81 -3.08


Valores críticos de Z ó ó ó ó ó
para test bilateral
1.645 1.96 2.58 2.81 3.08

Todos los casos son para poblaciones infinitas o por muestreo con repetición.
PRUEBA PARA MEDIAS
S= 𝑋̅ = Media muestral
M 𝑋̅ = M= Media de la población
𝜎
𝜎𝑠 = 𝜎𝑥̅ =
𝑁
𝜎= Desviación típica de la población
𝑁= Tamaño de la muestra
𝑋̅ − M
𝑍= 𝜎
𝑁
Cuando sea necesario se usa la desviación muestral S ó ̂
𝑺
PRUEBA PARA DIFERENCIA DE MEDIAS
𝑋̅1 y 𝑋̅2 = medias muestrales obtenidos en grandes muestras de tamaño N 1 y N2
tomados de poblaciones con respectivas medias M1 y M2 y desviaciones típicas 𝜎1
y 𝜎2
Se considera la hipótesis que “No hay diferencia entre las medias”
M1 = M2
DISTRIBUCION DE MUESTREO DE DIFERENCIA DE MUESTRAS
M𝑋̅1 - M 𝑋̅2= 0 y 𝜎 𝜎12 𝜎22
𝑋̅ 1−𝑋̅2 = √ +
𝑁1 𝑁2

con esto se puede contrastar la hipótesis nula frente a la hipótesis alternativa.


𝑋̅ 1 − 𝑋̅ 2
𝑍=
𝜎𝑋̅ 1 − 𝜎𝑋̅ 2
PRUEBA PARA PROPORCIONES
S=P Proporción de éxitos en una muestra
MS= MP= P P es la proporción de éxitos en una población
N= Tamaño de la muestra

𝑝𝑞
𝜎s= 𝜎p =√ 𝑛 q= 1-p

𝑃−𝑝
Z= 𝑝𝑞

𝑁

𝑋
Cuando P= 𝑁 , donde X es el número real de éxitos en una muestra
𝑋̅ −𝑁𝑝
Z se calcula así 𝑍 =
√𝑁 𝑝𝑞

Esto es:
Mx=M =Np

𝜎x= 𝜎 =√𝑁 𝑝𝑞

S=X
DIFERENCIA DE PROPORCIONES
P1, P2 = Proporciones muestrales obtenidas en grandes muestral de tamaño N1 y
N2 tomadas de respectivas poblaciones que tienen proporciones P1, P2
Se considera la hipótesis nula Ho = “No hay diferencia entre los parámetros de las
poblaciones” (P1= P2) muestras tonadas de la misma población.
MP1-P2= =0  1 1 
 P1 P 2  pq  
donde  N1 N 2 
N P1  N 2 P 2
p 1
N1  N 2
Se usa como estimación para la proporción poblacional
2 Hipótesis
H0=M=1800 lbs, “no hay cambios en la tensión de ruptura”
H1=M>1800 lbs, “hay un cambio real en la tensión de ruptura”
Para un nivel de significancia de 0.1 la regla de decisión es
Si Z observando es mayor a 1.28el resultado es significativo y se rechaza H 0
En caso contrario se acepta H0

X M 1850  1800
Z   3.54
 100
N 50
3.54  1.28

El resultado es altamente significativo y la hipótesis puede mantenerse muestras


pequeñas
Distribución t de student

X M X M
t  N 1 
s 
N
Para muestras N<30 las aproximaciones no son buenas y empeoran al decrecer N
por eso se realizan algunas modificaciones en los cálculos; un tipo de modificación
es conocida como distribución t de student

xM xM
t  N 1 
S 
Para muestras pequeñas con población normalN se calcula t utilizando la media de
x y S ó Ŝ; puede obtenerse la distribución de muestreo para t, esta distribución
viene dada por student.
Y0= constante que depende de N de tal forma que el área de la curva
sea 1rados de libertad
Y0 Y0
y  (V 1)
V=(N-1)= Numero de grados de libertad N
 t2  2  t2  2

Fórmula para ajustar las curvas cuando V o N> 30 


 N  1
1 1  V 
   

t2
1 2
y e
2
Distribución t de student para valores de V
Los valores de t se obtienen por tabla (apéndice 3, libro Schawm)
DISTRIBUCIÓN JI – CUADRADO

X2 
N s2

 X 1  X 2   X 2  X 2  ......   X n  X 2
2 2

Se aplica cuando:
 Se considera muestras N de población normal
  desviación típica
 X2 para cada muestra
La distribución de muestras Ji – cuadrada está dada por

 
1 1
2 2 v  2 
1  x2  x2
v 2
y  Y0 x e 2
 Y0 x e 2
____ V  N  1 # de _ grados _ de _ libertad

Y0 depende de V1 tal que el área bajo la curva es 1

Distribución Ji cuadrada para varios valores de V el máximo Y ocurre cuando X2=V-


2 para V>2.
BIBLIOGRAFIA
 Probabilidad y Estadística en Ingeniería Civil, Jack R Benjamin , ed.
MacGraw Hill, 1981
 Probabilidad y Estadística para Ingenieros, Montgomer, Mc Graw Hill
 Probabilidad y Estadística para Ingeniería, Walpole and Meyers

Вам также может понравиться