Вы находитесь на странице: 1из 9

TERCERA

UNIDAD

ESCUELA DE MATEMATICA
Universidad Nacional Autónoma de Honduras
Mario Antúnez Murillo
Cubículo 9
4:00 - 5:00 p. m.
Inferencia estadística
Métodos que permiten sacar conclusiones de la población habiendo sido analizada una muestra.
a. Estimación de parámetros
b. Pruebas de hipótesis

Distribuciones empleadas en estimación


Distribución 2 (chi–cuadrado) de Pearson
Sean X1 ,X 2 ,...,X  variables aleatorias normales con media 0 y varianza 1 independientes entre si
entonces la variable 2  X12  X 22  ...  X 2 recibe el nombre de 2 (chi–cuadrado) con  grados
de libertad. La función de densidad asociada es la distribución 2 de Pearson, que se puede
expresar como
 x (  /2)1e  x/2 x0
 / 2
f(x)   2 ( / 2)
 x0
 0

Donde ()   x 1e  x dx es la función gamma, definida para cualquier real positivo  ,
0
Nótese que la variable toma únicamente valores positivos, al ser una suma de cuadrados. Además
su distribución depende únicamente del parámetro  , o números de grados de libertad.
   2  2 

La importancia de la distribución 2 en estadística se basa en la siguiente propiedad: Sea 2 la


varianza de una población normal y s2 la varianza de una muestra de tamaño n extraída al azar de
dicha población. Entonces la variable aleatoria que cambia de muestra a muestra y viene dada por
s2
2  (n  1)
2
obedece a una distribución 2 con (n−1) grados de libertad. Esta propiedad es sumamente
importante para la estimación de la varianza y el contraste de hipótesis sobre la varianza 2

Distribución t de Student
Sea Z una variable aleatoria con distribución N(0,1) y V una variable aleatoria con distribución chi-
Z
cuadrado con  grados de libertad, si Z y V son independientes la variable aletoria T 
V/k
tiene por función de densidad de probabilidad
   1
 2 (  1)/2
 2   x 
f(x)  1  x
( / 2)   
La llamaremos función t de student con  grados de libertad

Distribución F de Fisher
Sean W  12 Y   22 dos variables aleatorias independientes con distribución 2 de Pearson con
u y  grados de libertad e independientes entre si. Entonces, la variable aleatoria definida mediante
W /u
F como tiene la función de densidad de probabilidad
Y/
 u    u  (u /21)
  x
f(x)   2    x0
(u  )/2
 u      u  
        x  1
 2   2     
Llamada distribución F de Fisher con u y  grados de libertad y de denota F(u,)

Diremos que un estimador A de un parámetro poblacional es insesgado, o centrado, si su media, o


esperanza matemática, coincide con el parámetro poblacional. Es decir
E(A)   A  

Si se tienen dos estimadores A1, A2 de un parámetro poblacional, se dice que A1 es más eficiente
que A2 si su varianza es menor. Es decir 12  22

La variable aleatoria poblacional "renta de las familias" del municipio de Tegucigalpa se distribuye
siguiendo un modelo N(,). Se extraen muestras aleatorias simples de tamaño 4. Como
estimadores del parámetro , se proponen los siguientes:
X  2X 2  3X 3
1  1
6
4X 2  X 3
2 
3
3  X
Se pide:
Comprobar si los estimadores son insesgados
¿Cuál es el más eficiente?
Si tuviera que escoger entre ellos, ¿cuál escogería?. Razone su respuesta a partir del Error
Cuadrático Medio.
 X  2X 2  3X 3 
E  1   E  1 
 6 
 4X  X 3 
E 2   E  2 
 3 
 X  X2  X 3  X 4 
E 3   E  1 
 4 

 X  2X 2  3X 3  1 14
V 1   V  1    V  X1   4V  X 2   9V  X 3   2
 6  36 36
 4X  X 3  1 17
V 1   V  2   16V  X 2   V  X 3    2
 3  9 9
 X  X2  X3  X4  1 1
V 1   V  1    V  X1   V  X 2   V  X 3   V  X 4   2
 4  16 4

Por ejemplo, para la estimación de la media poblacional, los estimadores media aritmética X y
mediana Me son insesgados, pero la media es más eficiente que la mediana (su varianza es menor).
Evidentemente, entre dos estimadores insesgados siempre será preferible usar el más eficiente.
Incluso en algunos casos será mejor usar un estimador algo sesgado pero más eficiente que otro
insesgado.

Se dice que un estimador es consistente cuando, al crecer el tamaño muestral, se aproxima


asintóticamente al valor del parámetro poblacional y su varianza se hace nula. Es decir
lim A   lim 2A  0
n n
Un estimador ideal ha de ser insesgado y con una eficacia máxima.
Existen dos procedimientos para realizar la estimación de un parámetro poblacional. Cuando se
determina un único valor de un estimador que se aproxime al parámetro poblacional desconocido se
dice que se hace una estimación puntual. Cuando, alternativamente, se calculan dos valores entre
los cuales se considera que, con cierta probabilidad, se encuentra el parámetro poblacional, el
procedimiento se conoce como estimación por intervalos de confianza. En este tema veremos la
estimación puntual y en el siguiente la estimación por intervalos.

Muestreo aleatorio simple


Muestra seleccionada de manera que cada elemento o individuo de la población tenga las mismas
posibilidades de que se le incluya.

Muestreo aleatorio sistemático


Se selecciona un punto aleatorio de inicio y posteriormente se elige cada k-ésimo miembro de la
población

Muestra aleatoria estratificada


Una población se divide en subgrupos, denominados estratos, y se selecciona al azar una muestra
de cada estrato.
Muestreo acumulado
Una población se divide en conglomerados a partir de los límites naturales geográficos o de otra
clase. A continuación se seleccionan los conglomerados al azar y se toma una muestra de forma
aleatoria con elementos de cada grupo.

Error de muestreo
Diferencia entre el estadístico de una muestra y el parámetro de la población correspondiente.

Distribución muestral
Es aquella distribución que resulta al considerar todas la muestras posibles que pueden ser tomadas
en una población
Distribución muestral de medias
Distribución muestral de proporciones
Distribución muestral de diferencia de medias
Distribución muestral de diferencia de proporciones
Distribución muestral de varianzas

Teorema del límite central


Si X1,X 2 ,...,X n es una muestra de n tomada de una población de tamaño N de una población con
media y varianza 2 , si X es la media muestral su comportamiento es una variable aleatoria con
2  N  n  2 
2
x   y varianza 2    si N    
x n  N 1  x n
Ejemplo
Una población consta de los cinco números 10,11,12,12,14 Considerar todas las muestras de
tamaño 2 que pueden extraerse de esta población sin reposición
Encontrar:
la media de la población 11.8
la varianza de la población 1.76
distribución muestral de las medias
la media de la distribución muestral de las medias 11.8
la desviación estándar de la distribución muestral de las medias (es decir, el error estándar de las
medias). 0.66

El tiempo en que el cajero de un banco con servicio en el automóvil atiende a un cliente es una
variable aleatoria con una media μ = 3.2 minutos y una desviación estándar σ = 1.6 minutos. Si se
observa una muestra aleatoria de 64 clientes, encuentre la probabilidad de que su tiempo medio con
el cajero sea
a. a lo más 2.7 minutos;
b. más de 3.5 minutos;
c. al menos 3.2 minutos pero menos de 3.4 minutos.

Se ha determinado que el 60% de los estudiantes de la universidad fuman, si se toma una muestra
de 800 alumnos calcule la probabilidad de que a lo más el 57% de la muestra fume.
x   np  np p  p 0.57  .6
z     1.7341
 npq pq (0.6)(0.4)
n 800
P(p  0.57)  P(z  1.7341)  0.4145

En las elecciones pasadas el 25% de la población votó por el partido ABC. Se realiza una encuesta
a 200 ciudadanos, encuentre la probabilidad de que entre 44 y 54 votantes apoyen al candidato de
dicho partido.

Estimador puntual
Estadístico calculado a partir de información de la muestra para estimar el parámetro poblacional.
Por ejemplo, si el salario medio de una muestra representativa que se ha tomado es de L.21,000, se
supondrá entonces que el salario medio de la población es de L.21,000 también.

Estimación por Intervalos de confianza


Es un intervalo que tiene al menos 1 o 2 extremos aleatorios y está construido de manera que el
parámetro de interés se estima que está en dicho intervalo con una probabilidad 1- llamada nivel o
coeficiente de confianza
Puede ser:
No acotado

Acotado
Fórmula general para un intervalo acotado simétrico para medias y proporciones

Ic 1α %  Estimador muestral  Coeficiente de Confiabilidad  Error Estándar

Parámetro a
Condición Intervalo
estimar

 conocida Normal   X  Z  /2
n
 desconocida s
Normal   X  Z  /2
Media  n  30 n

 desconocida s
t de student   X  t  /2
n  30 n

pq
Proporción p Normal p  p  Z  /2
n
Diferencia de
medias 1, 2 conocidas 2A 2B
Normal A  B  (X A  X B )  Z  /2 
 A  B nA nB

Diferencia de
p q p q
proporciones Normal p A  pB  (p A  p B )  Z  /2 A A  B B
p A  pB nA nB

(n  1)s2 2 (n  1)s2
Varianza  2 Chi cuadrado   2
 2 /2 1 /2

Problema:
La media de las estaturas de una muestra aleatoria de 400 personas es de 1.70 metros. Se sabe
que la estatura es las personas de esa ciudad es una variable aleatoria que sigue una distribución
normal con varianza 0.16 m2
a. ¿Cuál es el estimador puntual para la estatura media de la ciudad?
b. Con un nivel de confianza del 90%, determine el intervalo de confianza para la estatura
media. Interprete la respuesta
c. Encuentre el intervalo de confianza del 98% para media. Interprete la respuesta.
d. ¿Cuál sería el tamaño de la muestra necesario para que pueda decirse que la verdadera
media está a menos de 2 cms de la media muestral.
 0.4
  Z  /2 0.02  1.6448 n  1082
n n
Problema:
Una empresa de investigación llevó a cabo una encuesta para determinar la cantidad media que los
fumadores gastan en cigarrillos durante una semana. Datos históricos muestran que la distribución
de cantidades gastadas por semana tendía a seguir la distribución normal, con una desviación
estándar de $5. Una encuesta de 49 fumadores reveló que la media era de $20.
a) ¿Cuál es el estimador puntual de la media de la población?
b) Con un nivel de confianza del 95%, determine el intervalo de confianza para media. Interprete la
respuesta.
c) Encuentre el intervalo de confianza del 98% para media. Interprete la respuesta.

Problema:
El propietario de una granja avícola desea calcular la cantidad media de huevos que pone cada
gallina. Una muestra de 20 gallinas indica que ponen un promedio de 20 huevos al mes, con una
desviación estándar de 3 huevos al mes.
a. ¿Cuál es el valor de la media de la población? ¿Cuál es el mejor estimador de este valor?
b. Construya un intervalo de confianza de 95% para la media de población.
c. ¿Es razonable concluir que la media poblacional es de 21 huevos? ¿Y de 25 huevos?

Problema:
La Asociación estadounidense de Productores de Azúcar desea calcular el consumo medio de
azúcar por año. Una muestra de 16 personas revela que el consumo medio anual es de 60 libras,
con una desviación estándar de 20 libras. Construya un intervalo de confianza del 90% para la
media de la población. ¿Será razonable concluir que la media poblacional es de 63 libras?

Problema:
De 1024 personas encuestadas, 320 se manifestaron a favor de determinado candidato de un
partido político. ¿Qué porcentaje obtendrá dicho partido de celebrarse las elecciones en dicho
memento?. Construya un intervalo del 95% para la proporción de votos que obtendrá dicho partido
político. El candidato dice que obtendrá en la elecciones generales al menos un 35% de los votos,
de acuerdos a los resultados anteriores ¿qué se concluye de la opinión del candidato?

Problema:
Un proceso produce cierta clase de cojinetes de bola cuyo diámetro interior es de 3 cm. Se
seleccionan en forma aleatoria 12 de estos cojinetes y se miden sus diámetros internos que resultan
ser 3.01, 3.05, 2.99, 2.99, 3.00, 3.02, 2.98, 2.99, 2.97 2.97, 3.02, 3.01. Suponiendo que el diámetro
es una variable aleatoria normalmente distribuida, determinar un intervalo de confianza del 99% para
la varianza .

Вам также может понравиться