Вы находитесь на странице: 1из 35

ESTADÍSTICA APLICADA

Solange Lugo
Ingeniera de Sistemas, Especialista en Estadística
T.P. 68255125305 ST
ESTIMACIÓN

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Contenido

 Estimación puntual y por intervalos


 Estimación de la media y de la proporción de una
población
 Estimación del tamaño de muestra
 Factor de corrección para una población finita

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Estimador de intervalo

Intervalo donde probablemente se localiza un parámetro de población,


basado en información de la muestra.

Ejemplo:

De acuerdo con los datos de la muestra, la media de la población está en el


intervalo entre 0.9 y 2.0 libras.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Estimador puntual
Valor único calculado a partir de una muestra para calcular un parámetro
poblacional
𝑥 µ
𝑠 σ
𝑝
P
𝑠2 σ2

Ejemplo:

Si la media de una muestra de 100 días con respecto al valor del dólar es
de 2.920, éste constituye el mejor estimador del valor del dólar de la
media de la población.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Intervalos de confianza para la media
El análisis de estimadores puntuales y los intervalos de confianza
comienza con el cálculo de μ:

 Se conoce σ
 NO se conoce σ, por tanto se sustituye con s por la σ

Un estimador puntual sólo dice parte de la historia.


Aunque se espera que el estimador puntual se aproxime al parámetro
poblacional, sería conveniente medir cuán próximo se encuentra en
realidad.
Un intervalo de confianza sirve para este propósito.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Desviación estándar de la población no se
conoce σ
𝑋−𝜇
Distribución t = 𝑠
𝑛

Acá s es un estimador de σ. La distribución “t” es mas plana y se extiende


mas que la distribución normal estándar, esto se debe a que la desviación
estándar de la distribución t es mayor que la distribución normal estándar.

Intervalo de confianza para la media poblacional con una σ


desconocida
𝑠
𝑋 ±𝑡
𝑛

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Ejemplo

Gattos, operadora de la planta deshidratadora de gas chupanagua está considerando en


aumentar la calidad de su gas, para incrementar así el tamaño de los clientes que quieran
comprar su gas, con ello aumentar la rentabilidad de la compañía. Gattos estima el
tamaño promedio de clientes en la actualidad, los cuales adquieren su gas a diferentes
precios. Selecciona una muestra de 36 clientes los cuales adquieren el ft3 de gas cuya
media es de $14,37 con una desviación estándar de $4,02.
Construya una estimación por intervalo con el 95% de confianza

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Intervalo de confianza para la media poblacional con una σ
desconocida
𝑠
𝑋 ±𝑡
𝑛

14,37 ± 2,030 (4,02 / 36 ) = 14,37 ± 1,36


El nivel de confianza de 95% se encuentra entre 13,00 y 15,73.
Estos puntos extremos reciben el nombre de límites de confianza y abarca de
13,00 a 15,73 y el valor ± 1,36 se conoce como margen de error.

Para hallar el valor de t se debe ubicar en la tabla el nivel de confianza y


los grados de libertad gl el cual se escribe como n-1, en este caso
36-1=35, en ese ejercicio el valor de t es de 2,030.
Gattos puede estar seguro (95% de confianza) que el costo promedio
de un ft3 de gas para un cliente oscila entre $13 y $15,73.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Desviación estándar de la población conocida
σ
𝜎
 Para el intervalo de confianza de 90%: 𝑋 ± 1,645
𝑛
𝜎
 Para el intervalo de confianza de 95%: 𝑋 ± 1,96
𝑛
𝜎
 Para el intervalo de confianza de 99%: 𝑋 ± 2,575
𝑛

Intervalo de confianza para la media poblacional con una σ


conocida
𝜎
𝑋 ±𝑧
𝑛

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Ejemplo

En el ejemplo anterior, se conoce la desviación estándar de la población


como $3,50, construya una estimación por intervalo con el 90% de
confianza

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Intervalo de confianza para la media poblacional con una σ
conocida
𝜎
𝑋 ±𝑧
𝑛

Intervalo de confianza para la media poblacional con una σ conocida


3,50
14,37 ± 1,645 = 14,37 ± 0,9595
36

Estos puntos extremos reciben el nombre de límites de confianza y abarca de


13,41 a 15,32 y el valor ± 0,9595 se conoce como margen de error.
Gattos puede decir con una confianza del 90% que el costo promedio de un ft3
de gas para un cliente está entre $13,41 y $15,32.

El nivel de confianza, puede definirse como si se seleccionaran 100 muestras de


36 clientes de la población, se calcula la media muestral de cada una de ellas y
se crea un intervalo de confianza basado en cada media muestral, se esperaría
una media poblacional de aproximadamente 95 de los 100 intervalos.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Intervalos de confianza para la
proporción
La interpretación de un intervalo de confianza resulta de mucha utilidad
en la toma de decisiones y desempeña un papel importante.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Ejemplo

La corporación kenloss ha estado recibiendo reclamos por parte de diferentes compañías


petroleras que utilizan el chiller que comercializa desde hace cinco años. Para resolver
este problema, la compañía quiere conocer primero los porcentajes de chiller vendidos
que tienen problemas. Durante los últimos seis meses ha estado vigente un programa de
descuentos, de manera que la empresa decide usar los nombres de la lista de descuentos
como la población de la que se obtendrá la muestra. Se escoge una muestra aleatoria de
1800 nombres a partir de esta lista y se les envía por correo un breve cuestionario a las
compañías junto con un vale de descuento por valor de $500. Contestaron un total de
1675 encuestados, lo que representan un buen puntaje, 93%. La compañía piensa que
obtuvo una muestra representativa. El 12% de los encuestados dijo haber experimentado
problemas. La estimación por intervalo se calcula con un nivel de confianza del 99%

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Intervalo de confianza de la proporción de una población =
0,12(1−0,12)
0,12±2,575 = 0,12 ± 0,02
1675

Los puntos extremos del intervalo de confianza son 0,10 – 0,14.


Por tanto, se concluye que Kenloss puede establecer con el 99% de
confianza que el porcentaje de compradores que ha tenido
problemas con el chiller está entre el 10 y 14%.
La dirección de la compañía no considera satisfactorio este nivel de
calidad e inicia un programa de mejora de la calidad.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Error de muestreo

Diferencia entre el estadístico de una muestra y el parámetro de la población


correspondiente.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Ejemplo 1
Un Candidato para ser presidente de ECOPETROL cree contar con el 70 % de opinión favorable.
En un Sondeo de opinión obtuvo que 75 % de los miembros de la Junta Directiva están por dicho candidato.
Se puede afirmar que se supera la creencia original?
Si el Error Muestral es del 8 %, el verdadero valor promedio de favorabilidad esta entre el
67 % y el 83 %,
es decir, la favorabilidad en el sondeo podría ser incluso inferior a la primera medición.
El sondeo solo mostraría superación de la creencia original, para una estimación puntual del 75 %, si el error
muestral fuera inferior al 5 % (digamos, por ejemplo, 4 %).
En este caso el intervalo de confianza para la favorabilidad promedio en el sondeo, estaría entre el
71% y el 79 %, intervalo que esta por encima del 70 % (creencia original).
Si la creencia original se estableció también por un procedimiento de muestreo y lo que obtuvo fue un
Intervalo de Confianza de 68 % al 72 %.
El nuevo sondeo, para ser favorable, debería tener un error muestral más pequeño (2 %).
Así, el nuevo intervalo del 73 % al 77 %
al no interceptar al anterior apoyaría la conclusión de que la favorabilidad actual
es mayor que la original?.
Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST
Factor de corrección de una población
finita
Qué sucede si la población de la que se ha tomado muestra no es muy grande?.
Es necesario realizar algunos ajustes en la forma de calcular el error estándar de las medias
muestrales y el error estándar de las proporciones muestrales.
Una población con un límite superior es finita.
Ejemplo

 Existen 21376 estudiantes matriculados en la Universidad Nacional de


Colombia
 Tenemos 978 ingenieros de Petróleos
 DAimlerChrysler ensambló 910 jeeps wrangler en la planta.

Una población finita puede ser muy pequeña como también puede ser muy
grande
Para determinar el intervalo de confianza para la media, se ajusta el error
estándar de la media.

Si está determinado el intervalo de confianza para la proporción, necesita


ajustar el error estándar de la proporción.
Este ajuste recibe el nombre de factor
de corrección de una población finita

𝑁−𝑛
𝐹𝑃𝐶 =
𝑁−1

Si la muestra es un porcentaje significativo de la población, el estimador es más


preciso.
El factor de corrección se utiliza mucho cuando la población es pequeña.
Ejemplo:

N = 1000 y n = 100
La razón es de (1000-100)/(1000-1), o 900/999.
Factor = 0,9492
Al multiplicar este factor por el error estándar, se reduce el error estándar
aproximadamente 5%
(1-0,9492 = 0,0508).
Esta reducción en la magnitud del error estándar da como resultado un intervalo
menor de valores al calcular la media poblacional o la proporción poblacional.
La regla consiste en que n/N < 0,05

se ignora el factor de corrección

También, si se tiene el tamaño de la población se debe usar, que con esto el


margen de error mejora, por tanto cuando se conoce el tamaño de la
población se vuelve obligatorio corregir.
Intervalo de confianza para la media a
partir de una población finita
Sin conocer σ
𝑠 𝑁−𝑛
𝑋 ±𝑡
𝑛 𝑁−1

Conociendo σ
𝜎 𝑁−𝑛
𝑋 ±𝑧
𝑛 𝑁−1
Intervalo de confianza para la
proporción partir de una población finita

𝑝(1 − 𝑝) 𝑁−𝑛
𝑝±𝑧
𝑛 𝑁−1
Ejemplo

Hay 250 familias en una ciudad. Una muestra aleatoria de 40 de estas familias revela que la
contribución anual media a la iglesia fue de $450.000.= y la desviación estándar de $75.000.=
La media poblacional puede ser de
$425.000.= o $445.000?
1. Cuál es la media de la población?. Cuál es el mejor estimador de la media poblacional?
2. Analice la razón por la que se debe emplear el factor de corrección y es esta una
población finita?
3. Construya un intervalo de confianza de 90% para la media de la población. Cuáles son
los puntos extremos del intervalo de confianza?
4. Interprete el intervalo de confianza.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


La población es finita porque conocemos el total que son 250 familias
1. El mejor estimador de la media poblacional es su media muestral que para este caso es
$450.000.=
2. La muestra corresponde al 16% de la población 40/250, como la muestra constituye más del 5% de
la población debe utilizarse el FCP para ajustar el error estándar en el momento de determinar el
intervalo de confianza.
3. La fórmula para determinar el intervalo de confianza para una media de la población es el
siguiente:
𝑠 𝑁−𝑛
𝑋 ±𝑡
𝑛 𝑁−1

75.000 250 − 40
450.000 ± 1.685
40 250 − 1
450.000 ± 19.981,64197 0.91835
450.000 ± 18.350,2146
Los puntos extremos del intervalo de confianza son $431.650 y 468.350
4. Es probable que la media poblacional sea de más de $431.650 e inferior a $468.350, en otras
palabras la media poblacional puede ser mayor de $445.000.= Si, pero no es probable que sea de
$425.000.= Porque el valor de $445.000 se encuentra dentro del intervalo de confianza y $425.000
no pertenece al intervalo de confianza. Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST
Elección del tamaño adecuado de una
muestra
Una pregunta frecuente la hora de realizar muestreo es cuántos
elementos debe haber en una muestra. Si una muestra es demasiado
grande, se gasta mucho dinero en recabar datos. Asimismo si la
muestra es muy pequeña, las conclusiones resultarán inciertas.
El tamaño adecuado de una muestra depende de tres factores:
1. El nivel de confianza deseado
2. El margen de error que tolerará el investigador
3. La variabilidad de la población que se estudia

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Los niveles de confianza más usados son 95% y 99%, aunque es posible cualquier valor
entre 0% y 100%.
Mientras más alto el nivel de confianza, mayor será el tamaño de la muestra
correspondiente.
El error admisible es la magnitud hacia derecha o izquierda para determinar los puntos
extremos del intervalo de confianza y es la magnitud del error que tolerarán quienes
conducen el estudio. También es la mitad de la amplitud del correspondiente intervalo de
confianza.
Un error admisible más pequeño requerirá una muestra mayor.
Un error admisible grande permitirá una muestra menor.
Si la población se encuentra muy dispersa, se requiere de una muestra muy grande .
Por otra parte si la población se encuentra concentrada el tamaño de muestra que se
requiere es menor.
Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST
La interacción entre estos tres factores y el tamaño
de la muestra se expresa con la siguiente fórmula

𝑧𝜎 2
𝑛=
𝐸
n: Tamaño de la muestra
z: Es el valor normal estándar correspondiente al nivel de confianza
deseado
σ: Desviación estándar de la población (variabilidad de los datos)
E: Error máximo admisible

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


En caso de una proporción, también se deben
especificar los 3 elementos descritos anteriormente
y la fórmula queda
𝑧 2
𝑛 = 𝑝(1 − 𝑝)
𝐸

Si se cuenta con un estimador disponible de p a partir de un estudio piloto


u otra fuente, se puede utilizar, sino se utiliza 0.50.

El resultado de este cálculo no siempre es un número entero, sin embargo


por tratarse de unidades muestrales debe llevarse al siguiente valor.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Ejemplo

Un estudiante de Ingeniería de petróleos desea determinar la cantidad media que


ganan al mes los miembros de los consejos ciudadanos de las grandes ciudades. El
error al calcular la media debe ser inferior de $1000, con un nivel de confianza de 95%.
El estudiante encontró un informe del Departamento del Trabajo en el que la
desviación estándar es de $10000. Cuál es el tamaño de la muestra que se requiere?

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


𝑧𝜎 2
𝑛=
𝐸

2
1.96 ∗ 10000
𝑛=
1000

𝑛 = 384,16

Llevando el valor a la siguiente unidad muestral encontramos que el tamaño de la


muestra puede ser 385, si el estudiante desea incrementar el nivel de confianza,
por ejemplo a 99% se requiere una muestra mas grande.
2
2,575 ∗ 1000
𝑛=
100

𝑛 = 663,06
Se recomienda una muestra de 664, la diferencia del n es de 279, por ello el
cuidado cuando se define el nivel de confianza.
Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST
Ejemplo

En el estudio anterior también se calcula la proporción de ciudades que


cuentan con recolectores de basura privados. El estudiante desea que el
margen de error se encuentre a 0,10 de la proporción de la población; el
nivel de confianza deseado es de 90% y no se encuentra disponible
ningún estimador para la proporción de la población. Cuál es el tamaño de
la muestra que se requiere?

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


𝑧 2
𝑛 = 𝑝(1 − 𝑝)
𝐸

2
1,645
𝑛 = 0,5(1 − 0,5)
0,1
𝑛 = 67.6506

El estudiante necesita una muestra aleatoria de 68 ciudades.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Вам также может понравиться