Вы находитесь на странице: 1из 43

CUADERNILLO

ESTADISTICA ESTADISTICA
BASICA
INTEGRANTES : *
ARZATE SALGADO JOSE IVAN
* MIGUEL HERRERA ENRIQUE *
SALAS CURIEL JESSICA *
SAN VICENTE FERNANDEZ ALEJANDRA *
VALDEZ MANZO SARAI MIROSLAVA
CUADERNILLO DE ESTADISTICA

Unidad Temas Subtemas


1 Estadística descriptiva.
1.1 Definición y campo de la
estadística.
1.2 Planteamiento de un caso
específico.
1.3 Organización de datos.
1.4 Medidas de tendencia
central.
1.5 Medidas de dispersión.
1.6 Aplicación en el caso
específico.

2 Distribuciones muéstrales.
2.1 Introducción.
2.2 Distribución muestral de
la media con varianza
conocida.
2.3 Teorema del límite
central.
2.4 Distribución muestral de
la proporción.
2.5 Distribución muestral de
la diferencia de medias y de
diferencia de proporciones.
2.6 Distribución muestral de
la media con varianza
desconocida.
2.7 Distribución muestral de
la diferencia de medias.
2.8 Distribución muestral de
la varianza.
2.9 Distribución muestral de
la razón de varianzas.
2.10 Aplicación en el caso
específico.

3 Teoría de la estimación.
3.1 Introducción.
3.2 Estimación y propiedades
de los estimadores.
3.3 Estimación por intervalo.
3.4 Intervalo de confianza
para la media con varianza
conocida y desconocida.
3.5 Intervalo de confianza
CUADERNILLO DE ESTADISTICA

para una proporción y


diferencia de proporciones.
3.6 Intervalo de confianza
para diferencias de medias
con varianza conocida y
desconocida.
3.7 Intervalo de confianza
para una varianza.
3.8 Intervalo de confianza
para una razón de varianzas.
3.9 Aplicación en el caso
específico.

4 Pruebas de hipótesis.
4.1 Conceptos de la teoría
de prueba de hipótesis.
4.2 Errores tipo I y II.
4.3 Prueba de hipótesis para
una media con varianza
conocida y desconocida.
4.4 Prueba de hipótesis para
una proporción y diferencia
de proporciones.
4.5 Prueba de hipótesis para
diferencia de medias con
varianzas conocidas y
desconocidas.
4.6 Prueba de hipótesis para
una varianza
4.7 Prueba de hipótesis para
una razón de varianzas.
4.8 Prueba de bondad de
ajuste.
4.9 Aplicación en el caso
específico.

ESTADISTICA:
La estadística es la ciencia cuyo objetivo es reunir información cuantitativa
relacionada a individuos, grupos, series de hechos, entre otros. Gracias al análisis
de estos datos se pueden deducir algunos significados precisos o algunas
previsiones para el futuro. La estadística, en general, es la ciencia que trata la
recopilación, la organización, la presentación, el análisis y la interpretación de
datos numéricos con el fin de realizar una toma de decisiones más efectiva.
CUADERNILLO DE ESTADISTICA

“Ciencia que se ocupa del estudio de fenómenos de tipo genérico, normalmente


complejos y enmarcados en un universo variable, mediante el empleo de modelos
de reducción de la información y de análisis de validación de los resultados en
términos de representatividad”. La información puede ser numérica, alfabética o
simbólica. Consta de las fases de recogida de información, de análisis y de
presentación e interpretación de los resultados y elaboración de métodos.

Importancia

La estadística resulta muy útil no sólo para recopilar y describir datos, sino
también para interpretar la información obtenida, que puede ser aprovechada para
demostrar la evolución de un fenómeno a través de cierto tiempo.

En México, el Instituto Nacional de Estadística y Geografía (INEGI) se encarga de


recabar información estadística y geográfica de todo el país, en diferentes áreas y
contextos. Los datos que publica sirven para dar a conocer a cualquier persona la
situación en la que se encuentra el área de donde se obtuvo la información. Al
gobierno le son muy útiles para tomar decisiones, por ejemplo, para saber qué
acciones se deben implementar en tal o cual zona del país, conocer los avances
que se han registrado o como herramienta para la evaluación de un proyecto. Los
métodos estadísticos se utilizan prácticamente en investigaciones de todas las
áreas de conocimiento; tanto en el ámbito académico, como en el profesional y
laboral.

División de la Estadística

La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la


Estadística Descriptiva y la Inferencial.

 Estadística Descriptiva: La función descriptiva de la estadística se enfoca


en la presentación y clasificación de los datos obtenidos de la población
que se analiza.

 Estadística Inferencial: Esta aplicación de la estadística busca plantear y


resolver problemas específicos y/o hacer previsiones a partir de los datos
de una muestra.

La estadística descriptiva describe datos.


La estadística inferencial infiere con esos datos, entendiendo inferir como la
predicción de un resultado.

Conceptos básicos:
CUADERNILLO DE ESTADISTICA

Población: Conjunto de todos los elementos que presentan una característica


común determinada, observable y medible. Por ejemplo, si el elemento es una
persona, se pueden estudiar las características edad, peso, nacionalidad, sexo,
etc. Los elementos que integran una población pueden corresponder a personas,
objetos o grupos (por ejemplo, familias, las manzanas de una cosecha, empleados
de una empresa, etc.).

Individuo: Un individuo o unidad estadística es cada uno de los elementos que


componen la población. Nota que un individuo en estadística puede ser distinto a
un individuo como persona. Por ejemplo, en los censos económicos se obtienen
datos de los negocios. En este caso cada negocio, que está formado por varias
personas, es un individuo de la población.

Muestra: La mayoría de los estudios estadísticos se realiza, no a partir de toda la


población, sino de un subconjunto o parte de ésta, llamado muestra, partiendo del
supuesto de que este subconjunto presenta el mismo comportamiento y
características que la población. En general el tamaño de la muestra es mucho
menor al tamaño de la población.

Muestreo: Es el proceso de recabar los datos que se desean analizar, obtenidos


de una proporción reducida y representativa de la población.

Variable: Se llama variable a una característica que se observa en una población


o muestra, y a la cual se desea estudiar. La variable puede tomar diferentes
valores dependiendo de cada individuo. Las variables se pueden clasificar en
cuantitativas y cualitativas:

a) Variable cuantitativa: se expresa en valores numéricos. Dentro de ella, se


subdividen en:
 Discreta: Se tratan de variables expresadas con valores enteros. Ej. N° de
hijos de una Familia, n° de alumnos de un curso.
 Continua: son valores que pueden tomar cualquier valor dentro de un
intervalo. Ej. Peso, estatura, sueldos.

b) Variable cualitativa: es aquella que describe cualidades. No son numéricas


y se subdividen en:

 Nominal: son variables presentadas sin orden ni jerarquía. Ej. Estado civil,
preferencia por una marca, sexo, lugar de residencia.
 Ordinal: son variables organizadas de acuerdo con una clasificación. Ej.
grado de estudios, días de la semana, calidad de la atención, nivel
socioeconómico.

Solución de un problema estadístico


CUADERNILLO DE ESTADISTICA

La solución de un problema estadístico comprende los siguientes pasos:

A) Planteamiento del problema.


En el planteamiento se define la población, la característica a estudiar (las
variables), una hipótesis, etc. En este punto también se analizan los medios de los
que se dispone y el procedimiento a seguir.

B) Elaboración de un modelo.
Se establece un modelo teórico de comportamiento de las variables de estudio. En
ocasiones no es posible diseñar el modelo hasta realizar un estudio previo.
Los posibles modelos son Normal, Binomial, Poisson, Uniforme, etc.

C) Extracción de la muestra.
Se usa alguna técnica de muestreo o un diseño experimental para obtener
información de una pequeña parte de la población.

D) Tratamiento de los datos


En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los
datos y se calculan los valores que serán necesarios en pasos posteriores, como
la media y la varianza de la muestra. Los métodos de esta etapa corresponden a
los métodos de la estadística descriptiva. Algunas de las etapas de esta fase son:
recopilación, clasificación y presentación de la información.

E) Estimación de los parámetros


La estadística inferencial nos proporciona herramientas para la predicción o
estimación de los parámetros de la población que nos ayudarán a resolver el
problema. Un ejemplo de estas herramientas son las pruebas de hipótesis que se
obtienen del análisis de los datos y los intervalos de confianza.

EJERCICIO:

Durante un mes de verano los 8 vendedores en una empresa de equipos de


calefacción de aire acondicionado vendieron los siguientes números en unidades
centrales de aire acondicionado 8, 11, 5, 14, 8, 11, 16 y 11 con los datos
anteriores encuentre el rango, moda, mediana, media aritmética, varianza y
desviación estándar de esta población.

RANGO:
5 8 8 11 11 11 14 16 = 5-16 =11

MODA: 11
CUADERNILLO DE ESTADISTICA

MEDIANA:
11+11=22/2=11

MEDIA ARITMETICA:
n
2 xi 5+8+ 8+11+11+ 11+14+16 84
μ =∑ ¿ =¿ = =¿ ¿10.5
i =1 n 8 8

VARIANZA:
n
σ 2=∑ ¿ ¿ ¿ ¿
i−1
+¿ ¿10.75

DESVIACION ESTANDAR:

σ =√ σ 2=√ 10.75=¿ 3.278

“DATOS AGRUPADOS”
Es agrupar la información con la que se cuenta, e ir clasificando por características
que nos faciliten manejar y tener el control de los datos.

Es decir cuando el conjunto de datos de interés, contiene solo pocas


observaciones, proporciona habitualmente un adecuado resumen de los mismos,
sin embargo, en la práctica, la mayor parte de los conjuntos de datos, contienen
muchas observaciones y será preciso lograr una presentación más completa, de la
distribución de tales datos.

En los datos agrupados se pueden calcular, su media y varianza, pero sería útil
proporcionar además una idea visual de la información que contienen los datos.
Una ordenación de datos es una de las formas más sencillas de presentarlos:
Organiza los valores en orden ascendente o descendente.
La ordenación de datos ofrece varias ventajas con respecto a los datos sin
procesar.
• Podemos identificar los valores mayor y menor rápidamente.

• Es fácil dividir los datos en secciones.

• Podemos ver si algunos valores aparecen más de una vez en el arreglo.


CUADERNILLO DE ESTADISTICA

• Podemos observar la distancia entre valores sucesivos de los datos.

Una distribución de frecuencias es una tabla, en la que organizamos los datos en


clases, es decir, en grupo de valores, qué describen una característica de los
datos, muestra el número de observaciones, de el conjunto de datos que caen en
cada una de las clases. Si se puede determinar la frecuencia con la que se
presentan los valores en cada clase de un conjunto de datos, se puede construir
una distribución de frecuencias.

EJEMPLOS
CUADERNILLO DE ESTADISTICA

n
fimi 1662
x́=∑ ¿ = =20.770
i=1 ∑ fi 80
n
2 fi m2 36306.02
s =∑ −x́ 2= −¿ ¿
i =1 n 80
s= √ s2 =√ 22.43=4.73

EJERCICIO #2
A) Encuentre la media aritmética
B) DETERMINE LA VARIANZA
C) Encuentre la desviación estándar
Clases ventas f M fM F M2
dólares
10-20 1 15 15 225
20-30 8 25 200 5,000
30-40 10 35 350 12,250
40-50 9 45 405 18,225
50-60 8 55 440 24,200
60-70 4 65 260 16,900
70-80 2 75 150 11,250
total 42 1,820 88,050
CUADERNILLO DE ESTADISTICA

1820
x=̅ 42 =43.3
88,050
42
– ( 43.3) = 2,096.42-1,874.89
2

S2=221.53

S= √ 221.53
S=14.88

UNIDAD II
DISTRIBUCIONES MUESTRALES

Muestrear es una forma de evaluar la calidad de un producto, la opinión de los


consumidores, la eficacia de un medicamento o de un tratamiento. Muestra es una
parte de la población. Población es el total de resultados de un experimento.
Hacer una conclusión sobre el grupo entero (población) basados en información
estadística obtenida de un pequeño grupo (muestra) es hacer una inferencia
estadística.

A menudo no es factible estudiar la población entera. Algunas de las razones por


lo que es necesario muestrear son:

1. La naturaleza destructiva de algunas pruebas

2. La imposibilidad física de checar todos los elementos de la población.

3. El costo de estudiar a toda la población es muy alto.

4. El resultado de la muestra es muy similar al resultado de la población.


CUADERNILLO DE ESTADISTICA

5. El tiempo para contactar a toda la población es inviable.

Distribución muestral de las medias. Es una distribución de probabilidad de todas


las posibles medias muestréales, de un tamaño de muestra dado, seleccionadas
de una población.

EJERCICIO #3
DISTRIBUCIONES MUESTRALES
UNA POBLACION NORMAL TIENE MEDIA=80 Y DESVIACION ESTANDAR=14

A) Calcule la probabilidad de tener un valor entre 75 y 90.


B) La probabilidad de tener un valor de 75 o menor.
C) Calcule la probabilidad de tener un valor entre 55 y 70.

90−80
A) M=80 Z= 14 =0.7142=0.2611
σ =14

P (75<X<90)
75−80
P (90<X<80) Z= 14
=0.3571=0.1368

0.2611+0.168 R= 39.79%
CUADERNILLO DE ESTADISTICA

B) μ=80 0.5 - 0.1368=.3632


σ =14 R= 36.32%
P (75<X)
CUADERNILLO DE ESTADISTICA

C) M=80
σ =14
70−80
P (55<X<70) Z= 14
=0.7142 =.2611
.2611-.1368= .1243
R= 12.43%
CUADERNILLO DE ESTADISTICA

EJERCICIO #4

LA MEDIA DE LA POBLACION NORMAL, ES 60 Y LA DESVIACION=12. SE


TOMA UNA MUESTRA ALEATORIA DE 9. CALCULE LA PROBABILIDAD DE
QUE LA MEDIA MUESTRAL.

A) Se mayor que 63
B) Menor que 56
C) Este entre 56 y 63

A) x=̅ 60 P (x ̅>63)
63−20
3
σ =56 Z= 12 = 4 =.75 R=.75
√9
.5 + 2734 = .7734 1 - .7734 = 0.2266
22.66%
CUADERNILLO DE ESTADISTICA

B) P (x>̅ 56) .05 + .0398 = .5398


56−60
4
Z= 12 = 4 =1 1 - .5398 = .4602=
√9
R=46.02%

C) P(56<X<63)

0.3938+.2734=0.3132
0.3132X100= R=31.32%
CUADERNILLO DE ESTADISTICA

DISTRIBUCION MUESTRAL DE LA PROPORCION

Sea X1, X2,…, Xn una muestra aleatoria tomada de una población con una
distribución de Bernoulli con parámetro q. Por lo tanto su función de probabilidad,
su media y su varianza están dadas por:

E(X) = q, V(X) = q (1 - q)

Si P es la proporción muestral, definida como

En virtud del Teorema Central del Límite, como P es la media muestral de los
diferentes valores de Xi, entonces P tiende a seguir una distribución normal con
los parámetros dados anteriormente, es decir, P ~. Ó también la variable aleatoria

Sigue una distribución normal estándar con media cero y varianza unitaria, cuando
el tamaño de la muestra n es grande.
CUADERNILLO DE ESTADISTICA

EJEMPLO

Se elije una muestra de 2000 electores potenciales en el estado de México.


Se encontró que 1550 planean votar por el gobernador actual ¿cuál es la
probabilidad de que el gobernador sea elegido presidente de la Republica?
En una encuesta previa se determinó que el 80% de la población total del padrón
votante elegiría a dicho candidato.

ρ́− p
ρ́−ρ
ρ =.80 formula Z= σ ρ́ =¿ Z = ρq =
√ n

ρ́ =.775

1550
n=2000 P(A)
2000
=.775

q=.225
.775−.80
Z= ( .775 ) (.225) = -2.67
√ 2000
CUADERNILLO DE ESTADISTICA

DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE MEDIAS

Para conocer la distribución muestral de las diferencias entre las medias se debe
saber si las varianzas poblacionales son conocidas o desconocidas, y en caso de
que sean desconocidas, se debe saber si son iguales o diferentes. Cada uno de
estos tres casos se analizará por separado.

a) Distribución de la diferencia entre dos medias cuando las varianzas son


conocidas. Si las varianzas y son conocidas, tanto como se distribuyen
normalmente. Por lo tanto la distribución de la diferencia entre las medias
muéstrales es normal con el valor esperado y la varianza dados anteriormente, es
decir,

De acuerdo con lo anterior la siguiente variable aleatoria tiene una distribución


normal estándar:

Por lo tanto, con base en la expresión anterior se pueden realizar inferencias con
respecto a la diferencia de medias poblacionales, bajo el supuesto de que las
varianzas sean conocidas. Si además, son iguales, la expresión anterior se puede
expresar como:
CUADERNILLO DE ESTADISTICA

b) Distribución de la diferencia entre dos medias cuando las varianzas son


desconocidas pero iguales ( = = )

Cuando las varianzas son desconocidas, se debe realizar previamente una prueba
estadística para verificar si éstas son iguales o diferentes. Para realizar esta
prueba debemos hacer uso de la distribución F para verificar si la relación de
varianzas es igual a uno o diferente de uno.

Para cada una de las dos muestras se definen sus respectivas varianzas como:

Además tienen distribuciones chi cuadrado con n1–1 y n2–1 grados de libertad
respectivamente. Por lo tanto su suma también sigue otra distribución chi
cuadrado con n1+n2–2 grados de libertad. Es decir:

Ahora bien, si Z es una variable normal (0,1) y Y tiene una distribución chi
cuadrado con n grados de libertad, entonces la variable tiene una distribución t con
n grados de libertad. Para nuestro caso la variable Z corresponde a la distribución
de la diferencia de las dos medias, con varianzas conocidas, y la variable chi
cuadrado corresponde a la variable Y acabada de definir. Por lo tanto

Donde es un estimador ponderado de la varianza poblacional s


Obtenida ponderando las varianzas poblacionales por sus respectivos grados de
libertad.

c) Distribución de la diferencia entre dos medias cuando las varianzas son


desconocidas y diferentes

EJEMPLO:
De una población se toma una muestra de 40 observaciones. La media muestral
es de 102 y la desviación estándar de 5. De otra población se toma una muestra
de 50 observaciones y la media muestral es ahora 99 y la desviación estándar es
6. Calcule el valor estadístico de la prueba.
Supongo que las medias poblacionales son iguales a las varianzas.
x͞ 1= 102 Z=¿ ¿ ¿ x͞ 2= 99

S1=5
(102−99)(0) 3
Z= = =2.54
1.18 1.18
CUADERNILLO DE ESTADISTICA

S2=6

( n−1 ) S 21 +( n2−1) S22 ( 40−1 ) 52 + ( 50−1 ) 6 2 975+1764 2739


S2
= n1 +n −2 2
= 40+ 50−2 = 88
=
88 = 31.13

2
S2 S2 31.13 31.13
σ x1 x 2
√ +
n1 n 2
=
√ 40
+
50
=√ 0.77+0.62= √1.3926=1.18

.5+.4945=0.9945
.1-0.9945=.0055
CUADERNILLO DE ESTADISTICA

DISTRIBUCION DE PROBABILIIDAD
T DE STUDENT
DISTRIBUCION DE PROBABILIDAD:
Con respecto a una variable aleatoria es una función que asigna a cada suceso
definido sobre la variable aleatoria la probabilidad de que dicho suceso ocurra. La
distribución de probabilidad está definida sobre el conjunto de todos los eventos
rango de valores de la variable aleatoria.
Cuando la variable aleatoria toma valores en el conjunto de los números reales, la
distribución de probabilidad está completamente especificada por la función de
distribución, cuyo valor en cada real x es la probabilidad de que la variable
aleatoria sea menor o igual que x.

T DE STUDENT:
Permite decidir si dos variables aleatorias normales y con la misma varianza
tienen medias diferentes. Dada la ubicuidad de la distribución normal puede
aplicarse en numerosos contextos, para comprobar si la modificación en las
condiciones de un proceso (humano o natural) esencialmente aleatorio producen
una elevación o disminución de la media poblacional. Esto opera decidiendo si una
diferencia en la media muestral entre dos muestras es estadísticamente
significativa, y entonces poder afirmar que las dos muestras corresponden a
distribuciones de probabilidad de media poblacional distinta, o por el contrario
afirmar que la diferencia de medias puede deberse a oscilaciones estadísticas.
La eficacia aumenta con el número de datos del que constan las dos muestras, en
concreto del número de grados de libertad conjunto de las dos muestras, este
número viene siendo Ni el tamaño muestral, es decir, el número de datos en cada
muestral.
CUADERNILLO DE ESTADISTICA

1.- Suponga que los datos siguientes se seleccionan al azar de una población de
valores normalmente distribuidos y realicen un intervalo de confianza del 95%para
calcular la media poblacional.

40,51,43,48,44,57,54,39,42,48,45,39 y 43
n
X i 40+51+ 43+48+ 44+57 +54+39+ 42+48+ 45+39+ 43 593
χ́ =∑ = = = 45.61
i=1 n 13 13
n
( x −xi )
s2=∑ =¿ ¿
i=1 n−1
+¿ ¿
+¿ ¿

s= √ s2 =√ 32.42=5.69
∝=1−.95 %=0.05÷ 2=0.025
gl=n−1=13−1=12
5.69
S x= =1.57
√ 13
I ∝=x ±t S x
I ∝=45.61+ ( 2.179 ) (1.57 )=¿
45.61+3.42=49.03Límite superior
45.61−3.42=42.12Límite inferior

(42.12, 49.03)
CUADERNILLO DE ESTADISTICA
CUADERNILLO DE ESTADISTICA

EJERCICIO#2
Si se supone que X esta normalmente distribuida utiliza la siguiente información
para calcular un intervalo de confianza de 90% para estimar la media poblacional.
n
Xi
χ́ =∑ 313, 320, 319, 340, 325, 310, 321, 329, 317, 311, 307, 318.
i=1 n
313 ,320 , 319 ,340 , 325 , 310 ,321 , 329 ,317 ,311 , 307 , 318.
= 319.16
12
n
2= ∑ ¿¿¿
S i=1
¿
¿¿
¿

37.9456+0.7056+0.0256+ 434.305634 .1056+83.9056+ 3.3856+96.82564 .6656+66.5856+ ¿147.8656+ 1.345


12−1

911.6672
= 11 = 82.87 √ 82.87 = 9.10

x́ =319.16

σ 2=82.87

σ =9.10

gl= n-1
gl= 12-1=11
∝ 1-.90%= 0.2/2= 0.05
9.10
IC=319.16+ (1.796) (2.6269) S x́ = =2.6269
√ 12
319.16 + 4.7179= 323.8779 Límite Superior
319.16 – 4.7179= 314.4421 Límite Inferior
(314.4, 323.8)
CUADERNILLO DE ESTADISTICA

EJERCICIO #3

Si una muestra aleatoria de 27 Artículos produce x́= 128.4 y S= 20.6, cual es el


intervalo de confianza de 98% para la media poblacional. Suponga que X esta
normalmente distribuida para la población. ¿Cuál es la estimación puntual?
x́ = 128.4
S= 20.6
σ= 4.53
gl= n-1
gl= 27-1= 26
∝= 1-.98%= 0.02/2= 0.01
20.6
IC= 128.4+ (2.479) (3.96) S x́ = 27 =3.96

128.4 + 9.8168= 138.21 Límite Superior
128.4 – 9.8168= 118.58 Límite Inferior
(118.58, 138.21)
CUADERNILLO DE ESTADISTICA

Use información en base a cada una de las siguientes muestras para calcular el
intervalo de confianza para estimar la proporción de la población.
A)n= 44 y p= .51 calcule en IC 99%
B)n= 300 y p= .82 calcule un IC 95%
C)n= 1150 y p= .48 calcule un IC 90%
D)n= 95 y p= .32 calcule un IC 88%

A)n=44
p=.51

σρ=x=
√( .51 ) (.49) =0.075
44

IC= p ± zσx
IC=.51± (2.57) (.075)
=.51+0.19=0.7
=.51-0.19=.32
B)n=300
p=.82
σp=√ ( .82 ) ¿ ¿ ¿
IC=.82± (1.96) (.022)
=.82+0.043=0.863
CUADERNILLO DE ESTADISTICA

=.82-0.043=0.777
C)n=1150

p=.48

σp=
√( .48 ) (.52) =0.014
1150
IC=.48± (1.65) (0.014)
=.48+0.023=.50
=.48-0.023=.45
D)n=95

p=.32

σp=
√( .32 ) (.68) =0.047
95
IC=.32± (1.56) (0.047)
=.32+.073=0.39
=.32-.073=0.24

INTERVALO DE CONFIANZA PARA ESTIMAR P

INTERVALO DE CONFIANZA:

Se llama intervalo de confianza en estadística a un par de números entre los


cuales se estima que estará cierto valor desconocido con una determinada
probabilidad de acierto. Formalmente, estos números determinan un intervalo, que
se calcula a partir de datos de una muestra, y el valor desconocido es un
parámetro poblacional.
El intervalo de confianza para estimar una proporción p, conocida una proporción
muestral pn de una muestra de tamaño n, a un nivel de confianza del (1-α)·100%
es:
CUADERNILLO DE ESTADISTICA

Una compañía textil produce pantalones para hombre, los pantalones se


confeccionan y venden con corte regular o con corte de bota. En un esfuerzo por
estimar la proporción del mercado de sus pantalones para hombre en el centro de
la ciudad que prefiere pantalones con corte de bota, el analista toma una muestra
aleatoria de 212 ventas de pantalones de las 2 tiendas de venta al público de la
ciudad solo 34 de las ventas fueron con pantalones de corte de bota. Construye un
intervalo de confianza de 90% para estimar la proporción de la población en toda
la ciudad que prefieren pantalones con corte bota.

n=212P̅ =.16
34
P( A) =.16
212

P = IC =P̅ ± Zσ P̅
√ pq √( .16 ) (.84)
IC= .16 ± (1.65) (0.25)σ P̅ = n σ P̅ ¿ 212 =.025

IC=.16 + .041 = .2 Limite Superior


IC= .16 - .041 = .11 Límite Inferior
(.11, .2)

PROBLEMAS
Usen la información sobre cada una de las siguientes muestras para calcular el
intervalo de confianza para estimar la proporción de la población.
a) n=44 ṕ=.51 ; Calcule un Intervalo de Confianza del 99%

n= 44 p= IC∝ = ṕ ±Z√ ṕ
ṕ=.51 IC= .51± (2.57) (0.075)
IC= .51+ 0.19= 0.7 Limite Superior
IC= .51- 0.19= 0.32 Límite Inferior
(.32, .7)
√ pq .51(.49)
σ ṕ=
n √
= 44
= 0.075
CUADERNILLO DE ESTADISTICA

b) n=300 P̅ =.82; calcule un intervalo de confianza de 95%


pq ( .82 ) (.18)
σ P̅= √ n σ P̅ = √ 300 =.022
.82 ± (1.96) (.022)
Límite superior .82+ .043=.863
Límite inferior .82 - .043= .777
(.77, .86)

c)n=1150 P̅ =.48; calcule un intervalo de confianza de 90%


n=1150
CUADERNILLO DE ESTADISTICA

P̅ =.48 σ P̅ = √
pq
σ P̅ =
√( .48 )( .52) =.014
n 1150

.48 ± (1.65) (.014)

Limite Superior .48 + .023=.503

Límite Inferior .48 - .023=.45 (.457, 503)

d) n=95 P̅ =.32; calcule un intervalo de confianza de 88%


pq ( .32 ) (.68)
n=95 σ P̅ = √ σ P̅ = √ =.047
n 95

P̅ =.32
.32 ± (1.56) (.047)

Limite Superior.32 + .073=.393

Límite Inferior .32 - .073=.247

(.247, .393)
CUADERNILLO DE ESTADISTICA

EJERCICIOS

Use la siguiente Información para construir intervalo de confianza de 90%,


95% y 99% para estimar la media poblacional de los siguientes datos que
provienen de una población normalmente distribuida.
12.3, 11.6, 11.9, 12.8, 12.5, 11.4, 12.0, 11.7, 11.8, 12.3
n
X i 12.3 , 11.6 , 11.9 , 12.8 , 12.5 ,11.4 , 12.0 ,11.7 ,11.8 ,12.3
χ́ =∑ =12.03
i=1 n 10
n
2
( x −xi )
s =∑ n−1
i=1

¿¿¿
¿
CUADERNILLO DE ESTADISTICA

0.0729+0.1849+0.0169+0.5929+ 0.2209+0.3969+.0009+0.1089+0.0529+ 0.0729


10−1
1.721
=
9
= .191 √ .191 = .4370
x́ = 12.03

σ 2= .191
σ = .4370

gl= n-1 gl=10-1 =9


∝ =1-.90% = 0.1/2= 0.05
.4370
IC= 12.03+ (1.833) (0.1381) S x́ = =0.1381
√10
12.03+0.2531= 12.2831 Límite Superior
12.03-0.2531= 11.7769 Límite Inferior

(11.7, 12.2)
∝= 1-.95%= 0.05/2= 0.025
.4370
IC= 12.03+ (2.262) (0.1381) S x́ = =0.1381
√10
12.03+0.3123= 12.3423 Límite Superior
CUADERNILLO DE ESTADISTICA

12.03-0.3123= 11.7177 Límite Inferior


(11.7, 12.3)

∝= 1-.99%= 0.01/2= .005


.4370
IC= 12.03+ (3.250) (0.1381) S x́ = =0.1381
√10
12.03+0.4488= 12.478 Límite Superior
12.03-0.4488= 11.5812 Límite Inferior
(11.5, 12.4)
CUADERNILLO DE ESTADISTICA

Use la Siguiente información para calcular el Intervalo de Confianza para la


proporción poblacional. 90% de Confianza
a) n= 284
ṕ= .71

P = IC =P̅ ± Zσ P̅
σ P̅ = √
pq
σ P̅ ¿
√( .71 ) (.29)
IC= .71±(1.65) (0.026) n 284
=0.026
.71+ 0.0429= 0.7529 .71- 0.0429= 0.6671
(0.66, 0.75)

b) n= 1,250
ṕ= .48

P = IC =P̅ ± Zσ P̅
CUADERNILLO DE ESTADISTICA

σ P̅ = √
pq √( .48 )(.52)
n P̅
IC= .48±(1.96) (0.014) σ ¿
1,250
=0.014
.48+ 0.0274= 0.5074
.48- 0.0274= 0.4526
(0.45, 0.50)

PRUEBA DE HIPOSTESIS

Afirmación acerca de los parámetros de la población.


Etapas Básicas en Pruebas de Hipótesis.
Al realizar pruebas de hipótesis, se parte de un valor supuesto (hipotético) en
parámetro poblacional. Después de recolectar una muestra aleatoria, se compara
la estadística muestral, así como la media (x), con el parámetro hipotético, se
compara con una supuesta media poblacional (). Después se acepta o se rechaza
el valor hipotético, según proceda. Se rechaza el valor hipotético sólo si el
resultado muestral resulta muy poco probable cuando la hipótesis es cierta.
Etapa 1.- Planear la hipótesis nula y la hipótesis alternativa. La hipótesis nula (H0)
es el valor hipotético del parámetro que se compra con el resultado muestral
resulta muy poco probable cuando la hipótesis es cierta.
Etapa 2.-Especificar el nivel de significancia que se va a utilizar. El nivel de
significancia del 5%, entonces se rechaza la hipótesis nula solamente si el
resultado muestral es tan diferente del valor hipotético que una diferencia de esa
magnitud o mayor, pudiera ocurrir aleatoria mente con una probabilidad de 1.05 o
menos.
Etapa 3.- Elegir la estadística de prueba. La estadística de prueba puede ser la
estadística muestral (el estimador no segado del parámetro que se prueba) o una
CUADERNILLO DE ESTADISTICA

versión transformada de esa estadística muestral. Por ejemplo, para probar el


valor hipotético de una media poblacional, se toma la media de una muestra
aleatoria de esa distribución normal, entonces es común que se transforme la
media en un valor z el cual, a su vez, sirve como estadística de prueba.
Consecuencias de las Decisiones en Pruebas de Hipótesis.

Decisiones Posibles Situaciones Posibles

  La hipótesis nula La
es verdadera hipótesis
nula es
falsa

Aceptar la Hipótesis Nula Se acepta correctamente Error tipo II  

Rechazar la Hipótesis Error tipo I Se rechaza  


Nula correctamente

Etapa 4.- Establecer el valor o valores críticos de la estadística de prueba.


Habiendo especificado la hipótesis nula, el nivel de significancia y la estadística de
prueba que se van a utilizar, se produce a establecer el o los valores críticos de
estadística de prueba. Puede haber uno o más de esos valores, dependiendo de si
se va a realizar una prueba de uno o dos extremos.
Etapa 5.- Determinar el valor real de la estadística de prueba. Por ejemplo, al
probar un valor hipotético de la media poblacional, se toma una muestra aleatoria
y se determina el valor de la media muestral. Si el valor crítico que se establece es
un valor de z, entonces se transforma la media muestral en un valor de z.
Etapa 6.-Tomar la decisión. Se compara el valor observado de la estadística
muestral con el valor (o valores) críticos de la estadística de prueba. Después se
acepta o se rechaza la hipótesis nula. Si se rechaza ésta, se acepta la alternativa;
a su vez, esta decisión tendrá efecto sobre otras decisiones de los
administradores operativos, como por ejemplo, mantener o no un estándar de
desempeño o cuál de dos estrategias de mercadotecnia utilizar.
La distribución apropiada de la prueba estadística se divide en dos regiones: una
región de rechazo y una de no rechazo. Si la prueba estadística cae en esta última
región no se puede rechazar la hipótesis nula y se llega a la conclusión de que el
proceso funciona correctamente.
Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el valor
crítico en la distribución estadística que divide la región del rechazo (en la cual la
hipótesis nula no se puede rechazar) de la región de rechazo. A hora bien el valor
crítico depende del tamaño de la región de rechazo.
CUADERNILLO DE ESTADISTICA

PASOS DE LA PRUEBA DE HIPÓTESIS


1. Expresar la hipótesis nula
2. Expresar la hipótesis alternativa
3. Especificar el nivel de significancia
4. Determinar el tamaño de la muestra
5. Establecer los valores críticos que establecen las regiones de rechazo de
las de no rechazo.
6. Determinar la prueba estadística.
7. Coleccionar los datos y calcular el valor de la muestra de la prueba
estadística apropiada.
8. Determinar si la prueba estadística ha sido en la zona de rechazo a una de
no rechazo.
9. Determinar la decisión estadística.
10. Expresar la decisión estadística en términos del problema.

CONCEPTOS BÁSICOS PARA EL PROCEDIMIENTO DE


PRUEBAS DE HIPÓTESIS.
Hipótesis Estadística:
Al intentar alcanzar una decisión, es útil hacer hipótesis (o conjeturas) sobre la
población aplicada.
Tales hipótesis, que pueden ser o no ciertas, se llaman hipótesis estadísticas.
Son, en general, enunciados acerca de las distribuciones de probabilidad de las
poblaciones.
Hipótesis Nula.
En muchos casos formulamos una hipótesis estadística con el único propósito de
rechazarla o invalidarla. Así, si queremos decidir si una moneda está trucada,
formulamos la hipótesis de que la moneda es buena (o sea p = 0,5, donde p es la
probabilidad de cara).
Analógicamente, si deseamos decidir si un procedimiento es mejor que otro,
formulamos la hipótesis de que no hay diferencia entre ellos (o sea. Que cualquier
diferencia observada se debe simplemente a fluctuaciones en el muestreo de la
misma población). Tales hipótesis se suelen llamar hipótesis nula y se denotan por
Ho.
Para todo tipo de investigación en la que tenemos dos o más grupos, se
establecerá una hipótesis nula.
La hipótesis nula es aquella que nos dice que no existen diferencias significativas
entre los grupos.
CUADERNILLO DE ESTADISTICA

Por ejemplo, supongamos que un investigador cree que si un grupo de jóvenes se


somete a un entrenamiento intensivo de natación, éstos serán mejores nadadores
que aquellos que no recibieron entrenamiento. Para demostrar su hipótesis toma
al azar una muestra de jóvenes, y también al azar los distribuye en dos grupos:
uno que llamaremos experimental, el cual recibirá entrenamiento, y otro que no
recibirá entrenamiento alguno, al que llamaremos control. La hipótesis nula
señalará que no hay diferencia en el desempeño de la natación entre el grupo de
jóvenes que recibió el entrenamiento y el que no lo recibió.
Una hipótesis nula es importante por varias razones:
Es una hipótesis que se acepta o se rechaza según el resultado de la
investigación.
El hecho de contar con una hipótesis nula ayuda a determinar si existe una
diferencia entre los grupos, si esta diferencia es significativa, y si no se debió al
azar.
No toda investigación precisa de formular hipótesis nula. Recordemos que la
hipótesis nula es aquella por la cual indicamos que la información a obtener es
contraria a la hipótesis de trabajo.
Al formular esta hipótesis, se pretende negar la variable independiente. Es decir,
se enuncia que la causa determinada como origen del problema fluctúa, por tanto,
debe rechazarse como tal.
Otro ejemplo:
Hipótesis: el aprendizaje de los niños se relaciona directamente con su edad.
Hipótesis Alternativa.
Toda hipótesis que difiere de una dada se llamará una hipótesis alternativa. Por
ejemplo: Si una hipótesis es p = 0,5, hipótesis alternativa podrían ser p = 0,7, p "
0,5 ó p > 0,5.
Una hipótesis alternativa a la hipótesis nula se denotará por H1.
 Al responder a un problema, es muy conveniente proponer otras hipótesis
en que aparezcan variables independientes distintas de las primeras que
formulamos. Por tanto, para no perder tiempo en búsquedas inútiles, es
necesario hallar diferentes hipótesis alternativas como respuesta a un mismo
problema y elegir entre ellas cuáles y en qué orden vamos a tratar su
comprobación.

Las hipótesis, naturalmente, serán diferentes según el tipo de investigación que se


esté realizando. En los estudios exploratorios, a veces, el objetivode la
investigación podrá ser simplemente el de obtener los mínimos conocimientos que
permitan formular una hipótesis. También es aceptable que, en este caso, resulten
poco precisas, como cuando afirmamos que "existe algún tipo de problema social
CUADERNILLO DE ESTADISTICA

en tal grupo", o que los planetas poseen algún tipo de atmósfera, sin especificar
de qué elementos está compuesto.
Los trabajos de índole descriptiva generalmente presentan hipótesis del tipo
"todos los X poseen, en alguna medida, las característica Y". Por ejemplo,
podemos decir que todas las naciones poseen algún comercio internacional, y
dedicarnos a describir, cuantificando, las relaciones comerciales entre ellas.
También podemos hacer afirmaciones del tipo "X pertenece al tipo Y", como
cuando decimos que una tecnología es capital - intensiva. En estos casos,
describimos, clasificándolo, el objeto de nuestro interés, incluyéndolo en un tipo
ideal complejo de orden superior.
Por último, podemos construir hipótesis del tipo "X produce (o afecta) a Y", donde
estaremos en presencia de una relación entre variables.
Errores de tipo I y de tipo II.
Si rechazamos una hipótesis cuando debiera ser aceptada, diremos que se ha
cometido un error de tipo I.
Por otra parte, si aceptamos una hipótesis que debiera ser rechazada, diremos
que se cometió un error de tipo II.
En ambos casos, se ha producido un juicio erróneo.
Para que las reglas de decisión (o no contraste de hipótesis) sean buenos, deben
diseñarse de modo que minimicen los errores de la decisión; y no es una cuestión
sencilla, porque para cualquier tamaño de la muestra, un intento de disminuir un
tipo de error suele ir acompañado de un crecimiento del otro tipo. En la práctica,
un tipo de error puede ser más grave que el otro, y debe alcanzarse un
compromiso que disminuya el error más grave.
La única forma de disminuir ambos a la vez es aumentar el tamaño de la muestra
que no siempre es posible.

EJERCICIO 1
Un desarrollador considera 2 ubicaciones alternadas para un centro comercial
regional dado que el ingreso domestico de la comunidad es una consideración
importante en la selección del sitio, el desarrollador desea probar la hipótesis nula
de que no existe diferencia entre los montos de ingreso domestico medio que de
las 2 comunidades. En consonancia con esta hipótesis se supone que la
desviación estándar del ingreso domestico también es igual en los dos
comunidades.
En una muestra de n1=30 hogares de la primera comunidad el ingreso anual
promedio es de x̅ 1=45,000 con una desviación estándar S1= 1800. En una muestra
de n2 =40 hogares de la segunda comunidad x̅ 2=44,600 y S2=2,400. Pruebe la
hipótesis nula el nivel de significancia del 5%.
CUADERNILLO DE ESTADISTICA

n1=30 H 0= M 1- M 2 = 0 z=.95 / 2= .475 = 1.96


S1=.4 H 1= M 1- M 2≠ 0
x̅ 1=45,500
S1 = 1800
n2 =40
x̅ 2=44,600
S2=2,400
∝=.05
( X́ − X́ 2)(μ−μ2 ) ( 45,500−44,600 )− ( 0 )
Z= 1 = =1.74
σ X́ 1− X́ 2 522.78

2 ( n1 −1 ) S 21+(n2−1) S 22
S=
n1 +n2 −2
( 30−1 ) 1,8002 + ( 40−1 ) 2,4002 318,600,000
S2 = = 4, 685,294
30+ 40−2 68

2
S2 S2
σ x1 x 2
√ +
n1 n 2
4,685,294 4,685,294
= √ 30
+
40
=√ 156,176−117,132.35=522.78

Se acepta la hipótesis nula


CUADERNILLO DE ESTADISTICA

EJERCICIO 2

2) Una muestra aleatoria de n1=12 de estudiantes de informática tiene un promedio


de calificación media de x͞ 1= 2.60 (donde a=4) con una desviación estándar de .
40.En el caso de los estudiantes de ingeniería en sistemas, una muestra aleatoria
de n2 =10 estudiantes tiene un promedio de calificación media de x͞ 2=2.9 con una
desviación estándar de .30. Se supone que los valores de calificación siguen la
distribución normal.Pruebe la hipótesis nula de que el promedio de calificación
medio de las 2 categorías de estudiantes no es diferente con un nivel de
significación del 5%
H 0 : μ1−μ 2=0
H 1 : μ1−μ 2 ≠ 0
n1 =12
x́ 1=2.7
S1=40
n2 =10
x́ 2=2.90
S2=30
α =.05
.05/2=.025
gl=n1 +n 2−2=12+10−2=20 t=2.086
( 2.7−2.9 )−( 0 )
t=¿ ¿ ¿= = -1.30
.1534
( n−1 ) S 21 +( n2−1) S22 ( 11 ) .4 2 + ( 9 ) . 32 2.57
S= 2
= 12+10−2 = 20 =.1285
n1 +n −2
2

.1285 .1285
√ 12
+
10
=.1534

Se acepta la hipótesis nula


CUADERNILLO DE ESTADISTICA

EJERCICIO 4
Una empresa desea saber cómo está el ausentismo en sus trabajadores. A
continuación se da el número de días de ausencia durante una quincena en una
muestra de diez trabajadores 4, 1, 2, 2, 1, 2, 2, 1, 0 y 3.
A) Determine la media y la desviación estándar de la muestra
B) Cuál es la media poblacional y cuál es la mejor estimación de ese valor
C) Proporcione un intervalo de confianza de 95% para la media poblacional
D) Explique por qué se usa la distribución “t” como punto del intervalo de
confianza
E) Es razonable concluir que el trabajador promedio no falto ningún día
durante la quincena

n
X i 4+ 1+ 2+ 2+ 1+ 2+ 2+ 1+ 0+3 18
χ́ =∑ = = = 1.8
i+1 n 10 10
n
2
( x −xi )
s =∑ =¿ ¿
i=1 n−1
11.6
= 9 =1.288

s2=1.288 s=√ s 2=√ 1.288=1.134


CUADERNILLO DE ESTADISTICA

∝=1−.95 %=0.05÷ 2=0.025


gl=n−1=10−1=9

t =2.262
s 1.134
S x= = =.358
√n √ 10
I ∝=x ±t S x
I ∝=1.8+ ( 2.262 )( .358 )=¿
1.8+.809=2.609
1.8−.809=.991

(.991, 2.609)

Вам также может понравиться