Вы находитесь на странице: 1из 14

MUESTREO

1) A continuación se tiene información del ingreso mensual (en soles) de 150 estudiantes
del curso Estadística II en la carrera de Administración y Negocios Internacionales de
la UAP, durante el presente año. ( 5 puntos )

Condici Condici Ingreso Condici


Ingresos Ingresos
ón ón s ón
Código mensuale Código mensuale Código
laboral laboral mensua laboral
s s
les
10029088 C 10029293 P I
9 889 5 2935 110292935 1930
10029328 P 10029206 I I
4 3284 4 2064 110292064 1062
10008613 P 10029162 I C
4 6134 1 1621 110291621 2624
10029175 P 10029099 P I
5 1755 4 994 110290994 896
10029292 P 10029134 P P
2 2922 5 1345 110291345 1548
10029300 P 10029323 C I
1 3001 9 3239 110293239 3030
10029343 C 10029328 C P
4 3434 1 3281 110293281 3082
10029204 C 10027725 I C
6 2046 9 7259 110277259 5254
10029230 C 10029275 I C
0 2300 0 2750 110292750 1752
10029365 C 10029163 C I
5 3655 5 1635 110291635 2634
10029311 C 10029335 C P
9 3119 1 3351 110293351 4356
10029216 C 10029303 P P
0 2160 5 3035 110293035 2038
10029148 I 10029277 I I
8 1488 3 2773 110292773 3779
10029250 P 10029304 I I
3 2503 4 3044 110293044 2045
10029394 C 10029328 P C
9 3949 6 3286 110293286 1282
10029085 C 10029248 C C
8 858 1 2481 110292481 3480
10029201 I 10029365 I C
4 2014 6 3656 110293656 4654

1TA20162DUED
10029182 I 10029188 C P
3 1823 5 1885 110291885 4880
10029194 I 10029341 C P
5 1945 8 3418 110293418 2410
10029123 P 10029336 P P
4 1234 5 3365 110293365 2360
10029186 P 10029068 P I
8 1868 1 681 110290681 882
10029202 P 10029332 I I
5 2025 2 3322 110293322 3820
10029213 C 10029131 I I
3 2133 0 1310 110291310 1613
10029327 C 10029114 P C
0 3270 0 1140 110291140 1842
10029333 C 10029334 P C
8 3338 6 3346 110293346 3940
10029143 I 10029346 I P
5 1435 7 3467 110293467 3068
10029325 I 10029296 C P
3 3253 8 2968 110292968 2862
10029241 I 10029324 C P
7 2417 0 3240 110293240 3044
10029327 I 10029325 P I
5 3275 2 3252 110293252 3454
10029283 C 10029139 C I
3 2833 9 1399 110291399 1896
10029173 P 10029309 I I
4 1734 1 3091 110293091 3990
10029304 C 10029177 I P
0 3040 3 1773 110291773 1870
10029145 P 10029084 P P
0 1450 9 849 110290849 946
10008605 I 10029237 P C
1 6051 1 2371 110292371 2670
10029084 I 10029395 C P
8 848 1 3951 110293951 3050
10029343 P 10028377 P C
8 3438 2 3772 110283772 3670
10029244 P 10029159 P P
0 2440 3 1593 110291593 1895
10029315 C 10029339 C I
4 3154 9 3399 110293399 3994
10029321 C 10029327 P P
9 3219 4 3274 110293274 3670
10029109 C 10029574 C C
8 1098 8 5748 110295748 5846
10029305 I 10029394 I I
3 3053 8 3948 110293948 3044
10029206 C 10029326 I I
1 2061 7 3267 110293267 3866

2TA20162DUED
10029139 C 10029349 C P
2 1392 5 3495 110293495 4490
10029326 I 10029252 P P
6 3266 1 2521 110292521 3520
10029114 I 10029395 P C
8 1148 0 3950 110293950 3554
10029318 P 10029248 C C
4 3184 7 2487 110292487 2785
10029132 P 10029303 C P
3 1323 8 3038 110293038 3836
10029198 I 10029211 P I
6 1986 3 2113 110292113 2610
10029293 P 11029303 I C
7 2937 8 3034 110293038 3536
10029150 C 11029211 I P
9 1509 3 2110 110292113 2810

a) Usando una tabla de números aleatorios y con un arranque, hallar una muestra piloto
que represente el 7% de la población.
b) Construir una muestra de 20 alumnos utilizando el procedimiento de muestreo
aleatorio estratificado con asignación proporcional. ¿Qué alumnos debo incluir en la
muestra? Construya un intervalo de confianza para la estimación de la media
estratificada.

Nota:
C = CONTRATADO, P = PERMANENTE, I = INDEPENDIENTE.
Utilice un nivel de confianza de 95%

CONTRASTE DE HIPÓTESIS
2) La Empresa de Transportes SIEMPRE UNIDOS SA, que sigue la ruta de la MOLINA-
VENTANILLA CALLAO ha adquirido un lote de llantas aro 22,5 ‘’ de la
distribuidora LLANTAS MOBIL SAC. El Transportista tiene dudas de la afirmación
hecha por el distribuidor de que la vida útil de los neumáticos es al menos 28,000 km.
Para verificar la afirmación se prueba una muestra de estas llantas en los ómnibus de
la empresa, obteniéndose los siguientes resultados en miles de kilómetros:
( 4 puntos )
25,6 27,1 31,1 26,5 26,5 28,3 29,4 27,1 27,1 28,3
27,4 29,7 29,5 27,7 27,1 31,2 29,5 29,7 31,2 31,2
27,3 25,8 26,5 27,3 31,2 28,0 26,0 25,8 26,4 28,0
29,6 26,4 26,4 25,8 27,5 27,9 26,9 26,4 28,0 27,9
23,4 28,0 29,0 28,8 27,3 27,5 27,8 28,0 29,6 27,5
a) ¿Es correcta la sospecha de la compañía de transportes en base a estos datos?
La media de los datos registrado es 27.86 mil kilómetros = 27860 km. Por lo que las
afirmaciones hechas por el transportista son erróneas

3TA20162DUED
b) Se sospecha que la varianza poblacional es superior a 3000 ¿es correcta esta
sospecha?

Es incorrecta, la variancia poblaciones sale 2.77


𝑁
2
1 2
𝜎 = ∑(𝑥𝑗 − 𝜇)
𝑁
𝑗=1
50

∑(25.6 − 27.86)2 + (27.1 − 27.86)2 + ⋯ … . +(27.5 − 27.86)2 = 138.44


𝑗=1

1
𝜎2 = 138.44 = 2.77
50

Nota:
Utilice un nivel de confianza de 95%

CHI CUADRADO
3) En la encuesta telefónica realizada el pasado curso por los alumnos los resultados
fueron muy dispares, mientras algunos realizaron las cuatro entrevistas programadas
otros no consiguieron cumplimentar ninguna de ellas. La distribución del número de
entrevistas conseguidas por los 57 alumnos que participaron en el proyecto fue la
siguiente: ( 3 Puntos )
Nº entrevistas Nº alumnos
0 6
1 16
2 24
3 9
4 2
total 57

A un nivel de confianza del 90% ¿Puede afirmarse que estas diferencias han sido
debidas al azar? O por el contrario están motivadas por alguna otra causa.

Hipótesis nula: las diferencias han sido al azar, siguiendo una distribución binomial

4TA20162DUED
Hipótesis planteada: no sigue una distribución binomial

Determinamos el n: total de llamadas realizadas


57/4=228 llamadas realizadas en total

Nº entrevistas Nº alumnos Llamadas


exitosas
0 6 0
1 16 16
2 24 48
3 9 27
4 2 8
total 57 99

La probabilidad de éxito =99/228 = 0.43421


p = 0.43421 (probabilidad de que ocurra)
q = 1-0.43421
q= 0.56579 (probabilidad que no ocurra)
N = 228 (total de llamadas)
X = 99 (llamadas exitosas)
𝑛
( ) 𝑝 𝑥 𝑞 𝑛−𝑥
𝑥
4 4!
( ) 0.434210 0.565794−0 = 0.10248 = 1 ∗ 0.10248 = 0.10248
0 0! (4 − 0)!
4 4!
( ) 0.434211 0.565794−1 = 0.07864 = 4 ∗ 0.07864 = 0.31456
1 1! (4 − 1)!
4 4!
( ) 0.434212 0.565794−2 = 0.06035 = 6 ∗ 0.06035 = 0.3621
2 2! (4 − 2)!
4 4!
( ) 0.434213 0.565794−3 = 0.04632 = 4 ∗ 0.04632 = 0.18528
3 3! (4 − 3)!
4 4!
( ) 0.434214 0.565794−4 = 0.03555 = 1 ∗ 0.03555 = 0.03555
4 4! (4 − 4)!

xi ni pi npi ni - npi (ni - npi)2 (ni - npi)2/ npi


0 6 0.10248 5.8414 0.1586 0.0252 0.0043
1 16 0.31456 17.9299 -1.9299 3.7246 0.2077
2 24 0.3621 20.6397 3.3603 11.2916 0.5471
3 9 0.18528 10.5610 -1.5610 2.4366 0.2307
4 2 0.03555 2.0264 -0.0263 0.0007 0.0003
0.9902

BUSCAMOS EN LAS TABLAS DE DISTRIBUCION ACUMULATIVA CHI -


CUADRADO
3 grados de libertad con 90% de confianza (0.90)

5TA20162DUED
El valor es de 6.251
Como nuestro valor es de 0.9902 es menor que 6.251, se acepta la hipótesis nula
Por lo que los resultados obtenidos por los alumnos muestran diferencias al azar

IMPORTANTE: desarrolle correctamente estos problemas que corresponde a


los temas del examen parcial.

DISEÑO DE EXPERIMENTOS
4) En la siguiente tabla, se tiene la calificación de una prueba a personas con diferentes
grados de escolaridad, lo que se intenta es probar si existe o no diferencia entre el
grado escolar (variable nominal) y el promedio de la calificación (variable numérica).
Para analizar si existe diferencia en los promedios se debe proceder a realizar una
prueba F. (3 Puntos)
Nº CALIFICACI GRADO Nº CALIFICACI GRADO
ÓN ESCOLAR ÓN ESCOLAR
1 67.15 DOCTORAD 33 39.56 ESTUDIAN
O TE
2 64.36 DOCTORAD 34 39.07 ESTUDIAN
O TE
3 60.91 ESTUDIANT 35 38.71 DOCTORAD
E O
4 55.38 ESTUDIANT 36 34.95 ESTUDIAN
E TE
5 53.91 ESTUDIANT 37 34.27 ESTUDIAN
E TE
6 53.34 MAESTRÍA 38 34.27 ESTUDIAN
TE
7 52.15 ESTUDIANT 39 67.63 DOCTORAD
E O
8 51.86 ESTUDIANT 40 62.77 DOCTORAD
E O
9 51.12 DOCTORAD 41 60.88 ESTUDIAN
O TE
10 50.63 ESTUDIANT 42 56.55 ESTUDIAN
E TE
11 50.35 MAESTRÍA 43 51.76 ESTUDIAN
TE
12 48.38 MAESTRÍA 44 53.63 MAESTRÍA
13 47.07 DOCTORAD 45 50.77 ESTUDIAN
O TE
14 44.09 MAESTRÍA 46 50.89 ESTUDIAN
TE
15 43.41 ESTUDIANT 47 48.66 DOCTORAD
E O

6TA20162DUED
16 43.23 MAESTRÍA 48 52.67 ESTUDIAN
TE
17 41.82 ESTUDIANT 49 47.98 MAESTRÍA
E
18 41.57 ESTUDIANT 50 48.23 MAESTRÍA
E
19 41.21 MAESTRÍA 51 46.83 DOCTORAD
O
20 40.82 ESTUDIANT 52 45.52 MAESTRÍA
E
21 40.79 ESTUDIANT 53 43.28 ESTUDIAN
E TE
22 33.09 ESTUDIANT 54 41.03 MAESTRÍA
E
23 32.18 ESTUDIANT 55 41.53 ESTUDIAN
E TE
24 58.49 ESTUDIANT 56 43.38 ESTUDIAN
E TE
25 56.18 ESTUDIANT 57 39.98 MAESTRÍA
E
26 51.46 ESTUDIANT 58 39.42 ESTUDIAN
E TE
27 53.41 MAESTRÍA 59 38.45 ESTUDIAN
TE
28 53.76 ESTUDIANT 60 39.80 ESTUDIAN
E TE
29 50.90 ESTUDIANT 61 37.09 ESTUDIAN
E TE
30 49.49 DOCTORAD 62 41.13 DOCTORAD
O O
31 50.07 ESTUDIANT 63 34.42 ESTUDIAN
E TE
32 48.55 MAESTRÍA 64 40.28 ESTUDIAN
TE

7TA20162DUED
Estudiante Maestria doctorado
60.91 53.34 67.15
55.38 50.35 64.36
53.91 48.38 51.12
52.15 44.09 47.07
51.86 43.23 49.49
50.63 41.21 38.71
43.41 53.41 67.63
41.82 48.55 62.77
41.57 53.63 48.66
40.82 47.98 46.83
40.79 48.23 41.13
33.09 45.52
32.18 41.03
58.49 39.98
56.18
51.46
53.76
50.9
50.07
39.56
39.07
34.95
34.27
34.27
60.88
56.55
51.76
50.77
50.89
52.67
43.28
41.53
43.38
39.42
38.45
39.8
37.09
34.42
40.28
n 39 11 14
Media 𝒙̅ 45.71362283 47.0721418 53.17895218
Cuadrado del 2215.78653 2828.000955
2089.735312
promedio
desviación 8.383858417 4.69392914 10.44722904

8TA20162DUED
Planteamos las hipótesis
Hipótesis nula: µE = µM = µD
Hipótesis planteada: µE ≠ µM ≠ µD que almenas una presenta diferencias en relación a
los promedio de las calificaciones

Cálculos y procedimientos

- Desviación estándar
𝑛𝑖
1
∑(𝑥𝑖 − 𝑥̅𝑖 )2
𝑛𝑖 − 1
𝑖=1
Estudiante
𝑛𝑖
1
∑(60.91 − 45.71)2 + (55.38 − 45.71)2 + ⋯ + (39 − 45.71)2 = 8.38
39 − 1
𝑖=1
Maestría
𝑛𝑖
1
∑(53.34 − 47.07)2 + (50.35 − 47.07)2 + ⋯ + (39.98 − 47.07)2 = 4.69
11 − 1
𝑖=1
Doctorado
𝑛𝑖
1
∑(67.15 − 53.17)2 + (64.36 − 53.17)2 + ⋯ + (41.13 − 53.17)2 = 10.44
14 − 1
𝑖=1

- Media total
𝑋̅ = 47.2939

- Corrección de la media
𝐶𝑀 = 𝑛𝑋̅ 2
CM =64 (47.294)2 = 64(2236.713) = 143149.64

- Suma del cuadrado de los tratamientos


𝑐
2
𝑆𝐶𝐶 = ∑ 𝑛𝑗 𝑋̅𝑗 − 𝐶𝑀
𝑗=1

𝑆𝐶𝐶 = 39 ∗ (2089.7353) + 11 ∗ (2828.0009) + 14 ∗ (2215.7865) − 143149.64


SCC = 479.0544

- Suma de los cuadrados totales


𝑛𝑖 𝑐

𝑆𝐶𝑇 = ∑ ∑ 𝑋𝑖𝑗 2
𝑖=1 𝑗=1
𝑆𝐶𝑇 = 147677.559 − 143149.645 = 4527.914

- Suma de los cuadrados del error

𝑆𝐶𝐸 = 𝑆𝐶𝑇 – 𝑆𝐶𝐶 = 4527.914 – 479.0544 = 4048.859

9TA20162DUED
Usando los grados de libertad
Grados de libertad 1:
gl = c-1= 3-1 =2
Grados de libertad 2:
gl = n-c = 64-3 =61

- Cuadrado medio de los tratamientos


𝑆𝐶𝐶 479.0544
𝐶𝑀𝐶 = = = 239.5272
𝑔𝑙. 1 2

- Cuadrados medios del error


𝑆𝐶𝐸 4048.859
𝐶𝑀𝐸 = = = 66.37473
𝑔𝑙. 2 61

- Valor de prueba F
𝐶𝑀𝐶 239.5272
𝐹= = = 3.608
𝐶𝑀𝐸 66.37473

Interpolando Para Encontrar El 𝛼


Distribución F de Fisher-Snedecor con u y v grados de libertad.
http://dm.udc.es/asignaturas/estadistica2/documentos-pdf/dmtablas.pdf

(Ojo no encontré una tabla que contenga 61 grados de libertad, trabaje con 60 gl)

0.050 − 𝛼 3.15 − 3.608


= → 𝛼 = 0.0353
0.050 − 0.025 3.15 − 3.93

Aplicando un nivel de significancia del 95%

0.035<0.05

Conclusión

10TA20162DUED
. Se rechaza la hipótesis nula y se acepta la hipótesis planteada, esto implica que existe
diferencia entre el grado de escolar y el promedio de las calificaciones

REGRESIÓN Y CORRELACION
5) Los residentes de un pueblo pequeño del interior del país están preocupados sobre el
incremento en los costos de la vivienda en la zona. El alcalde considera que los precios
de la vivienda fluctúan con los valores de la tierra. Los datos sobre 24 casas vendidas
recientemente y el costo del terreno sobre el cual se construyeron se observan en la
siguiente tabla (en miles de dólares). Se trata el costo de las casas como la variable
dependiente. ( 3 Puntos )
Valor Costo Valor de Costo de
de la de la la tierra la casa
tierra casa
7,0 67,0 3,8 36,0
6,9 63,0 8,9 76,0
5,5 60,0 9,6 87,0
3,7 54,0 9,9 89,0
5,9 58,0 10,0 92,0
3,3 45,0 7,6 82,0
5,2 64,0 8,5 93,0
6,4 74,0 7,8 82,0
4,2 64,0 8,8 93,0
6,8 74,0 7,9 82,0
6,4 82,0 6,9 80,0
4,7 78,4 7,4 76,2

a) Muestre el diagrama de dispersión.

11TA20162DUED
Diagrama de Dispersión
Costo de la casa (en miles de 100

90

80
dólares)

70

60

50

40

30
3 4 5 6 7 8 9 10

Valor de la tierra (en miles de dólares)

b) Determine la recta de regresión y el coeficiente de determinación.


Siendo:
x: valor de la tierra (en miles de dólares)
Y: costo de casa (en miles de dólares)
24

∑ 𝑥𝑖 = 7 + 6.9 + ⋯ + 7.4 = 163.1


𝑖=1
24

∑ 𝑥𝑖 2 = 72 + 6.92 + ⋯ + 7.42 = 1198.07


𝑖=1
24

∑ 𝑦𝑖 = 67 + 63 + ⋯ + 76.2 = 1751.6
𝑖=1
24

∑ 𝑦𝑖 2 = 672 + 632 + ⋯ + 76.22 = 133080


𝑖=1
24

∑ 𝑥𝑖 𝑦𝑖 = 7 ∗ 67 + 6.9 ∗ 63 + ⋯ + 7.4 ∗ 76.2 = 12480.76


𝑖=1

24
(∑24
𝑖=1 𝑥𝑖 )
2
𝑆𝐶(𝑋) = ∑ 𝑥𝑖 2 − = 89.6658333
𝑛
𝑖=1
24
(∑24
𝑖=1 𝑦𝑖 )
2
𝑆𝐶(𝑌) = ∑ 𝑦𝑖 2 − = 5242.39333
𝑛
𝑖=1

12TA20162DUED
24
∑24 24
𝑖=1 𝑥 ∑𝑖=1 𝑦𝑖
𝑆𝑃(𝑋𝑌) = ∑ 𝑥𝑖 𝑦𝑖 − = 577.1783333
𝑛
𝑖=1

La línea de regresión estimada


𝑆𝑃(𝑋𝑌)
𝑏1 = = 6.4
𝑆𝐶(𝑋)
∑24
𝑖=1 𝑦𝑖 ∑24
𝑖=1 𝑥𝑖
𝑏0 = 𝑦̅ − 𝑏𝑖 𝑥̅ = − (𝑏𝑖 ) ( ) = 29.2386023
𝑛 𝑛
Siendo la línea estimada:
𝐘̂𝐢 = 𝟐𝟗. 𝟐𝟑𝟖𝟔𝟎𝟐𝟑 + 𝟔. 𝟒𝐗 𝐢
El 𝑏0 = 29.2386023, representa el costo de las casas promedio (en miles de dólares)
cuando el valor de la tierra es nulo
El 𝑏1 = 6.4, indica que el costo promedio de la casa (en miles de dólares) aumenta
6.4 miles de dólares por valor de tierra (en miles de dólares)

El coeficiente de determinación
2
2
𝑆𝐶(𝑅) (𝑆𝑃(𝑋𝑌))
𝑟 = = = 0.7087
𝑆𝐶(𝑌) 𝑆𝐶(𝑋)𝑆𝐶(𝑌)
𝑟 2 = 70.87%

Diagrama de Dispersión
100
Costo de la casa (en miles de

90
y = 6.4367x + 29.24
R² = 0.7087
80
dólares)

70

60

50

40

30
3 4 5 6 7 8 9 10

Valor de la tierra (en miles de dólares)

c) ¿Sería adecuada una regresión cuadrática en este caso?.

13TA20162DUED
No, debido a que el costo las casas no podría incrementarse excesivamente sin
aumentar el valor de la tierra, por lo que no sera adecuado usar una regresión
cuadrática

IMPORTANTE: desarrolle correctamente estos problemas que corresponde a


los temas del examen final.

"Una voluntad fuerte es la mejor


ayuda para alcanzar tus metas

14TA20162DUED

Вам также может понравиться