Вы находитесь на странице: 1из 10

Estadística Aplicada Producto Académico N° 03

Producto Académico N° 03
Desarrolle de manera detallada las preguntas presentadas a continuación y responda a las
preguntas.
1. El gerente de ventas de COPIADORAS SUPER que tienen una gran fuerza de ventas en el
país quiere determinar si hay alguna relación entre el número de llamadas de ventas
hechas en un mes y el número de copiadoras vendidas en ese mes.
El gerente selecciona una muestra aleatoria de 10 representantes y determina el número
de llamadas de ventas hechas por cada representante el mes pasado y el número de
copiadoras que vendió. La información se muestra a continuación:

Llamadas de ventas 20 40 20 30 10 10 20 20 20 30
Copiadoras vendidas 30 60 40 60 30 40 40 50 30 70

a. Represente gráficamente la relación entre las dos variables.

Variable independiente (X): Llamadas de ventas


Variable dependiente (Y): Copiadoras vendidas

Como vemos en el diagrama de dispersión, los representastes que tienen más


llamadas tienden a vender más copiadoras. Aunque parece una relación positiva
entre las dos variables, no todos los puntos estan en una recta.

1|Página
Estadística Aplicada Producto Académico N° 03

b. Determine el grado de relación entre las variables.

Llamadas de Copiadoras
XY X^2 Y^2
ventas (X) vendidas (Y)
20 30 600 400 900
40 60 2400 1600 3600
20 40 800 400 1600
30 60 1800 900 3600
10 30 300 100 900
10 40 400 100 1600
20 40 800 400 1600
20 50 1000 400 2500
20 30 600 400 900
30 70 2100 900 4900
Σ 220 450 10800 5600 22100

Para determinar el grado de relación entre las variables, calcularemos el


Coeficiente de Correlación de Pearson (r):

𝑛(∑ 𝑋𝑌) − (∑ 𝑋)(∑ 𝑌)


𝑟=
√[𝑛(∑ 𝑋 2 ) − (∑ 𝑋)2 ][𝑛(∑ 𝑌 2 ) − (∑ 𝑌)2 ]

10(10800) − (220)(450)
𝑟= = 0,759
√[10(5600) − (220)2 ][10(22100) − (450)2 ]

Entonces podemos decir que hay una fuerte correlación entre el número de
llamadas y el número de unidades vendidas. La correlación es positiva.

c. Calcule la variación del número de copiadoras vendidas que se debe a la


variación al número de llamadas de venta.

Para determinar la variación del número de copiadoras vendidas que se debe a


la variación al número de llamadas de venta, calcularemos el Coeficiente de
Determinación (r^2):

𝑟 2 = (0,759)2 = 0,576 = 57,6%


Es decir, el 57,6% de la variación del número de copiadoras vendidas, se debe
a la variación en el número de llamadas de ventas realizadas.

2|Página
Estadística Aplicada Producto Académico N° 03

d. Realice la Prueba de hipótesis respecto al coeficiente de correlación.

Hipótesis:
𝐻0 : 𝜌=0
𝐻1 : 𝜌≠0

𝜌: 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛

Nivel de significación: α = 0,05

Estadístico de Prueba:

𝑟√𝑛 − 2 0,759√10 − 2
𝑡𝑐 = = = 3,297
√1 − 𝑟2 √1 − 0,7592

𝑡𝑡𝑎𝑏𝑙𝑎 = 𝑡1−𝛼/2 ,𝑛−2 = 𝑡0,975, 8 = 2,306

Decisión:

Como el 𝑡𝑐 = 3,297 > 𝑡𝑡𝑎𝑏𝑙𝑎 = 2,306, entonces rechazamos la hipótesis


nula.

Conclusión:
Con un nivel de significación del 5% podemos afirmar que la correlación de
la población no es cero.

e. Determine la ecuación de regresión (recta de regresión).

𝐸𝑐𝑢𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙: 𝑌̂ = 𝑎 + 𝑏𝑋

𝑛(∑ 𝑋𝑌) − (∑ 𝑋)(∑ 𝑌) 10(10800) − (220)(450)


𝑏= = = 1,1842
𝑛(∑ 𝑋 2 ) − (∑ 𝑋)2 10(5600) − (220)2

∑𝑌 ∑ 𝑋 450 220
𝑎= −𝑏 = − 1,1842 ( ) = 18,9476
𝑛 𝑛 10 10

𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠: 𝑌̂ = 18,9476 + 1,1842𝑋

f. ¿Cuál es el número esperado de venta de copiadoras para un empleado que


hace 20 llamadas?

Para X = 20 :
𝑌̂ = 18,9476 + 1,1842(20) = 42,6316 ≈ 43

Entonces, un vendedor que realice 20 llamadas puede esperar vender


43 copiadoras.

3|Página
Estadística Aplicada Producto Académico N° 03

g. Determine el error estándar de estimación.

∑ 𝑌 2 − 𝑎 ∑ 𝑌 − 𝑏 ∑ 𝑋𝑌 22100 − 18,9476(450) − 1,1842(10800)


𝑆𝑒 = √ =√ = 9,9
𝑛−2 10 − 2

h. Determine el intervalo de confianza del 95% para todos los representantes que
hicieron 20 llamadas.

1 (𝑋 − 𝑋̅)2
𝐼𝐶(95%) = 𝑌̂ ± 𝑡(1−𝛼/2 ,𝑛−2) (𝑆𝑒 )√ +
𝑛 (∑ 𝑋)2
∑ 𝑋2 −
𝑛

1 (20 − 22)2
𝐼𝐶(95%) = 42,6316 ± 2,306(9,9)√ +
10 (220)2
5600 −
10
𝐼𝐶(95%) = 42,6316 ± 7,4068

i. Determine el intervalo de predicción del 95% para una representante del norte
del país que hizo 20 llamadas.

1 (𝑋 − 𝑋̅)2
𝐼𝑃(95%) = 𝑌̂ ± 𝑡(1−𝛼/2 ,𝑛−2) (𝑆𝑒 )√1 + +
𝑛 (∑ 𝑋)2
∑ 𝑋2 −
𝑛

1 (20 − 22)2
𝐼𝑃(95%) = 42,6316 ± 2,306(9,9)√1 + +
10 (220)2
5600 − 10

𝐼𝐶(95%) = 42,6316 ± 24

4|Página
Estadística Aplicada Producto Académico N° 03

2. La tabla muestra las correlaciones de las variables de la ecuación para estimar la


resistencia a la tensión mecánica de un alambre de acero:

Diámetro ex- Cantidad de


Resistencia (ŷ )
terior (x1) Molibdeno (x2)
Diámetro exterior (x1) 1,000
Cantidad de Molibdeno (x2) 0,971 1,00
Resistencia (ŷ ) 0,995 0,990 1,00

a) Halle e interprete el coeficiente múltiple de determinación ajustado si la muestra


es de tamaño 5.

Primero hallamos el coeficiente de determinación múltiple:

2 2
𝟐
ryx1
+ ryx 2
− 2ryx1 ryx2 rx1 x2 0,9952 + 0,9902 − 2(0,995)(0,990)(0,971)
𝐫 𝐲.𝐱𝟏 𝐱𝟐 = =
1 − rx21 x2 1 − (0,971)2
2
r y.x1 x2 = 0,99998076

Ahora calculamos el coeficiente de determinación ajustado para n=5 :

𝑛−1 5−1
r 2 ajustado = 1 − (1 − r 2 ) ( ) = 1 − (1 − 0,9999) ( )
𝑛−𝑘−1 5−2−1
r 2 ajustado = 0,99996151

El 99,99% de la variación de la Resistencia a la tensión mecánica del alambre de acero, puede


explicarse por el Diámetro exterior y la Cantidad de molibdeno.

b) Realice el análisis de multicolinealidad.

De la tabla anterior se afirma que la Resistencia a la tensión mecánica es la variable


dependiente (Y). El Diámetro exterior (x1) esta ligeramente más correlacionado con la
Resistencia a la tensión mecánica: (0,995), en comparación con la Cantidad de
molibdeno (x2): 0,990. El signo positivo indica la relación directa entre las variables.

5|Página
Estadística Aplicada Producto Académico N° 03

3. La tabla muestra los días de inasistencia al trabajo y el bono de reconocimiento (x100


soles) recibido por una muestra de empleados de una empresa por motivo de fiestas
patrias:

Inasistencias (días) (x) 1 4 5 1 2 3


Bono de reconocimiento (y) 49 41 40 48 45 43

a) Grafique el diagrama de dispersión.

Como vemos en el diagrama de dispersión, los trabajadores que tienen más


días de inasistencias reciben menos bono de reconocimiento. Aunque parece
una relación negativa entre las dos variables, no todos los puntos estan en una
recta.

b) Identifique el mejor modelo matemático (lineal, cuadrático, exponencial, loga-


rítmico o potencial) que mejor se ajuste a los datos de la tabla. Argumente su
decisión.

6|Página
Estadística Aplicada Producto Académico N° 03

7|Página
Estadística Aplicada Producto Académico N° 03

El mejor modelo matemático será aquel que tenga mayor coeficiente de


determinación (R^2), en este caso el que mejor se ajusta es el modelo cuadrático
con un coeficiente de determinación igual a 0,9908.

𝑌 = 0,3636𝑋 2 − 4,2909𝑋 + 52,382

c) Realice una predicción para 6 inasistencias.

Para X = 6 :
𝑌 = 0,3636(6)2 − 4,2909(6) + 52,382 = 39,7262

Entonces, si un trabajador falta 6 días, recibirá una bonificación de 3972,62 soles.

4. En la tabla se presentan datos que corresponden a la cantidad de muertes a causa de


accidentes mensualmente en los Estados Unidos desde el año 1973 a 1978 (Fuente
National Sadety Council).

Media mensual
Meses del año
de muertes
Enero 8044,00
Febrero 7283,83
Marzo 8063,83
Abril 8264,83
Mayo 9126,17
Junio 9595,33
Julio 10452,80
Agosto 9749,17

8|Página
Estadística Aplicada Producto Académico N° 03

Septiembre 8700,33
Octubre 8984,67
Noviembre 8467,17
Diciembre 8720,67

Su correspondiente gráfico es:

Gráfico de cantidad de muertes a causa de accidentes mensualmente en los Estados Unidos


desde el año 1973 a 1978 (Fuente National Sadety Council).

Conteste:
a) ¿En qué mes del año es menos frecuente las muertes? En el mes de Febrero.
b) ¿En qué mes del año ocurren más muertes? En el mes de Julio.
c) ¿En qué meses del año ocurren picos? En el mes de Julio y Octubre.
d) ¿En qué meses del año ocurren valles? En el mes de Febrero, Setiembre y
Noviembre.

9|Página
Estadística Aplicada Producto Académico N° 03

5. A partir de los datos de la tabla anterior aplique el método de suavizamiento de la serie


del promedio móvil trimestral y realice los pronósticos a partir del mes de febrero
hasta noviembre. Grafique la tendencia de las muertes por accidentes y el
correspondiente suavizamiento trimestral.

Media
Meses del año mensual de Pronóstico
muertes
Enero 8044
Febrero 7283,83 7797,22
Marzo 8063,83 7870,83
Abril 8264,83 8484,943333
Mayo 9126,17 8995,443333
Junio 9595,33 9724,766667
Julio 10452,8 9932,433333
Agosto 9749,17 9634,1
Septiembre 8700,33 9144,723333
Octubre 8984,67 8717,39
Noviembre 8467,17 8724,17
Diciembre 8720,67

10 | P á g i n a

Вам также может понравиться