Академический Документы
Профессиональный Документы
Культура Документы
∑n
j =1
j (nº _ coches _ acumulados) 5 13 25 40 50 56 60
i
∑f
j =1
j ( proporción _ acumulada) 8.33 21.67 41.67 66.67 83.33 93.33 100
xi (nº horas) 1 2 3 4 5 6 7
7
∑n
j =i
j (n º coches _ acumulados) 60 55 47 35 20 10 4
7
∑f
j =i
j ( proprción _ acumulada) 100 91.67 78.34 58.34 33.34 16.67 6.67
x( 45) + x( 46 ) 5+5
c 0.75 = = = 5 horas
2 2
___ ∑n i * xi
231
X = i =1
= = 3.85 horas
N 60
Se calcula dividiendo el tiempo total de permanencia de todos los coches en el
aparcamiento, 231 horas, entre los coches analizados, 60.
En la segunda fórmula se calcula el tiempo medio como resultado de las
aportaciones que hacen a dicho valor los productos de los diferentes valores del
número de horas que han estado los coches aparcados, x i , por la proporción de
lcoches, f i , que han estado aparcados durante cada número de horas. Por tanto,
___ k
X =∑ f * x = 3.85 horas
i
i
i =1
Se pide:
SOLUCIÓN:
k=1+ [3.3*log N]
En este caso N=100, luego k=7. ahora debemos propones el límite inferior del
primer intervalo y el límite superior del último intervalo. Al ser el valor mínimo
4.3068 se propone 4 como límite inferior del primer intervalo, y al ser 7
intervalos se propone como anchura 13 para cada uno de ellos, para que sea un
valor entero, con lo cual el límite superior del último intervalo es 95.
En esta tabla aparecen por filas los intervalos, junto con la frecuncia absoluta y la
frecuencia relativa. Por ejemplo la cuarta columna se puede interpretar diciendo
que el 27% de estos neumáticos han recorrido entre 43000 y 5600 Km hasta que
se ha producido un pinchazo o reventón.
∑n
j =1
j 2 4 23 50 79 93 100
∑n
j =1
j 100 98 96 77 50 21 7
c- El histograma de frecuencias relativas se represena es la figura 1 y el de
frecuencias acumuladas en la figura 2.
Frecuencias relativas
0,4
Frecuencia
0,3
0,2
0,1
0
0
5
17
_3
_4
_5
_6
_8
_9
4_
17
30
43
56
69
82
Intervalo
Figura 1
1,2
1
0,8
0,6
0,4
0,2
0
17
5
_3
_4
_5
_6
_8
_9
4_
17
30
43
56
69
82
Intervalo
Figura 2
Se interpreta diciendo que son los 100 neumáticos analizados se han recorrido
5587000 de Km antes de un pinchazo o reventón.
La mediana será
Me = 56000 Km
e- La desviación típica es
s = 16899 Km
y nos informa sobre lo que se dispersan los kilómetros recorridos por los
diferentes neumáticos respecto del kilometraje medio.
El coeficiente de variación de Pearson será
s
g= * 100% = 30.24
x
55.87 − 57.529
V1 = = −0.09817
16.899
55.87 − 56.00
V2 = = −0.02308
16.899
7 __ 3
m3 = ∑ f i ( xi − x ) = −421.39015
i =i
7 __
m4 = ∑ f (x − x )
i =1
i
4
= 234594.7408
Luego
m4
g2 = − 3 = −0.12343
s4
7
c 0.3 = 43 + 13 * = 46.37
27
16. La tabla siguiente nos proporciona los valores de la media y la desviación típica
de dos variables así como su coeficiente de correlación lineal para dos muestras
diferentes:
__ __
Muestra nº de _ observaciones x y sx sy rxy
1 600 5 12 2 3 0.6
2 400 7 10 3 4 0.7
Se pide:
a- Recta de regresión de Y sobre X en cada muestra.
b- Si consideramos la muestra que resulta de agrupar las dos muestras en
una sola de tamaño 1000, obtener el nuevo coeficiente de correlación
lineal de Pearson y explicar el hecho de que sea inferior a los de cada
una de las muestras tomadas por separado.
SOLUCIÓN:
__
m11 ___
y = y+ ( x − X)
s x2
m11
rxy =
sx s y
se tiene que la recta de regresión es
___ sy ___
y = Y + rxy (x − X )
sx
Luego, sustituyendo, las rectas de regresión de Y sobre X en cada una de las dos
muestras son:
Muestra 1: y=12+0.9*(x-4)
Muestra 2: y=10+0.93*(x-7)
m11,T
r xy ,t =
s x ,T s y ,T
donde m 11,T es la covarianza en la muestra total y s x,T , s x,T las desviaciones
típicas de X e Y en la muestra total. Para obtener estas cantidades necesitamos
___ ___
X T e Y T , medias de X e Y en la muestra total, que se calculas como un
__ ___
promedio entre las medias de X e Y en las muestras 1 y 2, notadas por X 1 , Y 1
,
___ ___
X 2, Y 2 , según las relaciones siguientes
___ ___
___
X * 600 + X 2 * 400
XT = 1
1000
___ ___
___
Y 1 * 600 + Y 2 * 400
Y T =
1000
___ ___
Sustituyendo se obtiene que X T = 5.8 e Y T = 11.2 .
Por otra parte si m 11,h denota la covarianza en la muestra h, se tiene que
m 11,1 =2*3*0.6=3.6
m 11, 2 =3*4*0.7=8.4
Como
m 1,h =
∑n ij , h xi ,h y j ,h ___ ___
− X h Yh
Nh
resulta que:
∑n x y j ,1
ij ,1 i ,1
= 3.6 + 5.12 = 63.6
N1
∑n x yl ,2
ij , 2 1, 2
= 8.4 + 7 * 10 = 78.4
N2
∑n ij xi y j
=
∑n x y j ,1 + ∑ nij , 2 xij , 2 xi , 2 y j , 2
ij ,1 i ,1
=
N N
63.6 * 600 + 78.4 * 400
= = 69.52
1000
Por tanto
m 11,T =
∑n ij xi y j ___ ___
− XT Y T = 69.52 − 5 * 8 * 11.2 = 4.56
N
___ 2 ___ 2
s x,T = a 2, xT − X T y s y,T = a 2, yT − Y T
donde
a 2, x1 * 600 + a 2, x 2 * 400
a 2, xT =
1000
a 2, y1 * 600 + a 2, y 2 * 400
a 2, yT =
1000
siendo
___ 2
a 2, Xh = s X2 ,h + X h
___
a 2,Yh = sY2 ,h + Y 2
h para h=1,2.
a 2,YT =0.6*153+0.4*116=138.2
de donde
4.56
r xy,T = = 0.4838
2.6382 * 3.5721
17. En una compañía aérea se sabe que, por término medio, el 65% de los vuelos
tiene retraso. La distribución de los vuelos retrasados es la siguiente:
Se pide:
a- Determinas el retraso medio y la desviación típica del tiempo de retraso
para los vuelos retrasados.
b- Determinar el centil del 60% e interpretarlo.
c- La compañía ha determinado que por cada vuelo con retraso se producen
unas pérdidas fijas de 17000 pts y unas pérdidas variables de 10000 pts
por cada minuto de retraso. ¿Entre qué cantidades se encuentran al
menos las tres cuartas partes de las pérdidas generadas por cada vuelo
retrasado?
d- Resolver el apartado a- para el total de los vuelos. ¿Es representativa la
nueva media? En caso negativo propones razonadamente otra medida de
centralización.
SOLUCIÓN:
xi 5 15 25 40 75
fi 0.2 0.3 0.25 0.2 0.05
___
X = 23.5 centésimas de hora
∑f
j =1
j 0.2 0.5 0.75 0.95 1
c 0.6 =20+z
por una regla de tres
10 → 0.25
z → 0.1
0.1 *10
z= =4
0.25
Así c 0.6 =24 centésimas de hora y significa que el 60% de los vuelos retrasados
(con menos tiempo de retraso) han tenido un retraso de a lo sumo 24 centésimas de
hora y significa que el 60% de los vuelos retrasados (con menos tiempo de retraso)
han tenido un retraso de a lo sumo 24 centésimas de horas.
___ ___
Y = 17000 + 6000 * X = 17000 + 6000 * 23.5 = 158000 pts
s y = 6000 * s x = 6000 * 16.6658 = 999948 pts
Resulta que: “Entre 0 pts y 3579896 pts se encuentran al menos las tres cuartas
partes de las pérdidas generadas por cada vuelo retrasado”.
Como
s 16.6658
gx= x
= = 0.7092 y
___
23.5
X
sy 99994.8
gy= = = 0.6329
___
158000
Y
d- Al considerar el total de los vuelos hay que modificar la tabla del anunciado
por la tabla siguiente
___
X * =15.275 centésimas de hora y s X * =17.5 centésimas de hora.
17.5
Como g X * = = 1.1457 > 1 la nueva media no es representativa al existir
15.275
observaciones extremas. Una medida de centralización que evita este problema es la
mediana. Para esta distribución se verifica que Me = 11.026 centésimas de hora.
18. En una clínica se han registrado durante un mes las longitudes en metros que los niños
andan el primer día que comienzan a caminar, obteniéndose los siguientes resultados:
Número de metros 1 2 3 4 5 6 7 8
Número de niños 2 6 10 5 10 3 2 2
SOLUCIÓN:
Xi ni Ni fi Fi
1 2 2 0.05 0.05
2 6 8 0.15 0.2
3 10 18 0.25 0.45
4 5 23 0.125 0.575
5 10 33 0.25 0.825
6 3 36 0.075 0.9
7 2 38 0.05 0.95
8 2 40 0.05 1
35
30
25
20
Comida
Transporte
Alojamiento
15
10
0
Ene Feb Mar Abr May Jun
19.- La distribución de los costes salariales de los 100000 empleados de una multinacional
se presenta en la tabla siguiente:
Salarios Nº de empleados
0 – 15000 2145
15000 – 20000 1520
20000 – 25000 840
25000 – 30000 955
30000 – 35000 1110
35000- 40000 2342
4000 – 50000 610
50000 – 100000 328
100000 - 300000 150
Calcular el salario medio por trabajador, el salario más frecuente y el salario tal
que la mitad de los restantes sea inferior a él. Calcular también el primer cuartel salarial y
el percentil 75.
SOLUCIÓN:
293800000 =29380
1000
Para hallar el salario más frecuente se calcula la moda de la variable X. Para ello hemos de tener
presente que los intervalos de la distribución de frecuencias son desiguales, por lo que l
intervalo modal será el correspondiente al mayor valor de di, es decir será el intervalo (35000-
40000).por lo tanto la moda se calcula como sigue:
Para hallar el salario tal que la mitad de los restantes sea inferior a él se calcula la
mediana. Para llo, como N/2 = 5000, el intervalo mediano será (25000-3000) ya que
Ni-1<N/2>Ni es equivalente en este problema a 4505 < 50000< 5460.la mediana se calculará
como sigue:
Para calcular el primer cuartil (primer cuartil de orden 4) observamos que como N/4 =
2500, el intervalo relativo al primer cuartel será (15000-20000) ya que
Ni-1<2500<Ni es equivalente en este problema a 2145<2500<3655.El primer cuartel se calculará
como sigue:
Q1,4 = L i-1 + N/4 – Ni-1 ci = 15000+ 10000/4 – 2145 5000 = 16167,76
ni 1520
El primer cuartil se interpreta como el valor de la variable para el que la cuarta parte de
los valores menores que él y las tres cuartas partes resultantes son superiores.
Para calcular el percentil 75 (cuantil 75 de orden 100), observamos que como 75N7100
= 7500, el intervalo al percentil 75 será (3500 – 40000) ya que Ni-1<7500<ni es equivalente en
este problema a 6570<7500<8912.El percentil 75 se calculará como sigue:
El percentil 75 se interpreta como el valor de la variable para que el 75% de los valores
son inferiores a él y el 25% restante son superiores.
20. Los rendimientos de cinco inversiones distintas realizadas por un individuo y las
cantidades iniciales invertidas n unidades monetarias son los siguientes:
SOLUCIÓN:
Como se trata d promediar rendimientos por unidad, estamos ante un caso de aplicación
del concepto de media armónica. Calcularemos por tanto el rendimiento medio por unidad
monetaria invertida para el total de inversión del individuo como la media armónica de los
rendimientos de cada inversión ponderada de las cantidades iniciales desembolsadas en cada
inversión.
Meses Dic Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov
Consumo 10,1 10,7 9,96 9,46 9,54 8,92 8,95 9,58 7,86 8,96 9,57 9,57
SOLUCIÓN:
10,7 = 1,06 9,96 = 0,93 9,46 = 0,95 9,54 = 1,008 8,92 = 0,93 8,95 = 1,003
10,1 10,7 9,96 9,46 9,54 8,92
9,58 = 1,07 7,86 = 0,82 8,96 = 1,14 9,17 = 1,02 9,57 = 1,04 10,2 = 1,06
8,95 9,58 7,86 8,96 9,17 9,57
_______________________________________________________
G=12√1,06*0,93*0,95*1,008*0,93*1,003*1,07*0,82*1,14*1,02*1,04*1,06 = 1,01
22. En la siguiente tabla se muestran las diferentes cantidades de IVA que se imponen en
la compra de una obra de arte.
País IVA
España 0,16
Italia 0,20
Bélgica 0,06
Holanda 0,06
Alemania 0,07
Portugal 0,17
Luxemburgo 0,06
Finlandia 0,22
SOLUCIÓN:
- El recorrido:
R = ( x) max − ( x) min = 0,22 − 0,06 = 0,16
- La varianza:
1 6 2 0,1586
s2 = ∑
n i =1
x i ni − a 2 =
8
= 0,125 2 = 0,0042
∑ (x i − a ) 3 * ni
0,000423
Af = i =1
3
= = 0,159
n*S 8 * 0,0003325
Tamaño tabla n
3-6 37
6-11 198
11-16 191
16-21 149
21-26 79
26-31 46
31-41 55
41-51 51
51-76 26
76-101 25
101-201 25
201-501 11
501-1000 2
Calcula la media aritmética, la mediana.
SOLUCIÓN:
- La media aritmética:
1 k 27678,5
a= ∑
n i =1
x i * ni =
895
= 30,93
- La mediana:
Para ello nos valemos del cálculo de frecuencias absolutas acumuladas:
Este tipo de datos nos dice el número de datos que hay igual o inferiores a uno
determinado.
i
Se calcula con la siguiente formula: N i = ∑n
j =1
j = N i =1 + n j
24. Con los datos del ejercicio anterior calcular el primer cuartel y el sexto decil.
SOLUCIÓN:
a) El primer cuartil:
1
37 < * n = 223,75 < 235
4
Será p 1 ∈ [6,11) y, en concreto:
4
1 1
* n − N j −1 * 895 − 37
p1 / 4 = x j −1 + 4 *cj = 6 + 4 * 5 = 10,716
nj 198
SOLUCIÓN:
- El recorrido:
R = x max − x min = 750,5 − 4,5 = 746
- La varianza es:
1 k 1 k 3713428,25
s2 = ∑
n i =1
( xi − a ) 2 * ni = ∑ xi2 ni − a 2 =
n i =1 895
− 30,93 2 = 3192,47
- La cuasivarianza
n * s 2 895 * 3192
S =2
= = 3195,988
n −1 894
- La desviación típica:
s = s 2 = 3192,417 = 56,50
- La cuasidesviación típica:
S = S 2 = 3195,988 = 56,53
- El coeficiente de variación de Pearson:
s 56,50
Vp = * 100 = *100 = 182,67
a 30,93
- El coeficiente de asimetría de Pearson:
a − Md 30,93 − 9,78
Ap = = = 0,374
s 56,50
SOLUCIÓN:
1- Para empezar calcularemos las frecuencias correspondientes a los niños para esto
utilizaremos la siguiente formula:
- En el caso de la frecuencia absoluta contaremos el número de veces que se
repite un determinado valor, por lo que para x1=0 n1=32; x2= 0 n2=27; x3=1 n3=29; x4=0
n4=31;
1 360 º
= así de esta forma obtenemos:
fi α
diagrama niños
1
2
3
0,1824; 18% 4
0,39; 40%
diagrama niñas
0,267; 27%
0,38; 38% 1
2
3
4
0,15; 15%
0,2; 20%
27. Establecido un balance de explotación sobre las ocho sucursales de una cadena de
almacenes, resultó la siguiente estimación:
Sucursal Beneficios sobre ventas Ventas totales
28 500
15 126
24 432
32 870
17 180
23 450
18 912
25 713
Obténgase el porcentaje medio de beneficios sobre las ventas totales de la cadena.
SOLUCIÓN:
di pi ji-pi
28 500 14000
15 126 1890
24 432 10368
32 870 27840
17 180 3060
23 450 10350
18 912 16416
713 17825
4183 101479
De donde:
101479
x= = 24,32%
4183
28. Una prestigiosa frutería tiene como norma clasificar los mangos según su
tamaño, de cara a la venta, en superiores y normales. Los superiores son aquellos
cuyo peso es superior a 450 g. De una partida, representativa de los mangos que
recibe normalmente, se ha obtenido la distribución de frecuencias siguientes: