Вы находитесь на странице: 1из 10

Universidad del Valle

Facultad de Ingeniería
Escuela de Estadística
Taller -1

1) Ejercicio introductorio sobre construcción de tablas de frecuencias y cálculo de algunos indicadores de tendencia
central y variabilidad. Interpretación.
Suponga que se tiene una información sobre la variable X: Duración de la llamada telefónica (segundos) en una
determinada empresa. La información corresponde a 100 llamadas.
4,4 12,1 20 29,8 11,3 185 187,1 182,4 201 188,8 35 63 124 107
58,1 52,8 56 39,9 50,2 63 80,8 72 63,1 72 40 90 107 93
90 68,3 70,1 74,1 89 137 119 141 145,7 136 54,7 90 144 90,6
104,2 112 116 146 130,8 159,2 174 152 172,7 152 33 65,5 148,8 117
176,2 167 177,4 156 166,7 73 86,2 74 68 88,1 57,9 78 112 125
184,2 204 186,5 196 186,8 112 101 142 127,2 97,3 126 99 164 103,2
232,1 216,8 231 237,2 239,7 154 175 176,9 169 161,7 112,8 126 176 178,6
179 178

Complete la siguiente tabla de frecuencias:

Duración de la Frecuencia Frecuencia


Frecuencia Frecuencia
Llamada Marca de clase absoluta relativa
absoluta simple relativa simple
telefónica acumulada acumulada
𝐿𝑖−1 -𝐿𝑖 𝑀𝑖 𝑛𝑖 𝑓𝑖 𝐹𝑖 𝑁𝑖

Nota considere anchos de clase iguales a 30 segundos. Primera clase [0, 30) .

a) Dibuje el Histograma de frecuencias y el Polígono de frecuencias.


b) Encuentre la cantidad de llamadas que caen en el intervalo (35; 158) segundos. Resuelva el problema de dos
formas: i) Con los datos sin agrupar y ii) Con los datos agrupados. Comente.
c) Encuentre los siguientes cuartiles: 𝑄1 , 𝑄2 y 𝑄3 . Dibuje el diagrama de cajas y alambres. ¿Qué puede decir del
gráfico?
d) Encuentre los siguientes indicadores para los datos agrupados: Media, Mediana, Moda y Coeficiente de variación.
e) Suponga que otras dos muestras de tamaño 100 han dado los siguientes resultados.

Muestra B Muestra C
Clase 𝑛𝑖 𝑓𝑖 Clase 𝑛𝑖 𝑓𝑖
[0, 30) 1 0,01 [0, 30) 32 0,32
[ 30, 60) 3 0,03 [ 30, 60) 20 0,2
[ 60, 90) 6 0,06 [ 60, 90) 18 0,18
[ 90, 120) 8 0,08 [ 90, 120) 12 0,12
[120, 150) 12 0,12 [120, 150) 8 0,08
[150, 180) 18 0,18 [150, 180) 6 0,06
[180, 210) 20 0,2 [180, 210) 3 0,03
[210, 240] 32 0,32 [210, 240] 1 0,01
Total 100 1.0 Total 100 1.0

1
Encuentre el diagrama de cajas para cada una de las distribuciones anteriores. Encuentre los siguientes
indicadores para cada muestra: Media, Mediana, Moda y Coeficiente de variación.

f) Dibuje el Histograma de frecuencias para los datos de las muestras B y C.


g) Compare los Histogramas y los diagramas de cajas y alambres correspondientes al literal a) y el literal e) de tal
manera que; debajo de cada Histograma; quede representado el diagrama de cajas correspondiente. Es decir
siguiendo la siguiente figura:

¿Que concluye de cada distribución al compararlas entre ellas?. ¿Para cuál de las distribuciones la media es el
mejor representante de los datos?. Desde el punto de vista absoluto; relativo.

h) Usando el literal a) aplique el Teorema de Chebyshev cuando k= 1.5. ¿Cuál sería el resultado si usamos la
aproximación a la normal mediante la tabla?

2
2) Dos grupos de datos sobre la misma variable presentan la siguiente información:

 
ni ni
ni xi xi2
i 1 i 1

Primer grupo 20 561,6 16237,16


Segundo grupo 30 1237,2 52731,06

Al formar un solo grupo con los 50 datos, encuentre la media y la varianza de ellos.

3) Una fábrica de ejes de madera por torneado tiene dos plantas A y B. La distribución del diámetro X de cierto eje
fabricado en las dos plantas presenta las siguientes distribuciones:

La Planta A produce 40 ejes semanalmente mientras que la Planta B produce 60.

a) ¿Qué planta tiene una fabricación más homogénea en cuanto al diámetro de los ejes?
b) ¿Qué porcentaje de ejes produce semanalmente la fábrica (las dos plantas juntas) con un diámetro entre 28.5 y
38.5 mm?

4) La siguiente información corresponde a la respuesta en segundos (X) de un dispositivo electrónico: 8.9, 12.4, 8.6,
11.3, 9.2, 8.8, 13.1, 6.2, 7.0, 7.1, 11.8, 10.7, 7.6, 9.1, 9.2, 8.2, 9.0, 8.7, 9.1, 10.9, 10.3, 9.6, 7.8, 11.5, 9.3, 7.9, 8.8, 8.8,
12.7, 8.4, 7.8, 14.0, 10.5, 10.5, 9.6, 8.9, 10.2, 10.3, 7.7, 10.6, 8.3, 8.8, 9.5, 8.8, 9.4, 13.1, 14, 13.8

a) Elabore la tabla de frecuencias considerando las siguientes clases:


[6.15; 8.15); [8.15; 10.15); [10.15; 12.15) y [12.15; 14.15]
b) Encuentre los siguientes indicadores: 𝑋̅ y 𝑆𝑥2 (Use la tabla elaborada en a)
c) Encuentre el porcentaje de mediciones que hay en el intervalo: 𝑋̅ ∓ 𝑘. 𝑆 para 𝑘 = 0.03; 𝑘 = 0.5 (No use tabla
elaborada en a)
d) Encuentre el valor de X para el cual por debajo de dicho valor está el 40% de las mediciones (percentil 40) (Use
la tabla elaborada en a)
e) ¿Qué porcentaje de mediciones están por encima de 11.2 segundos? (Use la tabla elaborada en a)
f) Dibuje el Histograma de frecuencias simples e indique el Polígono de frecuencias.
g) Dibuje el Histograma de frecuencias acumuladas y represente el él la Ojiva.

5) Veinte motobombas se ponen a funcionar hasta que sufran alguna avería, y de sus tiempos de falla (en horas) se
tiene la siguiente información:

∑20 20 2
𝑖=1 𝑥𝑖 = 7118.2; ∑𝑖=1 𝑥𝑖 = 2919406.82

a) Calcule la media y la varianza del tiempo de falla de las motobombas


3
b) Si faltaban los siguientes datos: 345.7; 453.3; 324.8; 334.6; y 432.5, sobre cinco motobombas de las mismas,
¿cuál es ahora la media y la varianza de los tiempos de falla? (considere 25 motobombas)

6) La siguiente información corresponde a dos muestras (una para cada colegio) de tamaños diferentes sobre los
pesos (Kg) de estudiantes de dichos colegios.

Si se unen las dos muestras formando una sola

a) ¿Qué porcentaje de estudiantes tienen para los dos colegios un peso mayor de 52,3Kg?
b) Si en total los dos colegios tienen 1200 estudiantes, ¿Cuántos de ellos tienen un peso mayor de 52,3Kg?
 
c) Encuentre para cada colegio el coeficiente de variación CV  100. S X , compárelos y comente.

7) Una fábrica empaqueta en lotes de 100 unidades cierto tipo de circuitos que produce. Se establece un plan de
inspección por muestreo consistente en examinar de cada lote, 320 circuitos elegidos al azar y rechazar el lote si de
los 20 aparecen más de 4 defectuosos; almacenar el lote como “revisable” si el número de defectuosos es menor
que 5 y mayor que 1, y aceptarlo en otro caso. Se inspeccionan 52 lotes y resulta el siguiente número de circuitos
defectuosos en cada muestra:

2 3 7 0 4 1 5 3 0 2 3
1 0 8 1 2 2 3 0 2 1 5
1 2 0 3 6 1 3 4 5 0 0
0 2 2 0 4 3 3 2 6 0 1
1 2 1 1 3 0 1 2 2 4 0

a) Construya la tabla de frecuencias


b) Indique la proporción de lotes rechazados.
c) Representar la distribución de frecuencias simples.
d) Representar la distribución de frecuencias acumuladas.
e) Realice un diagrama de barras y uno circular considerando la clasificación: Rechazado, Revisable y Aceptado.

8) Se tiene para 1000 fincas de una determinada región agrícola su tamaño en hectáreas (ha) como se muestra en la
siguiente tabla:

4
Clase Intervalo Ancho de clase Frecuencias
i Li 1, Li Tamaño Ci  Li  Li 1 ni fi Fi
1 L0 , L1 [1.0, 3.0) 2 190 0,19 0,19
2 L1, L2 [3.0, 5.0) 2 250 0,25 0,44
3 L2 , L3 [5.0 ,9.0) 4 270 0,27 0,71
4 L3 , L4 [9.0, 14) 5 180 0,18 0,89
5 L4 , L5 [14, 18) 4 110 0,11 1
Total 1000 1,0

a) Encuentre el tamaño más frecuente de las fincas.


b) La función definida por:

0 Para x  L0

 f
F ( x)   F ( Li 1 )  f i * ( x  Li 1 ) Para Li 1  x  Li , i  1,2,3,....m; f i *  i
 Ci

1 Para x  Lm
Se denomina Función empírica de distribución acumulativa, F (x) ; comúnmente llamada Ojiva. Construya dicha
función de acuerdo con la tabla de las 1000 fincas y determine con base en ella el porcentaje de fincas que tienen
un tamaño comprendido en: 4.2ha  x  9.8ha

9) La siguiente función corresponde a la distribución relativa acumulada para la variable, X: diámetro (mm) de 25 ejes
analizados.
0; si x  9.5
 0,12( x  9.5)
0  ; si 9.5  x  20,5
 10
 0,4( x  20.5)
0,12  ; si 20.5  x  30.5
 10
F(X )  
0,52  0,32( x  30.5) ; si 30.5  x  40.5
 10
 0,16( x  40.5)
0,84  ; si 40.5  x  50.5
 10
1; si x  50.5

a) Dibuje la Ojiva de frecuencias.


b) Usando la función F(X), encontrar el porcentaje de ejes con el siguiente diámetro: 12,5  x  26,4
c) Reconstruya la tabla de frecuencias sobre la base de función F(X).

10) Decida la verdad o falsedad de la siguiente afirmación:


a) Si Yi  AX i  B , con A  1 y B  0 , entonces CV (Y )  CV ( X )
b) Si Y  2.4 X  3.5 y se sabe que: X  12.5 y S X  8.9 , encuentre: Y y SY
2 2

5
11) Muestre las siguientes igualdades

1 n 1 n
S xy 
n
i 1
( xi  X )( yi  Y )  i 1 xi yi  XY
n

n
( xi  X ) 2 1 n 2
S 2
x  i 1
n
  xi  X 2
n i 1

12) El siguiente gráfico representa una distribución con tres clases de igual amplitud, en el aparecen las frecuencias
relativas de cada clase y la relación entre ellas.

∆1 .𝐶
Encuentre el valor de la Moda para la variable representada utilizando la fórmula: 𝑀0 = 𝐿𝑖−1 +
∆1 +∆2

13) Los ingresos por ventas en millones de euros ¿en 500 empresas vienen reflejados en la siguiente tabla:

Ingresos [1, 2) [2, 3) [3, 4) [4, 5) [5, 6) [6, 7]


N° de empresas 50 80 170 90 56 54

a) Halle la gráfica de la función F(x); Ojiva (frecuencias relativas acumuladas) y usando esta encontrar los siguientes
indicadores: 𝑀𝑒 y 𝑄1
b) Encuentre matemáticamente 𝑀𝑒 y 𝑄1

14) Encuentre en términos generales para el modelo de regresión: 𝑌 = 𝛽0 + 𝛽1 . 𝑋; los valores de 𝛽0 y 𝛽1 basándose en
el sistema de ecuaciones normales del modelo; las cuales son:

 yi  n 0  1 i 1 xi
n n
i 1

 x y   0 i 1 xi  1 i 1 xi2
n n n
i 1 i i

15) Para los siguientes datos de las variables X e Y:

X 1 3 4 6 8 9 11 14
Y 1 2 4 4 5 7 8 9

6
a) Halle las ecuaciones normales del modelo 𝑌 = 𝛽0 + 𝛽1 . 𝑋

b) Grafique el modelo
c) Encuentre el coeficiente de correlación lineal del modelo

¿Qué significa dicho valor?


d) Usando el modelo encuentre los siguientes valores de Y: 𝑦 = 𝑓(𝑥 = 5); 𝑦 = 𝑓(𝑥 = 12)

16) La duración media de anuncios comerciales por televisión es de 75 segundos con desviación estándar de 20
segundos. Para contestar lo siguiente, suponga que las duraciones están distribuidas normalmente en forma
aproximada.

a) ¿Qué porcentaje de anuncios dura más de 95 segundos?


b) ¿Qué porcentaje de anuncios dura entre 35 y 115 segundos?
c) ¿Esperaría que los anuncios duren más de 2 minutos? ¿Por qué sí o por qué no?

17) Un conjunto de 340 calificaciones de examen, que muestran una distribución de frecuencia relativa en forma de
campana, tiene una media de 𝑦̅ = 72 y una desviación estándar de s = 8. ¿Aproximadamente cuántas de las
calificaciones se esperaría que cayeran en el intervalo de 64 a 80? ¿Y en el intervalo de 56 a 88?

18) Los ritmos de respiración en reposo para estudiantes del Programa de Ingeniería Electrónica de la universidad están
normalmente distribuidos, en forma aproximada, con una media de 12 y desviación estándar de 2.3 respiraciones
por minuto. ¿Qué fracción de todos los estudiantes tienen ritmos de respiración en los siguientes intervalos?

a) 9.7 a 14.3 respiraciones por minuto


b) 7.4 a 16.6 respiraciones por minuto
c) 9.7 a 16.6 respiraciones por minuto
d) Menos de 5.1 o más de 18.9 respiraciones por minuto

19) Ajuste una recta a los cinco puntos de la tabla siguiente. Dé las estimaciones de 𝐵0 y 𝐵1 . Localice los puntos y trace
la recta ajustada como prueba de los cálculos en un diagrama cartesiano.

20) La siguiente figura muestra la distribución de frecuencias para un grupo de jefes de hogar a los cuales se les preguntó
sobre sus gastos mensuales en transporte (miles de pesos).

21) La Variable 𝑋, se distribuye Normal es decir 𝑋 ≅ 𝑁(𝜇 = 10; 𝜎 = 4). Se tiene la combinación lineal de la variable 𝑌 =
3𝑋 + 2 que depende de 𝑋.

a) ¿Qué porcentaje de mediciones de 𝑋 se encuentran en el intervalo (6; 12)?


b) Encuentre 𝜇𝑌 y 𝜎𝑌 y estandarice la variable 𝑌 para encontrar ahora el porcentaje de mediciones de 𝑌 que están
por debajo de 30.

7
a) Encuentre para la distribución anterior la tabla de frecuencias.
b) Encuentre e interprete los siguientes indicadores: X , M e , M 0 , S

22) Analice las siguientes demostraciones:

Suponga que se tienen dos muestras excluyentes de tamaños n1 y n2 para la misma variable X de las cuales se
obtienen los siguientes indicadores:

Tamaño Media Varianza


Muestra N°1 n1 X1 S12
Muestra N° 2 n2 X2 S 22

a) Si se reúnen las dos muestras formando una sola, esta nueva muestra tendrá como media:

X 1.n1  X 2 .n2
X
n1  n2
Demostración//

Al reunir las dos muestras en una sola se tiene que:


 xi  i 1 1 x1i  i 21 x2i
n1  n2 n n
i 1

Dividiendo por n1  n2  n a ambos lados se tiene:


 n1 x1i   n2 x2i 
n1  i 1   n2  i 1 
 
i 1 xi  X  i 1 x1i  i 1 x2i   1   n2   n1 X1  n2 X 2
n1  n 2 n1 n2
n
n1  n2 n1  n2 n1  n2 n1  n2
Luego:
X 1.n1  X 2 .n2
X
n1  n2

b) Si se reúnen las dos muestras formando una sola, la varianza de esta nuestra será:
8
S X2 
  
n1 S12  ( X 1  X )2  n2 S12  ( X 2  X )2 
n1  n2
Demostración//
Al reunir las dos muestras en una sola se obtiene X como media resultante, y la varianza de la muestra
resultante S X2 se puede escribir de la siguiente manera:

S X2 
1
n1  n2

i 1
n1
( x1i  X )2  i 21 ( x2i  X )2
n

S X2 
1
n1  n2
 n1
i 1
( x
1i  X 1 )  ( X 1  X )  i 21 ( x2i  X 2 )  ( X 2  X )
2 n 2
 (1)

Pero:

 ( x  X 1 )  ( X 1  X )  i 11 ( x1i  X 1 ) 2  2( X 1  X )i 11 ( x1i  X 1 )  i 11 ( X 1  X ) 2


n1 2 n n n
i 1 1i
 
0
Luego:

 ( x  X 1 )  ( X 1  X )  i 11 ( x1i  X 1 ) 2  n1 ( X 1  X ) 2 (2)


n1 2 n
i 1 1i

Análogamente:
 ( x  X 2 )  ( X 2  X )  i 21 ( x2i  X 2 ) 2  n2 ( X 2  X ) 2 (3)
n2 2 n
i 1 2i

Remplazando (2)y (3) en la expresión (1) se tiene:

S X2 
1
n1  n2
  n1
i 1
( x1i  X 1 ) 2  n1 ( X 1  X ) 2    n2
i 1
( x2i  X 2 ) 2  n2 ( X 2  X ) 2 
1  n1 ( x1i  X 1 )
2
  n2 ( x2i  X 2 )
2

S X2    1 i 1
n  n1 ( X 1  X ) 2   2 i 1
 n  n2 ( X 2  X ) 2  
n1  n2   n1   n2 

Finalmente:

S X2 
1
n1  n2
n S 1 1
2
 
 n1 ( X 1  X )2  n2 S22  n2 ( X 2  X )2 
n S 2
 ( X1  X )   n S
2 2
 ( X 2  X )2 
S X2  1 1 2 2
n1  n2

23) Complete la siguiente tabla de frecuencias correspondiente a la característica Y, sabiendo que la distribución es
simétrica (respecto de 𝑛𝑖 y 𝑓𝑖 ).

9
Yi ni Ni fi Fi
10 6 6 0.12 0.12
20 0.32
30
40
50
Total

24) Dada la siguiente tabla de frecuencias para la variable X en la cual f1  f 2  0,34 y f1  f3  0,36

Intervalo Frecuencia
10- 20 𝑓1
20-30 𝑓2
30-40 𝑓3
40-50 0,30
50-60 0,12

a) Calcule e interprete CV (x)


b) Encuentre los valores de X1 y X2 para los cuales el porcentaje de datos por debajo de X1 es igual al 40% y por encima de X2
es de 40%.

25) Completar la siguiente tabla de frecuencias:

26) Complete la siguiente tabla de frecuencias (ASUMA ASIMETRÍA RESPECTO DE LAS FRECUENCIAS SIMPLES) y
determine el porcentaje de unidades que tienen un valor para la variable analizada comprendido entre: 𝑀2 ≤ 𝑋 ≤
𝑀6 .

i Lim -Inf M de C Lim -Sup 𝑛𝑖 𝑁𝑖 𝑓𝑖 𝐹𝑖


2 10
3 0.13
4 30 38 0.15
5 24
6
7 65 0.13 0.90
8
TOTAL X X X X X

10

Вам также может понравиться