Академический Документы
Профессиональный Документы
Культура Документы
Facultad de Ingeniería
Escuela de Estadística
Taller -1
1) Ejercicio introductorio sobre construcción de tablas de frecuencias y cálculo de algunos indicadores de tendencia
central y variabilidad. Interpretación.
Suponga que se tiene una información sobre la variable X: Duración de la llamada telefónica (segundos) en una
determinada empresa. La información corresponde a 100 llamadas.
4,4 12,1 20 29,8 11,3 185 187,1 182,4 201 188,8 35 63 124 107
58,1 52,8 56 39,9 50,2 63 80,8 72 63,1 72 40 90 107 93
90 68,3 70,1 74,1 89 137 119 141 145,7 136 54,7 90 144 90,6
104,2 112 116 146 130,8 159,2 174 152 172,7 152 33 65,5 148,8 117
176,2 167 177,4 156 166,7 73 86,2 74 68 88,1 57,9 78 112 125
184,2 204 186,5 196 186,8 112 101 142 127,2 97,3 126 99 164 103,2
232,1 216,8 231 237,2 239,7 154 175 176,9 169 161,7 112,8 126 176 178,6
179 178
Nota considere anchos de clase iguales a 30 segundos. Primera clase [0, 30) .
Muestra B Muestra C
Clase 𝑛𝑖 𝑓𝑖 Clase 𝑛𝑖 𝑓𝑖
[0, 30) 1 0,01 [0, 30) 32 0,32
[ 30, 60) 3 0,03 [ 30, 60) 20 0,2
[ 60, 90) 6 0,06 [ 60, 90) 18 0,18
[ 90, 120) 8 0,08 [ 90, 120) 12 0,12
[120, 150) 12 0,12 [120, 150) 8 0,08
[150, 180) 18 0,18 [150, 180) 6 0,06
[180, 210) 20 0,2 [180, 210) 3 0,03
[210, 240] 32 0,32 [210, 240] 1 0,01
Total 100 1.0 Total 100 1.0
1
Encuentre el diagrama de cajas para cada una de las distribuciones anteriores. Encuentre los siguientes
indicadores para cada muestra: Media, Mediana, Moda y Coeficiente de variación.
¿Que concluye de cada distribución al compararlas entre ellas?. ¿Para cuál de las distribuciones la media es el
mejor representante de los datos?. Desde el punto de vista absoluto; relativo.
h) Usando el literal a) aplique el Teorema de Chebyshev cuando k= 1.5. ¿Cuál sería el resultado si usamos la
aproximación a la normal mediante la tabla?
2
2) Dos grupos de datos sobre la misma variable presentan la siguiente información:
ni ni
ni xi xi2
i 1 i 1
Al formar un solo grupo con los 50 datos, encuentre la media y la varianza de ellos.
3) Una fábrica de ejes de madera por torneado tiene dos plantas A y B. La distribución del diámetro X de cierto eje
fabricado en las dos plantas presenta las siguientes distribuciones:
a) ¿Qué planta tiene una fabricación más homogénea en cuanto al diámetro de los ejes?
b) ¿Qué porcentaje de ejes produce semanalmente la fábrica (las dos plantas juntas) con un diámetro entre 28.5 y
38.5 mm?
4) La siguiente información corresponde a la respuesta en segundos (X) de un dispositivo electrónico: 8.9, 12.4, 8.6,
11.3, 9.2, 8.8, 13.1, 6.2, 7.0, 7.1, 11.8, 10.7, 7.6, 9.1, 9.2, 8.2, 9.0, 8.7, 9.1, 10.9, 10.3, 9.6, 7.8, 11.5, 9.3, 7.9, 8.8, 8.8,
12.7, 8.4, 7.8, 14.0, 10.5, 10.5, 9.6, 8.9, 10.2, 10.3, 7.7, 10.6, 8.3, 8.8, 9.5, 8.8, 9.4, 13.1, 14, 13.8
5) Veinte motobombas se ponen a funcionar hasta que sufran alguna avería, y de sus tiempos de falla (en horas) se
tiene la siguiente información:
∑20 20 2
𝑖=1 𝑥𝑖 = 7118.2; ∑𝑖=1 𝑥𝑖 = 2919406.82
6) La siguiente información corresponde a dos muestras (una para cada colegio) de tamaños diferentes sobre los
pesos (Kg) de estudiantes de dichos colegios.
a) ¿Qué porcentaje de estudiantes tienen para los dos colegios un peso mayor de 52,3Kg?
b) Si en total los dos colegios tienen 1200 estudiantes, ¿Cuántos de ellos tienen un peso mayor de 52,3Kg?
c) Encuentre para cada colegio el coeficiente de variación CV 100. S X , compárelos y comente.
7) Una fábrica empaqueta en lotes de 100 unidades cierto tipo de circuitos que produce. Se establece un plan de
inspección por muestreo consistente en examinar de cada lote, 320 circuitos elegidos al azar y rechazar el lote si de
los 20 aparecen más de 4 defectuosos; almacenar el lote como “revisable” si el número de defectuosos es menor
que 5 y mayor que 1, y aceptarlo en otro caso. Se inspeccionan 52 lotes y resulta el siguiente número de circuitos
defectuosos en cada muestra:
2 3 7 0 4 1 5 3 0 2 3
1 0 8 1 2 2 3 0 2 1 5
1 2 0 3 6 1 3 4 5 0 0
0 2 2 0 4 3 3 2 6 0 1
1 2 1 1 3 0 1 2 2 4 0
8) Se tiene para 1000 fincas de una determinada región agrícola su tamaño en hectáreas (ha) como se muestra en la
siguiente tabla:
4
Clase Intervalo Ancho de clase Frecuencias
i Li 1, Li Tamaño Ci Li Li 1 ni fi Fi
1 L0 , L1 [1.0, 3.0) 2 190 0,19 0,19
2 L1, L2 [3.0, 5.0) 2 250 0,25 0,44
3 L2 , L3 [5.0 ,9.0) 4 270 0,27 0,71
4 L3 , L4 [9.0, 14) 5 180 0,18 0,89
5 L4 , L5 [14, 18) 4 110 0,11 1
Total 1000 1,0
0 Para x L0
f
F ( x) F ( Li 1 ) f i * ( x Li 1 ) Para Li 1 x Li , i 1,2,3,....m; f i * i
Ci
1 Para x Lm
Se denomina Función empírica de distribución acumulativa, F (x) ; comúnmente llamada Ojiva. Construya dicha
función de acuerdo con la tabla de las 1000 fincas y determine con base en ella el porcentaje de fincas que tienen
un tamaño comprendido en: 4.2ha x 9.8ha
9) La siguiente función corresponde a la distribución relativa acumulada para la variable, X: diámetro (mm) de 25 ejes
analizados.
0; si x 9.5
0,12( x 9.5)
0 ; si 9.5 x 20,5
10
0,4( x 20.5)
0,12 ; si 20.5 x 30.5
10
F(X )
0,52 0,32( x 30.5) ; si 30.5 x 40.5
10
0,16( x 40.5)
0,84 ; si 40.5 x 50.5
10
1; si x 50.5
5
11) Muestre las siguientes igualdades
1 n 1 n
S xy
n
i 1
( xi X )( yi Y ) i 1 xi yi XY
n
n
( xi X ) 2 1 n 2
S 2
x i 1
n
xi X 2
n i 1
12) El siguiente gráfico representa una distribución con tres clases de igual amplitud, en el aparecen las frecuencias
relativas de cada clase y la relación entre ellas.
∆1 .𝐶
Encuentre el valor de la Moda para la variable representada utilizando la fórmula: 𝑀0 = 𝐿𝑖−1 +
∆1 +∆2
13) Los ingresos por ventas en millones de euros ¿en 500 empresas vienen reflejados en la siguiente tabla:
a) Halle la gráfica de la función F(x); Ojiva (frecuencias relativas acumuladas) y usando esta encontrar los siguientes
indicadores: 𝑀𝑒 y 𝑄1
b) Encuentre matemáticamente 𝑀𝑒 y 𝑄1
14) Encuentre en términos generales para el modelo de regresión: 𝑌 = 𝛽0 + 𝛽1 . 𝑋; los valores de 𝛽0 y 𝛽1 basándose en
el sistema de ecuaciones normales del modelo; las cuales son:
yi n 0 1 i 1 xi
n n
i 1
x y 0 i 1 xi 1 i 1 xi2
n n n
i 1 i i
X 1 3 4 6 8 9 11 14
Y 1 2 4 4 5 7 8 9
6
a) Halle las ecuaciones normales del modelo 𝑌 = 𝛽0 + 𝛽1 . 𝑋
b) Grafique el modelo
c) Encuentre el coeficiente de correlación lineal del modelo
16) La duración media de anuncios comerciales por televisión es de 75 segundos con desviación estándar de 20
segundos. Para contestar lo siguiente, suponga que las duraciones están distribuidas normalmente en forma
aproximada.
17) Un conjunto de 340 calificaciones de examen, que muestran una distribución de frecuencia relativa en forma de
campana, tiene una media de 𝑦̅ = 72 y una desviación estándar de s = 8. ¿Aproximadamente cuántas de las
calificaciones se esperaría que cayeran en el intervalo de 64 a 80? ¿Y en el intervalo de 56 a 88?
18) Los ritmos de respiración en reposo para estudiantes del Programa de Ingeniería Electrónica de la universidad están
normalmente distribuidos, en forma aproximada, con una media de 12 y desviación estándar de 2.3 respiraciones
por minuto. ¿Qué fracción de todos los estudiantes tienen ritmos de respiración en los siguientes intervalos?
19) Ajuste una recta a los cinco puntos de la tabla siguiente. Dé las estimaciones de 𝐵0 y 𝐵1 . Localice los puntos y trace
la recta ajustada como prueba de los cálculos en un diagrama cartesiano.
20) La siguiente figura muestra la distribución de frecuencias para un grupo de jefes de hogar a los cuales se les preguntó
sobre sus gastos mensuales en transporte (miles de pesos).
21) La Variable 𝑋, se distribuye Normal es decir 𝑋 ≅ 𝑁(𝜇 = 10; 𝜎 = 4). Se tiene la combinación lineal de la variable 𝑌 =
3𝑋 + 2 que depende de 𝑋.
7
a) Encuentre para la distribución anterior la tabla de frecuencias.
b) Encuentre e interprete los siguientes indicadores: X , M e , M 0 , S
Suponga que se tienen dos muestras excluyentes de tamaños n1 y n2 para la misma variable X de las cuales se
obtienen los siguientes indicadores:
a) Si se reúnen las dos muestras formando una sola, esta nueva muestra tendrá como media:
X 1.n1 X 2 .n2
X
n1 n2
Demostración//
b) Si se reúnen las dos muestras formando una sola, la varianza de esta nuestra será:
8
S X2
n1 S12 ( X 1 X )2 n2 S12 ( X 2 X )2
n1 n2
Demostración//
Al reunir las dos muestras en una sola se obtiene X como media resultante, y la varianza de la muestra
resultante S X2 se puede escribir de la siguiente manera:
S X2
1
n1 n2
i 1
n1
( x1i X )2 i 21 ( x2i X )2
n
S X2
1
n1 n2
n1
i 1
( x
1i X 1 ) ( X 1 X ) i 21 ( x2i X 2 ) ( X 2 X )
2 n 2
(1)
Pero:
Análogamente:
( x X 2 ) ( X 2 X ) i 21 ( x2i X 2 ) 2 n2 ( X 2 X ) 2 (3)
n2 2 n
i 1 2i
S X2
1
n1 n2
n1
i 1
( x1i X 1 ) 2 n1 ( X 1 X ) 2 n2
i 1
( x2i X 2 ) 2 n2 ( X 2 X ) 2
1 n1 ( x1i X 1 )
2
n2 ( x2i X 2 )
2
S X2 1 i 1
n n1 ( X 1 X ) 2 2 i 1
n n2 ( X 2 X ) 2
n1 n2 n1 n2
Finalmente:
S X2
1
n1 n2
n S 1 1
2
n1 ( X 1 X )2 n2 S22 n2 ( X 2 X )2
n S 2
( X1 X ) n S
2 2
( X 2 X )2
S X2 1 1 2 2
n1 n2
23) Complete la siguiente tabla de frecuencias correspondiente a la característica Y, sabiendo que la distribución es
simétrica (respecto de 𝑛𝑖 y 𝑓𝑖 ).
9
Yi ni Ni fi Fi
10 6 6 0.12 0.12
20 0.32
30
40
50
Total
24) Dada la siguiente tabla de frecuencias para la variable X en la cual f1 f 2 0,34 y f1 f3 0,36
Intervalo Frecuencia
10- 20 𝑓1
20-30 𝑓2
30-40 𝑓3
40-50 0,30
50-60 0,12
26) Complete la siguiente tabla de frecuencias (ASUMA ASIMETRÍA RESPECTO DE LAS FRECUENCIAS SIMPLES) y
determine el porcentaje de unidades que tienen un valor para la variable analizada comprendido entre: 𝑀2 ≤ 𝑋 ≤
𝑀6 .
10