Вы находитесь на странице: 1из 106

INGENIERÍA QUÍMICA: EXAMEN DE ESTADÍSTICA.

9 DE FEBRERO DE 1999

1.-Tres imprentas hacen trabajos para una oficina de publicaciones: Los datos que a
continuación se expresan reflejan la experiencia a largo plazo con estas imprentas
Proporción de contratos Proporción de entrega con
Impresor correspondientes retraso de más de un mes
1 .2 .1
2 .3 .4
3 .5 .2
La oficina descubre un trabajo con más de un mes de retraso. Calcular la probabilidad de que el
impresor 3 sea el que tiene el contrato.
SOLUCION:
P(impresor 3/más de un mes de retraso)= P(impresor 3, más de un mes de retras0)/P(más de
1 mes de retraso) = p(mas de un mes de retraso/impresor 3) P(impresor 3)/[P( /1)P(1) +
P( /2)P(2)+P( /3)P(3)] = (0,2x0,5)/(0,1x0,2+0,4x0,3+0,2x0,5)=0,1/0,24=0,416

2.- El servicio postal requiere, en promedio, 2 días para entregar una carta al otro lado de la
ciudad. Se estima que la varianza es de 0,4. Si un ejecutivo desea que el 99% de sus cartas sean
entregadas a tiempo, ¿Con qué anticipación debe ponerlas en el correo?
SOLUCIÓN:
1 1 1
P( X    k )  1  2  0.99 1  2  0.99  0.01 k 2  100 k  10
k k k2
 2  0.4   0.632 X  2  6.32
Debe enviarlas con 9 días de antelación.

3.- Un lote de 200 piezas presenta 5 defectuosas.


Calcular la probabilidad de que en una muestra aleatoria de tamaño 50 se encuentre al menos una
defectuosa.
Calcular el tamaño muestral necesario para detectar tres o menos piezas defectuosas el 90% de
las veces.
SOLUCIÓN:
 195
 
 50 
Sin reemplazamiento P (0 defectuosas)= =0,233
 200
 
 50 
P(al menos una defectuosa)=0,766
Con reemplazamiento p=5/200=0,025 n=50 P(0 defectuosas)=(0,975)50 = 0,2819
P(al menos una defectuosa)= 0,7181
Se puede aproximar por una variable de Poisson de parámetro 50x0,025=1,25
P(X=0)=(0,301+0,272)/2= 0,286
P(al menos una defectuosa)= 0,714
P(X3)=0,9 tablas = 1,7 np = 1,7 n =1,7/0,025= 68

1
4.- Un fabricante de cierto monitor comercial de televisión garantiza el cinescopio por un
año (8760 h). Los monitores se usan en terminales de aeropuertos para indicar horarios de vuelo
y están en uso continuo. La vida media de los cinescopios es 20000 y sigue una distribución
exponencial. Al fabricante le cuesta 45000 Pts hacer un monitor y le vende en 60000 Pts. Le
cuesta 22000 Pts reemplazar un cinescopio en periodo de garantía. ¿Cuál es la ganancia esperada
del fabricante? Suponemos que el fabricante reemplaza el cinescopio solo una vez.
SOLUCION :
=1/20000
8760 8760

 e dt  1  e
 t
P (T8760)= 20000
 1  0.6453  0,354
0

15000 si T > 8760


Ganancia =
-7000 si T8760

E (G)= 15000x0, 645-7000 x 0,354= 7190 Ganancia esperada

5.- Un ensamble está compuesto por tres componentes colocados uno junto al otro. La
longitud de cada componente se distribuye normalmente con media 2 cm. y desviación típica 0,2
cm. Las especificaciones requieren que todos los ensambles tengan una longitud entre 5,7 y 6,3
cm. ¿Cuántos ensambles verificarán estos requerimientos?
SOLUCION:
Sean X1, X2, X3 la longitud de los componentes cada uno de ellos con distribución normal
de media 2 y varianza (0,2)2 = 0,04. La suma tiene una distribución normal de media
3x2=6 y varianza 0,04x3= 0,12.
Nos piden P(5,7<X1+X2+X36,3) tipificando la variable
5,7  6 6,3  6
P( Z )  P(0,867  Z  0,867)  2 0,867   1  2 x0,805  1  0,610
0,12 0,12

6.- Una droga A se administró a 7 pacientes seleccionados al azar y después de un periodo


fijo, se midió en las unidades apropiadas la concentración de la droga en ciertas células de cada
paciente. Se obtuvieron los resultados siguientes:
1,23 1,42 1,41 1,62 1,55 1,60 1,76
Se administró una segunda droga B a otros 6 pacientes distintos seleccionados al azar con los
resultados siguientes:
1,76 1,41 1,87 1,49 1,67 1,81
Suponiendo que todas las observaciones siguen una distribución normal con una varianza común
desconocida. Calcular un intervalo de confianza para la diferencia de medias al nivel 0,1.
Contrastar las siguientes hipótesis al nivel 0,1. Calcular la región crítica y el p valor.
H0: AB H0: A=B
H1: A<B H1: A≠B
SOLUCION:
X 1  1,512 S12  0,030 S1=0,17
X 2  1,668 S12  0,033 S2=0,183 X 1  X 2  0,156
6 x0,03  5 x0,033 0,345 1 1
S2    0,031 S=0,177 S   0,098
11 11 6 7
t0,05, 11 = 1,796

2
Intervalo -0,156 1,796x0,098 =(-0,332, 0,020)
Hipótesis unilateral es equivalente a H0: A=B
H1: A<B
t0= -0,156/0,107=-1,457 t0,1,11= 1,363
Región crítica t0<-1,363
Rechazamos la hipótesis de que la media del primer tratamiento sea mayor que la
media del segundo al nivel 0,1
p valor: P (t11 < -1,47)=P (t11>1,47) <P (t11>1,363)=0,1 El p valor es menor de 0,1
cosa que ya sabíamos ya que rechazamos la hipótesis a este nivel. También puede verse que
es mayor de 0,05. Su valor exacto es 0,086
Hipótesis bilateral: Región crítica t 0  1,796
Aceptamos la hipótesis nula de que los dos tratamientos tienen la misma media.
P valor: P ( t11  1,475)  2 x0,086  0,172
7.- El porcentaje de impurezas en oxigeno producido mediante un proceso de destilación se
considera relacionado con el porcentaje de hidrocarburo en el condensador principal del
procesador. Se dispone de los datos de un mes de operación, dados a continuación. Se pide:
Ajustar un modelo de regresión
Hacer el contraste de regresión: Hallar la región crítica y el p valor
Intervalo de confianza para la pendiente
Calcular R2
Hacer uso de los datos proporcionados y rellenar los que faltan
¿Qué se desprende del análisis de los residuos?
Pureza hidrocarburo predicción limite inferior limite superior limite inferior limite superior
( %) (%) predicción predicción estimación estimación
86,91 1,02 89,9003 82,0667 97,7339 87,8338 91,9668
89,85 1,11 83,2015 98,7233 89,1914
90,28 1,43 94,7388 86,7868 102,691 92,2611 97,2164
86,34 1,11 90,9624 83,2015 98,7233 89,1914 92,7335
92,58 1,01 89,7823 81,9373 97,6274 87,6728 91,8918
87,33 ,95 89,0743 81,1466 97,0019 86,6758 91,4728
86,29 1,11 90,9624 83,2015 98,7233 89,1914 92,7335
91,86 ,87 88,1302 80,0565 96,2039 85,2858 90,9745
95,61 1,43 94,7388 86,7868 102,691 92,2611 97,2164
89,86 1,02
96,73 1,46 95,0928 87,0879 103,098 92,4502 97,7354
99,42 1,55 96,1549 87,9579 104,352 92,9776 99,3322
98,66 1,55 96,1549 87,9579 104,352 92,9776 99,3322
96,07 1,55 96,1549 87,9579 104,352 92,9776 99,3322
93,65 1,40 94,3847 86,4799 102,29 92,0629 96,7066
87,31 1,15 91,4345 83,6881 99,1808 89,7282 93,1407
95 1,01 89,7823 81,9373 97,6274 87,6728 91,8918
96,85 ,99 89,5463 81,6764 97,4163 87,346 91,7466
85,20 ,95 89,0743 81,1466 97,0019 86,6758 91,4728
90,56 ,98 89,4283 81,5449 97,3117 87,1804 91,6762

Hidrocarburo pureza
n 20 20
Media 1,1825 91,818
Varianza muestral 0,0560513 20,0604
Desviación Standard 0,236752 4,47888
Covarianza 0,661463

3
Análisis de Regresión - Modelo: Y = a + b*X
Variable Dependiente: pureza
Variable Independiente: hidrocarburo
Error Estadístico
Parámetro Estimador Estándar T P-Valor
Ordenada 77,8633 4,19889 18,5438 0,0000
Pendiente 3,48512 3,38612 0,0033
Análisis de la Varianza
Fuente Suma de cuadrados Df Media Cuadrática F-Ratio P-Valor
Modelo 148,313 1 148,313 11,47 0,0033
Residual
Total (Corr.) 381,147
Coeficiente Correlación = 0,623797
R-cuadrado =
Standard Error de estimación. = 3,59656
Plot del modelo ajustado Residual Plot
100 8

97
4
residuos
pureza

94
0
91

88 -4

85 -8
0.87 1.07 1.27 1.47 1.67 88 90 92 94 96 98
hidrocarburo pureza estimada

Normal Probability Plot for RESIDUOS Box-and-Whisker Plot


99.9
99
95
80
50
20
5
1
0.1 -5 -2 1 4 7 10
-4.7 -2.7 -0.7 1.3 3.3 5.3 7.3 9.3 RESIDUOS
RESIDUOS

Histograma para RESIDUOS


6
5
frecuencia

4
3
2
1
0
-5 -2 1 4 7 10
RESIDUOS
Solución:

4
Cov( X , Y )
ˆ1   11,801
S X2
Modelo de Regresión: pureza = 77,8633 + 11,801x hidrocarburo
20 S X  1 11,801
t    3,38612
SR 3,48
Región crítica: t  t18, 0.025  2,101
Rechazamos la hipótesis. Hay relación lineal entre las variables.
P valor: P  t18  3,38612   0,0033

Intervalo de confianza para la pendiente:



20 S X ˆ1   1 t18,0.025
SR
 1  ˆ1  2,101x3,48512  1  4,478;19,123
VE 148,313
R2    0,3891228
VT 381,147
VNE= VT-VE= 232,834 Df = 18 Media Cuadrática = 232,834/18=12,.935
VT Df= 19
Predicción para hidrocarburo = 1,11: El punto central de intervalo de la predicción de pureza
(98,7233+83,2015)/2=90,9624
Límite superior del intervalo de estimación: 90,9624- 89,1914=1,771;
90,9624+1,771=92,7334
Predicción para hidrocarburo = 1,02
Pureza = 77,863+11,801x1,02=89,9002
Intervalo de confianza para la estimación: Tamaño muestral
20
nˆ  2
 13,5951
 1,02  1,1825 
1  
 0,236752 
S 3,59656
Intervalo 89,9002  t18,0,025 R  89,9002  2,101  89,9002  2,0493
nˆ 13,5951
(87,8508; 91,9495)
Intervalo para la predicción
1
89,9002  t18,0, 025 S R 1   89,9002  2,101x3,59656 1,036  89,9002  7,6910

(82,2091; 97,5912)
El R2 es muy bajo la regresión solo explica el 39,91 % de la variabilidad. Analizando
los residuos, sobre todo el histograma vemos que éstos no son centrados, la distribución no
es simétrica. El diagrama de cajas también manifiesta la falta de simetría y el plot
Probabilístico nos dice que en las colas el ajuste a la normal no es demasiado bueno.

5
EXAMEN DE ESTADISTICA 2º de Ingeniería química 9 de septiembre de 1999

1.- A continuación se presentan datos de viscosidad de un lote de cierto proceso químico.


13,3 14,9 15,8 16,0 14,5 13,7 13,7 14,9 15,3 15,2 15,1 13,6 15,3
14,5 13,4 15,3 14,3 15,3 14,1 14,3 14,8 15,6 14,8 15,6 15,2 15,8
14,3 16,1 14,5 13,3 14,3 13,9 14,6 14,1 16,4 15,2
a. Construir un diagrama de tallo- hojas para los datos de viscosidad.
b. Construir una tabla de distribución de frecuencias.
c. Calcular los cuartiles primero, segundo y tercero y construir un diagrama de cajas.
SOLUCIÓN:
a. Diagrama de tallo-hojas
Tallo hojas
13 3776439
14 95953138835361
15 832133366282
16 014
También podemos subdividir cada tallo
Tallo hojas
3 13A 343
7 13B 7769
13 14A 313331
(8) 14B 95958856
15 15A 32133322
7 15B 8668
3 16A 014
b. Distribución de frecuencias de la variable viscosidad
Intervalo Centro Frecuencia Frecuencia Frec absoluta Fre relativa
Absoluta Relativa acumulada acumulada
13-13,5 13,25 3 0,083 3 0,083
13,5-14 13,75 4 0,111 7 0,194
14-14,5 14,25 6 0,166 13 0,361
14,5-15 14,75 8 0,22 21 0,583
15-15,5 15,25 8 0,22 29 0,805
15,5-16 15,75 4 0,11 33 0,916
16-16,5 16,25 3 0,083 36 1
c. Para calcular los cuartiles ordenamos los datos de menor a mayor
13,3 13,3 13,4 13,6 13,7 13,7 13,9 14,1 14,1 / 14,3 14,3 14,3 14,3 14,5 14,5 14,5 14,6 14,8 //
14,8 14,9 14,9 15,1 15,2 15,2 15,2 15,3 15,3 / 15,3 15,3 15,6 15,6 15,8 15,8 16,0 16,1 16,4
Primer cuartil (14,1+14,3)/2 = 14,2
Segundo cuartil o mediana (14,8+14,8)/2 = 14,8
Tercer cuartil 15,3
Rango intercuartílico 15,3-14,2 = 1,1
Límite superior del diagrama de cajas 15,3 + 1,5x1,1 = 16,95
Límite inferior 15,3 – 1,1x1,5 = 12,55
En nuestro caso los límites superior e inferior son 16,4 y 13,3
El diagrama de cajas queda representado por la siguiente figura

6
13 14 15 16 17

2.- Las cuadrillas de mantenimiento llegan al cuarto de herramientas pidiendo cierta parte de
repuesto según una distribución de Poisson de parámetro 2. El cuarto de herramientas dispone de
tres repuestos. Si se presentan más de tres, las cuadrillas deben recorrer una distancia
considerable hasta el almacén central.
En un día cualquiera
a. ¿Cuál es la probabilidad de que tenga que realizarse dicho recorrido?
b. ¿Cuál es la demanda diaria esperada de partes de repuesto?
c. ¿Cuántas partes de repuesto deberán tenerse en el cuarto de herramientas para asegurar el
servicio a todas las cuadrillas un 90% de las veces?
d. ¿Cual es el número esperado de cuadrillas que recibirán servicio diariamente en el cuarto de
herramientas?
Utilizar las tablas
SOLUCION:
a. Probabilidad de realizar el recorrido hasta el almacén = P(X>3) = 1- P(X3) = 1 - 0.857 =
0.143
b. demanda media diaria = E(X)= 2
c. Se busca un número a tal que P( X  a )  0.9 Buscando en las tablas P( X  4)  0.947 .
Con 4 repuestos en el cuarto de herramientas se asegura el servicio el 90% de las veces.
d. Se trata de calcular la distribución de la variable X condicionada por X3 y después calcular
su media.
P(X=0)= 0.135 P(X=0/ X3)=0.135/0.857=0.157
P(X=1)= P(X1)-P(X=0)= (0.406-0.135) = 0.271
P(X=1/ X3)=0.271/0.857=0.316
P(X=2)= P(X2)-P(X1) =(0.676-0.406) =0.270
P(X=2/ X3)=0.270/0.857=0.315
P(X=3)= P(X3)-P(X2)=(0.857-0.676)=0.181
P(X=3/ X3)=0.181/0.857=0.211
número medio de cuadrillas que reciben servicio en el cuarto de herramientas =
P(X=1/ X3)+2P(X=2/ X3)+3P(X=3/ X3)=1.569

7
3.- Un lote de 50 arandelas espaciadoras contiene 30 que son más gruesas que la dimensión
requerida. Se escogen tres arandelas al azar, sin reemplazo
a. Calcular la probabilidad de que las tres arandelas sean más gruesas que la dimensión
requerida
b. Sabiendo que las dos primeras arandelas no son más gruesas de lo requerido, calcular la
probabilidad de que la tercera si lo sea.
c. Calcular la probabilidad de que la tercera arandela sea más gruesa de la dimensión
requerida.
d. Calcular el número mínimo de arandelas que es necesario tomar del lote para que la
probabilidad de que ninguna de ellas sea más gruesa de lo requerido sea menor que 0,1.
e. Calcular el número mínimo de arandelas que es necesario tomar del lote para que la
probabilidad de que una o más de ellas sea más gruesa de lo requerido sea al menos de 0,9.
SOLUCION:
a. n = 50 , m = 30 son más gruesas ; llamamos Ai al suceso la arandela i es más gruesa
 30 
 
3 30 x 29 x38
P( A1 A2 A3 )      0,271
 50  50 x 49 x 48
 
3
30
b. P ( A3 / A1 A 2 )   0,625
48
P ( A3 )  P( A1 A 2 A3 )  P( A1 A2 A3 )  P( A1 A 2 A3 )  P ( A1 A2 A3 )
c. 20 19 30 20 30 29 30 20 29 30 29 28
 x x  x x  x x  x x  0.6
50 49 48 50 49 48 50 49 48 50 49 48

d. Se trata de calcular n para que P ( A1 A 2 ... An )  0,1 .


20
Si n=1 P ( A1 )   0,4
50
20 19
Si n=2 P ( A1 A 2 )   0,155
50 49
20 19 18
Si n=3 P ( A1 A 2 A 3 )   0,058
50 49 48
El n buscado es 3.
e. P (una o más arandelas sean más gruesas) = 1 – P (ninguna sea más gruesa) >0,9.
El n buscado es el mismo de antes, es decir, n=3.

4.- De un proceso químico se toma cada hora una muestra de 20 partes. Lo común es que el
1% de las partes requieran volver a ser procesadas. Sea X el número de partes de una muestra de
20 que necesitan ser reprocesadas. Se sospecha de un problema en el proceso si X es mayor que
su media por tres desviaciones estándar.
a. Calcular la probabilidad de que se sospeche de la existencia de un problema.
b. Si el porcentaje de partes que necesita reprocesarse es de 4%. Calcular la probabilidad de X
sea mayor que 1.
c. Calcular la probabilidad de que X sea mayor que 1 en al menos una de las muestras tomadas
en las próximas 5 horas.
SOLUCION:

8
a. n = 20; p=0,01, la variable X sigue una distribución B (20, 0,01).
E(X) = 20x0,01 = 0,2 =  2 = 20x0,01x0,99 = 0,198;  = 0,4449;
X 
P(  3)  P( X    3 )  P( X    3 )  P( X  1,534)  P( X  1,13)  P( X  1) 

1  P ( X  0)  P( X  1)  1  0,9919  20 x0,01x0,9919  1  0,817  0,165  0,018
Si utilizamos aproximaciones nxp=20x0,01=0,2, podemos aproximar X por una variable de
Poisson de parámetro 0,2 ; buscando en las tablas P(X>1) = 1-P(X1) 1-0,982=0,01
b. Si p = 0,04, la variable X sigue una distribución B(20, 0,04)
P(X>1) = 1 – P(X=0) – P(X=1) = 1-0,442-0,368 = 0,19.
Aproximando nxp = 20x0,04 = 0,8 ; aproximamos X por una variable de Poisson de
parámetro 0,8; P(X>1) = 1 - P(X1)1 - 0,808 = 0,192
c. Sean X1, X2, X3, X4, X5 las muestras obtenidas en las 5 horas siguientes. Definimos las
variables Yi =1 si Xi > 1; Yi = 0 en caso contrario para i=1, 2, 3, 4, 5. Sea Y = Y1 +Y2 + Y3 +
Y4 + Y5. Nos piden calcular P (Y  1) . La variable Y sigue una distribución B (5, 0,19).
Por tanto P (Y  1)  1  P(Y  0)  1  0,810  1  0,349  0,65
5

5.- Se utilizan dos máquinas para llenar botellas de plástico con un volumen neto de 16
onzas. Las distribuciones de los volúmenes de llenado pueden suponerse normales con
desviaciones estándar 0,02 y 0,025 onzas. Un miembro del grupo de ingeniería de calidad
sospecha que el volumen de llenado de las dos maquinas es el mismo, sin importar si éste es de
16 onzas o no. Se toma una muestra aleatoria de 10 botellas

Máquina 1 16,03 16,04 16,05 16,05 16,02 16,01 15,96 15,98 16,02 15,99
Máquina 2 16,02 15,97 15,96 16,01 15,99 16,03 16,04 16,02 16,01 16
a. Utilizando =0,05. ¿Tiene razón el ingeniero?
b. Calcular el p-valor de la prueba.
c. Calcular la potencia del contraste si la diferencia entre las medias es de 0,095.
d. Suponiendo el tamaño muestral el mismo para las dos muestras, calcular el tamaño de
muestra necesario para asegurar que =0,05 cuando la diferencia de las medias es de 0,08.
SOLUCION:
a. Dadas dos muestras de tamaño 10 de las variables X1N (1, 0.02) y X2N (2, 0,025) se
H 0 : 1   2
trata de realizar el siguiente contraste al nivel  = 0,05. Bajo H0 el
H 1 : 1   2
X1  X 2
estadístico Z 0   N (0,1) . La región crítica al nivel 0,05 viene dada por
 12  22

n1 n2
Z 0  z 0, 025 ; buscando en las tablas de la normal z0,025= 1,96. Para nuestras muestras el valor
de Z0 es 0,9871 que no cae dentro de la región crítica por tanto acepto la hipótesis nula y el
ingeniero tiene razón.
b. P  Z  z 0   2(1    z 0 )  2(1   0,9871)  2 x(1  0,836)  0,338 , como vemos el p-valor
es muy grande lo que nos apoya en nuestra decisión de aceptar la hipótesis nula de igualdad
de medias.

9
P (aceptarH 0 / 1   2  0,095)  P( Z 0  1,96 / 1   2  0,095) 
P (1,96  Z 0  1,96 / 1   2  0,095) 
0,095 X 1  X 2  0,095 0,095
c. P (1,96    1,96  / 1   2  0,095) 
 12  22  12  22  12  22
  
n1 n2 n1 n2 n1 n2
P (11,34  Z  7,42)   (7,42)   (11,34)  0
La potencia viene dada por 1- P (aceptarH 0 / 1   2  0,095)  1
0,08
d. P (aceptarH 0 / 1   2  0,08)  0,05 , d =  2,498 .
 12   22
Buscando en las curvas OC encontramos n = 2 ó n = 3. Si n = 2
P (aceptarH 0 / 1   2  0,08) 
0,08 X 1  X 2  0,08 0,08
P (1,96    1,96  / 1   2  0,08) 
 2
 2
 2
 2
 12  22

1 2
 1 2

2 2 2 2 2 2
P (5,492  Z  1,572)   (1,572)  1   (1,572)  0,059
Si n = 3
P (aceptarH 0 / 1   2  0,08) 
0,08 X 1  X 2  0,08 0,08
P (1,96    1,96  / 1   2  0,08) 
 12  22  12  22  12  22
  
3 3 3 3 3 3
P (6,286  Z  2,366)   (2,366)  1   (2,366)  0,01
La respuesta es n = 3.

6.- Una compañía productora de energía eléctrica está interesada en desarrollar un modelo
que relacione la demanda pico por hora (y, en Kw.) con el uso de energía total al mes (x, en
Kwh.). Se dispone de una muestra de 49 clientes que se ha procesado con el paquete Statgraphics
y se han obtenido los siguientes resultados
XKWH YKW
n 49 49
Media 1083,02 3,24204
Varianza 293589,0 5,84703
Desviación típica 541,838 2,41806
Mínimo 292,0 0,17
Máximo 2316,0 9,5
Cov(X,Y)=1020,1
Análisis de Regresión - Modelo: Y = a + b*X
Variable Dependiente: YKW
Variable Independiente: XKWH
Parámetro Estimador Error Standard Estadístico T P-Valor
Intercept -0,521022 0,493678 -1,05539 0,2966
Slope 0,0034746 0,000408497 8,50582 0,0000

10
Análisis de la Varianza
Fuente Suma de cuadrados Df Media cuadrática F-Ratio P-Valor
Modelo 170,134 1 170,134 72,35 0,0000
Residual 110,524 47 2,35157
Total (Corr.) 280,657 48
Coeficiente de Correlación = 0,778587
R-Cuadrado = 60,6197 percent
Error Standard de Estimación = 1,53348
Valores Predichos
95,00% 95,00%
Predicted Prediction Limits Confidence Limits
X Y Lower Upper Lower Upper
292,0 0,493561 -2,68981 3,67693 -0,291802 1,27892
582,0 1,5012 -1,64218 4,64457 0,898078 2,10431
1097,0 3,29061 0,174298 6,40693 2,84975 3,73147
1428,0 4,44071 1,31154 7,56987 3,91669 4,96473
2189,0 7,08488 3,83875 10,331 6,07478 8,09497
Plot of Fitted Model Residual Plot
15 4,9
Studentized residual

12
2,9
9
YKW

0,9
6

3 -1,1

0 -3,1
0 1 2 3 4 0 10 20 30 40 50
(X 1000)
XKWH row number

Box-and-Whisker Plot Histogram for SRESIDUALS


24
20
frequency

16

12
8
4
0
-3,1 -2,1 -1,1 -0,1 0,9 1,9 2,9 -3,3 -2,3 -1,3 -0,3 0,7 1,7 2,7

SRESIDUALS SRESIDUALS

Explicar los resultados de la salida del ordenador en los siguientes aspectos


a. Modelo de regresión
b. Hacer el contraste de regresión: Hallar la región crítica y el p valor
c. Intervalo de confianza para el intercept
d. Explicar el significado de R-cuadrado
e. En la tabla de predicción ,explicar el significado de los dos intervalos proporcionados
e. ¿Qué se desprende del análisis de los residuos? ¿Crees que el modelo está bien ajustado?
SOLUCION
a. El modelo de regresión ajustado es Y = 0,00347 X – 0,521
H 0 : 1  0
b. Contraste de regresión Contrastamos si existe relación lineal entre las
H 1 : 1  0
ˆ S n
variables. El estadístico de contraste es T  1 x que sigue una distribución t con n-2
Sˆ R

11
grados de libertad, bajo la hipótesis nula. Según los datos proporcionados por la salida de la
Sˆ R
regresión  0.000408497 y ˆ1  0.0034746 . El valor del estadístico t también
Sx n
proporcionado es 8,5058152. La región crítica al nivel 0,05 viene dada por T  t 0, 025, 47 ,
buscando en las tablas t 0,025, 47  2,021 . El valor de t está dentro de la región crítica y
rechazamos la hipótesis nula y admitimos que existe relación lineal entre las variables. El p-
valor viene dado por la fórmula P( t 47  8,505)  0 .
( ˆ 0   0 ) n
c. El estadístico que se utiliza es que sigue una distribución t con n-2 grados de
2
X
Sˆ R 1  2
SX
libertad. El intervalo de confianza al nivel 0,05 viene dado por
X2 X2
Sˆ R 1  2 Sˆ R 1  2
SX SX
ˆ 0  t 0, 025, 47   0  ˆ 0  t 0,025, 47 . Las salidas nos proporcionan los
n n
X2
Sˆ R 1  2
SX
valores ˆ 0  0,521022 y  0,493686 , sustituyendo obtenemos
n
 1,5187   0  0,4767
VE
d. R 2  0,606197  ; VE= Variación explicada por la regresión; VT = variación total
VT
VE   (Yi  Yˆi ) 2 ; VT   (Yi  Y ) 2 . El 60% de la variación de nuestros datos está
explicada por la regresión.
e. Intervalo de predicción: Estimamos el valor de la variable dependiente Y para un valor de la
variable independiente X.
Intervalo de estimación: Estimamos el valor de la media de la variable Y para un valor de la
variable X. El intervalo de predicción es más amplio
Intervalo de estimación yˆ  t Sˆ / nˆ Intervalo de predicción yˆ  t Sˆ 1  nˆ ,
1
h  R h h  R h
2 2

n
donde nˆ h  2
valor muestral equivalente. Como estos intervalos son al 95%
X X 
1   h 
 SX 
 = 0,05
f. Residuos. No se observa ninguna anomalía en el plot de los valores ajustados ni en el de los
residuos, sin embargo en el diagrama de cajas se observa cierta asimetría y en el histograma
se aprecia que los valores de los residuos se alejan de lo que cabría esperar para una variable
normal. En el modelo de regresión se observa que el contraste de la ordenada en el origen
tiene un p-valor cercano a 0,3 con lo que aceptaríamos la hipótesis nula de que esta vale 0.
Convendría hacer un nuevo análisis de regresión con esta ordenada igual a 0 y ver si los
resultados son mejores.

12
INGENIERIA QUIMICA: EXAMEN DE ESTADÍSTICA, SEGUNDO CURSO.
16 de febrero de 2000
1.- En un proceso de fabricación industrial se utilizan 10 máquinas. Estas máquinas
funcionan independientemente unas de otras durante un tiempo que sigue una ley exponencial de
media 100 horas. El proceso de fabricación se detiene cuando hay más de 8 máquinas sin funcionar.
(La fabricación sigue si funcionan al menos dos máquinas)
a) Calcular la probabilidad de que una máquina se averíe antes de 98 horas.
b) Calcular la probabilidad de que se detenga el proceso de fabricación antes de 98 horas
c) ¿Cuantas máquinas necesitaríamos para asegurarnos que el proceso de fabricación no se
detendrá antes de 98 horas con una probabilidad mayor que 0,9?
Solución:
Sea X la variable que mide el tiempo de funcionamiento de una máquina cualquiera.
98 1 98
1 100 x 
P ( X  98)   e dx  1  e 100  0,625
0
100
El proceso de fabricación se detiene si de las 10 máquinas se averían más de 8 antes de 98
horas.
Sea Xi =1 si la máquina i se avería antes de 98 horas. P(Xi=1) = 0,625. El número de
máquinas averiadas es Z  i 1 X i . Z tiene una distribución binomial. P (se detenga el
10

proceso) =
10 
P ( Z  8)  P ( Z  9)  P( Z  10)   0,625 0,375  0,625  0,055  0,009  0,0637
9 10

9
Con n=10 la probabilidad de que no se detenga el proceso es 1-0,0637=0,9363; este n nos
asegura el resultado.
Si n=9 P (se detenga el proceso)
9
= P ( Z  9)  P( Z  8)  0,625   0,625 0,375  0,015  0,079  0,0193 .
9 8

8
P (no se detenga el proceso) = 1 – 0,0193 = 0,9807
Si n=8, esta probabilidad es
8
= P ( Z  8)  P( Z  7)  0,625   0,625 0,375  0,023  0,111  0,135
8 7

7
Por tanto n=9.

2.- Supongamos que tres fábricas A, B y C vierten productos al río Pisuerga en una
proporción 0,3 0,5 0,2. Estos vertidos son tóxicos con probabilidades 0,05 0,01 y 0,1
respectivamente.
a) Calcular la probabilidad de un vertido tóxico al río Pisuerga.
b) Si se detecta un vertido tóxico en el río, calcular la probabilidad de que este provenga de cada
una de las tres fábricas.
c) Si se han detectado en el último año 10 vertidos tóxicos, calcular la probabilidad de que 5 sean
de A 3 de B y 2 de C.
Solución:
Por la regla de la probabilidad total.
P (vertido tóxico) = P (tóxico/A) P(A) + P (tóxico/B) P (B) + P (tóxico/C) P(C) = 0,05x0,3 +
0,01x0,5 + 0,1x0,2= 0,04
Por la regla de Bayes

13
P(A/tóxico)= P (tóxico/A) x P(A)/P (tóxico) = 0,015/0,04 = 0,375;
P (B/tóxico) = 0,005/0,04 = 0,125; P(C/tóxico) = 0,02/0,04 = 0,5.
Si se han detectado 10 vertidos tóxicos
10  5 
P (5deA,3deB,2deC )    0,375 0,125 0,5  0,024
5 3 2

 5  3 

3.- El diámetro de una arandela tiene una distribución normal de media 0,2 pulgadas. Las
especificaciones requieren que el diámetro está entre 0,14 y 0,26 pulgadas con probabilidad
0,9973.
a) Calcular la desviación estándar.
b) Si se conoce que la varianza es de 0,0016 pulgadas, calcular el valor de las especificaciones.
Solución:
Sea X la variable que mide el diámetro de la arandela P (0,14 < X <0,26) =
0,9973.Tipificamos la variable

0,14  0,2 X  0,2 0,26  0,2  0,06 0,06


P(   )  P( Z )  P( z  Z  z )  ( z )  ( z ) 
    
2 ( z )  1  0,9973
( z )  1,9973 / 2  0,99865 Buscando en las tablas z = 3;   0,06 / 3  0,02
Si se conoce que la varianza es 0,0016 la desviación estándar es 0,04

a  0,2 X  0,2 b  0,2


P(   )  P ( z  Z  z )  2 ( z )  1  0,9973 , como antes z =3
0,04 0,04 0,04
b = 0,04x3 +0,2 =0,32; a = 0,2-0,04x3 = 0,08. Las especificaciones son que el diámetro está
comprendido entre 0,08 y 0,32 con probabilidad 0,9973
También seria correcto
0,14  0,2 X  0,2 0,26  0,2
P(   )  P (1,5  Z  1,5)  2 (1,5)  1  2 x0,93943  1  0,87886
0,04 0,04 0,04
Las especificaciones son que el diámetro está comprendido entre 0,14 y 0,26 con
probabilidad 0,87886.

4.- Dada una población N (, 2,5). Se realiza el siguiente contraste de hipótesis
H 0 :   50
obteniéndose los siguientes resultados.
H :1   50

Región de Tamaño de la   para  =52 para =50,5


aceptación muestra
48,5  x  51,5 10 0,2327 0,89
48  x  52 10 0,02
48,5  x  51,5 16 0,02
48  x  52 16 0,5 0,9918

a) Rellenar los datos que faltan en la tabla y dar los resultados del contraste.
b) Con los datos proporcionados ¿podrías obtener un intervalo de confianza para la media?
c) Para =0,05 ¿Qué tamaño de muestra nos asegura una potencia de 0.9 para =52?
Solución:

14
Es un contraste de hipótesis sobre la media de una población normal con varianza conocida.
X  0
El estadístico que se utiliza para el contraste es Z 0  . La región de aceptación al
/ n
nivel  viene dada por X   0  z / 2 / n .
Para la primera fila de la tabla, z / 2 / n  1,5 de donde deducimos que
z / 2  1,5 n /   1,5 10 / 2,5  1,8973 . Buscando en las tablas, (1,89)=0,97; es decir
/2=0,03. Luego = 0,06. También se puede hacer
48,5  50 X  50 51,5  50
  1  P(48,5  X  51,5 /   50)  1  P(   /   50) 
2,5 / 10 2,5 / 10 2,5 / 10
1   (1,897)   (1,897)  1  0,97  1  0,97  0,06
En la segunda fila z / 2  2 n /   2 10 / 2,5  2,529 ; (2,53)=0,99;
 = 2 x 0,01=0,02.
En la tercera fila z / 2  1,5 n /   1,5 16 / 2,5  2,4 ; (2,4)=0,99;
 =2 x 0,01=0,02.
En la cuarta fila z / 2  2 n /   2 16 / 2,5  3,2 ;
(3,2)=0,99931; =2 x 0,00069=0,00138.
Para calcular el error, este se define como la probabilidad de aceptar la hipótesis
nula para un valor de .
En la primera fila
48,5  52 X  52 51,5  52
  P(48,5  X  51,5 /   52)  P(   /   52) 
2,5 / 10 2,5 / 10 2,5 / 10
 (0,63)   (4,27)  1   (0,63)  1  0,7673  0,2327
48  52
En la segunda fila    (0)   ( )  1 / 2   (5,05)  1 / 2
2,5 / 10
En la tercera fila
51,5  52 48,5  52
  ( )  ( )   (0,8)   (5,6)  1  0,7881  0,2119
2,5 / 16 2,5 / 16
52  52 48  52
En la cuarta fila    ( )  ( )  1/ 2
2,5 / 16 2,5 / 16
Para la última columna  = 50,5.
En la primera fila
51,5  50,5 48,5  50,5
  ( )  ( )  (1,264)   (2,529)  0,8962  (1  0,9944)  0,89
2,5 / 10 2,5 / 10
En la segunda fila
52  50,5 48  50,5
  ( )  ( )   (1,897)   (3,16)  0,97062  (1  0,9992)  0,969
2,5 / 10 2,5 / 10
51,5  50,5 48,5  50,5
En la tercera fila    ( )  ( )   (1,6)   (3,2)  0,9452
2,5 / 16 2,5 / 16
52  50,5 48  50,5
En la cuarta fila    ( )  ( )   (2,4)   (4)  0,9918
2,5 / 16 2,5 / 16

15
Para poder dar un intervalo de confianza para la media, necesitaríamos la media
muestral y esta no se puede calcular con los datos suministrados.
Para  = 0,05 z / 2  1,96 , la región de aceptación es X  50  1,96 x 2,5 / n . Si la
potencia es mayor de 0,9, el error  es menor de 0,1
50  (4,9 / n )  52 50  (4,9 / n)  52
  ( )  ( )  0,1
2,5 / n 2,5 / n
Calculamos la distancia entre la hipótesis nula y  d  (52  50) / 2,5  0,8. Buscando
en las gráficas OC n está comprendido entre 15 y 30.
Si n = 15
50  (4,9 / 15 )  52 50  (4,9 / 15)  52
  ( )  ( )   (1,138)   (5,05)  1  0,87  0,13
2,5 / 15 2,5 / 15
Si n =16
50  (4,9 / 16 )  52 50  (4,9 / 16)  52
  ( )  ( )   (1,24)   (5,16)  1  0,8925  0,1075
2,5 / 16 2,5 / 16
Si n =17  =(-1,338)= 1- 0,908= 0,0092. Luego n =17.
5.- Se dispone de los siguientes datos que miden el porcentaje de algodón en un material
utilizado para la fabricación de camisas de caballero.
34,2 33,6 33,8 34,7 37,8 32,6 35,8 34,6
33,1 34,7 34,2 33,6 33,1 37,6 36,6 33,6
34,5 35 33,4 32,5 35,4 34,6 37,3 34,1
35,6 35,4 34,7 34,1 34,6 35,9 34,6 34,7
36,3 36,2 34,6 35,1 33,8 34,7 35,5 35,7
35,1 36,8 35,2 36,8 37,1 33,6 32,8 36,8
34,7 35,1 35 37,9 34 32,9 32,1 34,3
33,6 35,3 34,9 36,4 34,1 33,5 34,5 32,7
Estos datos se han procesado con el paquete Statgraphics, y obtenido los siguientes resultados.
variable: Porcentaje de algodón
64 valores desde 32,1 a 37,9
n = 62 Percentiles
Media = 34,7984 1,0% = 32,1
Mediana = 34,7 5,0% = 32,7
Moda = 34,7 10,0% = 33,1
Varianza = 1,86079 25,0% = 33,8
Desviación Standard = 1,36411 50,0% = 34,7
Mínimo 32,1 75,0% = 35,55
Máximo = 37,9 90,0% = 36,8
Rango = entre 32,1 y 37,9 95,0% = 37,3
Primer Cuartil = 33,8 99,0% = 37,9
Tercer Cuartil = 35,55
Rango InterCuartilico = 1,75
Coef. Asimetría = 1,21312
Coef. Apuntamiento = -0,442764

16
Tabla de distribución de frecuencias
-----------------------------------------------------------------------------------------------------------------------
Limite Limite Marca de Frecuencia Frecuencia Frecuencia
Clase Inferior Superior Clase Frecuencia Relativa Acumulada Rel. Acu.
-----------------------------------------------------------------------------------------------------------------------
Menor 32,0 0 0,0000 0 0,0000
1 32 33,0 32,5 6 0,0938 6 0,0938
2 33,0 34,0 33,5 12 0,1875 18 0,2813
3 34,0 35,0 34,5 22 0,3438 40 0,6250
4 35 36,0 35,5 12 0,1875 52 0,8125
5 36,0 37,0 36,5 7 0,1094 59 0,9219
6 37,0 38,0 37,5 5 0,0781 64 1,0000
mayor38,0 0 0,0000 64 1,0000
igual
-----------------------------------------------------------------------------------------------------------------------
Media = 34,7984 Desviación Standard = 1,36411
Diagrama de tallo-hojas: unidad = 0,1 1|2 representa 1,2
1 32|1
6 32|56789
9 33|114
17 33|56666688
24 34|0111223
(14) 34|55666667777779
26 35|001112344
17 35|56789
12 36|234
9 36|6888
5 37|13
3 37|689
Diagrama de cajas Histograma
24
20
Frecuencia

16

12
8
4
0
32 33 34 35 36 37 38
32 33 34 35 36 37 38
Porcentaje de algodón
porcentaje de algodón

Se pide.
a) Rellenar los huecos en los estadísticos resumen y en la tabla de frecuencias. (no hace falta hacer
ningún cálculo)
b) Explicar brevemente las salidas de texto y los gráficos

17
INGENIERIA QUIMICA: EXAMEN DE ESTADISTICA 11 de setiembre de 2000

1.- Para cada una de las siguientes variables, indicar si son cualitativas o cuantitativas
justificando la respuesta. (1 punto)
El resultado de lanzar una moneda al aire.
Cualitativa, dos posibles resultados cara y cruz
El número de calorías de una comida.
Cuantitativa, toma valores numéricos.
El partido votado en las últimas elecciones.
Cualitativa, toma los valores de los partidos presentados.
El tiempo de duración de una película de dibujos animados.
Cuantitativa.
La espera en el aeropuerto para un embarque.
Cuantitativa
La temperatura media a la que una reacción química tiene lugar.
Cuantitativa.
La concentración media de ozono en el aire.
Cuantitativa.
La proporción de desempleados.
Cuantitativa.
La nota media de los exámenes de estadística.
Cuantitativa.
El número de goles en un partido de fútbol.
Cuantitativa, discreta, toma solo valores naturales.

2.- Opina si las siguientes conclusiones son acertadas, justificando tu respuesta. (1 punto)
Un agente de la propiedad observa que el precio medio de las casas del centro de Valladolid
es de 30 millones y por tanto concluye que la mitad de las casa del centro cuestan menos de
30 millones.
Falso, está confundiendo la media con la mediana.
Un viajante calcula que el coste medio de los últimos 5 viajes ha sido de 20.000 pesetas y
concluye que el coste total es de 100.000 pesetas.
Verdadero, ya que coste medio = suma de todos los gastos/5.
El contable de una empresa piensa que se ha confundido ya que ha llegado a la conclusión
de que el 90% de los empleados gana menos que el salario medio.
No se ha confundido, ya que pocos valores muy altos de la variable hacen subir la
media.
Una vendedora de helados concluye que más de la mitad de helados vendidos son de
chocolate porque la moda cuando se elige entre 10 sabores diferentes es el sabor a chocolate.
Falso, está confundiendo moda con mediana, la conclusión sería verdadera si solo
hubiera dos gustos diferentes.

3.- En una factoría se producen piezas que se empaquetan en tres tipos diferentes de cajas
con 15 unidades cada una en proporción 1/2 , 1/3, 1/6. Las cajas de tipo I contienen 3 unidades
defectuosas, las de tipo II , 5 defectuosas y las de tipo III, 6 defectuosas. Se elige una caja al azar y
se extraen 3 unidades resultando una de ellas defectuosa y 2 buenas. ¿Qué tipo de caja tiene mayor
probabilidad de ser la elegida? (1.5 puntos).
Solución:
P (I)=1/2, P (II)=1/3, P (III)=1/6. I ={3D,12B}, II ={5D, 10B}, III ={6D,9B}

18
12  10  9
3.  5.  6. 
2 2 2
P (1B,2 D / I )     0,435, P(1B,2 D / II )     0,4945, P(1B,2 D / III )     0,4747,
15  15  15 
     
3 3 3
Por la regla de la probabilidad total P (1D,2B)= 0,435.1/2 + 0,4945.1/3 + 0,4747.
1/6=0,4615.
Por la regla de Bayes P( I / 1D,2B)  P(1D,2 B / I ) P( I )  0,4714
P (1D,2 B)
Análogamente P (II/1D,2B)=0,3571, P (III/1D,2B)=0,0571.
Luego la respuesta es la caja 1.

4.- Si se supone que el 4% de la población es zurda. Aproximar la probabilidad de que en


una clase de 71 estudiantes todos sean diestros. Aproximar la probabilidad de que haya al menos 2
zurdos. (1.5 puntos)
Solución:
Sean Xi variables de Bernoulli con parámetro p=0,04 . Sea X la variable que cuenta el
número de personas zurdas en 71, X sigue una distribución binomial de parámetros 71 y
0,04. En nuestro caso n.p=2,84. Por lo que la podemos aproximar por una variable de
Poisson de parámetro 2,84. Buscamos en las tablas la distribución de Poisson de parámetro
2,8 P(X=0)0.06, P(X2)=1-P(X1)1-0.231=0.769

5.- En un análisis de regresión se ha obtenido los siguientes resultados


Análisis de Regresión – Modelo lineal: Y = a + b*X
Variable Dependiente: Col_4
Variable Independiente: Col_3
Standard T
Parameter Estimate Error Statistic P-Value
Intercept -1967,37 259,597 -7,57857 0,0000
Slope 446,309 16,4418 27,1447 0,0000
----------------------------------------------------------------------------------------
Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 7,96197E7 1 7,96197E7 736,83 0,0000
Residual 1,29668E6 12 108057,0
----------------------------------------------------------------------------------------
Total (Corr.) 8,09164E7 13
Correlation Coefficient = 0,991955
R-squared = 98,3975 percent
Standard Error of Est. = 328,72
Hacer el contraste de regresión. Dar un intervalo de confianza para la ordenada en el origen
al 5%. (2 puntos).
Solución:
H 0 : 1  0
Contraste de regresión Para hacer este contraste se utiliza el estadístico
H1 : 1  0
ˆ1
T0  que bajo la hipótesis nula sigue una distribución T con 12 grados de libertad.
var(ˆ1 )
La región crítica al nivel 0,05 viene dada por T0>t0,025,12 =2,179. De las salidas del
ordenador sabemos que t =446,309/16,4418 =27,1447 que está en la región crítica, por

19
tanto rechazamos la hipótesis nula y llegamos a la conclusión de que existe relación lineal entre
las variables.
El intervalo de confianza para 0 viene dado por la fórmula ˆ0  t0,025,12 var( 0 ). Es decir
–1.967,372,179.259,597, dando como resultado. –2.533,0319  0  -1401,7081.

6.- Se han procesado las notas del examen y de prácticas de la asignatura de Estadística con
el paquete statgraphics, obteniéndose las siguientes salidas. Se pide explicar las salidas producidas
por el ordenador y las conclusiones a las que nos lleva el estudio estadístico. (3 puntos)
Solución:
De las tablas de distribución de frecuencias, se observa que la variable prácticas es más
homogénea, tiene menos variabilidad, los valores están concentrados entre el 5 ,5 y el 7,5,
mientras en las notas de junio están algo mas dispersa en torno a estos valores. También se
ve esta mayor dispersión en los cuartiles y el rango intercuartilico que es mayor en junio.
Mirando a los percentiles de las dos variables se podría decir que la nota de prácticas es más
alta que la de junio.
Frequency Tabulation for junio
Lower Upper Relative Cumulative Cum. Rel.
Class Limit Limit Midpoint Frequency Frequency Frequency Frequency
At or below 2,0 0 0,0000 0 0,0000
1 2,0 3,0 2,5 4 0,0870 4 0,0870
2 3,0 4,0 3,5 8 0,1739 12 0,2609
3 4,0 5,0 4,5 6 0,1304 18 0,3913
4 5,0 6,0 5,5 9 0,1957 27 0,5870
5 6,0 7,0 6,5 9 0,1957 36 0,7826
6 7,0 8,0 7,5 7 0,1522 43 0,9348
7 8,0 9,0 8,5 3 0,0652 46 1,0000
Above 9,0 0 0,0000 46 1,0000
Mean = 5,55217 Standard deviation = 1,70434

Frequency Tabulation for prácticas


Lower Upper Relative Cumulative Cum. Rel.
Class Limit Limit Midpoint Frequency Frequency Frequency Frequency
at or below 1,5 0 0,0000 0 0,0000
1 1,5 2,5 2,0 3 0,0652 3 0,0652
2 2,5 3,5 3,0 1 0,0217 4 0,0870
3 3,5 4,5 4,0 3 0,0652 7 0,1522
4 4,5 5,5 5,0 5 0,1087 12 0,2609
5 5,5 6,5 6,0 10 0,2174 22 0,4783
6 6,5 7,5 7,0 16 0,3478 38 0,8261
7 7,5 8,5 8, 0 5 0,1087 43 0,9348
8 8,5 9,5 9,0 3 0,0652 46 1,0000
above 9,5 0 0,0000 46 1,0000
Mean = 6,19565 Standard deviation = 1,73358

-One-Variable Analysis - junio One-Variable Analysis - practicas


Analysis Summary Analysis Summary

20
Data variable: junio Data variable: practicas
46 values ranging from 2,6 to 9,0 46 values ranging from 2,0 to 9,0
Summary Statistics for junio Summary Statistics for practicas
Count = 46 Count = 46
Average = 5,55217 Average = 6,19565
Median = 5,45 Median = 7,0
Variance = 2,90477 Variance = 3,00531
Standard deviation = 1,70434 Standard deviation = 1,73358
Minimum = 2,6 Minimum = 2,0
Maximum = 9,0 Maximum = 9,0
Range = 6,4 Range = 7,0
Lower quartile = 4,0 Lower quartile = 5,0
Upper quartile = 6,9 Upper quartile = 7,0
Interquartile range = 2,9 Interquartile range = 2,0
Stnd. skewness = -0,0150496 Stnd. skewness = -2,35487
Stnd. kurtosis = -1,29393 Stnd. kurtosis = 0,844995

Percentiles for junio Percentiles for practicas


1,0% = 2,6 1,0% = 2,0
5,0% = 2,8 5,0% = 2,0
10,0% = 3,1 10,0% = 4,0
25,0% = 4,0 25,0% = 5,0
50,0% = 5,45 50,0% = 7,0
75,0% = 6,9 75,0% = 7,0
90,0% = 7,8 90,0% = 8,0
95,0% = 8,3 95,0% = 9,0
99,0% = 9,0 99,0% = 9,0

Stem-and-Leaf Display for junio: unit = Stem-and-Leaf Display for practicas: unit
0,1 1|2 represents 1,2 = 0,1 1|2 represents 1,2
3 2|668
5 3|01 3 2|000
10 3|55699 4 3|0
13 4|002 7 4|000
17 4|5578 12 5|00000
23 5|033334 22 6|0000000000
23 5|589 (16) 7|0000000000000000
20 6|033 8 8|00000
17 6|555589 3 9|000
11 7|0123
7 7|568
4 8|033
1 8|
1 9|0

Confidence Intervals for junio


95,0% confidence interval for mean: 5,55217 +/- 0,506127 [5,04605; 6,0583]

21
95,0% confidence interval for standard deviation: [1,41364; 2,14665]

Confidence Intervals for practicas


95,0% confidence interval for mean: 6,19565 +/- 0,514812 [5,68084;6,71046]

95,0% confidence interval for standard deviation: [1,4379; 2,18349]


Aquí tenemos intervalos de confianza al 95% para las medias y las varianzas de las dos
variables. Para las medias, ambos intervalos se solapan, pero el de prácticas está mas a la
derecha, evidenciando que la nota de prácticas es más alta. Para la varianza los intervalos de
confianza son bastante similares con lo que la dispersión de las dos variables parece ser la
misma.

Box-and-Whisker Plot Histograma de practicas


16

12
frequency

0
0 2 4 6 8 10 1,5 2,5 3,5 4,5 5,5 6,5 7,5 8,5 9,5
practicas practicas

Box-and-Whisker Plot Histograma de junio


10

8
frequency

0
2,6 4,6 6,6 8,6 10,6 2 3 4 5 6 7 8 9
junio junio

Aquí tenemos un histograma y un diagrama de cajas para las dos variables. De los
histogramas no puede decirse que las dos variables sean normales, sobre todo la variable
prácticas. Esto ya se podía haber dicho con el coeficiente de asimetría que toma el valor –
2,35 evidenciando asimetría hacia la izquierda.
En los diagramas de cajas se ve el menor rango intercuartilico de la variable práctica y
también el mayor valor de la media y la mediana de esta variable, así como la falta de
simetría.

Two-Sample Comparison - junio & prácticas Comparison of Means

95,0% confidence bound for mean of junio: 5,55217 - 0,422026 [5,13015]

95,0% confidence bound for mean of prácticas: 6,19565 - 0,429268 [5,76638]

95,0% confidence bound for the difference between the means


Assuming equal variances: -0,643478 - 0,595717 [-1,23919]

t test to compare means


Null hypothesis: mean1 = mean2
Alt. hypothesis: mean1 > mean2
Assuming equal variances: t = -1,79521 P-value = 0,962012

22
Comparison of Standard Deviations
Junio prácticas
Standard deviation 1,70434 1,73358
Variance 2,90477 3,00531
Df 45 45
Ratio of Variances = 0,966546
95,0% Confidence Intervals
Standard deviation of junio: [1,41364;2,14665]
Standard deviation of prácticas: [1,4379;2,18349]

Ratio of Variances: [0,534811;1,7468]

F-test to Compare Standard Deviations


Null hypothesis: sigma1 = sigma2
Alt. hypothesis: sigma1 NE sigma2
F = 0,966546 P-value = 0,909639
Con estos procedimientos contrastamos lo que nos parece haber visto en los datos
mediante el estudio descriptivo. Primeramente calculamos un intervalo de confianza para la
diferencia de medias. Este intervalo depende de si las varianzas son iguales o distintas. El
procedimiento empleado es el suponer varianzas iguales, que después se verá que es la
hipótesis acertada. El intervalo de confianza es in intervalo superior dado por diferencia de
medias es mayor que –1,239, ya que la hipótesis que se contrasta a continuación es si la
media de junio es menor o igual que la media de practicas contra la alternativa de que es
mayor. El ordenador nos da el valor del estadístico T utilizado en el contraste para nuestras
muestras y el p valor. Como el p valor es muy grande, aceptamos la hipótesis nula a
cualquier nivel, es decir la nota media de junio es menor o igual que la nota media de
prácticas.
Finalmente se hace un contraste de varianzas, las salidas nos ofrecen un intervalo de
confianza para el cociente de varianzas y el valor del estadístico F para nuestra muestra y el
p-valor que también en este caso es muy grande y se acepta la hipótesis nula de que las
varianzas son iguales. Esta hipótesis ya la habíamos utilizado anteriormente.

23
INGENIERIA QUIMICA: EXAMEN DE ESTADISTICA 10 de febrero de 2001

1.- Para cada uno de los siguientes experimentos, indicar la distribución de la variable
resultante justificando la respuesta. (1 punto)
El resultado del lanzamiento de un dado.
Es una variable discreta que toma los valores 1,2,3,4,5 y 6 con probabilidad 1/6 cada
uno de ellos
Sacar una pieza de un lote y anotar si es buena o defectuosa.
Es una variable de Bernoulli que toma los valores 0 o 1 según que la pieza sea buena
defectuosa con probabilidades 1-p y p siendo p la proporción de piezas defectuosas.
El número de piezas defectuosas al inspeccionar 20 piezas de un lote grande
Es una variable que se puede aproximar por una binomial de parámetros 20 y
p, siendo p la proporción de piezas defectuosas.
La temperatura media nocturna de Valladolid en el mes de julio.
Es una variable continua cuya distribución se podrá aproximar por una normal

2.- En una encuesta se plantea la siguiente pregunta ¿Conoces a algún hombre que vaya a la
compra normalmente? Al procesarla se comprueba que el 90% de los preguntados responde que si,
y por lo tanto se concluye que el 90% de los hombres realiza la compra normalmente. (1punto)
A) Opina si la conclusión es acertada, justificando tu respuesta.
De la pregunta de la encuesta se concluye que el 90% de los encuestados conoce a
algún hombre que vaya a la compra (todos pueden conocer al mismo), por tanto la
conclusión es errónea.
B) Se presenta el resumen de los datos de la siguiente forma
Numero de encuestados = 10000 media = 0.9008
Desviación estándar = 0.298945
¿Es una presentación acertada?
La variable que se está estudiando es una variable cualitativa con respuestas si y no,
por tanto no tiene sentido calcular ni su media ni su desviación estándar. La
presentación de los datos no es acertada.

3.- Tres máquinas fabrican piezas en serie siendo sus producciones horarias de 5000, 6000 y
4000 piezas respectivamente. Las proporciones de defectuosas son 0.05, 0.08 y 0.01; De la
producción de un día se seleccionan dos piezas que resultaron buenas. Calcular la probabilidad de
que ambas procedan de la misma máquina (1 punto).
Se supone que el número de piezas de que disponemos es lo suficientemente grande como
para considerar que la selección de la primera pieza es independiente de la selección de la segunda.
Solución
Sean M1, M2 y M3 las tres máquinas.
P (M1)=5/15; P (M2)=6/15; P (M3)=4/15:
Al extraer dos piezas se pueden dar las siguientes elecciones de máquinas con probabilidad
P (M1, M1)= (5/15) x (5/15); P (M1, M2)= (5/15) x (6/15); P (M1, M3)= (5/15) x (4/15);
P (M2, M1)= (6/15) x (5/15); P (M2, M2)= (6/15) x (6/15); P (M2, M3)= (6/15) x (4/15);
P (M3, M1)= (4/15) x (5/15); P (M3, M2)= (4/15) x (6/15); P (M3, M3)= (4/15) x (4/15);
El resultado de la selección de las piezas depende de la elección de las máquinas.
Denotamos por B pieza buena
P (BB/M1, M1) = 0.95 x0.95; P (BB/M1, M2) = 0.95 x0.92; P (BB/M1, M3) = 0.95 x0.99;
P (BB/M2, M1) = 0.92 x0.95; P (BB/M2, M2) = 0.92 x0.92; P (BB/M2, M3) = 0.92x0.99;
P (BB/M3, M1) = 0.99 x0.95; P (BB/M3, M2) = 0.99 x0.92; P (BB/M3, M3) = 0.99 x0.99;

24
La probabilidad de que las dos piezas extraídas sean buenas viene dada por la suma
P(BB)= P(BB/M1,M1)x P(M1,M1)+ P(BB/M1,M21)x P(M1,M2)+ P(BB/M1,M3)x
P(M1,M3)+P(BB/M2,M1)x P(M2,M1)+ P(BB/M2,M2)x P(M2,M2)+ P(BB/M2,M3)x
P(M2,M3)+P(BB/M3,M1)x P(M3,M1)+ P(BB/M3,M2)x P(M3,M2)+ P(BB/M3,M3)x
P(M3,M3)=0.899966
La probabilidad de que las dos piezas sean de la misma máquina viene dada por
P (M1, M1/BB) +P (M2, M2/BB) +P (M3, M3/BB) =
=(P(BB/M1,M1)x P(M1,M1)+ P(BB/M2,M2)x P(M2,M2)+ P(BB/M2,M2)x
P(M2,M2))/P(BB)=0.33934

4.- Un auditor sospecha que el 25% de las facturas de una empresa son fraudulentas.
Dispone de un millón de facturas para inspeccionar. Calcular el número de facturas que debe
examinar para asegurarse que encontrará al menos una fraudulenta con una probabilidad mayor que
0.99. Justificar la aproximación realizada (1 punto)
Solución:
Si hay un millón de facturas 250.000 son fraudulentas y 750.000 correctas. Al examinar n
facturas, si llamamos X el nº de facturas fraudulentas
 750000 
 
 n 
P( X  1)  1  P( X  0)  1 
1000000 
 
 n 
Aproximamos la distribución de X por una binomial de parámetros n y 0.25
P ( X  0)  0.250 x0.75n  0.01
Tomando logaritmos n log 0.75  log 0.01 como ambos logaritmos son negativos
log 0.01
n  16.0078 . Por lo tanto debe examinar 17 facturas.
log 0.75

5.- Calcular los percentiles 5, 25, 50, 75 y 95 de una distribución BN (20, 0.05), para ello
disponemos de las salidas proporcionadas por el statgraphics (1 punto)
Parameters: Event prob. Successes
Dist. 1 0.05 20
Dist. 2 0.2 5

Distribución: Negativa Binomial


Lower Tail Area(<) Probability Mass (=) Upper Tail Area (>)
Variable Dist. 1 Dist. 2 Variable Dist. 1 Dist. 2 Variable Dist. 1 Dist. 2
269 0.0499782 1.0 269 0.00157882 1.75174E-21 269 0.948443 0.0
338 0.247116 1.0 338 0.00408192 9.05034E-28 338 0.748802 0.0
394 0.49991 1.0 394 0.00461729 6.27861E-33 394 0.495473 0.0
455 0.74921 1.0 455 0.00332881 1.37373E-38 455 0.247461 0.0
554 0.949908 1.0 554 0.000943347 7.71827E-48 554 0.049149 0.0
Solución:
Como es una distribución B (20,0.05) debemos utilizar los resultados calculados para la
distribución 1. Vamos a denotar por X la variable con esta distribución.
Si Percentil 5 = a por definición P( X  a)  0.05 ; P( X  a)  0.95
P ( X  269)  0.049978  0.001578  0.051556  0.05 P ( X  269)  0.948443  0.001578  0.950021  095
Por tanto el percentil 5 es 269.
El percentil 25 es 338 ya que

25
P ( X  338)  0247116  0.00408192  0.25 P ( X  338)  0.748802  0.00408192  0.75
El percentil 50 es 394 ya que
P ( X  394)  049991  0.0046172  0.5 P ( X  394)  0.495473  0.00461729  0.5
El percentil 75 es 455 ya que
P ( X  455)  0.74921  0.00332881  0.75 P ( X  455)  0.247461  0.00332881  0.25
El percentil 95 es 554 ya que
P ( X  554)  0.949908  0.000943347  0.95 P ( X  554)  0.049149  0.000943347  0.05

6.- En un análisis de regresión se han obtenido los siguientes resultados (2 puntos)


Regression Analysis - Linear model: Y = a + b*X
Dependent variable: accel
Independent variable: weight
Standard T
Parameter Estimate Error Statistic P-Value
------------------------------------------------------------------------------------
Intercept 16.7875 0.927477 0.0000
Slope -0.000191326 0.000338575 -0.565094 0.5728
-----------------------------------------------------------------------------------
Analysis of Variance
--------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
------------------------------------------------------------------------------------
Model 1 2.03717 0.5728
Residual 976.065 6.37951
---------------------------------------------------------------------------------------
Total (Corr.) 978.102 154
Correlation Coefficient = -0.0456375
R-squared =
Standard Error of Est. =
Rellenar los huecos que faltan : El valor del estadístico T para la ordenada en el origen, la
suma de los cuadrados del modelo, el valor del estadístico F, los grados de libertad de los
residuos, el valor de R2 y el valor del error estándar de estimación.
Solución:
T= 16.7875/0.927477=18.1001793
VT =VE + VNE; VE = VT- VNE =978.102-976.065=2.037
F =(VE/1)/(VNE/153)=2.037/6.37951=0.3193
Los residuos tienen 153 grados de libertad
R2= VE/VT =2.037/978.102=0.0020825
Error estándar de estimación VNE 153
 6.37951  2.525769

¿A la vista de los resultados, creéis que hay una relación lineal entre las dos variables
analizadas?
El p-valor para el contraste de hipótesis de la pendiente es 0.57, por lo tanto aceptamos la
hipótesis de que la pendiente es 0 y por tanto no existe relación lineal entre las variables. El
contraste F de regresión también da un p-valor de 0.57 como cabía esperar ya que ambos
contrastes son equivalentes. El coeficiente R2 da un valor muy pequeño, sólo el 0.2% de la
variación de los datos está explicado por la regresión. Definitivamente si existe alguna
relación entre estas dos variables, no es lineal.

26
Después de realizada la regresión se ha hecho un análisis descriptivo de los residuos,
obteniéndose
Summary Statistics for RESIDUALS Percentiles for RESIDUALS
Count = 155
Average = 8.49677E-8 1.0% = -4.97435
Variance = 6.33808 5.0% = -3.43123
Standard deviation = 2.51755 10.0% = -2.87294
Minimum = -4.99106 25.0% = -1.68098
Maximum = 8.62278 50.0% = -0.346094
Range = 13.6138 75.0% = 1.40754
Lower quartile = -1.68098 90.0% = 3.13286
Upper quartile = 1.40754 95.0% = 4.36781
Interquartile range = 3.08852 99.0% = 8.21998
Skewness = 0.780005
Kurtosis = 0.998636)

Histogram for RESIDUALS Box-and-Whisker Plot


50

40
frequency

30

20

10

0 -5 -2 1 4 7 10
-7 -4 -1 2 5 8 11
RESIDUALS
RESIDUALS

¿Qué se puede decir de los residuos?


De los valores muestrales presentados para los residuos, no puede decirse que se aparten
demasiado de las hipótesis de normalidad necesarias para la regresión. Son centrados. El
primer y tercer cuartil son casi simétricos y los coeficientes de asimetría y curtosis entran
dentro de los valores normales. Puede observarse en los percentiles que los superiores
(90,95 y 99) son superiores en módulo que sus correspondientes inferiores (10,5 y 1) por
tanto la distribución presenta asimetría a la derecha. Esta asimetría se observa en el
histograma aunque no muy marcada y en el diagrama de cajas se observan valores
anormalmente altos que pueden ser los que determinen esta asimetría.

7.- Se instala un nuevo dispositivo de filtrado en una unidad química. Antes de su


instalación una muestra aleatoria proporcionó la siguiente información acerca del porcentaje de
impurezas: tamaño muestral, 8; media muestral, 12.5; varianza muestral, 101.17. Después de la
instalación se tomó otra muestra obteniéndose: tamaño muestral, 9; media muestral, 10.2; varianza
muestral, 94.73. (3puntos)
a) ¿Se puede concluir que las dos varianzas son iguales?
H 0 : 1   2 S12
Se realiza el contraste El estadístico utilizado es que bajo la hipótesis nula se
H1 :  1   2 S 22
distribuye según una F con 7 y 8 grados de libertad. Buscando en las tablas
F0.025,7,8  4.53 F0.025,8,7  4.90

27
1 S2 S12
La región de aceptación es  12  4.53 es decir 0.20   4.53 . En nuestro caso
4.90 S 2 S22
S12
 1.06 que cae dentro de la región de aceptación, es decir aceptamos igualdad de varianzas.
S 22
b) Calcular la potencia del contraste cuando el cociente de varianzas es 2. Dato
F(2.2659) = 0.862761; F (0.1)=0.003265
S12
S12  12 2 2 2 2
P (2)  1   (2)  1  P (0.20   4.53 /  2)  1  P (0.20 22  12  4.53 22 / 12  2)  a
S22 2 2
1 S2 1  2
2
2
 12 S12
Si 2
2 sigue una distribución F con 7 y 8 grados de libertad, por tanto
2 2S22
S12
P (2)= 1  P(0.10   2.2659)  1  F (2.2659)  F (0.10)  1  0.86271  0.003265  0.140504
2 S22
c) ¿Que tamaño muestral nos asegura una potencia de 0.9 cuando el cociente de
varianzas es de 4?
Una potencia de 0.9 corresponde a un error de segunda clase 0.1 para una distancia entre la
hipótesis nula y la alternativa de 2, buscando en las curvas CO para un nivel 0.05
encontramos un tamaño maestral aproximado de 31 observaciones para las dos muestras
d) Dar un intervalo de confianza para la diferencia de medias
Asumiendo igualdad de varianzas la estimación de la varianza común es
(7x101.17+8 x 4.73)/15=97.735.La desviación estándar es 9.886
Buscando en las tablas t0.025,15  2.131 ; 2.131x9.886(1/7+1/8)=10.9032. El intervalo de
confianza al 95% para la diferencia de medias viene dado por (12.5-10.2)10.9032
1   2  8.6,13.2
e) Están los datos de acuerdo en que se ha reducido el porcentaje de impurezas al
colocar el filtro en al menos un 2%?
H 0 : 1   2  2
Hacemos el contraste Buscando en las tablas t0.05,15  1.753 ;
H1 : 1   2  2
La región de aceptación al nivel 0.05 es T >-1.753 , en nuestro caso
X Y  2 0.3
t   0.05 que está en la región de aceptación luego aceptamos la hipótesis de
1 1 5.116
s 
7 8
que se ha reducido el porcentaje de impurezas en al menos un 2%
f) Calcular la potencia del contraste cuando la diferencia de medias es de 0. F
(1,36)=0.898
P (0)=P (Rechazar la hipótesis/1=2)=
X Y  2 X Y 2
P(  1.753 / 1   2  0)  P (  1.753  / 1   2  0)
5.116 5.116 5.116

Si 1=2 entonces X  Y sigue una distribución T con 15 grados de libertad


5.116
X Y 2
P (0)= P(  1.753  )  P(T15  1.36)  1  P (T15  1.36)  1  0.898  0.102 )
5.116 5.116

28
INGENIERIA QUIMICA: EXAMEN DE ESTADISTICA.11 de setiembre de 2001

1.- Para cada uno de los siguientes experimentos, indicar la distribución de la variable
resultante justificando la respuesta. (1 punto)
- El resultado del lanzamiento de una moneda
- Sacar una pieza de un lote grande y anotar si es aceptable o no
- El número de piezas de piezas extraídas de un lote grande hasta sacar la primera
defectuosa, conociendo la proporción de defectuosas
- Las medidas de concentración de ozono en la calle Regalado de Valladolid

2.- Se han procesado unos datos y se han obtenido los resultados (1punto)
Clase Valor Frecuencia Frecuencia Frecuencia Frec.Relativa
Relativa Acumulada Acumulada
1 1.0 4 0.0741 0.0741
2 2.0 0.6111 37 0.6852
3 3.0 9 0.1667 0.8519
4 4.0 5 0.0926 51 0.9444
5 5.0 2 0.0370 53 0.9815
6 6.0 1 0.0185 1.0000
Rellena los huecos, explica que tipo de variable es y dibuja un diagrama de barras o un
histograma según corresponda.

3.- Tres máquinas fabrican piezas en serie siendo sus producciones horarias de 3000, 2000 y
1000 piezas respectivamente. Las proporciones de defectuosas son 0.01, 0.03 y 0.05; De la
producción de un día se selecciona dos piezas que resultan buenas. Calcular la probabilidad de que
ambas procedan de la misma máquina (1 punto).

4.- Un técnico de medio ambiente sospecha que el 5 % de las emisiones de gases


contaminantes de una empresa química sobrepasan el mínimo de lo permitido por la ley. Calcular el
número de muestras que debe tomar para asegurarse que encontrará al menos una con mayor
contaminación de la permitida con una probabilidad mayor que 0.99. Justificar la aproximación
realizada (1 punto).

5.- Calcular los percentiles 5, 25, 50, 75 y 95 de una distribución H (10, 15,35), para ello
disponemos de las salidas proporcionadas por el statgraphics (1 punto)
Distribution: Hypergeometric. Probability Mass (=)
Variable Dist. 1
0 0.0178713
1 0.103104
2 0.240576
3 0.297856
4 0.215689
5 0.094903
6 0.0255116
7 0.00410007
8 0.000372734
9 0.0000170532
10 2.9234E-7

29
6. - En un análisis de regresión se ha obtenido los siguientes resultados
Simple Regresión - Col_2 vs. Col_1
Regresión Análisis - Linear modelo: Y = a + b*X
Dependent variable: Col_2
Independent variable: Col_1
Standard T
Parameter Estimate Error Statistic P-Value
Intercept -0,966824 0,00484523 -199,541 0,0000
Slope 1,54376 0,00307363 502,259 0,0000
Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 1,96613 1 1,96613 252263,91 0,0000
Residual 0,0000623515 8 0,00000779394
Total (Corr.) 1,96619 9
Correlation Coefficient = 0,999984
R-squared = 99,9968 percent
Standard Error of Est. = 0,00279176
Explica las salidas suministradas por el programa. Dar un intervalo de confianza para la
pendiente al 5%. (2 puntos)

7.- Se instala un nuevo dispositivo de filtrado en una unidad química. Antes de su


instalación una muestra aleatoria proporcionó la siguiente información acerca del porcentaje de
impurezas: tamaño muestral, 9; media muestral, 10.2; varianza muestral, 94.73. Después de la
instalación se tomó otra muestra obteniéndose: tamaño muestral, 8; media muestral, 12.5; varianza
muestral, 94.73. (3puntos)
a) ¿Se puede concluir que las dos varianzas son iguales?
b) Calcular la potencia del contraste cuando el cociente de varianzas es 2.
c) ¿Que tamaño muestral nos asegura una potencia de 0.9 cuando el cociente de
varianzas es de 4?
d) Dar un intervalo de confianza para la diferencia de medias
e) ¿Están los datos de acuerdo en que el nuevo dispositivo de filtrado no reduce el
porcentaje de impurezas?
f) Calcular la potencia del contraste cuando la diferencia de medias es de -1.
Datos:
Distribution: F (variance ratio)
Variable Lower Tail Area (<) Probability Density Upper Tail Area (>)
0.2 0.0188324 0.273502 0.981168
0.44 0.136386 0.642464 0.863614
0.94 0.460826 0.558782 0.539174
4.55 0.96968 0.0171977 0.0303198
9.8 0.996528 0.00107239 0.00347171
Distribution: Student's t
Variable Lower Tail Area (<) Probability Density Upper Tail Area (>)
0.25 0.597011 0.379517 0.402989
0.44 0.666895 0.354097 0.333105
0.94 0.818945 0.248208 0.181055
4.55 0.999808 0.000380906 0.000191598
9.8 1.0 4.35082E-8 3.25702E-8

30
INGENIERÍA QUÍMICA: EXAMEN DE ESTADÍSTICA 6 DE SETIEMBRE DE 2002

1.-Tres laboratorios hacen análisis para una empresa de medio ambiente: Los datos que a
continuación se expresan reflejan la experiencia a largo plazo con estos laboratorios (2 puntos)
Proporción de análisis Proporción de entrega con
Laboratorio correspondientes retraso de más de un mes
1 .5 .3
2 .3 .4
3 .2 .2
La empresa descubre un análisis con más de un mes de retraso. Calcular la probabilidad de que
cada laboratorio sea el responsable del análisis.
2.- A continuación se presentan datos de viscosidad de un lote de cierto proceso químico.
13,3 14,9 15,8 16,0 14,5 13,7 13,7 14,9 15,3 15,2 15,1 13,6 15,3
14,5 13,4 15,3 14,3 15,3 14,1 14,3 14,8 15,6 14,8 15,6 15,2 15,8
14,3 16,1 14,5 13,3 14,3 13,9 14,6 14,1 16,4 15,2
a. Construir un diagrama de tallo- hojas para los datos de viscosidad. (0.5 punto)
b. Construir una tabla de distribución de frecuencias y dibujar el histograma correspondiente.
(1 punto)
c. Calcular los cuartiles primero, segundo y tercero y construir un diagrama de cajas. (0.5
puntos)
d. Suponiendo que todas las observaciones siguen una distribución normal con una varianza
común desconocida. Calcular un intervalo de confianza para la media al nivel 0.1. (1 punto)
e. Contrastar la siguiente hipótesis al nivel 0.05. (1 punto)
H0:  =15 H0:  =16
H1:  <15 H1:  ≠16
f. Calcular la región crítica y el p valor para ambos contrastes. (1 punto)

3.- Un lote de 2000 piezas presenta 50 defectuosas.


g. Calcular la probabilidad de que en una muestra aleatoria de tamaño 25 se encuentre al
menos una defectuosa. (0.5 puntos)
h. Calcular el tamaño muestral necesario para detectar tres o menos piezas defectuosas el 90%
de las veces. (0.5 puntos)
4.- Un ensamble está compuesto por 10 componentes colocados uno junto al otro. La longitud de
cada componente se distribuye normalmente con media 2 cm. y desviación típica 0.02 cm. Las
especificaciones requieren que todos los ensambles tengan una longitud entre 9.9 y 10.1 cm.
¿Cuántos ensambles verificarán estos requerimientos? (1 punto)
5.- Calcular los percentiles 5, 25, 50, 75 y 95 de una distribución H(10,15,35), para ello
disponemos de las salidas proporcionadas por el statgraphics (1 punto)
Distribution: Hypergeometric Probability Mass (=)
Variable Dist. 1 Variable Dist. 1 Variable Dist. 1
0 0.0178713 5 0.094903 10 2.9234E-7
1 0.103104 6 0.0255116
2 0.240576 7 0.00410007
3 0.297856 8 0.000372734
4 0.215689 9 0.0000170532

31
EXAMEN DE ESTADÍSTICA: 2º de Ingeniería Química 31 de Enero de 2003. Primera parte

1.- La tabla adjunta muestra los diámetros en centímetros de una muestra de 24 bolas de
cojinete manufacturados por una fábrica.
1.738 1.729 1.743 1.740 1.736 1.741 1.735 1.731 1.726 1.737 1.728 1.724 1.733 1.742
1.725 1.734 1.732 1.730 1.739 1.738 1.727 1.732 1.746 1.744
a. Calcular media, moda, mediana, rango, máximo, mínimo, desviación estándar, primer
cuartil, segundo cuartil, tercer cuartil, rango intercuartílico, percentil 5 y percentil 95
muestrales (0.5)
b. Hacer una tabla de distribución de frecuencias, un diagrama de tallo-hojas, un histograma y
un diagrama de cajas y comenta los gráficos.(1)
c. Hallar un intervalo de confianza al 95% para la media y otro para la varianza.(1)
d. Para el siguiente contraste de hipótesis
H0 :  = 1.725
H1 :  > 1.725
Calcular la región crítica, el p-valor (aproximado), la potencia en el punto 1.75. Calcular el
tamaño de muestra necesario para asegurarnos una potencia mayor de 0.99 en el punto 1.73.
(1.5)
e. Para el siguiente contraste de hipótesis
H0 :  = 0.005
H1 :  .0.005
Calcular la región crítica, el p-valor (aproximado), la potencia en el punto 0.004. Calcular el
tamaño de muestra necesario para asegurarnos una potencia mayor de 0.9 en el punto 0.004.
(1.5)
Solución:
n = 24 media = 1.73458 mediana = 1.7345 Moda = Hay dos 1.732; 1.738
Varianza = 0.0000402536 Desviación estándar = 0.00634457
Mínimo = 1.724 Máximo = 1.746 Rango = 0.022 Valores desde 1.724 a 1.746
Primer cuartil = 1.7295 (dato 6 + dato 7)/2 ordenados de menor a mayor
Tercer cuartil = 1.7395 (dato 18 + dato 19)/2 ordenados de menor a mayor
Rango intercuartílico = 0.01
percentil 5 = 1.725 dato 2 ordenados de menor a mayor
percentil 95 = 1.744 dato 23 ordenados de menor a mayor
Tabla de distribución de frecuencias

clase lim. Inf lim.Sup. Frec.Abs. Frec.Rel. Frec.Abs.Ac. Frec.Rel.Ac


menor 1.72 0 0 0. 0
1 1.72 1.725 1 0.041 1 0.041
2 1.725 1.73 5 0.208 6 0.25
3 1.73 1.735 6 0.25 12 0.5
4 1.735 1.74 6 0.25 18 0.75
5 1.74 1.745 5 0.208 23 0.58
6 1.745 1.75 1 0.041 24 1.
mayor 1.75 0 0. 24 1

32
6
5
frequency

4
3
2
1
0
1.72 1.725 1.73 1.735 1.74 1.745 1.75
histograma

Diagrama de cajas

1.723 1.728 1.733 1.738 1.743 1.748 1.753


diametro
Diagrama de tallo- hojas
1 172|4
6 172|56789
(6) 173|012234
(6) 173|567779
6 174|01234
1 174|6
Intervalo de confianza para la media. T23,0.025= 2.069
1.73458 +/- 0.00267908 [1.7319;1.73726]
Intervalo de confianza para la desviación estánda.r X223,0.025= 38.08 X223, 0.975= 11.69
[0.00493109;0.00889992]
Para la varianza [0.0000239;0.000078089]

33
Contraste para la media t23,0.05= 1.714
t0 = 7,776 Región crítica T0 > 1.714. Rechazamos la hipótesis nula
P- valor P (T23 > 7.776) < P (T23 > 3.767) = 0.0005
Potencia
P (1.75)=P (T23 > 1.714/ = 1.75)= P (T23 > -17.286) 1
Tamaño muestral
d = (1.73-1.725)/0.0063 = 0.79
(d) < 0.01 n comprendido entre 30 y 40
Si n =30 t29, 0.05 = 1.699
P (1.73)=P (T29 > 1.699/ = 1.73)= P (T29 > -2.65)
De las tablas P (T29 > 2.75) = 0.005 P (T29 > 2.462) = 0.01
P (T29 > - 2.75) = 0.995 P (T29 > - 2.462) = 0.99
0.99 < P (1.73) < 0.995 luego n=30

Contraste para la desviación estándar


X20  X223 X223,0.025 = 38.08 X223,0.975 = 11.69
Región de aceptación 11.69  X20  38.08
x20 = 36.514. Acepto la hipótesis nula, a pesar de que estamos muy cerca de la región crítica
P-valor P(X223 < 36.514)  0.05
P (0.004) = P (X20 > 38.08/ =0.004) + P (X20 < 11.69/ =0.004) = P(X223 > 59.5)+ P(X223 <
18.26)
De las tablas P(X223 > 14.85) = 0.90 P(X223 > 22.34) = 0.50
0.10 < P (0.004) <0.5
Tamaño muestral: d = 0.004/0.005 = 0.8
Curvas OC n >100
Si n=101 X2100,0.025 = 129.56 X2100,0.975 = 74.22
P (0.004) = P (X20 > 129.56/ =0.004) + P (X20 < 74.22)/ =0.004) = P(X223 > 202.437) +
P(X223 < 115.96) > 0.5
Utilizando el statgraphics se comprueba n=110

2.- Clasifica las siguientes variables como discretas, continuas o categóricas y da su posible
rango. (0.5)
a. Número de acciones vendidas en la bolsa de valores.
b. Temperatura media anual.
c. Vida media de los tubos de TV.
d. Ingresos anuales de un trabajador.
e. Longitud de tornillos producidos por una empresa.
f. Capacidad de un frigorífico.
g. Número de libros en la Biblioteca de la Facultad.
h. Suma de los puntos al lanzar 20 dados.
i. Diámetro de una pieza cilíndrica.
j. Países de Europa.

34
EXAMEN DE ESTADÍSTICA: 2º de Ingeniería Química 31 de Enero de 2003. Segunda parte

1.- Un muestreo de 200 votantes revela la siguiente información referente a tres candidatos
A, B, y C.
28 a favor de A y B;
98 a favor de A o B, pero no de C;
42 a favor de B, pero no A o C;
122 a favor de B o C pero no A;
64 a favor de C pero no A o B;
14 a favor de A y C pero no B.
Se pide número de votantes a favor de los tres candidatos. (0.75)

Solución:
P(ABC) = 8/200.
Número de votantes favorables a los tres candidatos 8

2.- Se lanza un dado 120 veces. (0.75)


a. Calcular la probabilidad de que salga el 4, 18 veces o menos.
b. Calcular la probabilidad de que salga el 4, 14 veces o más.

Solución:
Sea Xi =1 si el resultado del lanzamiento del dado i es 4 y 0 en caso contrario.
Xi es una variable de Bernoulli de parámetro p =1/6
120
Sea Y = X
i 1
i . La variable Y sigue una distribución B (200, 1/6) y cuenta el número de

veces que sale el 4 en 120 lanzamientos.


Esta variable la aproximamos por una normal de media 20 y desviación estándar 4.08
P (Y  18) = P (Z  -0.49) = 1- 0.6879 = 0.3121;
P (Y  14) = P (Z  -1.47) = 0.9292

3.- Tres joyeros idénticos tienen cada uno 2 cajones. En el primer joyero los dos cajones
tienen un reloj de oro, en el segundo un reloj de plata y en el tercer joyero un cajón tiene un reloj de
oro y el otro cajón un reloj de plata. Seleccionamos un joyero al azar, abrimos uno de los cajones y
observamos que contiene un reloj de plata.
Encontrar la probabilidad de que en el otro cajón haya un reloj de oro. (1)

Solución:
Sean I, II, y III los tres joyeros.
P (I) = P (II) = P (III) = 1/3
P (oro/I)=1 P (oro/II)=0 P (oro/III)=½ P (plata/I)=0 P (plata /II)=1 P (plata /III)=1/2
Hay que calcular P (III/plata).
Por la fórmula de Bayes
P( plata / III ) P( III )
= =1/3
P( plata / I ) P( I )  P( plata / II ) P( II )  P ( plata / III ) P( III )

4.- Sea Z una variable N (0,1). (0.75)

35
a. -Calcular P (Z  -1.64)
P (-1.96  Z  1.96)
P (  Z > 1)
b. -Hallar z1, z2, z3, z4, z5 en las siguientes ecuaciones:
P (Z > z1) = 0.2266
P (Z < z2) = 0.0314
P (-0.23 < Z < z3) = 0.5722
P (1.15 < Z < z4) = 0.0730
P (-z5 <Z < z5) = 0.9

Solución:
P( Z  -1.64) = P( Z  1.64) =0.949 P( -1.96  Z  1.96) =2 P(Z  1.96)-1 = 0.95
P(  Z > 1) = 2(1-P(Z  1)) = 0.3172
P (Z > z1) = 0.2266 P (Z  z1) = 0.7734 z1 = 0.75
P (Z < z2) = 0.0314 z2 ha de ser negativo P (Z  -z2) = 0.9686 - z2= 1.86 z2= -1.86
P (-0.23 < Z < z3) = P (Z < z3) – P (Z < -0.23) = P (Z < z3) – 0.41 =0.5722 . De donde
P (Z < z3) = 0.9822 z3 = 2.10
P (1.15 < Z < z4) = P (Z < z4) – P (Z < 1.15) = P (Z < z4) – 0.87493 = 0.0730. De donde
P (Z < z4) =0.94793 z4 = 1.62
P (-z5 <Z < z5) = 2 P (Z < z5) -1 = 0.9 P (Z < z5) = 0.95 z5 = 1.64

5.- En una muestra de tamaño 100, se ha obtenido una media muestral de 38,283 y una
desviación estándar muestral de 1.25. (0.75)
a. ¿Qué porcentaje de observaciones cae dentro del rango 38,283 2.5?
El 75% al menos por la desigualdad de Chebichev (1- (1/2)2)
b. ¿Qué porcentaje de observaciones cae dentro del rango 38,283 1.5?
Al menos el 30.55% ( 1- (1/1.2)2)

36
EXAMEN DE ESTADÍSTICA: 2º de Ingeniería Química 3 de setiembre de 2003.
Primera parte

1.- La tabla adjunta muestra los diámetros en milímetros de una muestra de 24 bolas de
cojinete manufacturados por una fábrica.

17.38 17.29 17.43 17.40 17.36 17.41 17.35 17.31 17.26 17.37 17.28 17.24
17.33 17.42 17.25 17.34 17.32 17.30 17.39 17.38 17.27 17.32 17.46 17.44

a) Calcular media, moda, mediana, rango, máximo, mínimo, desviación estándar,


primer cuartil, segundo cuartil, tercer cuartil, rango intercuartílico, percentil 5 y percentil 95
muestrales (0.5)
b) Hacer una tabla de distribución de frecuencias, un diagrama de tallo-hojas, un
histograma y un diagrama de cajas y comenta los gráficos.(1)
c) Hallar un intervalo de confianza al 95% para la media y otro para la varianza.(1)
d) Para el siguiente contraste de hipótesis
H0 :  = 17.25
H1 :  ≠ 17.25
Calcular la región crítica, el p-valor (aproximado), la potencia en el punto 17.5. Calcular el
tamaño de muestra necesario para asegurarnos una potencia mayor de 0.99 en el punto 17.3.
(1.5)
e) Para el siguiente contraste de hipótesis
H0 :  = 0.5
H1 :  < 0.5
Calcular la región crítica, el p-valor (aproximado), la potencia en el punto 0.4. Calcular el
tamaño de muestra necesario para asegurarnos una potencia mayor de 0.9 en el punto 0.4.
(1.5)

2.-Define: variable discreta, variable continua y variable categórica.


Clasifica las siguientes variables y da su posible rango. (0.5)
a) Número de acciones vendidas en la bolsa de valores.
b) Temperatura media anual.
c) Vida media de los tubos de TV.
d) Ingresos anuales de un trabajador.
e) Longitud de tornillos producidos por una empresa.
f) Capacidad de un frigorífico.
g) Número de libros en la Biblioteca de la Facultad.
h) Suma de los puntos al lanzar 20 dados.
i) Diámetro de una pieza cilíndrica.
j) Países de Europa.

37
EXAMEN DE ESTADÍSTICA: 2º de Ingeniería Química 3 de setiembre de 2003.
Segunda parte

1.- Un muestreo de 200 votantes revela la siguiente información referente a tres candidatos
A, B, y C.
28 a favor de A y B
98 a favor de A o B, pero no de C
42 a favor de B, pero no A o C
122 a favor de B o C pero no A
64 a favor de C pero no A o B
14 a favor de A y C pero no B
Se pide número de votantes a favor de los tres candidatos. (0.75)
Solución:
P(ABC) = 8/200
Número de votantes favorables a los tres candidatos 8

2.- Se lanza un dado 200 veces. (0.75)

a) Calcular la probabilidad de que salga el 1, 30 veces o menos.


b) Calcular la probabilidad de que salga el 6, 14 veces o más.

3.- Tres joyeros idénticos tienen cada uno 3 cajones. En el primer joyero dos cajones tienen
un reloj de oro cada uno, y el otro está vacío, en el segundo, dos cajones tienen un reloj de plata y el
tercer cajón vacío y en el tercer joyero un cajón tiene un reloj de oro otro cajón un reloj de plata y el
otro cajón está vacío. Seleccionamos un joyero al azar, abrimos uno de los cajones y observamos
que contiene un reloj de plata. Encontrar la probabilidad de que al abrir otro cajón encontremos un
reloj de oro. (1)

4.- Sea Z una variable N (0,1). (0.75)


b. Calcular
P (Z  -1.64) P (-1.96  Z  1.96) P (  Z > 1)
b.-Hallar z1, z2, z3, z4, z5 en las siguientes ecuaciones
P (Z > z1) = 0.2266 P (Z < z2) = 0.0314 P (-0.23 < Z < z3) = 0.5722
P (1.15 < Z < z4) = 0.0730 P (-z5 <Z < z5) = 0.9

5.- En una muestra de tamaño 100, se ha obtenido una media muestral de 38,283 y una
desviación estándar muestral de 1.25. (0.75)
c. ¿Qué porcentaje de observaciones cae dentro del rango 38,283 2.5?
d. ¿Qué porcentaje de observaciones cae dentro del rango 38,283 1.5?

38
Examen de Estadística: Segundo de Ingeniería Química: Primera parte 26 de enero de 2004.

1.- Se realiza un experimento para comparar las características de llenado del equipo de
embotellado de dos bodegas diferentes. Para ello se eligen al azar 20 botellas de cada bodega
obteniendo los resultados.
Bodega 1 Bodega 2
755 751 752 753 753 756 754 757 756 755
753 753 754 754 752 756 756 753 754 755
751 753 752 753 753 755 754 754 756 755
752 755 753 750 753 756 756 756 756 756
Suponiendo normalidad e igualdad de varianzas
a) Calcular un intervalo de confianza al 95% para la diferencia de medias (0.5 puntos)
b) ¿Apoyan los datos la afirmación de que ambas bodegas llenan las botellas con el mismo
volumen? Para responder a esta cuestión, plantear el contraste de hipótesis, calcular la
región crítica al nivel 0.05 y el p-valor de la prueba. (1 punto)
c) Calcular la potencia si la diferencia de medias fuera de 10cl. (0.5 puntos)
d) Construir un histograma, un diagrama de tallo-hojas y un diagrama de cajas para cada una
de las dos muestras e interpretar las gráficas. ¿Parece razonable la hipótesis de varianzas
iguales? (1 punto)
e) Contrastar la hipótesis de igualdad de varianzas (1 punto)
f) Con los datos de la bodega 1 contrastar la hipótesis de normalidad es decir
H0: Los datos provienen de una normal
H1: Los datos no provienen de una normal
Calcular el valor del estadístico 2 y el p-valor de la prueba (1punto)
Solución:
a) algunas medidas muestrales
bodega 1 bodega 2
n 20 20
Media 752,75 755,3
Mediana 753 756
Variance 1,56579 1,06316
Desviacion estandard 1,25132 1,0311
Mínimo 750 753
Máximo 755 757
Rango 5 4
Primer cuartil 752 754,5
Tercer cuartil 753 756
Rango intercuartilico 1,0 1,5
Intervalo de confianza para la diferencia de medias asumiendo normalidad y varianzas
iguales y desconocidas
1 1 1 1
( X 1  X 2 )  t Sp   1   2  ( X 1  X 2 )  t  Sp 
2
, n1  n2  2 n1 n2 2
,n  n  2
1 2 n1 n 2

2 ( n 1  1) S 12  ( n 2  1) S 22 = 1,3144
con S p  Sp= 1,1465
n1  n 2  2
t0,025,40 = 2,021 t0,025,30 = 2,042 aproximo por el más próximo, la diferencia no es muy
grande
t0.025,38 ≈ t0,025,40 = 2,021

39
Intervalo : -2,55 +/- 0,7326 [-3,283,-1,817] -3,283 ≤ μ1 - μ2 ≤-1,817
b) Test para comparar las medias
Ho: μ1 = μ2
H1: μ1 ≠ μ2
X1  X 2
El estadístico usado para el contraste es T0 
1 1
sp 
n1 n 2
Región crítica : |T0|>tn1+n2-2,/2 |T0|> 2,021
Para nuestros datos t0 = -7,0334 que cae dentro de la región crítica, es decir rechazamos la
hipótesis de igualdad de medias.
P-valor < 0,001 ya que éste viene expresado
P(|T38| > 7,0334) = 2 x P(T38 > 7,0334) ≈ 2 x P(T40 > 7,0334) < 2 x P(T40 > 3,551) = 2 x
0,0005 = 0,001
Este p-valor tan pequeño nos asegura de nuevo que los datos no están de acuerdo con la
hipòtesis nula de igualdad en el volumen de llenado.
Si miramos al intervalo de confianza calculado para la diferencia de medias, vemos que el 0
no está en este intervalo, lo que es otro punto que refuerza el rechazo de la hipótesis nula.
c) Potencia en el punto 10
P(10) = P(rechazar H0 / μ1-μ2 = 10) = P(|T0| >2,021/ μ1-μ2 = 10) =
X1  X 2 X1  X 2
P( > 2,021 / μ1-μ2 = 10) + P( < -2,021 / μ1-μ2 = 10) =
1 1 1 1
sp  sp 
n1 n2 n1 n2
X 1  X 2  10 10
P( > 2,021 - / μ1-μ2 = 10) +
0,3625 0,3625
X 1  X 2  10 10
P( < -2,021 - / μ1-μ2 = 10) = P(T38 > -25,56) + P( T38 < -29,60) ≈ 1
0,3625 0,3625

d) Diagramas de tallo-hojas
Bodega 1 Bodega2
1 750|0 1 753|0
3 751|00 5 754|0000
7 752|0000 9 755|0000
(9) 753|000000000 (10) 756|0000000000
4 754|00 1 757|0
2 755|00
Tratamos los datos como contínuos, por eso dibujamos un histograma en vez de un
diagrama de barras ya que las medidas estan dadas en ml.
Los cuartiles para el diagrama de cajas ya estan halladas, vamos a calcular los límites
superior e inferior
Bodega 1 Bodega 2
Q1 – 1,5 x RI = 752 – 1,5 = 750,5 Q1 – 1,5 x RI = 754,5 – 1,5 x 1,5 = 752,25
Q3 + 1,5 x RI = 753 + 1,5 = 754,5 Q3 + 1,5 x RI = 756 + 1,5 x 1,5 = 758,25
LI = 750,5 LS = 754,5 LI = 753 LS = 758

40
Histograma Histograma
10 10

8 8
frecuencia

frecuencia
6 6

4 4

2 2
0 0
749 750 751 752 753 754 755 752 753 754 755 756 757
bodega 1 bodega 2

diagrama de cajas diagrama de cajas

750 751 752 753 754 755 753 754 755 756 757

bodega 1 bodega 2

diagrama de cajas bodega 1


10

6
frecuencia

bodega 1
2

bodega 2 6

10
750 752 754 756 758 749 751 753 755 757
bodega 2

Mirando el histograma, los datos de la bodega 1 parecen más dispersos, tienen mayor
varianza y mayor rango; pero si nos fijamos en el diagrama de cajas, el rango de la bodega 1
es menor ya que la caja es bastante más estrecha y presenta 3 datos extremos que quizá sean
los que aumentan su varianza. Ambas variables presentan asimetría a la izquierda, más
marcada en la bodega 2. Por tanto a la vista de los gráficos la hipótesis de varianzas iguales
debería ser contrastada.
e) Comparación de las Varianzas
H0: σ1 = σ2
H1: σ1 ≠ σ2
Se utiliza el estadístico
S12 que bajo H0 tiene una distribución F (n1-1,n2-1)
F0  2
S2
Región crítica {F0>fn1-1,n2-1,/2 }{F0<fn1-1,n2-1,1-/2}
f0,025, 20, 19 = 2,51 f0,025, 15, 19 = 2,62
f0,975, 19, 20 = 1/2,51= 0,398 f0,975, 19, 15 = 1/2,62=0,38
Región crítica {F0 > 2,51 }{F0 < 0,38}
Para nuestros datos f0 = 1,47 que no cae dentro de la región crítica, es decir acepto la
hipótesis nula de igualdad de varianzas.
f) Para hacer el contraste necesitamos una tabla de distribución de frecuencias con la
frecuencia observada y la frecuencia esperada

41
Si suponemos que el volumen de llenado sigue una distribución normal, estimamos su
media y su desviación típica por los valores muestrales, es decir V→ N( 752,75 , 1,2196)
P(X ≤ 750) = P(Z ≤ (750-752,75)/1,2196) = Φ(-2,25) = 1–0,987 = 0,013
0,013 x 20 = 0,26
P(750 < X ≤ 751)=Φ(-1,43)-Φ(-2,25)=0,077–0,013=0,064 0,064 x 20 = 1,28
P(751 < X ≤ 752)=Φ(-0,61)-Φ(-1,43)=0,271–0,077=0,194 0,194 x 20 = 3,98
P(752 < X ≤ 753)=Φ(0,20)-Φ(-0,61)=0,579–0,271=0,308 0,308 x 20 = 6,16
P(753 < X ≤ 754)=Φ(1,02)-Φ(0,20)=0,846–0,579=0,267 0,267 x 20 = 5,34
P(X > 754)=1-Φ(1,02)=1–0,846=0,154 0,154 x 20 = 3,08
Clase Oi Ei (Oi – Ei)2/Ei
X≤170 1 0,26 2,106
750 < X ≤ 751 2 1,28 0,405
751 < X ≤ 752 4 3,98 0,0001
752 < X ≤ 753 9 6,16 1,309
753 < X ≤ 754 2 5,34 2,089
X > 754 2 3,08 0,378
6,287
20 sigue una distribucion chi- cuadrado con 3 (6-2-1) grados de libertad.
x20 = 6,287
P-valor P(23 > 6,287) 0,05 < p-valor < 0,1
Ya que de las tablas obtenemos P(23 > 7,81) = 0,05 P(23 > 6,25) = 0,1
Aceptariamos la hipótesis al nivel 0,05, aunque el valor del estadístico 20 está próximo a la
región de rechazo.

2.- Resolver las ecuaciones (0.5 puntos)


a) P(25 ≤ x) = 0,95 b) P(12,549 ≤ 210 ≤ y) = 0,20 c) P(T15 ≤ z) = 0,01
d) P(T8 > t) = 0.9 e) P( 1,476 ≤ T5 ≤ u) = 0,075 f) P( F10,20 ≤ 2,42) = v
Solución
a) P(25≤ x) = 0,95 P(25 > x) = 0,05 x = 11,07
b) P(12,549 ≤ 210 ≤ y) = P(210 ≤ y) - P(210 ≤ 12,549) = 0,20
P(210 >15,99) = 0,1 P(210 > 9,34 ) =0,5 0,5 < P(210 ≤ 12,549) < 0,9
0,7 < P(210 ≤ y) < 1 P(210 > y) < 0,3 y > 15,99
c) P(T15 ≤ z) = 0,01 z ha de ser negativo P(T15 > -z ) = 0,01 -z = 2,602 z = -2,602
d) P(T8 > t) = 0.9 t ha de ser negativo P(T8 > -t ) = 0,1 -t = 1,397 t = -1,398
e) P( 1,476 ≤ T5 ≤ u) = P(T5 ≤ u) - P(T5 ≤ 1,476) = 0,075
P(T5 > 1,476) = 0,1 P(T5 ≤ u) = 0,975 P(T5 > u) =0,025 u= 2,57
f) P( F10,20 ≤ 2,42)
P( F10,20 > 2,77) = 0,025 P( F10,20 > 2,35) = 0,05 0,025 < P( F10,20 > 2,42) < 0,05
0,95 ≤ P( F10,20 ≤ 2,42) ≤ 0,975
3.- Contesta lo más brevemente posible a las siguientes preguntas (1punto)
a) Define variable aleatoria discreta
b) Da la fórmula de la probabilidad total
c) Teorema de Bayes
d) Diferencia entre histograma y diagrama de barras y sus usos
e) Teorema Central del Límite (aproximación a la normal)

42
Examen de Estadística: Segundo de Ingeniería Química: Segunda parte 26 de enero de 2004.

1.- Dado que no todos los pasajeros de una aerolínea abordan el vuelo para el que han
reservado, la compañía aérea vende 125 billetes para un vuelo de 100 pasajeros. Si la probabilidad
de que un pasajero no aborde el vuelo es de 0,05 y los pasajeros se comportan de forma
independiente unos de otros. Calcular o aproximar (1punto)
a) P (todos los pasajeros aborden el vuelo)
b) P (un vuelo parta vacío)
c) P (100 < nº de pasajeros ≤ 125)
d) P ( nº de pasajeros ≤ 100)

Solución:
Sea X el nº de pasajeros que abordan el vuelo. X → B (125, 0,95)
- P(X = 125) = (0,95)125 = 0,00164
- P(X = 0) = (0,05)125 = 2,35. 10-63 ≈ 0
- X puede ser aproximada por una distribución normal de media 125x0,95 = 118,75 y
varianza 125x0,95x0,05 = 5,9375; desviación estándar 2,437.
100  118,75 125  118,75 
P(100 < X ≤ 125) ≈ P  Z = Φ(2,5649)-Φ(-7,695) ≈
 2,437 2,437 
0,99484
- P(X ≤ 100) ≈ P(Z ≤ -7,695) ≈ 0.

2.- Se lanza un dado n veces. Sea p̂ = (1/n) x( nº de veces que ha salido el 1). (0.75 puntos)
a) Calcula la distribución de p̂ .
 1 
b) ¿Cuantas veces debemos lanzar el dado para P pˆ   0,05   0.95 ?
 6 
Solución:
- p̂ es el estimador de una proporción y su distribución puede ser aproximada por una
normal de media 1/6 y varianza nx(1/6)x(5/6)
 1     
 pˆ      
 1   6 0,05   0,05   0,05 
- P p̂   0,05  = P  = P Z  =2Φ -1 > 0,95.
 6   5 5   5   5 
     
 36n 36n   36n   36n 
   
   
 0,05   0,05 
Despejando Φ > 0,975 . Buscando en las tablas = 1,96
 5   5 
   
 36n   36n 
Resolviendo n = 213,42 y redondeando obtenemos n = 214

3.- El espesor de la película fotoprotectora en un proceso de fabricación de semiconductores


tiene una media de 10 micrómetros y una desviación estándar de 1 micrómetro. Acotar la
probabilidad de que el espesor sea menor que 6 o mayor que 14. (0.75 puntos)
Solución:

43
E  6
Llamemos E a la variable espesor P(E <6) + P(E>14) = P   +
   
 E   14     E 
P   = P  4  = P ( E    4 ) ≤1/16 = 0,0625. Para la cota
      
hemos utilizado la desigualdad de Chebychev con k = 4.

4.- Los clientes se encargan de evaluar los diseños preliminares de varios productos. Se sabe
que de los productos con éxito en el mercado el 95% recibió buenas evaluaciones, de los productos
con éxito moderado el 60% recibió buenas evaluaciones y de los productos con escaso éxito el 10%
recibió buena evaluación. Además el 40% de los productos han tenido éxito, el 35% éxito
moderado y el 25% baja aceptación. (1punto)
a) Calcular la probabilidad de que un producto obtenga buena evaluación.
b) Si un nuevo diseño de un producto recibe buena evaluación. ¿Cual es la probabilidad de
que el producto alcance éxito en el mercado?
Solución:
Definimos los sucesos
B – Recibir buena evaluación
E – Producto con éxito.
M – Producto con éxito moderado.
F – Producto con escaso éxito.
Los datos suministrados son: P(E) = 0,4 P(M) = 0,35 P(F) = 0,25
P(B/E) = 0,95 P(B/M) = 0,60 P(B/F) = 0,10
- P(B) = P(B/E) P(E) + P(B/M) P(M) + P(B/F) P(F) = 0,615 Regla de la probabilidad total
- P(E/B) = P(B/E) P(E)/ P(B) = 0,618 Fórmula de Bayes.

44
Examen de Estadística Segundo de Ingeniería Química:
Primera parte 13 de setiembre de 2004.
1.- Dada la siguiente tabla, que es una salida proporcionada por statgraphics. Se pide dar una
explicación de toda la información suministrada por esta tabla. (0.5 punto)
Goodness-of-Fit Tests for Col_9

Chi-Square Test
----------------------------------------------------------------------------
Lower Upper Observed Expected
Limit Limit Frequency Frequency Chi-Square
----------------------------------------------------------------------------
at or below 162,167 8 8,37 0,02
162,167 167,013 11 8,37 0,82
167,013 170,636 13 8,37 2,55
170,636 173,881 2 8,38 4,85
173,881 177,125 11 8,38 0,82
177,125 180,749 8 8,37 0,02
180,749 185,594 7 8,37 0,23
above 185,594 7 8,37 0,23
----------------------------------------------------------------------------
Chi-Square = 9,53741 with 5 d.f. P-Value = 0,0894551

2.- Para controlar el volumen de llenado de una planta embotelladora se toma una muestra
aleatoria de tamaño 20 obteniendose las siguientes medidas en ml
750 746 747 748 748 748 748 749 749 747 746 747 747 748 748
747 750 748 745 748
Suponiendo normalidad
g) Calcular un intervalo de confianza al 95% para la media (0.5 puntos)
h) ¿Apoyan los datos la afirmación de que el volumen medio de llenado es de 750 ml? Para
responder a esta cuestión, plantear el contraste de hipótesis, calcular la región crítica al nivel
0.05 y el p-valor de la prueba. (1 punto)
i) Calcular la potencia si el volumen medio de llenado fuera de 745ml. (0.5 puntos)
j) Construir un histograma, un diagrama de tallo-hojas y un diagrama de cajas para la muestra
e interpretar las gráficas. ¿Parece razonable la hipótesis de normalidad? (1 punto)
k) Contrastar la hipótesis de varianza 1 frente a la alternativa <1 y calcular la potencia para la
varianza 1,4 (1 punto)
l) Contrastar la hipótesis de normalidad. Calcular el valor del estadístico 2 y el p-valor de la
prueba (0.5 punto)

3.- Resolver las ecuaciones (0.5 puntos)


a) P(210 ≤ x) = 0,95 b) P(2,16 ≤ 210 ≤ y) = 0,20 c) P(T15 ≤ z) = 0,9
d) P(T8 > t) = 0.5 e) P( 2,015 ≤ T5 ≤ u) = 0,025 f) P( F10,20 ≤ 1,42) = v

4.- Contesta lo más brevemente posible a las siguientes preguntas (1punto)


a) Clasifica las variables aleatorias
b) Da la fórmula de Bayes
c) Probabilidad a posteriori y Teorema de Bayes
d) Diagrama de tallo-hojas
e) Aproximaciones de la distribución binomial

45
Examen de Estadística.Segundo de Ingeniería Química.
Segunda parte 13 de setiembre de 2004.

1.- El tiempo de duración de un ensamble mecánico en una prueba de vibración tiene una
distribución exponencial con media 400 horas. (1.5 punto)
a) ¿ Cual es la probabilidad de que el ensamble falle en la prueba antes de 100 horas ?
b) Si el ensamble lleva probandose 400 horas sin que haya fallado ¿Cuál es la
probabilidad de que falle en las proximas 100 horas ?
c) Si se prueban 100 ensambles ¿ Cual es la probabilidad de que falle al menos uno de
ellos en menos de 100 horas? ¿Aproxima la probabilidad de que fallen 5 o menos

2.- La alineación entre la cinta mágnetica y el cabezal de un sistema de almacenamiento de


datos afecta a la lectura de los mismos. Si el 10% de las operaciones de lectura se ven afectadas por
una alineación oblicua, el 5% por alineación descentrada y las demás lecturas se efectúan
correctamente. La probabilidad de un error de lectura por alinezción oblicua es 0,01, por alinezción
descentrada 0,02 y 0,001 cuando la alineación es correcta. (1punto)
a) Probabilidad de un error de lectura
b) Dado que ha habido un error de lectura. Calcular la probabilidad de que este sea debido
a una alineación oblícua.

3.- En una muestra de tamaño 25, se ha obtenido una media muestral de 3,5 y una
desviación estándar muestral de 1.25. (1punto)
e. ¿Qué porcentaje mínimo de observaciones cae dentro del intervalo [1, 6]?
f. ¿Qué porcentaje mínimo de observaciones cae dentro del intervalo [-0,25, 7,25]?

46
Examen de Estadística: Segundo de Ingeniería Química: Primera parte
18 de febrero de 2005.

1.- Se han obtenido los siguientes datos del rendimiento de dos catalizadores
Catalizador I: 91.5 94.18 92.18 95.39 91.79 89.07 94.72 89.21
Catalizador II: 89.19 90.95 90.46 93.21 97.19 97.04 91.07 92.75
a) Hacer un diagrama de tallo-hojas para los datos de cada catalizador (0.5 puntos)
b) Calcular los percentiles 5, 15, 25, 50, 75, 85 y 95 de cada catalizador y hacer algún comentario
comparando los rendimientos. (0.5 puntos)
c) Realizar una tabla de distribución de frecuencias y un histograma de los rendimientos de cada
catalizador en la misma gráfica. (0.5 puntos)
d) Hacer los diagramas de cajas de los dos rendimientos en la misma gráfica y comentar los
gráficos. (0.5 puntos)
e) Calcular un intervalo de confianza para el cociente de varianzas
Realizar el contraste H0: σ1 = σ2 mediante el cálculo de la región crítica y el p-valor.
H1: σ1σ2
Calcular la potencia en el punto 0.5 (1 punto)
f) Calcular un intervalo de confianza para la diferencia de medias.
Realizar el contraste H0: 1 = 2 mediante el cálculo de la región crítica y el p-valor.
H1: 1< 2
Calcular la potencia en el punto -0.5 (1 punto)
Solución:
Diagrama de tallo-hojas

Catalizador I Catalizador II
2 89|02 1 89|1
2 90| 3 90|49
4 91|57 4 91|0
4 92|1 4 92|7
3 93| 3 93|2
3 94|17 2 94|
1 95|3 2 95|
2 96|
2 97|01
Percentiles
Catalizador I Catalizador II

5,0% = 89,07 dato 1 5,0% = 89,19


15,0% = 89,21 dato 2 15,0% = 90,46
25,0% = 90,355 (dato2+dato3)/2 25,0% = 90,705
50,0% = 91,985 (dato4+dato5)/2 50,0% = 91,91
75,0% = 94,45 (dato6+dato7)/2 75,0% = 95,125
85,0% = 94,72 dato 7 85,0% = 97,04
95,0% = 95,39 dato 8 95,0% = 97,19

Los percentiles del segundo catalizador, están por encima de los percentiles del primero,
indicando que quizá el rendimiento sea mayor; pero la mediana es mayor en el catalizador I. Los
percentiles no son simétricos respecto de la mediana en ninguno de los dos catalizadores, la
asimetría está más marcada en el segundo catalizador.

47
Tabla de distribución de frecuencias
Catalizador I
--------------------------------------------------------------------------------
Límite Límite Frecuencia Frecuencia Frecuencia
Clase Inferior Superior Marca Frecuencia Relativa Acumulada Rel. Acu.
--------------------------------------------------------------------------------
Menor o igual 89,0 0 0,0000 0 0,0000
1 89,0 92,0 90,5 4 0,5000 4 0,5000
2 92,0 95,0 93,5 3 0,3750 7 0,8750
3 95,0 98,0 96,5 1 0,1250 8 1,0000
Mayor 98,0 0 0,0000 8 1,0000
--------------------------------------------------------------------------------
Media = 92,255 Desviación estándar = 2,38502

Catalizador II
--------------------------------------------------------------------------------
Límite Límite Frecuencia Frecuencia Frecuencia
Clase Inferior Superior Marca Frecuencia Relativa Acumulada Rel. Acu.
--------------------------------------------------------------------------------
Menor o igual 89,0 0 0,0000 0 0,0000
1 89,0 92,0 90,5 4 0,5000 4 0,5000
2 92,0 95,0 93,5 2 0,2500 6 0,7500
3 95,0 98,0 96,5 2 0,2500 8 1,0000
Mayor 98,0 0 0,0000 8 1,0000
--------------------------------------------------------------------------------
Media = 92,7325 Desviación estándar = 2,98345

Histograma

catalizador I
4

2
Frecuencia

4
89 91 93 95 97 99
catalizador II

Diagrama de cajas:
Catalizador I Catalizador II
RI= 94.45 – 90.35 = 4.10 RI= 95.125 – 90.70 = 4.425
Q1 – 4.10 x1.5 = 84,2 Q1 – 4.425 x1.5 = 84,06
Q3 + 4.10 x1.5 = 100.65 Q3 + 4.425 x1.5 = 101.76
LI = 89,07 LI = 89,18
LS= 95.39 LS= 97.19

48
Diagrama de cajas

Catalizador I

Catalizador II

89 91 93 95 97 99

Las medianas son similares en los dos catalizadores. Ambos catalizadores presentan asimetría a la
derecha. El catalizador II presenta mayor dispersión y mayor asimetría hacia la derecha.
Cociente de varianzas:
Intervalo de confianza
Catalizador I Catalizador II
------------------------------------------------------------
n 8 8
Media 92,255 92,7325
Mediana 91,985 91,91
Varianza 5,68831 8,90099
Desviación Estándar 2,38502 2,98345
Mínimo 89,07 89,19
Máximo 95,39 97,19
Rango 6,32 8,0
Primer Cuartil 90,355 90,705
Tercer Cuartil 94,45 95,125
Rango Intercuartílico 4,095 4,42
------------------------------------------------------------
Radio de varianzas = 0,639065 f0.025,7,7 = 4.99 f0.975,7,7 = 0.2
Intervalo de confianza [0,127943; 3,19207]
Contraste de hipótesis:
Región crítica {F0< 0.2 } Ụ {F0 >4.99 } f0 = 0.63 no está en la región crítica aceptamos igualdad de
varianzas.
P-valor P(F7,7 >0.63)
De las tablas P(F7,7 >1,7) = 0.25 P(F7,7 >0,58) = 0.75
0.25 < p-valor < 0.75 Apoya nuestra decisión de aceptar la hipótesis nula.
Null hypothesis: sigma1 = sigma2
Alt. hypothesis: sigma1 NE sigma2
F = 0,639065 P-value = 0,569131
Potencia
P(0.5) = P(RC/(σ1/ σ2) = 0.5) = P (F0 < 0.2 /(σ1/ σ2) = 0.5) + P (F0 > 4.99 /(σ1/ σ2) = 0.5) = P(F7,7 <
0.2/0.25) + P(F7,7 > 4.99/0.25) = P(F7,7 < 0.8) +P(F7,7 >19.96)
De las tablas P(F7,7 > 6,99) = 0.01 P(F7,7 > 19,96) < 0.01
P(F7,7 > 1,7) = 0.25 luego P(F7,7 > 1/1,7) = 0,75 P(F7,7 > 0,58) = 0,75
P(F7,7 < 0,58) = 0.25 De donde P(F7,7 < 0.8) > P(F7,7 < 0,58) = 0.25
P(0,5) > 0,25

49
Diferencia de medias: - 0.4775 t14,0.025 = 1,746
Intervalo de confianza asumiendo varianzas iguales S p = 2.67
-0,4775 +/- 2,89639
[-3,37389,2,41889]
Contraste de hipótesis
Región crítica {T0 <-1.746} t0 = - 0.23 no está en la región crítica luego que la primera media es
mayor o igual que la segunda
p-valor P(T14 < -0.23) = P(T14 > 0.23) > P(T14 >0.25) = 0.4

t test to compare means


Null hypothesis: mean1 = mean2
Alt. hypothesis: mean1 NE mean2
assuming equal variances: t = -0,353591 P-value = 0,728914
Potencia (-0.5) = P(T0 < -1,746/μ1 – μ2 = -0.5) = P(T14 < -1.746 + 0.5/1.89) =
P(T14 < -1.48) = P(T14 > 1.48)
P(T14 > 1.34) = 0.1
P(T14 >.1.76) = 0.05
0.05 < P(-0.5) < 0.1

2.- En un proceso de fabricación de semiconductores ciertos problemas técnicos pueden


generar un defecto funcional, un defecto menor o ningún defecto en la proporción 10%, 60% y
30%. Si suponemos que los efectos de 10 problemas técnicos son independientes.
a) Calcular la probabilidad que 10 problemas técnicos generen 2 defectos funcionales y 5 defectos
menores.
b) Dar la distribución del nº de problemas técnicos entre 10 que no da como resultado defecto.
Calcular su media y su varianza. (1punto)
Solución:
10  8 
P (2 def fun., 5 def meno, 3 sin def) =   0.12 x 0.6 5 x 0.33 = 0.0529
 2  5 
La variable es binomial de parámetros 10 y 0,3.
Su media es 3 y su varianza 2.1

3.- En las siguientes preguntas elige la respuesta justificando la opción elegida (1 punto)
1. Si la probabilidad de error de tipo I de un contraste bilateral es de 0'02, entonces
a) La probabilidad de cometer un error de tipo II es del 0'98.
b) Se rechaza H0 para todo nivel de significación superior a 0'01.
c) Se aceptará H0 el 98% de las veces.
xd) Ninguna de las otras respuestas.
2.- Se denomina “nivel de significación” de un test de hipótesis
xa) A la probabilidad de rechazar H0 cuando H0 es cierto.
b) A la probabilidad de aceptar H0 cuando H0 es cierto.
c) A la probabilidad de rechazar H0 cuando H0 es falso.
d) A la probabilidad de aceptar H0 cuando H0 es falso.
3.- Un test de hipótesis es “estadísticamente significativo” si
a) La hipótesis nula es correcta.
b) La hipótesis nula es incorrecta.
xc) Si el estadístico del contraste cae en la región de aceptación.
d) Ninguna de las otras tres respuestas.

50
4.- En la Figura., se representan los residuos de un modelo de regresión frente al
número de orden. De él se deduce

Residual Plot
Studentized residual

-1

-2
0 10 20 30 40 50 60
row number
a) Que sería mejor hacer un ajuste parabólico.
b) Que los residuos no son normales.
c) Que no se ha tenido en cuenta una variable de clasificación.
xd) Que los datos son heterocedásticos.
5.- Del siguiente contraste se deduce
a) De la aplicación de este contraste no podemos obtener una conclusión
acerca de la hipótesis.
xb) El p-valor del contraste nos dice que podemos rechazar la hipótesis.
c) El resultado del contraste es 42,9108 y se acepta la hipótesis.
d) Ninguna de las otras tres respuestas.
Analysis Summary Data variable: lanzamientos
53 values ranging from 1,0 to 8,0
Fitted geometric distribution: event probability = 0,321212
Goodness-of-Fit Tests for lanzamientos
Chi-Square Test
----------------------------------------------------------------------------
Frecuencia Frecuencia
clase valor observada esperada Chi-Square
---------------------------------------------------------------------------
1 0 0 17,02 17,02
2 1 25 11,56 15,64
3 2 11 7,84 1,27
4 3 11 5,32 6,05
5 4 3 3,61 0,10
6 5 1 2,45 0,86
7 6, 7 1 2,80 1,15
8 >8 1 2,39 0,81
----------------------------------------------------------------------------
Chi-Square = 42,9108 with 6 d.f. P-Value = 1,2148E-7

51
Examen de Estadística: Segundo de Ingeniería Química: Segunda parte
18 de febrero de 2005.

1.- El peso de un caramelo tiene una distribución normal de media 5 gr. Y desviación
estándar 0,25gr. Se empaquetan de 16 en 16 Calcular la media y la desviación estándar del paquete,
así como la probabilidad de que su peso sea mayor de 85 gr. (1punto)
Solución: El peso total es la suma de los pesos de los 16 caramelos
P = X1 + X2 + … + X16 E(P) = 16x5 =80 gr. Var (P)= 16x 0.52 = 1 gr2
La variable peso sigue una distribución normal de media 80 y desviación estándar 1.
 P  80 85  80 
P (P > 85) = P    P( Z  5)  0
 1 1 

2.- Tres máquinas producen arandelas. El ritmo de producción de A es el doble que el de B


y el mismo que el de C. Las arandelas producidas por cada máquina se van empaquetando en lotes
que son colocados en un almacén a medida que se van produciendo. De las arandelas producidas
por A, el 10% son defectuosas por grandes y el 5% por pequeñas. Para B, el 5% son defectuosas por
grandes y el 10% por pequeñas. Para C, el 10% son defectuosas por grandes y el 10% por pequeñas.
(1punto)
Se extrae al azar un lote del almacén y se comprueba la validez de 20 arandelas del lote, resultando
3 defectuosas por grandes y ninguna por pequeña.
a) Hallar la probabilidad de que se trate de un lote producido por la máquina A.
b) Hallar la probabilidad de que de 10 arandelas elegidas al azar, 9 sean buenas y una defectuosa
por grande.
Solución:
P(A) = 0.4 P(B) = 0.2 P(C) = 0.4 Probabilidades a priori
Sea G el suceso la pieza es grande; P el suceso la pieza es pequeña ; N la pieza es buena; y H el
suceso de un lote de 20 arandelas 3 son grandes, 0 pequeñas y 17 buenas.
Se conocen las probabilidades condicionadas
P(G/A) = 0.1 P(P/A) = 0.05 P(N/A) = 0.85
P(G/B) = 0.05 P(P/B) = 0.1 P(N/B) = 0.85
P(G/C) = 0.1 P(P/C) = 0.1 P(N/C) = 0.8
Nos piden encontrar P(A/H) una probabilidad a posteriori
Aplicamos la fórmula de Bayes
 20 
P(H/A) =  0.13 x 0.8517 = 0.0719
3
 20 
P(H/B) =  0.05 3 x 0.8517 = 0.00899
3
 20 
P(H/C) =  0.13 x 0.817 = 0.0257
3
0.0719 x0.4
P(A/H) = = 0.704
0.0719 x0.4  0.00899 x0.2  0.0257 x0.4

Sea el suceso Y de 10 arandelas elegidas al azar, 9 son buenas y una grande


Utilizamos la fórmula de la probabilidad total
P Y/A) = 10 x 0,1x 0,859 = 0,2316
P (Y/B) = 10 x 0,05x 0.859 = 0,1158

52
P (Y/C) = 10 x 0,1x 0.89 = 0,1342
P (Y) = 0,2316 x 0,.4 + 0,1158 x 0,2,+ 0,134 x 0,4 = 0.1695

3.- En un libro de 400 páginas, el número de erratas de cada página sigue una distribución G
(0.05) Aproximar la probabilidad de que el número total de erratas del libro esté comprendido entre
375 y 410. (1punto)
Solución:
El número total de erratas, N, es la suma de las erratas de cada página
Sea Xi el número de erratas de la página i
E (Xi) = 0,95/0,05 = 19 Var (Xi) = 0,95/(0,05)2 = 380
E (N) = 400x19 = 7600 Var (N) = 400x380 = 152000 Desviación estándar = 389,87
N es la suma de 400 variables independientes e igualmente distribuidas, aplicando el teorema
central del límite
 375  7600 410  7600 
P (375  N  410)  P Z   P( Z  18,44)  P( Z  18,53)  0
 389,87 389,87 
4.- La Distribución beta es una distribución de una variable aleatoria X continua. Con los
datos de las siguientes salidas responder a las preguntas (1punto)
P(X<0.1)
P(0.1<X < 0.2)
P(X>0.5)
Mediana de la distribución
Primer cuartil
Tercer cuartil
Inverse CDF
-----------
Distribution: Beta
CDF Dist. 1
0,01 0,0267632
0,1 0,0925953
0,25 0,161163
0,5 0,26445
0,75 0,38948
0,9 0,510316
0,99 0,705686

Cumulative Distribution
-----------------------
Distribution: Beta
Lower Tail Area (<) Probability Density Upper Tail Area (>)
Variable Dist. 1 Dist. 1 Dist. 1
0,1 0,114265 1,9683 0,885735
0,2 0,34464 2,4576 0,65536
0,3 0,579824 2,1609 0,420176
0,4 0,766719 1,5552 0,233281
0,5 0,890624 0,9375 0,109376

Solución
P(X< 0.1) = 0,114265
P (0.1<X < 0.2) = P(X<0.2)-P(X<0.1) = 0,34464 – 0,114265 = 0,230375 por ser la distribución
continua
P(X>0.5) = 0,109376
Mediana de la distribución 0,26445 inversa de la función de distribución en 0,5
Primer cuartil 0,161163 inversa de la función de distribución en 0,25
Tercer cuartil 0,38948 inversa de la función de distribución en 0,75

53
Examen de Estadística: Segundo de Ingeniería Química: Primera parte
13 de setiembre de 2005.

1.- Un ingeniero que trabaja para un fabricante de llantas investiga la duración promedio de
un compuesto nuevo de caucho. Para ello toma una muestra de 16 llantas y las prueba en la
carretera hasta alcanzar el fin de la vida útil de estas. Los datos obtenidos en kms. Son los
siguientes
60613 59836 59554 60252 59784 60221
60311 59040 60545 60257 60000 59997
60947 60135 60220 60523
a) Hacer un diagrama de tallo-hojas para los datos (0.5 puntos)
b) Calcular los percentiles 5, 15, 25, 50, 75, 85 y 95 (0.5 puntos)
c) Realizar una tabla de distribución de frecuencias, un histograma, un diagrama de cajas de
la duración y comentar los gráficos (0.5 puntos)
d) Realizar el contraste de normalidad (0.5 puntos)
e) Calcular un intervalo de confianza para la duración media de la llanta.(2 puntos)
Calcular un intervalo de confianza para la varianza.
Al ingeniero le gustaría demostrar que la duración media excede los 60000kms. Proponer y
contrastar la hipótesis adecuada y obtener una conclusión.).
Calcular la potencia en el punto 61000
Si la duración media fuese de 61000 Kms al ingeniero le gustaría detectarla con una
probabilidad de al menos 0.90. ¿Es adecuado el tamaño muestral tomado? En caso negativo
determinar el tamaño muestral

2.- En un proceso de fabricación de semiconductores ciertos problemas técnicos pueden


generar un defecto en el semiconductor con probabilidad 0.4. Si suponemos que los efectos los
problemas técnicos son independientes. (1punto)
a) Calcular la probabilidad que 100 problemas técnicos no generen defectos.
b) Dar la distribución del nº de problemas técnicos entre 10 que no da como resultado defecto.
Calcular su media y su varianza.

3.- En las siguientes preguntas elige la respuesta justificando la opción elegida (1 punto)
1. Hipótesis estadística
a) Una afirmación sobre la distribución de una población o poblaciones.
b) Estamos dispuestos a aceptarla a no ser que los datos digan locontrario
c) La hipótesis nula es una afirmación sobre la distribución de la muestra.
d) Ninguna de las otras respuestas.
2.- Errores
a) Error de tipo I es la prob. de rechazar Ho cuando es cierta
b) Error de tipo II es la prob. de aceptar Ho cuando es cierta .
c) Potencia es la prob. de rechazar Ho cuando es cierta.
d) Ninguna de las otras respuestas.
3.- Región crítica
a) Si el parámetro estimado cae dentro de la región crítica aceptamos Ho
b) Si el parámetro estimado cae dentro de la región crítica rechazamos Ho
c) La región crítica cambia con la muestra
d) Ninguna de las otras tres respuestas.

54
4.-Distribuciones en el muestreo
a) La distribución de la media muestral es una normal
b) La distribución de la media muestral es una T
c) La distribución de la varianza muestral es una 2
d) Ninguna de las otras tres respuestas.

4.- Define (0.5 puntos)


a) p-valor
b) Muestra
c) Población
d) Estadístico

Examen de Estadística: Segundo de Ingeniería Química: Segunda parte


13 de setiembre de 2005.

1.- Un ensamble está compuesto por 5 componentes colocados uno junto al otro. La longitud
de cada componente se distribuye normalmente con media 2 cm. y desviación típica 0.02 cm. Las
especificaciones requieren que todos los ensambles tengan una longitud entre 9.9 y 10.1 cm.
¿Cuántos ensambles verificarán estos requerimientos? (1 punto)

2.- En una factoría se producen piezas que se empaquetan en tres tipos diferentes de cajas
con 20 unidades cada una en proporción 4, 3, 6. Las cajas de tipo I contienen 3 unidades
defectuosas, las de tipo II, 5 defectuosas y las de tipo III, 6 defectuosas. Se elige una caja al azar y
se extraen 3 unidades resultando una de ellas defectuosa y 2 buenas. ¿Qué tipo de caja tiene mayor
probabilidad de ser la elegida? (1punto)

3.- Un técnico de medio ambiente sospecha que el 5 % de las emisiones de gases


contaminantes de una empresa química sobrepasan el mínimo de lo permitido por la ley. Calcular el
número de muestras que debe tomar para asegurarse que encontrará al menos una con mayor
contaminación de la permitida con una probabilidad mayor que 0.99. Justificar la aproximación
realizada (1 punto).

4.- Resolver las ecuaciones (0.5 puntos)


a) P(25 ≤ x) = 0,95 b) P(12,549 ≤ 210 ≤ y) = 0,20 c) P(T15 ≤ z) = 0,01
d) P(T8 > t) = 0.9 e) P( 1,476 ≤ T5 ≤ u) = 0,075 f) P(F10,20 ≤ 2,42) = v

55
EXAMEN DE ESTADÍSTICA: 2º de Ingeniería Química
10 de febrero de 2006. Primera parte

1.- Se llevó a cabo un estudio para determinar la relación entre el número de años de
experiencia y el salario mensual, en euros, entre los ingenieros químicos de Castilla y
León. Se seleccionó una muestra aleatoria de 17 ingenieros químicos y se obtuvo la siguiente
información
 xi  247  yi  29902  xi2  5065  yi2  52330680
x y i i  483750 e 2
i  434772
Con los datos del Problema. Responde verdadero o falso justificando las respuestas
1) 0.5 puntos
a) ̂1  43,22
b) ̂1  1072
c) ̂ 0  43,22
d) ̂ 0  1072

2) 0.25 puntos
a) Como t = 12,56 la variable años de experiencia es significativa
b) Como t = 17,53, tendremos dudas acerca de la influencia de la variable años de
experiencia.
c) Como t = 17,53 la variable años de experiencia es significativa
b) Como t = 12,56, tendremos dudas acerca de la influencia de la variable años de
experiencia.
3) la predicción de salario para un ingeniero químico con diez años de experiencia es 0.25
puntos
a) 1162,2
b) 1504.2
c) 1723.2
d) 1389
4) Responde verdadero o falso justificando 1 punto
a) La variación no explicada es 434772
b) La variación total es 49440272
c) El coeficiente R-cuadrado es 0.99
d) El valor del estadístico F es 2314,5
e) Un I.C. al 95% para la pendiente es (35,89 50,55)

56
2.- Se está estudiando el tiempo transcurrido entre dos intentos de introducir un virus
informático via e-mail en el sistema informático de una empresa. Se han observado los tiempos (en
cientos de horas) desde el comienzo de año para los primeros veinte intentos obteniendo los
resultados expuestos en la tabla adjunta. 1punto

Al ajustar una distribución exponencial (con f. distribución F(x) = 1 - e- x) a estas


observaciones, el test chi cuadrado con puntos de división de las clases: 5, 10, 15 y 20, concluye
que
a. El test chi-cuadrado no se puede aplicar porque la distribución es continua.
b. Se rechaza que los datos siguen una distribución exponencial con < 0'5.
c. El p-valor del contraste está entre 0'1 y 0'5 y, por tanto, el contraste no es concluyente.
d. Ninguna de las otras tres respuestas.

3.- Dos máquinas A y B fabrican la misma pieza, con una producción aceptable del 70% y
80% respectivamente. Del total de la producción el 40\% corresponde a la màquina A y el resto a la
B. Se elige una pieza al azar y resulta no ser aceptable. Calcular la probabilidad de que haya sido
producida por cada una de las dos máquinas. 1 punto

4.- Dados los siguientes datos de pureza de un hidrocarburo.

Pureza ( %) 86,91 89,85 90,28 86,34 92,58 87,33 86,29 91,86 95,61 89,86
96,73 99,42 98,66 96,07 93,65 87,31 95 96,85 85,2 90,56

a) Calcular media, moda, mediana, rango, máximo, mínimo, desviación estándar,


primer cuartil, segundo cuartil, tercer cuartil, rango intercuartílico, percentil 5 y percentil 95
muestrales (0.5)

b) Hacer una tabla de distribución de frecuencias, un diagrama de tallo-hojas, un


histograma y un diagrama de cajas y comenta los gráficos.(1)

57
EXAMEN DE ESTADÍSTICA: 2º de Ingeniería Química
10 de febrero de 2006. Segunda parte
1.- Sea X una variable con las siguientes características: E(X)=5, E(X2)=29
Determinar una cota inferior de P (2X 8) 0.5 puntos
Si la variable tiene una distribución uniforme en el intervalo (a, b), Hallar P (2X 8) 0.5 p.

2.- Supongamos que en un proceso de fabricación de rodamientos se aceptan las bolas de


acero con diámetro comprendido entre dos valores fijos 100.1 y 100.6. Estudiado anteriormente el
diámetro de las bolas, se dedujo que seguía una ley Normal de media 100.3 y desviación típica 0.2.
Calcular la probabilidad de que en un lote de 100 bolas rechacemos 4 por grandes y 4 por
pequeñas. 0.5 puntos
Calcular la probabilidad de que un lote de tamaño 1000 contenga al menos 750 piezas
aceptables.0.5 puntos
3.- Define lo más brevemente posible 1.5 puntos
Población:
Muestra:
Tamaño muestral.
Muestreo aleatorio simple
Espacio muestral
Parámetro
Estadístico
Estimador.
Estimador de la media poblacional,
Estimador de la varianza poblacional,
Contraste hipótesis
Hipótesis estadística
Paramétrica
No Paramétrica:
Hipótesis nula
Estadístico del contraste:
Error tipo I
Error tipo II
Nivel de significación
La región de Rechazo
La región de Aceptación
Nivel crítico o p-valor

4.- El gráfico siguiente representa el diagrama de tallo-hojas del número de lanzamientos


necesarios para que salga cruz. 0.5 puntos
19 1|0000000000000000000
(14) 2|00000000000000
15 3|000000000
6 4|000
3 5|
3 6|00

HI|14,0
Calcular los cuartiles y percentiles 40 y 60

58
Examen de Estadística: Segundo de Ingeniería Química
15 de setiembre de 2006.
Apellidos Nombre
Entregar con el examen
1.- Un biólogo ha tomado una muestra de tortugas y ha medido su longitud y su anchura
obteniendo los siguientes diagramas de tallo-hojas
longitud: 1|2 representa 12,0 anchura: 1|2 representa 12,0
2 9|34
3 9|6 1 7|4
7 10|1234 2 7|8
9 10|67 8 8|012334
12 11|234 (5) 8|56899
12 11|6779 11 9|001333
8 12|001 5 9|5556
5 12|578 1 10|
2 13|1 1 10|6
1 13|5
Se pide
a) Tamaño muestral
b) Calcular los percentiles 5, 15, 25, 50, 75, 85 y 95 (0.5)
c) Realizar una tabla de distribución de frecuencias, un histograma, un diagrama de cajas de la
longitud y comentar los gráficos (1.5)
d) Realizar el contraste de normalidad de la longitud (0.5)
e) Calcular un intervalo de confianza para la longitud media de la longitud.(0.25)
f) Calcular un intervalo de confianza para la varianza. (0.25)
g) Al ingeniero le gustaría demostrar que la longitud media excede los 100 cms.
Proponer y contrastar la hipótesis adecuada y obtener una conclusión.). (0.5)
h) Calcular la potencia en el punto 95 (0.5)
Análisis de regresión
Variable dependiente: longitud
Variable independiente: anchura
Standard T
Parameter Estimate Error Statistic P-Value
Intercept -26,2686 9,83848 -2,66998 0,0140
Slope 1,58162 0,11109 14,2372 0,0000

Análisis de la varianza
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 2879,14 1 2879,14 202,70 0,0000
Residual 312,489 22 14,2041
--------------------------------------------------------------------------------
Total (Corr.) 3191,63 23
Coeficiente correlación = 0,949785
R-cuadrado = 90,2091 percent
R-cuadrado (adjusted for d.f.) = 89,764 percent
Standard Error of Est. = 3,76883
j)Explicar todo lo que aparece en las tablas de regresión y hacer el contraste de la regresión (2)
(Da la vuelta a la hoja)

59
2.- Explica brevemente (2)
1. Hipótesis estadística
2. Error de tipo I
3. Error de tipo II
4. Potencia
5. Región crítica
6. Relación entre región crítica y muestra
7.-Distribución en el muestreo
8. p-valor
9. Muestra
10. Población
11. Estadístico
12. Fórmula de Bayes
13. Fórmula de la probabilidad total
14. Fórmula producto
15. Parámetro poblacional
16. Parámetro muestral
17. Estimador de un parámetro
18. Estadístico utilizado en el contraste de varianzas
19. Relación entre p-valor y muestra
20. Gráficos utilizados en la descripción de datos categóricos.

3.- Resolver las ecuaciones (0.5 puntos)


a) P(28 ≤ x) = 0,95 b) P(12,549 ≤ 220 ≤ y) = 0,20 c) P(T35 ≤ z) = 0,01
d) P(T18 > t) = 0.9 e) P( 1,476 ≤ Z ≤ u) = 0,075 f) P(F10,20 ≤ 2,42) = v

4.- De un proceso químico se toman cada hora una muestra de 60 partes. Lo común es que el
1% de las partes requieran volver a ser procesadas. Sea X el número de partes de una muestra de
60 que necesitan ser reprocesadas. Se sospecha de un problema en el proceso si X es mayor que
su media por tres desviaciones estándar. (1)
d. Calcular la probabilidad de que se sospeche de la existencia de un problema.
e. Si el porcentaje de partes que necesita reprocesarse es de 5%. Calcular la probabilidad de X
sea mayor que 1.
f. Calcular la probabilidad de que X sea mayor que 1 en al menos una de las muestras tomadas
en las próximas 5 horas.

5.- Un técnico de medio ambiente sospecha que el 5 % de las emisiones de gases


contaminantes de una empresa química sobrepasan el mínimo de lo permitido por la ley. Calcular
el número de muestras que debe tomar para asegurarse que encontrará al menos una con mayor
contaminación de la permitida con una probabilidad mayor que 0.99. Justificar la aproximación
realizada (0.5).

60
Examen de prácticas: Estadística. Segundo de Ingeniería Química
12 de febrero de 2007

1.- Distribución Chi-cuadrado con parámetros: n = 23


Media = 23 Mediana =22,33 primer cuartil =18,1373 tercer cuartil =27,1423
Percentil 1 =10,197 percentil 5 = 13,0905 percentil 95 =35,1725percentil 99 =41,6384

Simular 100 valores de una distribución Chi-cuadrado : n = 23


Rellenar el siguiente cuadro para las clases 3 y 6
Comentar el diagrama de cajas observado
--------------------------------------------------------------------------------
Límite Límite Frecuencia Probabilidad
Clase Inferior Superior Marca Frecuencia Relativa
--------------------------------------------------------------------------------
Menor o igual 8.0
2 13,0 18,0 15,5
3 18,0 23,0 20,5 ---34---- ---0,34--- ---0,297----
4 23,0 28,0 25,5
5 28,0 33,0 30,5
6 33,0 38,0 35,5 ---6---- ---0,06--- ---0,056----
7 38,0 43,0 40,5
8 43,0 48,0 45,5
Mayor 48,0
--------------------------------------------------------------------------------
Media =23,44 Desviación estándar=6,89 Media poblacional=23 Desviación estándar pob.=6,78

2.- Datos correspondientes a la variable ¿vives?


Realiza una tabulación cruzada de esta variable con el sexo
Estimador de la proporción de chicas que viven en Valladolid 0,4286----------------
Estimador de la proporción de chicos que viven en Valladolid 0,6923----------------
Intervalos de confianza bilaterales para la diferencia de proporciones  = 0,01; 0,05; 0,1
Nivel de confianza Intervalo Tamaños muestrales

90 % [0,0319 ;0,4954] 370 302


95 % [-0,0124 ;0,5398] 214 176
99 % [-0,099 ;0,626] 151 124
Tamaños muestrales necesarios para cometer un error de 0,1 para los mismos.
Contrastar la hipótesis de que las proporciones son iguales
p-valor = 0,069 z0 = 1,817 Región crítica | Z0|>1,959
Resultados: Aceptamos que las proporciones son iguales al nivel 0,05; pero lo rechazaríamos al
nivel 0,1. El valor de z0 está muy cercano a la región crítica.
Tamaños muestrales para detectar una diferencia de proporciones de 0,2 con una potencia de 0,9
----205 y 155 ---------------------------------

61
3.- Trabajar con la variable altura en el grupo de hombres:
Estimador de la media 179,923 Estimador de la desviación estándar 4,95518
Cotas de confianza para la media y la desviación estándar para  = 0,01; 0,05; 0,1
Fijar tres errores de acuerdo al valor de la media y calcular tamaño muestral necesario para la cota
superior y los niveles de significación anteriores

confianza Para la media Para la desviación estándar


Superior inferior Superior inferior
90% 181,202 178,644 6,10433 4,22539
95 % 181,583 178,263] 6,48162 4,03769]
99 % 182,338] 177,508 7,29842 3,72185

confianza Error
1cm. 2cm. 3cm
90% 42 12 6
95 % 69 19 10
99 % 136 37 18
Explicar los resultados: Las cotas superiores crecen con el nivel de confianza; las cotas interiores
decrecen. A igual confianza, los tamaños muestrales decrecen al aumentar el error. A igual error los
tamaños muestrales crecen al aumentar la confianza

4.- Trabajar con la variable altura


Contrastar la hipótesis de que las varianzas son iguales.
p-valor = 0,797952 F0 = 0,902241 Región crítica F0 > 2,07392
Resultado: Aceptamos la igualdad de varianzas a cualquier nivel
Calcular tamaños muestrales para alcanzar una potencia de 0.85 en el punto 2: 88 y 70

5.- Trabajar con las variables altura y peso en las mujeres


El contraste de regresión tiene un p valor de -0,64- por tanto -no- rechazamos la hipótesis nula
y -no- admitimos que existe relación lineal entre las variables.
El contraste para la ordenada en el origen tiene un p-valor de -0- por tanto -si- rechazamos la
hipótesis nula y -si- admitimos que ésta es distinta de 0.
Región crítica para este contraste …|T|>…… 2,09303 ………………………
El contraste F de regresión tiene un p valor de -0,64- por tanto -no- rechazamos la hipótesis
nula y -no- admitimos que existe relación lineal entre las variables.
Región crítica para este contraste……F> 4,38077 ……………………..
El -1,14%- de la variabilidad de los datos queda recogida por el modelo.
La relación lineal -no- recoge la dependencia entre variables
VE = 6,23933 VNE = 538,046 Error estándar de la regresión = 5,3214

62
Examen de Estadística: Segundo de Ingeniería Química. 12 de febrero de 2007
Los datos siguientes muestran la salida de CD de un generador de viento (y) y la velocidad
del viento(x).
Velocidad viento(mph) Salida deCD Velocidad viento Salida de CD
5 1,582 3,05 0,558
6 1,822 8,15 2,166
3,4 1,057 6,2 1,866
2,7 0,5 2,9 0,653
10 2,236 6,35 1,930
9,7 2,386 4,6 1,562
9,55 2,294 5,8 1,737
7,4 2,088 9,1 2,303
3,6 1,137 10,2 2,31
7,85 2,179 4,1 1,194
8,8 2,112 3,95 1,144
7 1,8 2,45 0,123
5,45 1,501
1.- Calcular el valor de los estadísticos habituales para la variable velocidad del viento,
Media, varianza, desviación estándar, máximo, mínimo, rango, mediana, cuartiles y rango
intercuartílico.(0.5)
n = 25
Media = 6,132
Mediana = 6,0
Varianza = 6,3981
Desviación estándar = 2,52945
Mínimo = 2,45
Máximo = 10,2
Rango = 7,75
Primer cuartil = 3,95
Tercer cuartil = 8,15
Rango intercuartílico = 4,2
2.- (1)
Dibujar un diagrama de tallo-hojas
1|2 representa 1,2
3 2|479
7 3|0469
9 4|16
12 5|048
(3) 6|023
10 7|048
7 8|18
5 9|157
2 10|02

Dibujar un histograma

63
Histogram
6
5
frequency

4
3
2
1
0
0 2 4 6 8 10 12
velocidadv
Tabla de distribución de frecuencias
--------------------------------------------------------------------------------
Límite Limite frecuencia frecuencia frecuencia
Clase Inferior Superior Marca frecuencia relativa acumulada relat. Acu.
--------------------------------------------------------------------------------
Menor o igual 2,4 0 0,0000 0 0,0000
1 2,4 3,7 3,05 6 0,2400 6 0,2400
2 3,7 5,0 4,35 4 0,1600 10 0,4000
3 5,0 6,3 5,65 4 0,1600 14 0,5600
4 6,3 7,6 6,95 3 0,1200 17 0,6800
5 7,6 8,9 8,25 3 0,1200 20 0,8000
6 8,9 10,2 9,55 5 0,2000 25 1,0000
Mayor 10,2 0 0,0000 25 1,0000
--------------------------------------------------------------------------------
Dibujar un diagrama de cajas.

Box-and-Whisker Plot

0 2 4 6 8 10 12
velocidadv
Media = 6,132 Mediana = 6,0 Mínimo = 2,45 Máximo = 10,2
Primer cuartil = 3,95 Tercer cuartil = 8,15 Rango intercuartílico = 4,2
3,95- 1,5x4,2 = -2,35 8,15 + 1,5x4,2=14,45 LS = 10,2 LI= 2,45
Comentar gráficos obtenidos, simetría, datos atípicos, normalidad.
Del gráfico del histograma se desprende que los datos no se parecen a la distribución
normal, no se aprecia asimetría. En el diagrama de cajas se ve que los datos son bastante
simétricos, la media es casi igual a la mediana y los cuartiles son casi simétricos respecto a
la mediana. No se aprecian datos atípicos.
Contraste de normalidad.Explica la tabla, el gráfico y da el resultado del contraste
(0.5)

64
Plot Probabilistico Normal
99,9
99
acumulada

95
80
50
20
5
1
0,1
0 2 4 6 8 10 12
velocidadv
Goodness-of-Fit Tests for velocidadv
Lower Limit Upper Limit Observed Frequency Expected Frequency Chi-Square
at or below 3,68495 6 4,17 0,81
3,68495 5,04249 4 4,17 0,01
5,04249 6,132 3 4,17 0,33
6,132 7,22151 3 4,17 0,33
7,22151 8,57905 3 4,17 0,33
above 8,57905 6 4,17 0,81
Chi-Square = 2,60011 with 3 d.f. P-Value = 0,457466

El gráfico es un plot Probabilístico normal. En el eje de las X se representa la función de


distribución empírica de la muestra y en el eje de las Y la función de distribución de la normal. Si
los datos proceden de una distribución normal deberían estar alineados. Se ve que los datos oscilan
en torno a una línea recta por lo que podemos suponer que no se apartan mucho de la distribución
normal.
En la tabla tenemos el resultado de un contraste del ajuste de los datos a una distribución
normal. Se ha dividido el rango de valores en 6 clases, se calcula la frecuencia esperada de cada
clase y después se calcula el valor del estadístico con un valor de 2,6. Los grados de libertad son 6-
2(parámetros estimados, media y varianza)-1, es decir 3. El p-valor es la probabilidad de que una
chi cuadrado con 3 grados de libertad sea mayor que 2,6 que da 0,45; con lo que aceptamos la
hipótesis nula de que los datos son normales a cualquier nivel menor que0,45. Si  = 0,05
aceptamos la normalidad de los datos.

3.- (0.75)
Calcula un intervalo de confianza para la media al 95%.
Como la varianza es desconocida el estadístico utilizado es una T con 24 grados de libertad
s
T24,0,025 = 2,064 El intervalo es X  t 24, 0, 025 6,132  1,04411 [5,08789;7,17611]
25
Calcula el tamaño muestral necesario para estimar la media con un error de 0,75 mph.
El error cometido viene dado por s t 24,0,025 2,53 2,064  0,75 n = 49
n n

65
4.- (0.75)
Realiza el siguiente contraste: Región crítica, p-valor y resultado del contraste.
H0:  =6 H1:  >6
6,132  6
Calculamos el valor del estadístico T  X   0 t0   0,26
0
s 2,53
n 25
p-valor P(T24 >0,26)≈ 0,4 ya que P(T24 >0,256)= 0,4. En cualquier caso
0,25<p-valor<0,4
Es decir aceptamos la hipótesis nula de que la media es  6
Región crítica {T0 > 1,711} ya que t24,0,05= 1,711 en términos de la media
muestral X  6,865
Ni t0, ni la media muestral están en la región crítica por lo que aceptamos la hipótesis nula.
Calcula la potencia en el punto 6,5
X 6
P (6,5)  P (T0  1,711 /   6,5)  P (  1,711 /   6,5) 
s/ n
X  6,5 6,5  6 X  6,5 0,5
P(   1,711 /   6,5)  P (  1,711  /   6,5)  P(T24  0,72)
s/ n s/ n s/ n 2,53 / 25
0,1 < P (T24 > 0,72) < 0,25
Por lo tanto 0,1< P (6,5) < 0,25

5.-
De las siguientes tablas del análisis de regresión Rellenar huecos (0.5)
Regression Analysis - Linear model: Y = a + b*X
Dependent variable: salidaCD
Independent variable: velocidadv
Parameter Estimate Error Standard T Statistic P-Value
Intercept 0,130875 0,125989 1,039 [0,2; 0,5]
Slope 0,241149 0,0190492 12,66 0
0,130875/0,125989 = 1,039 P(|T23| > 1,039) = 2x P(T23 > 1,039) 0,2 < p-valor < 0,5
0,241149 / 0,0190492 =12,66 P(|T23| > 12,66) = 2x P(T23 > 12,66) ≈ 0
Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 8,92961 1 8,92961 160,254 0
Residual 1,28 23 0,0557
Total (Corr.) 10,2112 24
VNE = VT- VE = 10,2112 – 8,92961 = 1,28
S2R= VNE/(n-2) = 1,28/23 = 0,0557
F = VE/(VNE/n-2) = 8,92961/0,0557=160,254
p-valor = P(F1,23 >160,254) ≈ 0
Calcular R-cuadrado, r, error estándar de la regresión.
R-cuadrado = VE/VT = 8,92961/10,2112 = 0,87449
r = √R-cuadrado = 0,935
SR = √0,0557 = 0,236

Contraste de la regresión (los dos) (0.5)

66
En el contraste de la pendiente el valor del estadístico es 12,66 y el p-valor 0 por lo que
rechazamos la hipótesis nula de que la pendiente es 0 y por tanto existe relación lineal.
El contraste F tenemos un valor del estadístico de 160,254 y un p-valor 0 por lo que
rechazamos la hipótesis nula de que no hay relación entre las variables
Intervalo de confianza para la pendiente al 95% (0.25)
bˆ  t 0, 025, 23 s b  0,2411  2,069 x 0,019  0,21 ; 0,28
Ecuación de la recta de regresión.(0.25)
salidaCD = 0,130875 +0,241149 x velocidadv
Comentar los siguientes gráficos y tablas del análisis de los residuos (0.5)

Residual Plot Normal Probability Plot


Studentized residual

4,7 99,9
99

percentage
2,7 95
80
0,7 50
20
-1,3 5
1
-3,3 0,1
0 5 10 15 20 25 -0,6 -0,4 -0,2 0 0,2 0,4
row number RESIDUALS

Box-and-Whisker Plot Histogram


10

8
frequency

0
-0,6 -0,4 -0,2 0 0,2 0,4
-0,8 -0,5 -0,2 0,1 0,4 0,7
RESIDUALS RESIDUALS

En el plot de los residuos no se aprecia ninguna pauta que nos haga pensar que no son aleatorios.
En el plot Probabilístico normal no parece muy claro que los residuos estén alineados. Haría falta
comprobar la normalidad por otros medios. En el diagrama de cajas se aprecia una asimetría
bastante marcada a la izquierda, lo mismo en el histograma. Por lo que faltaría comprobar que los
residuos son normales mediante el contraste chi cuadrado.

6.- (0.5)
Con ayuda de las tablas calcula

67
P( 2,06 < F10,15 < 3,8) = P( F10,15 < 3,8) - P( F10,15 < 2,06) =
P( F10,15 > 2,06) - P( F10,15 > 3,8) = 0,1 – 0,01 = 0,09

P( 0,263 < F15,10 < 0,485) = P( F15,10 < 0,485) - P(F15,10 < 0,263) =
P( F10,15 >1/0,485) - P(F10,15 >1/ 0,263) = P( F10,15 >2,06) - P(F10,15 >3,8) = 0,09

P( 1,325 < T20 < 2,845) = P(T20 < 2,845)- P(T20 < 1,325) = P(T20 > 1,325) - P(T20 > 2,845)
= 0,1-0,005 = 0,095

P(Z < x ) = 0,147 x es negativo P(Z <- x ) = 0,853 –x = 1,05 x = -1,05

P( 215 < y ) = 0,5 y = 14,34

P(T20 < z) = 0,025 z es negativo P(T20 > -z) = 0,025 -z = 2,086 z =- 2,086

7.- (0.75)
La irregularidad del corte de productos de papel depende del grado de uso de las cuchillas.
Si las cuchillas son nuevas el 1% de los productos presentan un corte irregular; si las cuchillas
tienen un uso medio, el 3% de los cortes presentan irregularidades; si las cuchillas están
desgastadas, el 10% de los cortes son defectuosos. Si se conoce que de las cuchillas utilizadas en el
proceso de corte, el 10% son nuevas y el 60% tienen un uso medio.
Calcular la proporción de productos con cortes irregulares.
Sea N el suceso, cuchilla nueva; M, cuchilla de uso medio y D, cuchilla desgastada.
Sea I el suceso el corte es irregular.
Por los datos del problema P(N) = 0,1 P(M) = 0,6 P(D) = 0,3 P(I/N) = 0,01 P(I/M) =
0,03 P(I/D) = 0,1; aplicando la fórmula de la probabilidad total
P(I) = P(I/N) P(N) + P(I/M) P(M) + P(I/D) P(D) = 10-3 + 18x10-3 + 3x10-2 = 49x10-3
Proporción de productos con cortes irregulares 4,9 %

8.-
El peso de una zapatilla deportiva tiene una media de 250 g. y una desviación estándar de
5g.(0.75)
Acotar la probabilidad de que el peso esté comprendido entre 235 y 265 g.
Llamamos X a la variable peso de la zapatilla
P ( 235 <X < 265) = P( 235-250 <X-250 < 265-250) = P( -15 <X- < 15) = P(|X-| < 3x5) = P(|X-
| < 3σ)  1- (1/9) =8/9 = 0,88
Se toma una muestra de tamaño 100. Aproximar la probabilidad de que el número de
zapatillas cuyo peso no está comprendido entre los valores anteriores sea menor que10. Tomar
como valor de p la cota calculada anteriormente.
P(X  235) + P(X  265)  0,12
El número de zapatillas con peso fuera del intervalo anterior sigue una distribución B(100; 0,12).
Sea Y esta variable E (Y) = 12 var (Y) = 10,56 var(Y )  3,25 . Aproximamos por una normal
Y _ 12 10  12
P (Y  10)  P (  )  P ( Z  0,85)  1  P ( Z  0,85)  0,198
3,25 3,25

68
Examen de Estadística: Segundo de Ingeniería Química. 6 de setiembre de 2007
Nombre Apellidos
Los datos siguientes muestran el índice de refracción y la densidad de 12 trozos de cristal
Índice de refracción densidad
1,514 2,480
1,515 2,482
1,516 2,481
1,517 2,490
1,518 2,483
1,520 2,505
1,516 2,484
1,517 2,486
1,518 2,495
1,519 2,498
1,522 2,511
1,525 2,520
1.- Calcular el valor de los estadísticos habituales para la variable índice de refracción.
Media, varianza, desviación estándar, máximo, mínimo, rango, mediana, cuartiles y rango
intercuartílico. (0.5)

2.- (1)
Tabla de distribución de frecuencias y dibujar un diagrama de tallo-hojas, un histograma y
un diagrama de cajas para ambas variables
Comentar gráficos obtenidos, simetría, datos atípicos, normalidad.
Contrastar la normalidad de la variable índice de refracción

3.- (0.75)
Calcula un intervalo de confianza para la media del índice de refracción al 95%.
Calcula el tamaño muestral necesario para estimar la media con un error de 0,05.

4.- (0.75)
Realiza el siguiente contraste: Región crítica, p-valor y resultado del contraste.
H0:  = 1,5 H1:  >1,5
Calcula la potencia en el punto 1,4

5.- De las siguientes tablas del análisis de regresión Rellenar huecos (0.5)
Regression Analysis - Linear model: Y = a + b*X
Dependent variable: densidad
Independent variable: indicerefra
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
Intercept -3,68673 -6,2112 0,0001
Slope 4,07069 10,4111 0,0000

Analysis of Variance

69
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 0,00173852 1 0,00173852 0,0000
Residual 10 - - -
Total (Corr.) 0,00189892
Correlation Coefficient =
R-squared =
Standard Error of Est. =
Contraste de la regresión (los dos) (0.5)
Intervalo de confianza para la pendiente al 95% (0.25)
Ecuación de la recta de regresión.(0.25)
Comentar los siguientes gráficos y tablas del análisis de los residuos (0.5)
Residual Plot Normal Probability Plot
Studentized residual

4,1 99,9
99

percentage
2,1 95
80
0,1 50
20
5
-1,9
1
0,1
-3,9
-10 -7 -4 -1 2 5
0 2 4 6 8 10 12 (X 0,001)
RESIDUALS
row number

Box-and-Whisker Plot Histogram


8

6
frequency

0
-10 -7 -4 -1 2 5 -11 -7 -3 1 5
(X 0,001) (X 0,001)
RESIDUALS RESIDUALS

Goodness-of-Fit Tests for RESIDUALS


Chi-Square Test
Lower Upper Observed Expected
Limit Limit Frequency Frequency Chi-Square
at or below -0,00321376 2 2,40 0,07
-0,00321376 -0,000967417 2 2,40 0,07
-0,000967417 0,000967419 1 2,40 0,82
0,000967419 0,00321376 5 2,40 2,82
above 0,00321376 2 2,40 0,07
Chi-Square = 3,83342 with 2 d.f. P-Value = 0,14709

6.- (0.5) Con ayuda de las tablas calcula


P( 2,54 < F10,15 < 3,8)
P( 4,56 < F15,10 < 2,24)
P( 1,77 < T13 < 3,85)
P(Z < x ) = 0,95
P( 215 < y ) = 0,05
P(T30 < z) = 0,25
7.- (0.75) La irregularidad del corte de productos de papel depende del grado de uso de las
cuchillas. Si las cuchillas son nuevas el 0,5% de los productos presentan un corte irregular;

70
si las cuchillas tienen un uso medio, el 5% de los cortes presentan irregularidades; si las
cuchillas están desgastadas, el 20% de los cortes son defectuosos. Si se conoce que de las
cuchillas utilizadas en el proceso de corte, el 10% son nuevas y el 60% tienen un uso medio.
Calcular la proporción de productos con cortes irregulares.

8.- El peso de una zapatilla deportiva tiene una media de 220 g. y una desviación estándar de
10g.(0.75)
Acotar la probabilidad de que el peso esté comprendido entre 205 y 235 g.
Se toma una muestra de tamaño 100. Aproximar la probabilidad de que el número de
zapatillas cuyo peso no está comprendido entre los valores anteriores sea menor que10.
Tomar como valor de p la cota calculada anteriormente.

71
Examen de prácticas: Estadística. Segundo de Ingeniería Química
6 de setiembre de 2007

1.- Distribución binomial: n = 150 p = 0.01


Media = Mediana = primer cuartil = tercer cuartil =
Percentil 1 = percentil 5 = percentil 95 = percentil 99 =
Simular 100 valores de una distribución binomial con n = 150 p=0.01
Rellenar el siguiente cuadro para las clases 3 y 6
Comentar el diagrama de cajas observado
------------------------------------------------------------------------
Relative
Class Value Frequency Frequency Probabilidad F. distribucion
------------------------------------------------------------------------
1 0
2 1
3 2
4 3
5 4
6 5
Media = Desviación estándar= Media poblacional= Desviación est.pob.=

2.- Datos correspondientes a la variable venir a clase


Realiza una tabulación cruzada de esta variable con el sexo
Estimador de la proporción de chicas que vienen andando ----------------
Estimador de la proporción de chicos que vienen andando ----------------
Intervalos de confianza bilaterales para la diferencia de proporciones  = 0,01; 0,05; 0,1
Nivel de confianza Intervalo Tamaños muestrales

90 %
95 %
99 %
Tamaños muestrales necesarios para cometer un error de 0,1 para los mismos.
Contrastar la hipótesis de que las proporciones son iguales
p-valor = Z0 = Región crítica
Resultado

Tamaños muestrales para detectar una diferencia de proporciones de 0,2 con una potencia de 0,9 ---
-

3.- Trabajar con la variable peso en el grupo de mujeres:


Estimador de la media Estimador de la desviación estándar
Cotas de confianza para la media y la desviación estándar para  = 0,01; 0,05; 0,1
confianza Para la media Para la desviación estándar
Superior inferior Superior inferior
90%
95 %
99 %

72
Fijar tres errores de acuerdo al valor de la media y calcular tamaño muestral necesario para la cota
superior y los niveles de significación anteriores

confianza Error

90%
95 %
99 %
Explicar los resultados:

4.- Trabajar con la variable peso


Contrastar la hipótesis de que las varianzas son iguales en la población de hombres y mujeres.
p-valor = f20 = Región crítica
Resultado:

Calcular tamaños muestrales para alcanzar una potencia de 0.85 en el punto 2

5.- Trabajar con las variables altura y peso en hombres


El contraste de regresión tiene un p valor de --- por tanto -- rechazamos la hipótesis nula y --
admitimos que existe relación lineal entre las variables.
El contraste para la ordenada en el origen tiene un p-valor de --- por tanto -- rechazamos la
hipótesis nula y -- admitimos que ésta es distinta de 0.
Región crítica para este contraste ………………………………
El contraste F de regresión tiene un p valor de --- por tanto -- rechazamos la hipótesis nula y
--- admitimos que existe relación lineal entre las variables.
Región crítica para este contraste…………………………..
El ----- de la variabilidad de los datos queda recogida por el modelo.
La relación lineal -- recoge la dependencia entre variables
VE = VNE = Error estándar de la regresión =

73
Control 1: Segundo de Ingeniería Química
31 de octubre de 2007

Apellidos Nombre
Entregar con el examen
1.- Un biólogo ha tomado una muestra de tortugas y ha medido su longitud obteniendo el
siguiente diagrama de tallo-hojas

longitud: 1|2 representa 12,0


2 9|34
3 9|6
7 10|1234
9 10|67
12 11|234
12 11|6779
8 12|001
5 12|578
2 13|1
1 13|5
Se pide
a) Tamaño muestral media desviación estándar mediana
meda cuartil 1 cuartil 3 rango intercuartílico
mínimo máximo

b) Calcular los percentiles


5 15 25 50 75 85 95

c) Realizar una tabla de distribución de frecuencias, un histograma, un diagrama de cajas de la


longitud y comentar los gráficos

2.- En una muestra de tamaño 100, se ha obtenido una media muestral de 38,283 y una
desviación estándar muestral de 1.25.
g. ¿Qué porcentaje de observaciones cae dentro del rango 38,283 2.5?
h. ¿Qué porcentaje de observaciones cae dentro del rango 38,283 1.5?

74
Control 2: 2º curso de Ingeniería Química
19 de diciembre de 2007

1.- La siguiente sentencia fue mantenida por un “experto” en estadística. “Si se extrajera
una muestra de tamaño 64 de una población normal con media µ, se podría asegurar con una
confianza del 95% que µ estaría dentro del intervalo X  1,96s / 8 ”. ¿Es correcta esta afirmación?

2.- 20 estudiantes de Ingeniería Química midieron el punto de licuación del plomo. La


media y la desviación típica muestrales fueron 330,2ºC y 15,4ºC.
Construir un intervalo de confianza para el punto de licuación del plomo con una confianza
del 95% y del 99%.

Calcular el error cometido en ambos casos.

Determinar el tamaño muestral necesario para cometer un error de 5ºC en ambos casos

3.- Define:
Variable aleatoria:

Función de densidad

Función de probabilidad

Estadístico

Estimador

4:- En la siguiente función de densidad de una distribución normal en cada trozo de la


gráfica pon el valor del área de la región comprendida entre la gráfica y el eje de las x

función de densidad de la normal (0,1)


0,4

0,3
densidad

0,2

0,1

0
-4 -3 -2 -1 0 1 2 3 4
x

75
Examen de estadística: Prácticas 11 de febrero de 2008

1.- Simula 100 valores de una distribución N (3,2) Nómbrala X (0.5p)

Media = 3 Mediana = 3 primer cuartil = 1,65 tercer cuartil = 4,35


Percentil 1 = -1,65 percentil 5 = -0,29 percentil 95 = 6,29 percentil 99 =7,65

Media muestral = 3,14 Mediana muestral = 3,32 primer cuartil muestral = 1,73
Tercer cuartil muestral=4,49 Percentil 1 muestral =-1,78 percentil 5 muestral = -0,30
Percentil 95 muestral =6,58 percentil 99 muestral = 7,35

Rellenar el siguiente cuadro para las clases 3 y 6


Comentar el diagrama de cajas observado
--------------------------------------------------------------------------------
Límite Límite Frecuencia Probabilidad
Clase Inferior Superior Marca Frecuencia Relativa
--------------------------------------------------------------------------------
Menor o igual -3.0
2 -3, 0 -1,0 -2
3 -1,0 1,0 0 -------8----------0,08------------0,136
4 1,0 3,0 2
5 3,0 5,0 4
6 5,0 7,0 6 -------13---------0,13------------0,136
7 7,0 9,0 8
Mayor 9,0
--------------------------------------------------------------------------------
Media = 3,14 Desviación estándar= 1,98 Media poblacional= 3
Desviación estándar pob.= 2

2.- Trabajar con la variable simulada X: (0.5p)

Estimador de la media 3,14 Estimador de la desviación estándar 1,98


Cotas de confianza para la media y la desviación estándar para  = 0,01; 0,05; 0,1
Fijar tres errores de acuerdo al valor de la media y calcular tamaño muestral necesario para la cota
superior y los niveles de significación anteriores

confianza Para la media Para la desviación estándar


Superior inferior Superior inferior
90% 3,39 2,88 2,17 1,81
95 % 3,47 2,81 2,24 1,77
99 % 3,60 2,67 2,36 1,69

confianza Error
0,5 0,4 0,3
90% 28 43 75
95 % 46 70 123
99 % 90 139 244

Continúa a la vuelta

76
3.- Contrasta la normalidad de la variable simulada X (0.5p)

Nº de clases 8
Valor chi-cuadrado 3,36
Grados de libertad 5
p-valor 0,64
Conclusión Aceptamos normalidad de los datos

4.- Simular 80 valores de una N (3.1 , 2) variable Y (0.5p)


Contrastar la hipótesis de que las varianzas de las variables X e Y son iguales.
p-valor = 0,38 F0 = 1,21 Región crítica {F0>f99,790,025 }{F0<f9979,0,975}

{S12/S22>1,531 }{S12/S22<0,66}

Resultado: Acepto igualdad de varianzas

Calcular tamaños muestrales para alcanzar una potencia de 0.85 en el punto 1,5: 250, 200

Intervalo de confianza para la diferencia de medias al 95% 0,0450,562 (-0,52, 0,61)


Asumiendo varianzas iguales

5:- Trabaja con la variable deporte (0.5p)


Haz una tabulación cruzada de esta variable con la variable sexo y responde
Proporción de chicos que no realizan ningún deporte. 15,38%
Proporción de chicas que juegan al baloncesto 9,52%
Proporción de chicos que hacen natación 7,69%
De los que no hacen ningún deporte, proporción de chicos.21,05%
De los que juegan al frontenis, proporción de chicas 33,33%

77
Examen de estadística: 2º curso de ingeniería química.
11 de febrero de 2008

Nombre Apellidos
1.- Los siguientes datos corresponden al número de trabajadores en la industria en la
Comunidad de Castilla y León durante el periodo 1993-2006 (1p)
1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
133.96 133.74 135.34 135.09 132.20 138.49 140.59 141.00 140.56 144.36 146.58 147.4 151.62 151.85
0 1 7 1 5 3 3 5 1 1 0 47 0 9
Calcular
Media 140.918 varianza 43.671.485 máximo151.859 mínimo132.205 rango 19.654
Mediana 140.577 meda 5744,5 Primer cuartil 135.091 tercer cuartil 146.580
rango intercuartilico 11.489 percentil10 133.741
Dibujar un diagrama de cajas
Q1= 135.091
Q2 = 140.577
Q3 = 146.580
Media 140.919
LI = min. = 132.205
LS = Máx. = 152.859

13 13,4 13,8 14,2 14,6 15 15,4


(X 10000)

2.- Un fabricante de pilas alcalinas sabe que la duración de las mismas se distribuye según
una ley normal de varianza 3600 horas. Para estimar la media toma una muestra de su producción y
un nivel de confianza del 95% obteniendo el intervalo (372,6 392,2).(1p)
Calcular la media estimada y el tamaño muestral utilizado.
El intervalo es X   Z 0,o 25 La media estimada es el centro del intervalo X  382,4 y  Z 0,o 25  9,8
n n
z0,025 = 1,96 σ =60 y n = 144

Calcular el error de estimación para un tamaño muestral de 200 pilas y una confianza del
90%.
El error es 
X  Z 0.05 z0,05 = 1,64 E = 6,96
n
3.- Las cuasivarianzas muestrales de dos muestras de tamaños 51 y 101 de dos poblaciones
normales independientes son 70,2 y 76,8. (1.5p)
Demostrar que puede admitirse que las varianzas poblacionales son iguales al nivel 10%
H0: 12 = 22 El estadístico F  S12 Bajo H0 se distribuye como una F50,100
0
S 22
H1: 12 22 f50,100,0,05 = 1,48 f100,50, 0,05 = 1,52 f50,100, 0,95 = 0,66
RA 0,66< F0 <1,48 f0 = 0,91 por tanto acepto H0
Calcular la potencia de la prueba en el punto 1,5
P(0,66< F0 <1,48/12/22=1,5) = P(0,66< S12 <1,48/(12/22)=1,5) =
S 22
S /
2 2
P(0,66 (22/12) < 1 1 <1,48 (22/12) /(12/22)=1,5) = P(0,44< F50,100 < 0,98)
S / 2
2
2
2

P(1,5) = 1 - P(0,44< F50,100 < 0,98)

78
4.-Se ha realizado un análisis de regresión tomando como variable dependiente millas por
galón y variable independiente caballos de potencia del vehículo. Se ha obtenido(1.5p)
Dependent variable: mpg
Independent variable: horsepower
Standard T
Parameter Estimate Error Statistic P-Value
Intercept 49,8706 1,403 35,5426 0,0000
Slope -0,237707 0,0152283 -15,61 0,0000

Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 5030,95 1 5030,95 243,66 0,0000
Residual 148 20,6475
Total (Corr.) 8086,77 149

Correlation Coefficient = -0,788746


R-squared = 0,622
Standard Error of Est. = 4,54
Rellenar los huecos
Ecuación de la recta de regresión
Mpg = 49,87 – 0,24 x horsepower
Resultado del contraste F
H0: Modelo inadecuado VE / 1
F  F1,148 f0 = 243,66 p-valor 0
VNE / 148
H1: Modelo adecuado
Rechazamos y el modelo es adecuado
Resultado del contraste de la pendiente
H : β1 = 0 ˆ1 t = -15,61 p-valor 0
0 T  T148 0
s
H1: β1  0
Rechazamos H0 y admitimos que existe relación lineal

Intervalo de confianza al 95% para la pendiente


ˆ1  t 0, 025,148 s 
-0,24  1,98x0,0152 0,24  0,03 (-0,27, -0,21)

5.- Una empresa compra cierto tipo de pieza que es suministrada por 3 proveedores: el 45%
de las piezas son compradas al primer proveedor resultando defectuoso el 1%, el segundo
proveedor suministra 30% de las piezas y de ellas es defectuoso el 2%. Las restantes piezas
provienen del tercer proveedor, siendo defectuoso el 3% de las mismas.
En un control de recepción de artículos se selecciona una pieza al azar y es defectuosa. Calcular la
probabilidad de que la haya suministrado el segundo proveedor.(1p)
P(1) = 0,45 P(2) = 0,3 P(3) = 0,25 P(D/1)= 0,01 P(D/2)= 0,02 P(D/3)= 0,03
P(2/D)= P(D/2)xP(2)/P(D) = 0.33
P(D) = P(D/1)xP(1)+ P(D/2)xP(2) +P(D/3)xP(3) =0,018

6.- Resuelve las ecuaciones (0.5p)


P(Z < x ) = 0,1587 x = -1 P(Z>1) = 0,1587 =P(Z< -1)
P(T11< y) = 0,85 y = 1,088 P(T11<1,088) = 0,15 P(T11<1,088) = 0,85
P(χ221 < z) = 0.1 z= 13,24 P(χ221 <13,24) = 0,9 P(χ221 <13,24) = 0,1
P(F30,19 <t) = 0,95 t= 2,07 P(F30,19 > 2,07) = 0,05 P(F30,19 < 2,07) = 0,95

79
7.- Elige la respuesta correcta (1p)
1. Sean X1 y X2 dos variables aleatorias independientes B(5, 0.4). La varianza de Y = (X1 + X2)es
(a) 1.2
(b) 0.6
(c) Ninguna de las otras dos
2. Si dos sucesos son incompatibles, son independientes
(a) Si, claro.
(b) No
(c) Si la intersección es el conjunto vacío.
3. Si lanzamos 3 monedas al aire, ¿cual es la probabilidad de que las 3 sean caras o las 3 sean
cruces?
(a) 1/4
(b) 1/8
(c) 1/2
4. Para estimar la media de una población normal, la media muestral es
(a) Un estimador insesgado pero no consistente.
(b) Un estimador insesgado y consistente.
(c) Un estimador insesgado, consistente y con error cuadrático medio nulo.
5. Un intervalo de confianza al 90% para estimar θ es
(a) Un intervalo que contiene al 90% de los posibles valores de θ.
(b) Un intervalo aleatorio que contiene a θ para el 90% de las muestras aleatorias
extraídas de la población.
6. En una muestra aleatoria simple
(a) las observaciones son independientes
(b) todos los elementos de la población son iguales
(c) los valores de una muestra particular son variables aleatorias
7. La distribución en el muestreo de la media muestral
(a) es una distribución normal siempre
(b) es una distribución normal si las observaciones son independientes
(c) de forma general, sigue aproximadamente una distribución normal
8. La probabilidad de error de tipo II de un contraste de hipótesis
(a) es igual a 1-P(error tipo I)
(b) siempre es mayor o igual que la probabilidad de error de tipo I
(c) es 1-Potencia del test
9. El intervalo de confianza para la desviación típica de una población normal
(a) no es simétrico porque los datos son siempre mayores o iguales que cero
(b) no es simétrico porque la distribución normal es mayor o igual que cero
(c) no es simétrico porque la distribución χ2 es no negativa
10. Si aumentamos el valor del nivel de confianza, la longitud del intervalo de confianza seria:
(a) mayor
(b) menor
(c) podría ser mayor o menor, dependiendo del valor desconocido del parámetro

80
Examen de estadística: Prácticas 9 de septiembre de 2008

Nombre Apellidos

1.- Simula 100 valores de una distribución χ295 Nómbrala X (0.5p)

Media = Mediana = primer cuartil = tercer cuartil =


Percentil 1 = percentil 5 = percentil 95 = percentil 99 =

Media muestral = Mediana muestral = primer cuartil muestral =


Tercer cuartil muestral = Percentil 1 muestral = percentil 5 muestral =
Percentil 95 muestral = percentil 99 muestral =

Rellenar el siguiente cuadro para las clases 3 y 6


Comentar el diagrama de cajas observado
--------------------------------------------------------------------------------
Límite Límite Frecuencia Probabilidad
Clase Inferior Superior Marca Frecuencia Relativa
--------------------------------------------------------------------------------
Menor o igual 59,0
1 59,0 69,0
2 69,0 79,0
3 79,0 89,0
4 89,0 99,0
5 99,0 109,0
6 109,0 119,0
7 119,0 129,0
Mayor 129,0
--------------------------------------------------------------------------------
Media = Desviación estándar=
Media poblacional= Desviación estándar pob.=

2.- Trabajar con la variable simulada X: (0.5p)


Estimador de la media Estimador de la desviación estándar
Cotas de confianza para la media y la desviación estándar para  = 0,01; 0,05; 0,1
Fijar tres errores de acuerdo al valor de la media y calcular tamaño muestral necesario para la cota
superior y los niveles de significación anteriores
confianza Para la media Para la desviación estándar
Superior inferior Superior inferior
90%
95 %
99 %

confianza Error
3 2
90%
95 %
99 %

81
3.- Contrasta la normalidad de la variable simulada X (0.5p)
Nº de clases
Valor chi-cuadrado
Grados de libertad
p-valor
Conclusión

4.- Simular 150 valores de una χ292 Variable Y (0.5p)


Contrastar la hipótesis de que las varianzas de las variables X e Y son iguales.
p-valor = F0 = Región crítica
Resultado:
Calcular tamaños muestrales para alcanzar una potencia de 0.85 en el punto 1,5:

Intervalo de confianza para la diferencia de medias al 95%

5:- Trabaja con la variable vives (0.5p)


Haz una tabulación cruzada de esta variable con la variable sexo y responde
Proporción de chicos que vive en Valladolid.

Proporción de chicas que viven en un pueblo

Proporción de chicos que viven en urbanización

De los que viven en Valladolid, proporción de chicos.

De los que viven en un pueblo, proporción de chicas

82
Examen de estadística: 2º curso de ingeniería química.
9 de septiembre de 2008

Nombre Apellidos

1.- Los siguientes datos representan los días de baja por enfermedad en un grupo de 50
trabajadores (1p)
2 2 0 0 5 8 3 4 1 0 0 7 1 7 1 5 4 0 4 1 8 9 7 0 0
1 7 2 5 5 4 3 3 0 0 2 5 1 3 0 1 0 2 4 5 0 5 7 5 1

- Calcular
Media varianza máximo mínimo Mediana
Meda Primer cuartil tercer cuartil rango intercuartilico percentil10
- Presentar los datos en forma de tabla de distribución de frecuencias
- Dibujar un diagrama de cajas y un diagrama de barras
- Calcular el número de trabajadores que han estado de baja al menos 1 día

2.- Las longitudes de un tipo de cojinete de bolas se distribuyen normalmente con una
desviación típica de 0,5 mm.(1p)
¿Qué tamaño de muestra se necesita si se pretende que el estimador de la media difiera de la
media poblacional en ±0,1 mm. con una confianza del 95%?
¿Qué error de estimación se comete para un tamaño muestral de 100 y una confianza del
99%?

3.- Una compañía debe decidir entre dos suministradores de lámparas. La dirección ha
decidido hacer el pedido al suministrador A, a menos que se pueda probar que la vida media de las
lámparas del suministrador B es mayor. Para ello se prueban 31 lámparas de A y 31 lámparas de B,
obteniéndose los siguientes resultados. (1.5 p)
A 121 76 88 103 96 89 100 112 105 101 92 98 87 75 111 118
121 96 93 82 105 78 84 96 103 119 85 84 90 110 105

B 127 133 87 91 81 122 115 107 109 89 82 90 81 104 109 110


85 93 90 100 122 117 109 98 94 103 107 101 99 112 106
¿Qué suministrador elegirías para un nivel de significación de 0.05?
Plantea el contraste de hipótesis correspondiente y razona la respuesta.
Calcula la región crítica y el p-valor.
Calcula la potencia si la diferencia de medias es de 10.

4.-Se ha realizado un análisis de regresión tomando como variable dependiente Ávila y


variable independiente Burgos. Se ha obtenido (1.5p)
Regression Analysis - Linear model: Y = a + b*X
Dependent variable: avila
Independent variable: leon
Standard T
Parameter Estimate Error Statistic P-Value
Intercept -333,414 222,269 0,1351
Slope 0,317519 19,9313 0,0000

Analysis of Variance

83
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 1,14214E8 1,14214E8 0,0000
Residual 5,95138E7 207 287506,0
Total (Corr.)
Correlation Coefficient = 0,810821
R-squared = percent
R-squared (adjusted for d.f.) = 65,5776 percent
Standard Error of Est. =
Mean absolute error = 476,173
Durbin-Watson statistic = 0,0554521 (P=0,0000)
Lag 1 residual autocorrelation = 0,97107

- Rellenar los huecos


- Ecuación de la recta de regresión
- Resultado del contraste F
- Resultado del contraste de la pendiente y de la ordenada en el origen
- Intervalo de confianza al 95% para la pendiente

5.- Un proceso químico utiliza un catalizador con las siguientes características (1p)
P(catalizador funcione más de 1000horas)= 0,8
P(catalizador funcione más de 2000horas)= 0,4
P(catalizador funcione más de 3000horas)= 0,1
Sabiendo que un catalizador ha estado funcionando 1000horas encontrar las probabilidades
condicionadas
P( tiempo total de funcionamiento exceda las 2000horas)
P( continúe funcionando más de 2000horas)

6.- Sea X una v.a. binomial con E(X)=6 Var(X) = 2,4 (0.5p). Calcular
P(X>2)
P(X≤9)
P(X=12)

7.- Contesta brevemente (1p)


1. Coeficiente R cuadrado
2. Hipótesis estadística
3. Estadístico
4. Región crítica
5. Nivel de significación
6. Varianza muestral
7. Función de densidad de probabilidad
8. Espacio muestral
9. Sucesos independientes
10. fórmula de Bayes

84
Control 1: Segundo de Ingeniería Química 12 de noviembre de 2008
Apellidos Nombre
Entregar con el examen
1.- El siguiente gráfico de tallo-hojas refleja las presiones sanguíneas diastólicas de una
muestra de personas
presión: 1|2 representa 12,0
3 5|468
11 6|01223455
(10) 7|0122455678
9 8|678999
3 9|358
Se pide
a) Tamaño muestral 30 media 74,13 desviación estándar 12,65 mediana 73
cuartil 1 63 cuartil 3 87 rango intercuartílico 24
mínimo 54 máximo 98
b) Calcular los percentiles
5 56 15 61 25 63 50 73 75 83 85 89 95 95
c) Realizar un diagrama de cajas de la longitud y comentar el gráfico.
Q1 – 1,5xRI = 27 Q3 + 1,5xRI = 123 LI = 54 LS = 98

54 58 62 66 70 74 78 82 86 90 94 98

Los datos presentan leve asimetría a la derecha. No hay datos atípicos

2.- El tiempo de vida de un componente electrónico es una variable aleatoria de media 8


años y desviación típica 1 año. Acota el porcentaje de componentes
i. Que duran mas de 10 años
j. Que duran menos de 5 años
k. Que duran entre 6 y 10 años
P(X>10) = P(X-8>10-8) = P(X-μ > 2σ)  P(|X-μ|>2σ)  ¼ = 0,25
El porcentaje de componentes que duran más de 10 años es menor o igual que el 25%
P(X <5) = P(X-8<5-8) = P(X-μ < -3σ)  P(|X-μ|>3σ)  1/9 = 0,11
El porcentaje de componentes que duran menos de 5 años es menor o igual que el 11%
P(6<X<10) = P(6-8<X-8<10-8) = P(-2 < X-μ < 2) =P(|X-μ|  2σ)  1 -1/4 = 0,75
El porcentaje de componentes que duran entre 6 y 10 años es mayor o igual que el 75%

3.-Sea X una variable de Poisson con parámetro 4. Calcular usando las tablas
P(X=1) = 0,0733
P(X=2) = 0,1465
P(X>2) = 1 – P(X = 0) – P(X = 1) – P(X = 2) = 1 – 0,0183- 0,0733- 0,1415 = 0,7619

85
Control 2 : 2º curso de Ingeniería Química
17 de diciembre de 2008
1.- La siguiente sentencia fue mantenida por un “experto” en estadística. “Si se extrajera
una muestra de tamaño 25 de una población normal con media µ, se podría asegurar con una
confianza del 95% que µ estaría dentro del intervalo X  0,392s ”. ¿Es correcta esta afirmación?
El intervalo viene dado por X  t 0, 025, 24 s / 25
t0,025,24 = 2,064 t0,025,24 /5= 0,41
La afirmación es falsa

2.- Para estimar el contenido medio de nicotina en una marca de cigarrillos, se toma una
muestra aleatoria de tamaño 44 y se miden sus contenidos de nicotina, obteniendo una media
muestral de 1,74 mg. Por experimentos anteriores se considera que la desviación estándar es 0,7
mg.
Calcular un intervalo de confianza al 95% y 99% para µ
z0,025 = 1,96 z0,005= 2,57
α= 0,05 1,53≤µ≤1,95 α= 0,01 1,47≤µ≤2,01
Calcular el error cometido en ambos casos.
α= 0,05 error = 0,21mg. α= 0,01 error = 0,27mg.
Determinar el tamaño muestral necesario para cometer un error de 0,15mg. en ambos casos
α= 0,05 z0,025 σ/√n = 0,15 α= 0,01 z0,00 5 σ/√n = 0,15
n= 84 n=144

3.- Define:
Estadístico Variable aleatoria función de la muestra
Estimador Valor del estadístico para una muestra concreta
Variable estandarizada Variable obtenida de una dada cuando la restamos la media y la
dividimos por la desviación estándar. Tiene media 0 y varianza 1
Media muestral Estadístico o estimador que resulta al sumar las variables que componen
la muestra y dividirla por el nº de observaciones. En general se utiliza para estimar la
media poblacional
¿Qué estadístico se utiliza para hallar un intervalo de confianza para la varianza?
Se utiliza la varianza muestral que en el muestreo se distribuye según una ley chi cuadrado

4:- En la siguiente función de densidad de una distribución t pon el valor del área de la
región comprendida entre la gráfica, el eje de las x y las líneas verticales

86
distribución de Student con 11 grados de libertad

0,4 D. F.
11

0,3
densidad

0,2

0,1

0
-3,5 0 3,5
-1,796 -0,876 0,697 1,796
x
-1,363 1,088

De las tablas
t0, 25,11 = 0,697
t0,2,11 =0,876
t0,15,11 = 1,088
t0,1,11 =1,363
t0,05,11 = 1,796
P ( T < -1,796 ) =0,05
P (-1,796 < T < -1,363 ) = 0,1- 0,05= 0,05
P ( - 1,363 < T < -0,876 ) = 0,2-0,1= 0,1
P (-0,876< T < 0 ) =0,5 – 0,2 =0,3
P ( 0 < T < 0,697 ) =0,75 – 0,5 =0,25
P ( 0,697 < T < 1,088 ) =0,85 – 0,75 =0,1
P ( 1,088 < T < 1,796 ) =0,95 – 0,85 =0,1
P ( T > 1,1,796 ) =0,05

87
Examen de estadística: 2º curso de ingeniería química. 9 de febrero de 2009

Nombre Apellidos

1.- Se investiga la temperatura de deflexión bajo carga para dos tipos diferentes de tubería
de plástico. Para ello se toman dos muestras aleatorias anotando las temperaturas de deflexión
observadas.
Tipo I 20 19 19 18 20 21 20 18 19 18 17 17 19 21 20
6 3 2 8 7 0 5 5 4 7 9 8 4 3 5
Tipo II 17 17 19 19 18 18 20 20 18 20 19 20 18 19 19
7 6 8 7 5 8 6 0 9 1 7 3 0 2 3

- Calcular para tipo II (1p)


Media 192,13 Varianza 89,12 Máximo 206 Mínimo 176 Mediana 193 Meda 7
Primer cuartil 185 Tercer cuartil 200 Rango intercuartilico 15 Percentil1 176
Percentil5 175 Percentil15 180 Percentil90 203 Percentil95 206
- Presentar los datos en forma de tabla de distribución de frecuencias
Clase Limite inferior Limite superior Marca Frecuencia Frecuencia rel. Frecuencia ac. Frecuencia rel. ac.
Menor o igual -- 170 - 0 0 0 0
1 170 180 175 3 0,2 3 0,2
2 180 190 185 3 0,2 6 0,4
3 190 200 195 6 0,4 12 0,8
4 200 210 205 3 0,2 15 1
mayor 210 - - 0 0 15 1
Media = 192,133 desviación estándar = 9,44054
- Dibujar un diagrama de cajas, un diagrama de tallo-hojas y un histograma.
Comentar las gráficas
2 17|67
6 18|0589 6

(5) 19|23778 5

7 19|778 4
3
4 20|0136 2
1
0 170 180 190 200 210
170 180 190 200 210

Diagrama tallo-hojas Histograma Diagrama de cajas


Del diagrama de cajas se desprende que los datos son bastante simétricos, muestran ligera asimetría
a la izda. También se observa en el histograma esta asimetría
- Contrastar la igualdad de varianzas (0,5)
S12 = 127,07 S22 = 89,12 f0 = 1,43 RC = {F0 > 2,48}  {F0 < 0,4} f0 RC. Acepto la
igualdad de varianzas
¿Los datos apoyan la afirmación de que la temperatura de deflexión para la tubería 2
es menor que la de la tubería 1? (0,5)
H0 : μ1 = μ2 X 1  195,73 X 2  192,13 S1 = 11,27 S2 = 9,44 n1 = n2 = 15 S2 = 108,095
1 1
H1 : μ1 < μ2 S = 10,4 S  = 3,8 t0 = 0,95 RC ={T0 < -1,701} Los datos soportan la
15 15
hipótesis μ1  μ2
p-valor P(T28<0,95) 0,8 < p-valor< 0,85 ya que P(t28>0,85)=0,2 y P(T28>1,05) =0,15

88
Supongamos que si la temperatura de deflexión promedio para la tubería de tipo 2 es
mayor que la de la tubería de tipo 1 en 5ºF, entonces sería importante detectarlo con una
probabilidad de al menos 0,9. ¿Resulta adecuada la selección del tamaño de las muestras?
(0,5)
X  X2
P(-5)= P(RC/ μ1 - μ2 = -5) = P(T0<-1,701/ μ1 - μ2 = -5)= P( 1  -1,701/μ1 - μ2 = -5)=
1 1
s 
15 15
X  X 2  (5) 5
P( 1  -1,701+ /μ1 - μ2 = -5=P(T28<-0,39)<0,25
1 1 1 1
s  s 
15 15 15 15
No es adecuado el tamaño muestral
Calcula in intervalo de confianza para la media de la temperatura de deflexión para la
tubería de tipo 1. (0,5)
X 1  t 0,025,14 s1 / 15 t0,025,14 = 2,145 X 1  6,24 189,49  μ1  201,97
¿Error de estimación cometido? (0,25)
6,24
¿Qué tamaño de muestra se necesita si se pretende que el estimador de la media difiera
de la media poblacional en ±0,5 ºF? con una confianza del 95%? (0,25)
t 0,025,14 s1 / n = 0,5 n=2337,55 n= 2338

2.- Supongamos que tres fábricas A, B y C vierten productos al río Pisuerga en una
proporción 0,4 0,3 0,3. Estos vertidos son tóxicos con probabilidades 0,01 0,05 y 0,1
respectivamente. (0,75)
Calcular la probabilidad de un vertido tóxico al río Pisuerga.
P(tóxico) = P(tóxico/A)P(A)+ P(tóxico/B)P(B)+ P(tóxico/C)P(C) = 4.10-3+15.10-3+30.10-3 =
49.10-3
Si se detecta un vertido tóxico en el río, calcular la probabilidad de que este provenga
de cada una de las tres fábricas.
P(A/tóxico)=P(tóxico/A)P(A)/P(tóxico) = 4/49
P(B/tóxico)=P(tóxico/B)P(B)/P(tóxico) = 15/49
P(C/tóxico)=P(tóxico/C)P(C)/P(tóxico) = 30/49
Si se han detectado en el último año 10 vertidos tóxicos, calcular la probabilidad de que
5 sean de A 3 de B y 2 de C.
10  5 
P=    [ P(A/tóxico])5 [P(B/tóxico)]3 [P(C/tóxico])2=9,8.10-5
 5  3 
3.- Un proceso químico utiliza un catalizador. El tiempo de duración del catalizador es una
v.a. N (500,250) (0,75p).
Calcular P (catalizador funcione más de 500horas)
P(X>500)= P(Z>0)= 0,5
P (catalizador funcione más de 1000horas)=
P(X>1000)=P(Z>2)= 0,0228
P (catalizador funcione más de 1000horas/ha durado más de 500)=
P(X>1000/X>500) = P(X>1000)/P(X>500) = 0,0456

4. - Resolver o acotar (0, 5)

89
P (2,54 < F10, 15 < 3,8)=
P (F10, 15 < 3,8)- P (F10, 15 < 2,54)= 0,99-0,95 = 0,04
P (0,26 < F15, 10 < 0.39) =
P (F15, 10 < 0.39) - P (F15, 10 < 0,26 ) = P (F10, 15 >1/ 0.39) - P (F10, 15 >1/ 0,26 )=0,04
P (1,77 < T13 < 3,85)=
P (T13 < 3,85) -P (T13 < 1,77)=p 0.045  p0,0495
P (Z < x) = 0,95
X= 1,64
P (215 < y) = 0,05
Y = 7,26
P (T30 < z) = 0,25
P (T30 >- z) = 0,25 -z = 0,683 z = -0,683

5.- Contesta brevemente (1p)


1. Coeficiente R cuadrado Cociente entre la variación explicada por el modelo y la
VE
variación total R  cuadrado 
VT
VE    yˆ i  y 
2
2. Variación explicada por la regresión
i
3. Hipótesis estadística Cualquier afirmación sobre una característica de la población
4. Hipótesis nula La que se supone cierta, a no ser que los datos la contradigan
5. Estadístico V.a. función de la muestra
6. Región crítica En un contraste de hipótesis, subconjunto de R utilizado para hacer el
contraste. Si el valor del estadístico cae en la región crítica, se rechaza la hipótesis nula.
7. Nivel de significación Riesgo que el investigador está dispuesto a asumir. En porcentaje
corresponde al tanto por ciento de las veces que obtendríamos un resultado no válido.
2 2
1 n 1 n
8. Varianza muestral  i  x  x  o  i  x  x 
n i 1 n  1 i 1
9. Función de densidad de probabilidad Para v.a. continuas .Función positiva verificando


R
f ( x)dx  1

10. Función de probabilidad Para v.a. discretas conjunto de valores que toma la variable
con su probabilidad (x, Px) xRango(X)
11. Espacio muestral Conjunto de todos los posibles resultados de un experimento
12. Sucesos independientes La ocurrencia de uno de ellos, no influye en la ocurrencia del
otro P(AB) = P(A) P(B) P(A/B)=P(A) P(B/A)=P(B)
13. fórmula de Bayes  =  Ai Ai mutuamente excluyente con P(Ai) >0 y sea B el
resultado de un experimento con P(B)>0. La probabilidad a posteriori de los sucesos Ai viene dada
P( B / Ai ) P( Ai )
por la fórmula P( Ai / B) 
 P( B / Ai ) P( Ai )
i

14. Potencia de un contraste Potencia en un punto de la región crítica es la probabilidad


de rechazar la hipótesis nula cuando es falsa y toma el valor 
15. Error de tipo I en un contraste Es la probabilidad de rechazar la hipótesis cuando es
cierta.

90
Examen de Prácticas de Estadística: 9 de febrero de 2009

Nombre Apellidos

1.- Simula 300 valores de una distribución F 12,18 Nómbrala X (0.5p)


Valores poblacionales
Media=1,125 Desviación estándar=0,17 Mediana=0,98 Primer cuartil=0,68 Tercer cuartil=1,4
Percentil 1 = 0,26 Percentil 5 =0,39 Percentil 95 = 2,34 Percentil 99 =3,37 Moda=0,75
Valores muestrales
Media=1,091Desviación estándar=0,62Mediana=0,97Primer cuartil=0,66Tercer cuartil=1,37
Percentil 1 = 0,21 Percentil 5 =0,35 Percentil 95 = 2,43 Percentil 99 =2,95 Moda=-

Rellenar el siguiente cuadro para las clases 2 , 4 y 6


Comentar el diagrama de cajas observado
----------------------------------------------------------------------
Límite Límite Frecuencia Probabilidad
Clase Inferior Superior Marca Frecuencia Relativa
----------------------------------------------------------------------
Menor o igual 0
1 0 0,5
2 0,5 1 0,75 124 0,41 0,51-0,1=0,41
3 1 1,5
4 1,5 2 1,75 31 0,103 0,91-0,79=0,12
5 2 2,5
6 2,5 3 2,75 12 0,04 0,98-0,96=0,02
7 3 3,5
8 3,5 4
Mayor 4
----------------------------------------------------------------------
Media =1,09 Desviación estándar= 0,62
Media poblacional=1,125 Desviación estándar poblacional =0,17

2.- Trabajar con la variable simulada X: (0.5p)


Estimador de la media 1,09 Estimador de la desviación estándar 0,62
Cotas de confianza para la media y la desviación estándar para  = 0,01; 0,05; 0,1 y comentar
resultados
confianza Para la media Para la desviación estándar
Superior inferior Superior inferior
90% 1,14 1,04 0,66 0,59
95 % 1,15 1,03 0,67 0,58
99 % 1,18 1 0,69 0,57

Con los errores propuestos, calcular tamaño muestral necesario para un intervalo y las confianzas
dadas. Comentar resultados

confianza Error
0,05 0,08 0,12
90% 418 165 75
95 % 594 234 105
99 % 1021 403 181

91
3.- Simular 150 valores de una distribución de Erlang de parámetros 4 de forma y 3,5 de
escala Variable Y (0.5p)
Contrastar la hipótesis de que las varianzas de las variables X e Y son iguales.
S12 S12
p-valor = 0,07 f0 = 1,3 Región crítica { 2  1,33 }{ 2  0,76 }
S2 S2
Resultado: Aceptamos igualdad de varianzas
Calcular la potencia en el punto 2
S12  12 S12  12
P( 2  1,33 / 2  2 ) + P( 2  0,76 / 2  2 )=P(F299,149 >0,665) + P(F299,149 < 0,38)=0,998
S2 2 S2 2
Calcular de forma aproximada tamaños muestrales para alcanzar una potencia de 0.85 en el punto
1,5: 350, 175
Intervalo de confianza para la diferencia de medias al 95% -0,12 μ1- μ2  0,12
 12
Intervalo de Confianza para el cociente de varianzas al 95% 0,98 1,71
 22

3.- Contrasta si la variable simulada Y sigue una distribución normal (0.5p)


Nº de clases 9
Valor chi-cuadrado 22,56
Parámetros estimados X = 1,1 S=0,55
Grados de libertad 9-3 = 6
p-valor 0,00096
Conclusión Rechazamos normalidad de la variable Y

5:- Trabaja con la variable deporte (0.5p)


Haz una tabulación cruzada de esta variable con la variable fumas y responde
Proporción de fumadores que no hace deporte
85,71%
Proporción de no fumadores que hacen deporte
100-31,71 = 68,29 68,29%
De los que juegan al baloncesto proporción de fumadores
0%
De los que no hacen deporte, proporción de fumadores
31,58%
De los que practican judo, proporción de no fumadores
100%

92
Examen de Estadística: Segundo de Ingeniería Química. 9 de setiembre de 2009
Nombre Apellidos
Los datos siguientes muestran el índice de refracción y la densidad de 12 trozos de cristal
Índice de refracción densidad
1,514 2,480
1,515 2,482
1,516 2,481
1,517 2,490
1,518 2,483
1,520 2,505
1,516 2,484
1,517 2,486
1,518 2,495
1,519 2,498
1,522 2,511
1,525 2,520
1.- Calcular el valor de los estadísticos habituales para la variable índice de refracción.
Media , varianza, desviación estándar, máximo, mínimo, rango, mediana, cuartiles y rango inter
(0.5)
2.- (0.75)
Tabla de distribución de frecuencias y dibujar un diagrama de tallo-hojas, un histograma y
un diagrama de cajas para ambas variables
Comentar gráficos obtenidos, simetría, datos atípicos, normalidad.
3.- (0.75)
Calcula un intervalo de confianza para la media del índice de refracción al 95%.
Calcula el tamaño muestral necesario para estimar la media con un error de 0,05.
4.- (0.75)
Realiza el siguiente contraste: Región crítica, p-valor y resultado del contraste.
H0:  = 1 H1:  >1
Calcula la potencia en el punto 1,4
5.- De las siguientes tablas del análisis de regresión Rellenar huecos (0.5)
Regression Analysis - Linear model: Y = a + b*X
Dependent variable: densidad
Independent variable: indicerefra
Standard T
Parameter Estimate Error Statistic P-Value
Intercept -3,68673 -6,2112 0,0001
Slope 4,07069 10,4111 0,0000
Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 0,00173852 1 0,00173852
0,0000
Residual 10
Total (Corr.) 0,00189892
Correlation Coefficient =
R-squared =
Standard Error of Est. =
Ecuación de la recta de regresión y Contraste de la regresión (los dos) (0.5)
Intervalo de confianza para la pendiente al 95% (0.25)
Comentar los siguientes gráficos y tablas del análisis de los residuos (0.5)

93
Residual Plot Normal Probability Plot
Studentized residual

4,1 99,9
99

percentage
2,1 95
80
0,1 50
20
5
-1,9
1
0,1
-3,9
-10 -7 -4 -1 2 5
0 2 4 6 8 10 12 (X 0,001)
RESIDUALS
row number

Box-and-Whisker Plot Histogram


8

frequency
4

0
-10 -7 -4 -1 2 5 -11 -7 -3 1 5
(X 0,001) (X 0,001)
RESIDUALS RESIDUALS
Goodness-of-Fit Tests for RESIDUALS
Chi-Square Test
Lower Upper Observed Expected
Limit Limit Frequency Frequency Chi-Square
at or below -0,00321376 2 2,40 0,07
-0,00321376 -0,000967417 2 2,40 0,07
-0,000967417 0,000967419 1 2,40 0,82
0,000967419 0,00321376 5 2,40 2,82
above 0,00321376 2 2,40 0,07
Chi-Square = 3,83342 with 2 d.f. P-Value = 0,14709
6.- (0.5) Con ayuda de las tablas calcula
P( 2,54 < F10,15 < 3,8)
P( 0.26 < F15,10 < 0.39)
P( 1,77 < T13 < 3,85)
P(Z < x ) = 0,95
P( 215 < y ) = 0,05
P(T30 < z) = 0,25
7.- (0.75) La irregularidad del corte de productos de papel depende del grado de uso de
las cuchillas. Si las cuchillas son nuevas el 0,05% de los productos presentan un corte irregular; si
las cuchillas tienen un uso medio, el 0.5% de los cortes presentan irregularidades; si las cuchillas
están desgastadas, el 2% de los cortes son defectuosos. Si se conoce que de las cuchillas utilizadas
en el proceso de corte, el 10% son nuevas y el 60% tienen un uso medio. Calcular la proporción de
productos con cortes irregulares.
8.- El peso de una barra de aluminio tiene una media de 220 g. y una desviación
estándar de 10g.(0.75)
Acotar la probabilidad de que el peso esté comprendido entre 205 y 235 g.
Se toma una muestra de tamaño 100. Aproximar la probabilidad de que el número de zapatillas
cuyo peso no está comprendido entre los valores anteriores sea menor que 10. Tomar como valor de
p la cota calculada anteriormente.

94
Examen de prácticas: Estadística. Segundo de Ingeniería Química
9 de setiembre de 2009
Apellidos Nombre
1.- Distribución binomial: n = 150 p = 0.01
Media = Mediana = primer cuartil = tercer cuartil =
Percentil 1 = percentil 5 = percentil 95 = percentil 99
Simular 200 valores de una distribución binomial con n = 150 p=0.01
Comentar el diagrama de cajas observado
Rellenar el siguiente cuadro para las clases 3 y 6
Clase Valor Frecuencia Frecuencia Probabilidad F. distribucion
2 1
3 2
4 3
5 4
6 5
Media = Desviación estándar= Media poblacional= Desviación estándar
pob.=

2.- Datos correspondientes a la variable venir a clase (fichero 2)


Realiza una tabulación cruzada de esta variable con el sexo
Estimador de la proporción de chicas que vienen andando ----------------
Estimador de la proporción de chicos que vienen andando ----------------
Intervalos de confianza bilaterales para la diferencia de proporciones  = 0,01; 0,05; 0,1 y tamaños
muestrales necesarios para cometer un error de 0,1 para los mismos .

Nivel de confianza Intervalo Tamaños muestrales

90 %
95 %
99 %
Contrastar la hipótesis de que las proporciones son iguales
p-valor = Z0 = Región crítica
Resultado
Tamaños muestrales para detectar una diferencia de proporciones de 0,2 con una potencia de 0,9 ---
-

3.- Trabajar con la variable peso en el grupo de mujeres:


Estimador de la media Estimador de la desviación estándar
Cotas de confianza para la media y la desviación estándar para  = 0,01; 0,05; 0,1
confianza Para la media Para la desviación estándar
Superior inferior Superior inferior
90%
95 %
99 %

95
Fijar tres errores de acuerdo al valor de la media y calcular tamaño muestral necesario para la cota
superior y los niveles de significación anteriores
confianza Error

90%
95 %
99 %
Explicar los resultados:

4.- Trabajar con la variable peso


Contrastar la hipótesis de que las varianzas son iguales en la población de hombres y mujeres.
p-valor = F2 0 = Región crítica
Resultado:

Calcular tamaños muestrales para alcanzar una potencia de 0.85 en el punto 2

Calcular la potencia en el punto 2

5.- Trabajar con las variables altura y peso en hombres


El contraste t de regresión tiene un p valor de --- por tanto -- rechazamos la hipótesis nula y --
admitimos que existe relación lineal entre las variables.

El contraste para la ordenada en el origen tiene un p-valor de --- por tanto -- rechazamos la
hipótesis nula y -- admitimos que ésta es distinta de 0.
Región crítica para este contraste ………………………………

El contraste F de regresión tiene un p valor de --- por tanto -- rechazamos la hipótesis nula y
--- admitimos que existe relación lineal entre las variables.
Región crítica para este contraste…………………………..

El ----- de la variabilidad de los datos queda recogida por el modelo.


La relación lineal -- recoge la dependencia entre variables
VE = VNE = Error estándar de la regresión =
Rcuadrado = VT =

96
Apellidos Nombre
Examen de Estadística: 2º curso de Ingeniería Química. 9 de febrero de 2010
1.- Se han obtenido los siguientes datos del rendimiento de dos catalizadores
Catalizador I: 91.5 94.18 92.18 95.39 91.79 89.07 94.72 89.21
Catalizador II: 89.19 90.95 90.46 93.21 97.19 97.04 91.07 92.75
Hacer un diagrama de tallo-hojas para los datos de cada catalizador (0.25 puntos)
Catalizador I Catalizador II
2 8|99 1 8|9
4 9|11 4 9|001
4 9|2 4 9|23
3 94|445 2 9|
2 9|77
Calcular los percentiles 5, 15, 25, 50, 75, 85 y 95 de cada catalizador y hacer algún comentario
comparando los rendimientos. (0.25 puntos)
Catalizador I Catalizador II
5,0% = 89,07 dato 1 5,0% = 89,19
15,0% = 89,21 dato 2 15,0% = 90,46
25,0% = 90,355 (dato2+dato3)/2 25,0% = 90,705
50,0% = 91,985 (dato4+dato5)/2 50,0% = 91,91
75,0% = 94,45 (dato6+dato7)/2 75,0% = 95,125
85,0% = 94,72 dato 7 85,0% = 97,04
95,0% = 95,39 dato 8 95,0% = 97,19
Los percentiles del segundo catalizador, están por encima de los percentiles del primero, indicando
que quizá el rendimiento sea mayor; pero la mediana es mayor en el catalizador I. Los percentiles
no son simétricos respecto de la mediana en ninguno de los dos catalizadores, la asimetría está más
marcada en el segundo catalizador.
Realizar una tabla de distribución de frecuencias y un histograma de los rendimientos de cada
catalizador en la misma gráfica. (0.25 puntos)
Catalizador I
Límite Límite Frecuencia Frec Frec Frec
Clase Inferior Superior Marca Relativa Acu Rel. Acu.
Menor o igual 89,0 0 0,0 0 0,0000
1 89,0 92,0 90,5 4 0,5 4 0,5000
2 92,0 95,0 93,5 3 0,375 7 0,8750
3 95,0 98,0 96,5 1 0,125 8 1,0000
Mayor 98,0 0 0,0 8 1,0000
Catalizador II
Límite Límite Frecuencia Frec Frec Frec
Clase Inferior Superior Marca Relativa Acu Rel. Acu.
Menor o igual 89,0 0 0,0000 0 0,0000
1 89,0 92,0 90,5 4 0,5000 4 0,5000
2 92,0 95,0 93,5 2 0,2500 6 0,7500
3 95,0 98,0 96,5 2 0,2500 8 1,0000
Mayor 98,0 0 0,0000 8 1,0000

97
Hacer los diagramas de cajas de los dos rendimientos en la misma gráfica y comentar los
gráficos. (0.25 puntos)
Catalizador I Catalizador II
RI= 94.45 – 90.35 = 4.10 RI= 95.125 – 90.70 = 4.425
Q1 – 4.10 x1.5 = 84,2 Q1 – 4.425 x1.5 = 84,06
Q3 + 4.10 x1.5 = 100.65 Q3 + 4.425 x1.5 = 101.76
LI = 89,07 LI = 89,18
LS= 95.39 LS= 97.19

Diagrama de cajas

Catalizador I

Catalizador II

89 91 93 95 97 99

Las medianas son similares en los dos catalizadores. Ambos catalizadores presentan asimetría a la
derecha. El catalizador II presenta mayor dispersión y mayor asimetría hacia la derecha.
Calcular un intervalo de confianza para el cociente de varianzas (0.25)
Catalizador I Catalizador II
n 8 8
Media 92,255 92,7325
Varianza 5,68831 8,90099
Desviación Estándar 2,38502 2,98345
Radio de varianzas = 0,639065 f0.025,7,7 = 4.99 f0.975,7,7 = 0.2
Intervalo de confianza [0,127943; 3,19207]
Contrastar H0: σ1 = σ2 mediante el cálculo de la región crítica y el p-valor. (0.25)
H1: σ1σ2
Región crítica {F0< 0.2 } Ụ {F0 >4.99 } f0 = 0.63 no está en la región crítica ,aceptamos igualdad
de varianzas.
P-valor P(F7,7 >0.63)
De las tablas P(F7,7 >3,79) = 0.05 por tanto P(F7,7 > 0,26) = 0.95
0.05 < p-valor < 0.95 Apoya nuestra decisión de aceptar la hipótesis nula.
Calcular la potencia en el punto 0.5 (0.25)
P(0.5) = P(RC/(σ1/ σ2) = 0.5) = P (F0 < 0.2 /(σ1/ σ2) = 0.5) + P (F0 > 4.99 /(σ1/ σ2) = 0.5) = P(F7,7 <
0.2/0.25) + P(F7,7 > 4.99/0.25) = P(F7,7 < 0.8) +P(F7,7 >19.96)
De las tablas P(F7,7 > 6,99) = 0.01 por tanto P(F7,7 > 19,96) < 0.01
P(F7,7 > 3,79) = 0.05 luego P(F7,7 > 0,26) = 0,95
P(F7,7 < 0,26) = 0.05 De donde P(F7,7 < 0.8) > P(F7,7 < 0,26) = 0.05
P(0,5) > 0,05

98
Calcular un intervalo de confianza para la diferencia de medias. (0.25)
Diferencia de medias: - 0.4775 t14,0.025 = 1,746
Intervalo de confianza asumiendo varianzas iguales S p = 2.67
-0,4775 +/- 2,89639 [-3,37389,2,41889]
Contrastar H0: 1 = 2 mediante el cálculo de la región crítica y el p-valor.(0.25)
H1: 1< 2
Región crítica {T0 <-1.746} t0 = - 0.23 no está en la región crítica luego aceptamos que la primera
media es mayor o igual que la segunda
p-valor P(T14 < -0.23) = P(T14 > 0.23) > P(T14 >0.25) = 0.4
Calcular la potencia en el punto -0.5 (0.25)
Potencia (-0.5) = P(T0 < -1,746/μ1 – μ2 = -0.5) = P(T14 < -1.746 + 0.5/1.89) =
P(T14 < -1.48) = P(T14 > 1.48)
P(T14 > 1.34) = 0.1
P(T14 >.1.76) = 0.05
0.05 < P(-0.5) < 0.1
2.- Dado que no todos los pasajeros de una aerolínea abordan el vuelo para el que han reservado, la
compañía aérea vende 200 billetes para un vuelo de 160 pasajeros. Si la probabilidad de que un
pasajero no aborde el vuelo es de 0,05 y los pasajeros se comportan de forma independiente unos de
otros. Calcular o aproximar (0.5)
P (todos los pasajeros aborden el vuelo)
Sea X el nº de pasajeros que abordan el vuelo. X → B (200, 0,95)
- P(X = 200) = (0,95)200 = 3,5.10-5
P (un vuelo parta vacío)
- P(X = 0) = (0,05)200 = 6. 10-261 ≈ 0
P (100 < nº de pasajeros ≤ 125)
- X puede ser aproximada por una distribución normal de media 200x0,95 = 190 y varianza
200x0,95x0,05 = 9,5; desviación estándar 3,08
100  190 125  190 
P(100 < X ≤ 125) ≈ P  Z = Φ(-21)-Φ(-29) ≈ 0
 3,08 3,08 
P ( nº de pasajeros ≤ 160)
- P(X ≤ 160) ≈ P(Z ≤ -9,74) ≈ 0.

3.- Elige la respuesta correcta (1)


1. Sean X1 y X2 dos variables aleatorias independientes B (5, 0.4). La varianza de Y = (X1
+ X2) es
(a) 1.2 (b) 0.6 (c) Ninguna de las otras dos
2. Si dos sucesos son incompatibles, son independientes
(a) Si, claro. (b) No (c) Si , porque la intersección es el conjunto vacío.
3. Si lanzamos 3 monedas al aire, ¿cuál es la probabilidad de que las 3 sean caras o las 3
sean cruces?
(a) ¼ (b) 1/8 (c) 1/2
4. Para estimar la media de una población normal, la media muestral es
(a) Un estimador insesgado pero no consistente.
(b) Un estimador insesgado y consistente.
(c) Un estimador insesgado, consistente y con error cuadrático medio nulo.

5. Un intervalo de confianza al 90% para estimar θ es

99
(a) Un intervalo que contiene al 90% de los posibles valores de θ.
(b) Un intervalo aleatorio que contiene a θ para el 90% de las muestras aleatorias extraídas
de la población.
6. En una muestra aleatoria simple
(a) las observaciones son independientes
(b) todos los elementos de la población son iguales
(c) los valores de una muestra particular son variables aleatorias
7. La distribución en el muestreo de la media muestral
(a) es una distribución normal siempre
(b) es una distribución normal si las observaciones son independientes
(c) de forma general, sigue aproximadamente una distribución normal
8. La probabilidad de error de tipo II de un contraste de hipótesis
(a) es igual a 1-P (error tipo I)
(b) siempre es mayor o igual que la probabilidad de error de tipo I
(c) es 1-Potencia del test
9. El intervalo de confianza para la desviación típica de una población normal
(a) no es simétrico porque los datos son siempre mayores o iguales que cero
(b) no es simétrico porque la distribución normal es mayor o igual que cero
(c) no es simétrico porque la distribución χ2 es no negativa
10. Si aumentamos el valor del nivel de confianza, la longitud del intervalo de confianza seria:
(a) mayor
(b) menor
(c) podría ser mayor o menor, dependiendo del valor desconocido del parámetro

4.- Tres máquinas producen arandelas. El ritmo de producción de A es el doble que el de B y el


mismo que el de C. Las arandelas producidas por cada máquina se van empaquetando en lotes que
son colocados en un almacén a medida que se van produciendo. De las arandelas producidas por A,
el 10% son defectuosas por grandes y el 5% por pequeñas. Para B, el 5% son defectuosas por
grandes y el 10% por pequeñas. Para C, el 10% son defectuosas por grandes y el 10% por pequeñas.
(1punto)
Se extrae al azar un lote del almacén y se comprueba la validez de 20 arandelas del lote, resultando
3 defectuosas por grandes y ninguna por pequeña. Hallar la probabilidad de que se trate de un lote
producido por la máquina A.
P(A) = 0.4 P(B) = 0.2 P(C) = 0.4 Probabilidades a priori
Sea G el suceso la pieza es grande; P el suceso la pieza es pequeña; N la pieza es buena; y H el
suceso de un lote de 20 arandelas 3 son grandes, 0 pequeñas y 17 buenas.
Se conocen las probabilidades condicionadas
P(G/A) = 0.1 P(P/A) = 0.05 P(N/A) = 0.85
P(G/B) = 0.05 P(P/B) = 0.1 P(N/B) = 0.85
P(G/C) = 0.1 P(P/C) = 0.1 P(N/C) = 0.8
Nos piden encontrar P(A/H) una probabilidad a posteriori
Aplicamos la fórmula de Bayes
 20 
P(H/A) =  0.13 x 0.8517 = 0.0719
3
 20 
P(H/B) =  0.05 3 x 0.8517 = 0.00899
3

100
 20 
P(H/C) =  0.13 x 0.817 = 0.0257
3
0.0719 x0.4
P(A/H) = = 0.704
0.0719 x0.4  0.00899 x0.2  0.0257 x0.4
5.- Resolver las ecuaciones (0.5 puntos)
a) P(25 ≤ x) = 0,95 P(25 > x) = 0,05 x = 11,07
2
b) P(12,549 ≤  10 ≤ y) = 0,20
P(12,549 ≤ 210 ≤ y) = P(210 ≤ y) - P(210 ≤ 12,549) = 0,20
P(210 >15,99) = 0,1 P(210 > 9,34 ) =0,5 0,5 < P(210 ≤ 12,549) < 0,9
0,7 < P(210 ≤ y) < 1 P(210 > y) < 0,3 y > 15,99
c) P(T15 ≤ z) = 0,01
P(T15 ≤ z) = 0,01 z ha de ser negativo P(T15 > -z ) = 0,01 -z = 2,602 z = -2,602
d) P(T8 > t) = 0.9
P(T8 > t) = 0.9 t ha de ser negativo P(T8 > -t ) = 0,1 -t = 1,397 t = -1,398
e) P( 1,476 ≤ T5 ≤ u) = 0,075
P( 1,476 ≤ T5 ≤ u) = P(T5 ≤ u) - P(T5 ≤ 1,476) = 0,075
P(T5 > 1,476) = 0,1 P(T5 ≤ u) = 0,975 P(T5 > u) =0,025 u= 2,57
f) P( F10,20 ≤ 2,42) = v
P( F10,20 > 2,77) = 0,025 P( F10,20 > 2,35) = 0,05 0,025 < P( F10,20 > 2,42) < 0,05
0,95 ≤ P( F10,20 ≤ 2,42) ≤ 0,975

6.- En una muestra de tamaño 25, se ha obtenido una media muestral de 3,5 y una desviación
estándar muestral de 1.25. (0.5)
¿Qué porcentaje mínimo de observaciones cae dentro del intervalo [1, 6]?

El 75%
¿Qué porcentaje mínimo de observaciones cae dentro del intervalo [-0,25, 7,25]?
El 88%

101
Apellidos Nombre
Examen de prácticas: 2º de ingeniería química, 2 de febrero de 2010

1.- Distribución Chi-cuadrado con parámetros: n = 50


Media 50 Mediana 49,33 primer cuartil 42,94 tercer cuartil 56,33
Percentil 1 29,71 percentil 5 34,76 percentil 95 67,50 percentil 99 76,15
Simular 150 valores de una distribución Chi-cuadrado : n = 50
Rellenar el siguiente cuadro para las clases 3 y 6
Comentar el diagrama de cajas observado asimetría a la derecha, 4 obsevaciones atípicas a la
dcha.
Límite Límite Frecuencia
Clase Inferior Superior Marca Frecuencia Relativa Probabilidad
Menor o igual 30.0
2 30,0 35,0
3 35,0 40,0 37,5 18 0,12 0,094
4 40,0 45,0
5 45,0 50,0
6 50,0 55,0 52,5 29 0,19 0,182
7 55,0 60,0
8 60,0 65,0
Mayor 65,0
--------------------------------------------------------------------------------
Media 50,61 Desviación estándar 10,392 Media poblacional 50 Desviación estándar poblacional 10

2.- Trabajar con la variable altura (Fichero II)


Contrastar la hipótesis de que las varianzas son iguales en hombres y mujeres
p-valor = 0,89 f0 = 0,93 Región crítica {F0 > 2,22}{F0< 0,41}
Resultado: Aceptamos la hipótesis de igualdad de varianzas
Calcular tamaños muestrales para alcanzar una potencia de 0.85 en el punto 2: 61; 104
Calcular la potencia en el punto 2
P(2)= P[F0>2,22/(σ1/σ2)2=2] + P[F0<0,41/(σ1/σ2)2=2] = P[F18,31>1,11] + P[F18,31<0,205] = 0,388

3.- Trabajar con las variables altura y peso en las mujeres


El contraste de regresión tiene un p valor de --- 0,0008
¿Rechazamos la hipótesis nula? ---si
¿Admitimos que existe relación lineal entre las variables?--si
El contraste para la ordenada en el origen tiene un p-valor de --0
¿Aceptamos la hipótesis nula ? ---no
¿Decimos que es significativamente distinta de 0? ---si
Región crítica para este contraste --- {|^b| > 7,4x 2,05}
---- {|^a| > 0,13x2,05}

El contraste F de regresión tiene un p valor de --- 0.0008


¿Rechazamos la hipótesis nula? --- si
¿Admitimos que existe relación lineal entre las variables.?----si
Región crítica para este contraste {F0 > 5,59}{ |F0 <99x10-5}
----
Variabilidad de los datos queda recogida por el modelo---32,35%
¿Es adecuado el modelo de regresión?---- No
VE = 349,07 VNE = 729,7 Error estándar de la regresión = 5,016

102
4.- Datos correspondientes a la variable venir a clase
Realiza una tabulación cruzada de esta variable con el sexo
Estimador de la proporción de chicas que vienen andando ---------------- 0,45
Estimador de la proporción de chicos que vienen andando ---------------- 0,63
Intervalos de confianza bilaterales para la diferencia de proporciones  = 0,01; 0,05; 0,1
Tamaños muestrales necesarios para cometer un error de 0,1 para los mismos .

Nivel de confianza Intervalo Tamaños muestrales

90 % [-0,41 ; 0,054] 184 108


95 % [-0,45 ; 0.098] 260 153
99 % [-0,54 ; 0,18] 449 264
Contrastar la hipótesis de que las proporciones son iguales
p-valor = 0,22 z0 = -1,23 Región crítica {|Z0|>1,96}
Resultado Aceptamos que las proporciones son iguales

Tamaños muestrales para detectar una diferencia de proporciones de 0,2 con una potencia de 0,9 ---
- 181 ; 104

5.- Trabajar con la variable peso en el grupo de hombres:


Estimador de la media 74,975 Estimador de la desviación estándar 9,38
Cotas de confianza para la media y la desviación estándar para  = 0,01; 0,05; 0,1
confianza Para la media Para la desviación estándar
Superior inferior Superior inferior
90% 77,76 72,18 11,98 7,84
95 % 78,6 71,35 12,86 7,45
99 % 80,3 69,65 14,8 6,8
Fijar tres errores 0,5; 2 y 5 kilos y calcular tamaño muestral necesario para la cota superior y los
niveles de significación anteriores

confianza Error
0,5 2 5
90% 580 38 8
95 % 953 62 12
99 % 1905 123 23
Explicar los resultados: Las cotas superiores crecen con el nivel de confianza mientras que las
cotas inferiores decrecen.
El tamaño muestral crece con el nivel de confianza y decrece con el error.

103
Examen de Estadística: Segundo de Ingeniería Química. 22 de julio de 2010
Nombre Apellidos
Los datos siguientes muestran el índice de refracción y la densidad de 12 trozos de cristal
Índice de refracción densidad
1,514 2,480
1,515 2,482
1,516 2,481
1,517 2,490
1,518 2,483
1,520 2,505
1,516 2,484
1,517 2,486
1,518 2,495
1,519 2,498
1,522 2,511
1,525 2,520
1.- Calcular el valor de los estadísticos habituales para la variable índice de refracción.
Media, varianza, desviación estándar, máximo, mínimo, rango, mediana, meda, cuarteles,
rango intercuartílico, percentil 1, percentil 95 (0.5)
2.- (1) Tabla de distribución de frecuencias y dibujar un diagrama de tallo-hojas, un
histograma y un diagrama de cajas para ambas variables.
Comentar gráficos obtenidos, simetría, datos atípicos, normalidad.
3.- (0.75) Calcula un intervalo de confianza para la media del índice de refracción al 95%.
Calcula el tamaño muestral necesario para estimar la media con un error de 0,05.
4.- (1)Realiza el siguiente contraste: Región crítica, p-valor y resultado del contraste.
H0:  = 1 H1:  >1 Calcula la potencia en el punto 1,4
5.- (0.5) Con ayuda de las tablas calcula
P( 2,54 < F10,15 < 3,8)
P( 0.26 < F15,10 < 0.39)
P( 1,77 < T13 < 3,85)
P(Z < x ) = 0,95
P( 215 < y ) = 0,05
P(T30 < z) = 0,25
6.- (1) La irregularidad del corte de productos de papel depende del grado de uso de las
cuchillas. Si las cuchillas son nuevas el 0, 5% de los productos presentan un corte irregular; si las
cuchillas tienen un uso medio, el 1% de los cortes presentan irregularidades; si las cuchillas están
desgastadas, el 2% de los cortes son defectuosos. Si se conoce que de las cuchillas utilizadas en el
proceso de corte, el 10% son nuevas y el 60% tienen un uso medio. Calcular la proporción de
productos con cortes irregulares.
7.- El peso de una barra de aluminio tiene una media de 22 g. y una desviación estándar
de 1g.(1,25)
Acotar la probabilidad de que el peso esté comprendido entre 20,5 y 23,5 g.
Se toma una muestra de tamaño 100. Aproximar la probabilidad de que el número de barras cuyo
peso no está comprendido entre los valores anteriores sea menor que 10. Tomar como valor de p la
cota calculada anteriormente.
Responder a las mismas preguntas suponiendo que la distribución es normal

104
Apellidos Nombre
Examen de prácticas: 2º de ingeniería química, 22 de julio de 2010
1.- Distribución gamma con parámetros: forma =10 ; escala =3
Media Mediana primer cuartil tercer cuartil
Percentil 1 percentil 5 percentil 95 percentil 99
Simular 300 valores de una distribución gamma (10,3)
Rellenar el siguiente cuadro para las clases 3 , 6 y 8
Dibujar el diagrama de cajas observado
Clase Limite inferior Limite sup marca Frecuencia Frec Rel Frec Acumu Probabilidad
Menor o igual 0,8
1 0,8 1,4
2 1,4 2,0
3 2,0 2,6
4 2,6 3,2
5 3,2 3,8
6 3,8 4,4
7 4,4 5,0
8 5,0 5,6
9 5,6 6,2
10 6,2 6,8
mayor 6,8
Media = Desviación estándar= Media poblacional= Desviación estándar poblacional
2.- Simular 300 valores de una distribución de bernoulli de parametro 0,1
Simular 300 valores de una distribución binomial de parámetros 3 y 0,1
Realiza una tabulación de la variable binomial.
Rellena
Clase Valor Frecuenci Frecuencia Frecuencia Probabilidad
a Relativa acumulada
1 0
2 1
3 2
4 3
Haz una tabulación cruzada de la variable bernoulli con la variable binomial
Proporción de ceros de la variable de bernoulli para un valor 2 de la variable binomial-----
Proporción del valor 2 de la variable binomial para un valor 1 de la variable de bernoulli --- (1)
Proporción del valor 2 de la variable binomial para un valor 0 de la variable de bernoulli --- (2)
Intervalo de confianza para la diferencia de proporciones (1) y (2)
Nivel de confianza Intervalo Tamaños muestrales
90 %
95 %
99 %
Contrastar la hipótesis de que las proporciones son iguales
p-valor = z0 = Región crítica Resultado
Tamaños muestrales para detectar una diferencia de proporciones de 0,05 con una potencia de 0,9 –
3.- Trabajar con la variable gamma
Contrastar la hipótesis de que las varianzas son iguales en los dos grupos determinados por la
variable de bernoulli

105
p-valor = f0 = Región crítica Resultado:
Calcular tamaños muestrales para alcanzar una potencia de 0.85 en el punto 2:
Calcular la potencia en el punto 2
4.- Trabajar con la variable gamma con el valor 1 en la variable de bernoulli
Estimador de la media Estimador de la desviación estándar
Cotas de confianza para la media y la desviación estándar para  = 0,01; 0,05; 0,1
confianza Para la media Para la desviación estándar
Superior inferior Superior inferior
90%
95 %
99 %
Fijar tres errores 0,05; 0,1 y 0,5 y calcular tamaño muestral necesario para la media y los niveles de
significación anteriores. Explicar los resultados:
confianza Error

90%
95 %
99 %
5.- En el siguiente analisis de regresion contestar
Dependent variable: notafinal
Independent variable: mediacontroles
Coefficients
Least Squares Standard T
Parameter Estimate Error Statistic P-Value
Intercept 1,47237 0,525664 2,80097 0,0069
Slope 0,607833 0,081726 7,43741 0,0000
Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 128,468 1 128,468 55,32 0,0000
Residual 137,026 59 2,32247
Total (Corr.) 265,493 60
Correlation Coefficient = 0,695617 R-squared = 48,3883 percent
R-squared (adjusted for d.f.) = 47,5135 percent Standard Error of Est. = 1,52396
Mean absolute error = 1,23661 Durbin-Watson statistic = 2,27636 (P=0,8615)
Lag 1 residual autocorrelation = -0,173633
El contraste de regresión tiene un p valor de --- ¿Rechazamos la hipótesis nula? ---
¿Admitimos que existe relación lineal entre las variables?--
El contraste para la ordenada en el origen tiene un p-valor de --
¿Aceptamos la hipótesis nula ? --- ¿Decimos que es significativamente distinta de 0? ---
Región crítica para este contraste -------
El contraste F de regresión tiene un p valor de ---
¿Rechazamos la hipótesis nula? --- ¿Admitimos que existe relación lineal entre las variables.?----
Región crítica para este contraste ----
Variabilidad de los datos queda recogida por el modelo---
¿Es adecuado el modelo de regresión?----
VE = VNE = Error estándar de la regresión =

106