Академический Документы
Профессиональный Документы
Культура Документы
EJERCICIOS RESUELTOS
Resolución:
El gráfico muestra puntos muy próximos a una línea recta y esparcida aleatoriamente
alrededor de ella. Esto sugiere que los datos podrían haberse obtenido de una
población normal. Se puede hacer una estimación de la media observando el valor
correspondiente a una frecuencia acumulada del 50%, dando aproximadamente 10,2. De
hecho, los números fueron generados por un ordenador como muestra aleatoria de una
población normal con media 10 y desviación estándar 1.
1
QUIMIOMETRÍA
Frecuencia % de frecuencia
Medida acumulada acumulada
X Y
8.71 1 5
8.82 2 10
8.90 3 15
8.92 4 20
9.17 5 25
9.53 6 30
9.83 7 35
9.84 8 40
10.04 9 45
10.30 10 50
10.31 11 55
10.32 12 60
10.40 13 65
10.65 14 70
10.91 15 75
11.12 16 80
11.68 17 85
11.69 18 90
11.88 19 95
2
QUIMIOMETRÍA
Resolución:
( x́−µ ) √ n
t=
s
G . L .=8−1=7
3
QUIMIOMETRÍA
El valor crítico de ¿ t∨¿ es 2,36. Ninguno de los valores calculados excede este valor, de
manera que ninguno de los valores medios medidos difiere significativamente del valor
certificado correspondiente.
4
QUIMIOMETRÍA
3. Para los datos del ejemplo 3.3.3 relativos a la concentración de un tiol en el lisado
sanguíneo.
a. Verificar que 2.07 no es un dato anómalo para el grupo “normal”.
b. Demostrar que las varianzas de los dos grupos difieren significativamente.
Resolución:
En primer lugar, es preciso ordenar los valores por tamaño: 1,84 1,85 1,91 1,92 1,92
1,94 2,07
Concentración de tiol ( mm )
Normal Reumatoide
1.84 2.81
1.92 4.06
1.94 3.62
1.92 3.27
1.85 3.27
1.91 3.76
2.07
CONTRASTE DE DIXON
Q( calculado) 1.3 Dato de tabla 0.57
5
QUIMIOMETRÍA
|valor sospechoso−x́|
G=
s
Normal
Media 1.9214
Error típico 0.0286
Mediana 1.92
Moda 1.92
Desviación estándar 0.0756
Varianza de la muestra 0.0057
Curtosis 2.5657
Coeficiente de asimetría 1.2856
Rango 0.23
Mínimo 1.84
Máximo 2.07
Suma 13.45
Cuenta 7
Nivel de confianza (95.0%) 0.0699
CONTRASTE DEGRUBBS
Q( calculado) 1.3 Dato de tabla 2.020
El valor crítico (P = 0,05) es 2,02. Así pues, el valor sospechoso tampoco se rechaza al
nivel de significación del 5%.
s21
G= 2
s2
6
QUIMIOMETRÍA
Normal Reumatoide
Media 1.9214 Media 3.465
Error típico 0.0286 Error típico 0.1798
Mediana 1.92 Mediana 3.445
Moda 1.92 Moda 3.27
0.075
Desviación estándar 6 Desviación estándar 0.4405
Varianza de la muestra 0.0057 Varianza de la muestra 0.1940
Curtosis 2.5657 Curtosis -0.2919
Coeficiente de asimetría 1.2856 Coeficiente de asimetría -0.1959
Rango 0.23 Rango 1.25
Mínimo 1.84 Mínimo 2.81
Máximo 2.07 Máximo 4.06
Suma 13.45 Suma 20.79
Cuenta 7 Cuenta 6
Nivel de confianza (95.0%) 0.0699 Nivel de confianza (95.0%) 0.4623
0.44052
G= =34
0.07562
G=34
7
QUIMIOMETRÍA
El valor crítico es F6.5= 4,950 (P = 0,05) para un contraste de dos colas. Ya que el valor
calculado de F excede a éste, queda constancia de que las varianzas difieren
significativamente al nivel de significación del 5%.
Resolución:
s 21 183.95
F= 2 = =1.70
s 2 108.58
8
QUIMIOMETRÍA
El valor crítico es F6,6 = 5,82 (P = 0,05) para un contraste de dos colas. Ya que el valor
calculado de F no excede a este, llegamos a la conclusión de que las varianzas no difieren
significativamente.
s=12.09
9
QUIMIOMETRÍA
Las medias de muestra son 780,9 para el pepino y 772,6 para el tomate.
Si utiliza la Ecuación:
( x´1− x́ 2 )
t=
1 1
s
√ +
n1 n2
( 780.9−772.6 )
t= =1. 28
1 1
12.09 +
7 7√
t=1.28
Para un contraste de dos colas, el valor crítico es 2,18 (P = 0,05), de manera que las medias
no difieren de forma significativa.
10
QUIMIOMETRÍA
Profundidad de la
Agua recuperada (%)
muestra (m)
7 33.3 33.3 35.7 38.1 31.0 33.3
8 43.6 45.2 47.7 45.4 43.8 46.5
16 73.2 68.7 73.6 70.9 72.5 74.5
23 72.5 70.4 65.2 66.7 77.6 69.8
Resolución:
Esta tabla muestra diferentes estadísticos de % Agua recuperada para cada uno de los 4
niveles de Profundidad. La intención principal del análisis de varianza de un factor es la de
11
QUIMIOMETRÍA
comparar las medias de los diferentes niveles, enlistados aquí bajo la columna de Promedio.
Selecciones Gráfica de Medias de la lista de Opciones Gráficas para mostrar gráficamente
las medias.
Suma de Cuadrado
Fuente Gl Razón-F Valor-P
Cuadrados Medio
Entre grupos 6365.71 3 2121.9 261.92 0.0000
Intra grupos 162.028 20 8.10142
Total (Corr.) 6527.74 23
12
QUIMIOMETRÍA
Error Est.
Profundidad Casos Media (s agrupada) Límite Inferior Límite Superior
7 6 34.116 1.162 32.4027 35.8306
7
8 6 45.366 1.162 43.6527 47.0806
7
16 6 72.233 1.162 70.5194 73.9473
3
23 6 70.366 1.162 68.6527 72.0806
7
Total 24 55.520
8
13
QUIMIOMETRÍA
El StatAdvisor. Esta tabla muestra la media de % Agua recuperada para cada nivel de
Profundidad. También muestra el error estándar de cada media, el cual es una medida de la
variabilidad de su muestreo. El error estándar es el resultado de dividir la desviación
estándar mancomunada entre el número de observaciones en cada nivel. La tabla también
muestra un intervalo alrededor de cada media. Los intervalos mostrados actualmente están
basados en el procedimiento de la diferencia mínima significativa (LSD) de Fisher. Están
construidos de tal manera que, si dos medias son iguales, sus intervalos se traslaparán un
95.0% de las veces.
82
72
%Agua recuperada
62
52
42
32
7 8 16 23
Profundidad
√ 8.10142=2.846
Este diagrama indica que el resultado significativo se debe a que los dos primeros niveles
difieren entre sí y, a la vez, son diferentes de los dos niveles más bajos.
2 2
sx
√ x(t
n h ( n−1) √
)= √8.10142 x 6 x 2.09=3.43
14
QUIMIOMETRÍA
Si tomamos t20 = 2,09 (P = 0,05, contraste de dos colas), obtenemos una mínima diferencia
significativa de 3,43. Las medias, en orden ascendente de tamaño, son 34,1 (a 7 m), 45,4 (a
8 m), 70,4 (a 23 m) y 72,2 (a 16 m). Las diferencias entre medias consecutivas son 11,3,
25,0 y 1,8. Comparando estas diferencias con la mínima diferencia significativa,
observamos que no existe diferencia significativa entre las dos profundidades más bajas: el
resultado significativo se debe a que los dos resultados más altos se diferencian
significativamente entre sí y, a la vez, son diferentes de las dos profundidades más bajas.
Verificación de Varianza
Prueba Valor-P
Levene's 1.2600 0.314853
5
15
QUIMIOMETRÍA
16
QUIMIOMETRÍA
Resolución:
En primer lugar, es necesario emplear un contraste F para comprobar si las varianzas de las
dos muestras difieren de forma significativa. A partir de la Ecuación:
s 2 0.01577
F= 12 = =6.9573
s 2 0.00226
RESUMEN
Grupos Cuenta Suma Promedio Varianza
0.0157714
Machos 8 3.2 0.40 3
0.0022666
Hembras 4 1.28 0.32 7
El valor crítico es F7,3 = 14,62 (P = 0,05) para un contraste de dos colas. Ya que el valor
calculado de F no excede a éste, la conclusión que deriva es que las varianzas no difieren
significativamente. Como consecuencia, se pueden combinar las varianzas y realizar un
17
QUIMIOMETRÍA
s=0.108
Si utiliza la Ecuación:
( x´1− x́ 2 ) ( 0.40−0.32 )
t= = =1.21
1 1 1 1
s
√ +
n1 n2 √
0.108 +
8 4
El valor crítico, t10 = 2,23 (P = 0,05, contraste de dos colas). Como el valor calculado de t es
inferior a éste, no existe constancia de que la concentración de norepinefrina difiera entre
sexos.
7. Al leer en una bureta 0.01 ml, un analista tiene que estimar la cifra final. La
siguiente tabla de frecuencias proporciona las últimas cifras de 50 lecturas.
18
QUIMIOMETRÍA
Dígito 0 1 2 3 4 5 6 7 8 9
Frecuencia 1 6 4 5 3 11 2 8 3 7
Resolución:
La hipótesis nula es que todos los dígitos son iguales, por lo que la frecuencia esperada para
cada uno es 50/10 = 5. Utilizamos un contraste chi-cuadrado con el estadístico X2
calculado en la Ecuación (3.12). El cálculo se plantea más fácilmente en una tabla como la
siguiente.
2
Dígito
Frecuencia Frecuencia ( OI −EI )
observada, Oi esperada, Ei EI
0 1 5 3,2
1 6 5 0,2
2 4 5 0,2
3 5 5 0
4 3 5 0,8
5 11 5 7,2
6 2 5 1,8
7 8 5 1,8
8 3 5 0,8
9 7 5 0,8
Total X2 = 16,8
19
QUIMIOMETRÍA
Resolución:
Para cada material, primeramente es necesario emplear el contraste F para probar si las
varianzas de las dos muestras difieren significativamente. Si parte de la Ecuación:
s 21 0.26 2
Pino: F= 2 = 2
=3.449
s 2 0.14
s 21 0.80 2
Haya: F= = =3.306
s 22 0.44 2
s 21 4.662
Planta acuática: F= 2 = 2
=3.139
s 2 2.63
20
QUIMIOMETRÍA
2 2
Pino: s= ( 5−1 ) 0.26 + ( 5−1 ) 0.14 =0.0436
√ 5+ 5−2
2 2
Haya: s= ( 5−1 ) 0.80 + ( 5−1 ) 0.44 =0.4168
√ 5+ 5−2
2 2
Planta acuática: s= ( 5−1 ) 4.66 + (5−1 ) 2.63 =14.316
√ 5+ 5−2
Con la Ecuación:
( x´1− x́ 2 ) ( 2.15−2.45 )
t= = =2.27
Pino: 1 1 1 1
s
√ +
n1 n2
0.0436 +
√
5 5
( x´1− x́ 2 ) ( 5.12−7.27 )
t= = =5.27
Haya: 1 1 1 1
s
√ +
n1 n2
0.4168 +
√
5 5
( x´1− x́ 2 ) ( 23.08−32.1 )
t= = =3.73
Planta acuática: 1 1 1 1
s
√ +
n1 n2
14.316
√ +
5 5
Para un contraste de dos colas, los valores críticos son t8 = 2,31 (P = 0,05) y t8 = 3,36 (P =
0,01), lo que significa que las medias no difieren significativamente al nivel del 5% para las
21
QUIMIOMETRÍA
muestras de pino, pero sí difieren al nivel de significación del 1% en las muestras de haya y
de planta acuática.
Resolución:
Frecuencia Frecuencia
O-E (O - E)2/2
Observada, Oi esperada, Ei
24 15.25 8.75 5.020
17 15.25 1.75 0.201
11 15.25 -4.25 1.184
9 15.25 -6.25 2.561
Totales 61 0 X2 = 8.966
22
QUIMIOMETRÍA
La hipótesis nula es que el primer trabajador no difiere de los otros tres. Esto significa que
se espera que el primer trabajador tenga 15,25 roturas y que los otros tres tengan en total
15,25 × 3 = 45,75 roturas. El número de grados de libertad es 1; así pues, se debería aplicar
la corrección de Yates.
El valor crítico para el grado de libertad 1 es 3,84 (P = 0,05). Dado que 5,951 3,84, la
hipótesis nula se descarta: hay evidencia de que el primer trabajador difiere de los otros
tres. Observemos que el contraste no muestra en qué dirección difiere el primer trabajador
de los otros. Esto se debe deducir a partir de los datos. En este caso, es evidente que el
primer trabajador es más propenso a los accidentes.
La hipótesis nula es que el segundo, tercero y cuarto trabajadores no difieren entre sí. Si
este es el caso, entonces se espera que el número total de roturas de 37 se divida por igual
entre cada uno de ellos, obteniendo frecuencias esperadas de 37/3. El cálculo de X 2 se
muestra en la siguiente tabla.
23
QUIMIOMETRÍA
2
Frecuencia Frecuencia |Oi−E i|
Observada, Oi esperada, Ei Ei
17 37/3 1.77
11 37/3 0.14
9 37/3 0.90
2
Totales X = 2.81
Existen dos grados de libertad; así pues, el valor crítico (P = 0,05) es 5,99. El resultado no
es significativo y no hay datos para afirmar que los tres últimos trabajadores difieren
significativamente en la falta de cuidado de cada uno de los otros.
Resolución:
24
QUIMIOMETRÍA
El contraste t para datos emparejados es el más adecuado para este ejemplo, ya que se
emplean dos métodos en un número de muestras.
Método del
Método enzimático Diferencia
permanganato
31.1 32.6 -1.5
29.6 31 -1.4
31 30.3 0.7
Diferencia
Media -0.7333
Error típico 0.7172
Mediana -1.4
Desviación estándar 1.2423
Varianza de la muestra 1.5433
Rango 2.2
Mínimo -1.5
Máximo 0.7
Suma -2.2
Cuenta 3
Nivel de confianza (95.0%) 3.0861
Las diferencias entre la primera y la segunda medición son 1,5, 1,4 y 0,7 para la primera,
segunda y tercera muestras, respectivamente.
d́ √ n −0.7333 x √3
t= = =−1.02
sd 1.2423
El valor calculado de t es 1,02 y el valor crítico, t2, es 4,30 (P = 0,05, contraste de dos
colas). Los resultados obtenidos por los dos métodos no difieren significativamente.
25
QUIMIOMETRÍA
Con frecuencia, los estudiantes tienen dificultades a la hora de decidir si resulta apropiado
aplicar un contraste para datos emparejados o uno para datos no emparejados. Si los
tamaños muestrales son distintos, entonces está claro que no se puede llevar a cabo un
contraste para datos emparejados.
11. Seis analistas realizan seis determinaciones cada uno del contenido del mismo lote
de pastillas. Los resultados se muestran a continuación:
(Trafford, A. D., Jee R. D., Moffat, A. C. and Graham P. 1999. Analyst 124:163)
26
QUIMIOMETRÍA
Probar si existe alguna diferencia significativa entre las medias obtenidas por los
seis analistas.
Resolución:
Tabla de Medias para Contenido Paracetamol por Analista con intervalos de confianza del 95.0%
Error Est.
Analista Casos Media (s agrupada) Límite Inferior Límite Superior
A 6 84.536 0.086141 84.4123 84.6611
7
B 6 84.221 0.086141 84.0973 84.3461
7
C 6 84.401 0.086141 84.2773 84.5261
7
D 6 84.243 0.086141 84.1189 84.3677
3
E 6 84.158 0.086141 84.0339 84.2827
3
F 6 84.293 0.086141 84.1689 84.4177
3
Total 36 84.309
2
El StatAdvisor. Esta tabla muestra la media de Contenido Paracetamol para cada nivel de
Analista. También muestra el error estándar de cada media, el cual es una medida de la
variabilidad de su muestreo. El error estándar es el resultado de dividir la desviación
27
QUIMIOMETRÍA
84.8
84.6
84.4
84.2
84
A B C D E F
A nalista
2 2
sx
√ n
x ( t h( n−1) )= √0.0445 x
6
x 2.04=3.43
√
Si tomamos t30 = 2,04 (P = 0,05, contraste de dos colas), se obtiene una mínima diferencia
significativa de 0,25. La comparación entre pares de trabajadores sugiere que el resultado
significativo se debe a que el trabajador A difiere de los trabajadores B, D y E. En este
28
QUIMIOMETRÍA
Verificación de Varianza
Prueba Valor-P
Levene's 2.07121 0.0968935
29
QUIMIOMETRÍA
37 39 37 42 39 45 42 39 44 40 39 45 47 47 43 41
(Foote, J. W. and Delves, H. T. 1983. Analyst 108:492)
Las ocho primeras cifras corresponden a hombres y las segundas ocho cifras a
mujeres. Probar si la concentración media para hombres y mujeres difiere
significativamente.
Resolución:
Hombres Mujeres
Media 40.00 Media 43.25
Error típico 0.9820 Error típico 1.0815
Mediana 39 Mediana 43.5
Moda 39 Moda 47
Desviación estándar 2.7775 Desviación estándar 3.0589
Varianza de la muestra 7.7143 Varianza de la muestra 9.3571
Curtosis -0.1642 Curtosis -1.4985
Coeficiente de asimetría 0.7468 Coeficiente de asimetría -0.0749
Rango 8 Rango 8
Mínimo 37 Mínimo 39
Máximo 45 Máximo 47
Suma 320 Suma 346
Cuenta 8 Cuenta 8
Nivel de confianza (95.0%) 2.3220 Nivel de confianza (95.0%) 2.5573
s 2 9.3571
F= 12 = =1. 21
s 2 7.7143
30
QUIMIOMETRÍA
El valor crítico es F7.7 = 4,995 (P = 0,05) para un contraste de dos colas. Ya que el valor
calculado de F no excede a éste, llegamos a la conclusión de que las varianzas no difieren
significativamente.
Dado que las varianzas no difieren de forma significativa, se pueden combinar utilizando la
siguiente ecuación para calcular una estimación global de varianza.
s=2.92
Si utiliza la Ecuación:
( x´1− x́ 2 )
t=
1 1
s
√ +
n1 n2
( 43.25−40.00 )
t= =2.23
1 1
2.92 +
√
8 8
t=2.23
El valor crítico, t14 = 2,14 (P = 0,05, contraste de dos colas). Como el valor calculado de t es
superior a éste, las concentraciones medias de albúmina para hombres y mujeres difieren
significativamente.
31
QUIMIOMETRÍA
Resolución:
Un contraste t para datos emparejados es el más adecuado para este ejemplo, dado que se
emplean dos métodos para un número de muestras.
32
QUIMIOMETRÍA
Las diferencias entre la primera y la segunda medición son: 2,8; 0,3; 0,9; 0,9; 1,1; 1,1.
d́ √ n 1.1833 x √ 6
t= = =3.43
sd 0.8448
Diferencia
Media 1.1833
Error típico 0.3449
Mediana 1
Moda 0.9
Desviación estándar 0.8448
Varianza de la muestra 0.7137
Curtosis 3.9930
Coeficiente de asimetría 1.7363
Rango 2.5
Mínimo 0.3
Máximo 2.8
Suma 7.1
Cuenta 6
Nivel de confianza (95.0%) 0.8866
El valor calculado de t es 3,43 y el valor crítico, t5, es 2,57 (P = 0,05, contraste de dos
colas). Los resultados obtenidos por los dos métodos sí difieren significativamente.
33
QUIMIOMETRÍA
Resolución:
Se supone que n es el tamaño de muestra requerido y que xc es el valor crítico para la media
muestral.
34
QUIMIOMETRÍA
x−μ x́ c −μ
z= =
σ σ
√n
x´c −3.00
2.33=
0.036
√n
0.036
2.33 x = x´c −3.00
√n
Si H1 es verdadera, entonces la distribución muestral de la media será normal con media
3,05 y desviación estándar = 0,036/√ n. Necesitamos que P (media muestral ≤ xc) = 0,01.
Esto significa que F (z) = 0,01. Tomando la Tabla A.1 como referencia, el valor
correspondiente de z es -2,33.
x−μ x́ c −μ
z= =
σ σ
√n
x´c −3.05
−2.33=
0.036
√n
0.036
−2.33 x = x́ c −3.05
√n
Si se resta la ecuación 2 de la 1 se obtiene:
0.036
2 x 2.33 x =√ n
0.05
n=11.25
Al resolver esta ecuación, obtenemos n = 11.25, cifra que redondeamos al número entero
más cercano, es decir, 12.
35