Вы находитесь на странице: 1из 35

QUIMIOMETRÍA

EJERCICIOS RESUELTOS

1. Utilizando una gráfica de probabilidad normal, contrastar si el siguiente conjunto


de datos podría haber sido obtenido de una población normal:
11.68 11.12 8.92 8.82 10.31 11.88 9.84 11.69 9.53 10.30
9.17 10.04 10.65 10.91 10.32 8.71 9.83 8.90 10.40

Resolución:

En la siguiente figura se muestra una gráfica de probabilidad normal obtenida utilizando


Minitab.

El gráfico muestra puntos muy próximos a una línea recta y esparcida aleatoriamente
alrededor de ella. Esto sugiere que los datos podrían haberse obtenido de una
población normal. Se puede hacer una estimación de la media observando el valor
correspondiente a una frecuencia acumulada del 50%, dando aproximadamente 10,2. De
hecho, los números fueron generados por un ordenador como muestra aleatoria de una
población normal con media 10 y desviación estándar 1.

1
QUIMIOMETRÍA

De modo alternativo, los datos se pueden ordenar y representar frente al porcentaje de


frecuencia acumulada en un papel probabilístico normal. A continuación se proporciona la
tabla de valores para hacerlo.

Frecuencia % de frecuencia
Medida acumulada acumulada
X Y
8.71 1 5
8.82 2 10
8.90 3 15
8.92 4 20
9.17 5 25
9.53 6 30
9.83 7 35
9.84 8 40
10.04 9 45
10.30 10 50
10.31 11 55
10.32 12 60
10.40 13 65
10.65 14 70
10.91 15 75
11.12 16 80
11.68 17 85
11.69 18 90
11.88 19 95

2
QUIMIOMETRÍA

2. Para evaluar un método espectrofotométrico para determinar titanio, se aplicó el


método a muestras de aleaciones conteniendo diferentes cantidades certificadas de
titanio. Los resultados (% Ti) se muestran a continuación:

Muestra Valor certificado Media Desviación estándar


1 0.496 0.482 0.0257
2 0.995 1.009 0.0248
3 1.493 1.505 0.0287
4 1.990 2.002 0.0212

Para cada aleación se realizaron 8 determinaciones repetidas. (Qiu Xing-chu y Zhu


Ying-quen. 1983. Analyst 108:641). Para cada aleación, contrastar si el valor medio
difiere significativamente del valor certificado.

Resolución:

Se trabaja con la ecuación de comparación de una media experimental conocida con un


valor conocido:

( x́−µ ) √ n
t=
s

Para la muestra 1: Para la muestra 2:


( 0.482−0.496 ) √ 8 ( 1.009−0.995 ) √ 8
t= =|−1.54| t= =1.60
0.0257 0.0248
t=1.5 4 t=1.60
Para la muestra 3: Para la muestra 4:
( 1.505−1.493 ) √ 8 ( 2.002−1.990 ) √ 8
t= =1.18 t= =1.60
0.0287 0.0212
t=1. 18 t=1.60

Se determina que hay 7 grados de libertad:

G . L .=8−1=7

3
QUIMIOMETRÍA

El valor crítico de ¿ t∨¿ es 2,36. Ninguno de los valores calculados excede este valor, de
manera que ninguno de los valores medios medidos difiere significativamente del valor
certificado correspondiente.

4
QUIMIOMETRÍA

3. Para los datos del ejemplo 3.3.3 relativos a la concentración de un tiol en el lisado
sanguíneo.
a. Verificar que 2.07 no es un dato anómalo para el grupo “normal”.
b. Demostrar que las varianzas de los dos grupos difieren significativamente.

Resolución:

a. Verificar que 2.07 no es un dato anómalo para el grupo “normal”.

En primer lugar, es preciso ordenar los valores por tamaño: 1,84 1,85 1,91 1,92 1,92
1,94 2,07

Para aplicar el contraste de Dixon, utilicemos la Ecuación

|valor sospechoso−valor mas cercano|


Q=
( valor mas grande−valor mas pequeño )

Concentración de tiol ( mm )
Normal Reumatoide
1.84 2.81
1.92 4.06
1.94 3.62
1.92 3.27
1.85 3.27
1.91 3.76
2.07  

CONTRASTE DE DIXON
Q( calculado) 1.3 Dato de tabla 0.57

Valor sospechoso 2.07


|2.07−1.94|
Valor más cercano 1.94 Q= =0.565
( 2.07−1.84 )
Valor más grande 1.94
Q=0.565
Valor más pequeño 1.84

El valor crítico de la Q (P = 0,05) para un tamaño muestra 7 es 0,570, por lo que no se


rechaza la medida sospechosa al nivel del 5%.

5
QUIMIOMETRÍA

Para aplicar el contraste de Grubbs, utilicemos la Ecuación

|valor sospechoso−x́|
G=
s

Normal
Media 1.9214
Error típico 0.0286
Mediana 1.92
Moda 1.92
Desviación estándar 0.0756
Varianza de la muestra 0.0057
Curtosis 2.5657
Coeficiente de asimetría 1.2856
Rango 0.23
Mínimo 1.84
Máximo 2.07
Suma 13.45
Cuenta 7
Nivel de confianza (95.0%) 0.0699

CONTRASTE DEGRUBBS
Q( calculado) 1.3 Dato de tabla 2.020

Valor sospechoso 2.07

Desv. estándar 0.0756 G=|2 . 07−1 . 92|=1.984


0 .0756
Media 1.92
Q=1.984
Valor más pequeño 1.84

El valor crítico (P = 0,05) es 2,02. Así pues, el valor sospechoso tampoco se rechaza al
nivel de significación del 5%.

b. Demostrar que las varianzas de los dos grupos difieren significativamente

Se utiliza el contraste F para la comparación de desviación estándar. Para ello, se utiliza la


siguiente ecuación:

s21
G= 2
s2

6
QUIMIOMETRÍA

Normal Reumatoide
Media 1.9214 Media 3.465
Error típico 0.0286 Error típico 0.1798
Mediana 1.92 Mediana 3.445
Moda 1.92 Moda 3.27
0.075
Desviación estándar 6 Desviación estándar 0.4405
Varianza de la muestra 0.0057 Varianza de la muestra 0.1940
Curtosis 2.5657 Curtosis -0.2919
Coeficiente de asimetría 1.2856 Coeficiente de asimetría -0.1959
Rango 0.23 Rango 1.25
Mínimo 1.84 Mínimo 2.81
Máximo 2.07 Máximo 4.06
Suma 13.45 Suma 20.79
Cuenta 7 Cuenta 6
Nivel de confianza (95.0%) 0.0699 Nivel de confianza (95.0%) 0.4623

La ecuación de modo que F ≥ 1, siendo:

0.44052
G= =34
0.07562

G=34

7
QUIMIOMETRÍA

El valor crítico es F6.5= 4,950 (P = 0,05) para un contraste de dos colas. Ya que el valor
calculado de F excede a éste, queda constancia de que las varianzas difieren
significativamente al nivel de significación del 5%.

4. Los siguientes datos proporcionan la recuperación de bromuro adicionado a


muestras con contenido vegetal medido mediante un método cromatográfico gas –
líquido. La cantidad de bromuro potásico añadido a cada tipo de vegetal fue la
misma.

Tomate 777 790 759 790 770 758 764


Pepino 782 773 778 765 789 797 782

a. Contrastar si la recuperación en los dos vegetales tienen varianzas que difieran


significativamente.
b. Contrastar si las tasas de recuperación medias difieren significativamente.

Resolución:

a. Contrastar si la recuperación en los dos vegetales tienen varianzas que difieran


significativamente.

Tomate 777 790 759 790 770 758 764


Recuperación
Pepino 782 773 778 765 789 797 782

Se utiliza el contraste F para la comparación:

s 21 183.95
F= 2 = =1.70
s 2 108.58

TOMATE (µg/g) PEPINO (µg/g)


Media 772.6 Media 780.9
Error típico 5.1263 Error típico 3.9366
Mediana 770 Mediana 782
Moda 790 Moda 782
Desviación estándar 13.5629 Desviación estándar 10.4152
Varianza de la muestra 183.9524 Varianza de la muestra 108.4762
Curtosis -1.6852 Curtosis 0.1289
Coeficiente de asimetría 0.4147 Coeficiente de asimetría 0.0524
Rango 32 Rango 32

8
QUIMIOMETRÍA

Mínimo 758 Mínimo 765


Máximo 790 Máximo 797
Suma 5408 Suma 5466
Cuenta 7 Cuenta 7
Nivel de confianza (95.0%) 12.5436 Nivel de confianza (95.0%) 9.6324

El valor crítico es F6,6 = 5,82 (P = 0,05) para un contraste de dos colas. Ya que el valor
calculado de F no excede a este, llegamos a la conclusión de que las varianzas no difieren
significativamente.

b. Contrastar si las tasas de recuperación medias difieren significativamente.


Dado que las varianzas no difieren de forma significativa, se pueden combinar utilizando la
siguiente ecuación para calcular una estimación global de varianza.

( n1 −1 ) s 21+ ( n2−1 ) s22


s2=
n1 +n2−2

( 7−1 ) 183.95+ ( 7−1 ) 108.48


s2= =146.215
7+ 7−2

s=12.09

9
QUIMIOMETRÍA

Las medias de muestra son 780,9 para el pepino y 772,6 para el tomate.

Si utiliza la Ecuación:

( x´1− x́ 2 )
t=
1 1
s
√ +
n1 n2

( 780.9−772.6 )
t= =1. 28
1 1
12.09 +
7 7√
t=1.28

Para un contraste de dos colas, el valor crítico es 2,18 (P = 0,05), de manera que las medias
no difieren de forma significativa.

10
QUIMIOMETRÍA

5. Los siguientes resultados muestran el porcentaje de agua intersticial total


recuperada al centrifugar muestras de piedra arenisca tomadas a diferentes
profundidades.

Profundidad de la
Agua recuperada (%)
muestra (m)
7 33.3 33.3 35.7 38.1 31.0 33.3
8 43.6 45.2 47.7 45.4 43.8 46.5
16 73.2 68.7 73.6 70.9 72.5 74.5
23 72.5 70.4 65.2 66.7 77.6 69.8

(Wheatstone, K. G. and Getsthorpe, D. 1982. Analyst 107:731)


Demostrar que el porcentaje de agua recuperada difiere significativamente a
diferentes profundidades. Utilizar el método de la diferencia significativa menor
descrito en la Sección 3.9 para encontrar las causas de este estudio significativo.

Resolución:

La tabla que aparece a continuación muestra el resultado de llevar a cabo un ANOVA de un


factor utilizando Statgraphics Centurion:

Resumen Estadístico para % Agua recuperada

Profundidad Recuento Promedio Desviación Estándar Coeficiente de Variación Mínimo Máximo


7 6 34.1167 2.45309 7.19031% 31.0 38.1
8 6 45.3667 1.57056 3.46193% 43.6 47.7
16 6 72.2333 2.11061 2.92193% 68.7 74.5
23 6 70.3667 4.4121 6.27016% 65.2 77.6
Total 24 55.5208 16.8468 30.3432% 31.0 77.6

Profundidad Rango Sesgo Estandarizado Curtosis Estandarizada


7 7.1 0.716667 0.293911
8 4.1 0.371359 -0.418038
16 5.8 -1.00068 0.222345
23 12.4 0.70125 0.247681
Total 46.6 -0.280242 -1.78782

Esta tabla muestra diferentes estadísticos de % Agua recuperada para cada uno de los 4
niveles de Profundidad. La intención principal del análisis de varianza de un factor es la de

11
QUIMIOMETRÍA

comparar las medias de los diferentes niveles, enlistados aquí bajo la columna de Promedio.
Selecciones Gráfica de Medias de la lista de Opciones Gráficas para mostrar gráficamente
las medias.

Tabla ANOVA para % Agua recuperada por Profundidad

Suma de Cuadrado
Fuente Gl Razón-F Valor-P
Cuadrados Medio
Entre grupos 6365.71 3 2121.9 261.92 0.0000
Intra grupos 162.028 20 8.10142
Total (Corr.) 6527.74 23

El StatAdvisor. La tabla ANOVA descompone la varianza de % Agua recuperada en dos


componentes: un componente entre-grupos y un componente dentro-de-grupos. La razón-
F, que en este caso es igual a 261.918, es el cociente entre el estimado entre-grupos y el
estimado dentro-de-grupos. Puesto que el valor-P de la prueba-F es menor que 0.05, existe
una diferencia estadísticamente significativa entre la media de % Agua recuperada entre un
nivel de Profundidad y otro, con un nivel del 95.0% de confianza.

12
QUIMIOMETRÍA

La tabla muestra que el agua recuperada difiere significativamente entre distintas


profundidades, dado que F = 261.92 y que la probabilidad de este resultado es 0,0000 hasta
cuatro cifras significativas. El valor crítico de F3,20 (P = 0,05, contraste de una cola) es
3,098.

Tabla de Medias para % Agua recuperada por Profundidad con intervalos de


confianza del 95.0%

Error Est.
Profundidad Casos Media (s agrupada) Límite Inferior Límite Superior
7 6 34.116 1.162 32.4027 35.8306
7
8 6 45.366 1.162 43.6527 47.0806
7
16 6 72.233 1.162 70.5194 73.9473
3
23 6 70.366 1.162 68.6527 72.0806
7
Total 24 55.520
8

13
QUIMIOMETRÍA

El StatAdvisor. Esta tabla muestra la media de % Agua recuperada para cada nivel de
Profundidad. También muestra el error estándar de cada media, el cual es una medida de la
variabilidad de su muestreo. El error estándar es el resultado de dividir la desviación
estándar mancomunada entre el número de observaciones en cada nivel. La tabla también
muestra un intervalo alrededor de cada media. Los intervalos mostrados actualmente están
basados en el procedimiento de la diferencia mínima significativa (LSD) de Fisher. Están
construidos de tal manera que, si dos medias son iguales, sus intervalos se traslaparán un
95.0% de las veces.

Puede ver gráficamente los intervalos seleccionando Gráfica de Medias de la lista de


Opciones Gráficas. En las Pruebas de Rangos Múltiples, estos intervalos se usan para
determinar cuáles medias son significativamente diferentes de otras.

Ilustración 1. Gráfica de Medias

Medias y 95.0% de Fisher LSD

82

72
%Agua recuperada

62

52

42

32
7 8 16 23
Profundidad

Se calcula el valor de la desviación estándar conjunto, que en este caso es igual a:

√ 8.10142=2.846
Este diagrama indica que el resultado significativo se debe a que los dos primeros niveles
difieren entre sí y, a la vez, son diferentes de los dos niveles más bajos.

Se puede comprobar esta afirmación calculando la mínima diferencia significativa:

2 2
sx
√ x(t
n h ( n−1) √
)= √8.10142 x 6 x 2.09=3.43

14
QUIMIOMETRÍA

Si tomamos t20 = 2,09 (P = 0,05, contraste de dos colas), obtenemos una mínima diferencia
significativa de 3,43. Las medias, en orden ascendente de tamaño, son 34,1 (a 7 m), 45,4 (a
8 m), 70,4 (a 23 m) y 72,2 (a 16 m). Las diferencias entre medias consecutivas son 11,3,
25,0 y 1,8. Comparando estas diferencias con la mínima diferencia significativa,
observamos que no existe diferencia significativa entre las dos profundidades más bajas: el
resultado significativo se debe a que los dos resultados más altos se diferencian
significativamente entre sí y, a la vez, son diferentes de las dos profundidades más bajas.

Verificación de Varianza

Prueba Valor-P
Levene's 1.2600 0.314853
5

Comparación Sigma1 Sigma2 F-Ratio P-Valor


7/8 2.45309 1.57056 2.43959 0.3500
7 / 16 2.45309 2.11061 1.35087 0.7495
7 / 23 2.45309 4.4121 0.309127 0.2235
8 / 16 1.57056 2.11061 0.553726 0.5323
8 / 23 1.57056 4.4121 0.126712 0.0407
16 / 23 2.11061 4.4121 0.228836 0.1314

15
QUIMIOMETRÍA

El StatAdvisor. El estadístico mostrado en esta tabla evalúa la hipótesis de que la


desviación estándar de % Agua recuperada dentro de cada uno de los 4 niveles de
Profundidad es la misma. De particular interés es el valor-P. Puesto que el valor-P es
mayor o igual que 0.05, no existe una diferencia estadísticamente significativa entre las
desviaciones estándar, con un nivel del 95.0% de confianza. La tabla también muestra una
comparación de las desviaciones típicas para cada par de muestras. P-valores por debajo de
0.05, de los cuales hay 1, indican una diferencia estadísticamente significativa entre las dos
sigmas al 5% de nivel de significación.

6. La siguiente tabla proporciona la concentración de norepinefrina (umol por g de


creatinina) en la orina de voluntarios sanos de veinte años.

Machos 0.48 0.36 0.20 0.55 0.45 0.46 0.47 0.23


Hembra
0.35 0.37 0.27 0.29
s

16
QUIMIOMETRÍA

(Yamaguchi, M., J. and Yoshimura, M. 1998. Analyst 123:307)


¿Existe evidencia que la concentración de norepinefrina difiera entre sexos?

Resolución:

En primer lugar, es necesario emplear un contraste F para comprobar si las varianzas de las
dos muestras difieren de forma significativa. A partir de la Ecuación:

s 2 0.01577
F= 12 = =6.9573
s 2 0.00226

RESUMEN        
Grupos Cuenta Suma Promedio Varianza
0.0157714
Machos 8 3.2 0.40 3
0.0022666
Hembras 4 1.28 0.32 7

El valor crítico es F7,3 = 14,62 (P = 0,05) para un contraste de dos colas. Ya que el valor
calculado de F no excede a éste, la conclusión que deriva es que las varianzas no difieren
significativamente. Como consecuencia, se pueden combinar las varianzas y realizar un

17
QUIMIOMETRÍA

contraste de diferencia entre medias. En primer lugar, se calcula la estimación conjunta de


la varianza:

2 ( n1 −1 ) s 21+ ( n2−1 ) s22


s=
n1 +n2−2

( 8−1 ) 0.01577+ ( 4−1 ) 0.00226


s2= =0.011717
8+4−2

s=0.108

Si utiliza la Ecuación:

( x´1− x́ 2 ) ( 0.40−0.32 )
t= = =1.21
1 1 1 1
s
√ +
n1 n2 √
0.108 +
8 4

El valor crítico, t10 = 2,23 (P = 0,05, contraste de dos colas). Como el valor calculado de t es
inferior a éste, no existe constancia de que la concentración de norepinefrina difiera entre
sexos.

7. Al leer en una bureta 0.01 ml, un analista tiene que estimar la cifra final. La
siguiente tabla de frecuencias proporciona las últimas cifras de 50 lecturas.

18
QUIMIOMETRÍA

Realizar un contraste de significación adecuado para determinar si se prefieren


algunos dígitos a otros.

Dígito 0 1 2 3 4 5 6 7 8 9
Frecuencia 1 6 4 5 3 11 2 8 3 7

Resolución:

La hipótesis nula es que todos los dígitos son iguales, por lo que la frecuencia esperada para
cada uno es 50/10 = 5. Utilizamos un contraste chi-cuadrado con el estadístico X2
calculado en la Ecuación (3.12). El cálculo se plantea más fácilmente en una tabla como la
siguiente.

2
Dígito
Frecuencia Frecuencia ( OI −EI )
observada, Oi esperada, Ei EI
0 1 5 3,2
1 6 5 0,2
2 4 5 0,2
3 5 5 0
4 3 5 0,8
5 11 5 7,2
6 2 5 1,8
7 8 5 1,8
8 3 5 0,8
9 7 5 0,8
Total X2 = 16,8

Hay 9 grados de libertad y el valor crítico es 16,92 (P = 0,05). El resultado no es


significativo al nivel del 5%, por lo que a este nivel de significación no hay suficientes
pruebas para afirmar que se prefieren unos dígitos a otros. No obstante, la frecuencia del
dígito 5 es mucho más alta que las otras frecuencias y, como siempre, merece la pena
obtener más pruebas.

19
QUIMIOMETRÍA

8. La siguiente tabla proporciona otros resultados del trabajo citado en el ejemplo


3.3.1. (Sahuquillo, A., Rubio; R. and Rauret, G. 1999. Analyst 124:1) en el que
fueron comparados por dos métodos diferentes los resultados de la determinación
de cromo en materiales orgánicos:

Agujas de pino: Método 1 Media = 2.15 d.e. = 0.26


Método 2 Media = 2.45 d.e. = 0.14
Hojas de haya: Método 1 Media = 5.12 d.e. = 0.80
Método 2 Media = 7.27 d.e. = 0.44
Planta acuática: Método 1 Media = 23.08 d.e. = 2.63
Método 2 Media = 32.01 d.e. = 4.66

En cada caso la media es el promedio de 5 valores. Para cada material probar si la


media de los resultados obtenidos por los dos métodos difiere significativamente.

Resolución:

Para cada material, primeramente es necesario emplear el contraste F para probar si las
varianzas de las dos muestras difieren significativamente. Si parte de la Ecuación:

s 21 0.26 2
Pino: F= 2 = 2
=3.449
s 2 0.14

s 21 0.80 2
Haya: F= = =3.306
s 22 0.44 2

s 21 4.662
Planta acuática: F= 2 = 2
=3.139
s 2 2.63

El valor crítico es F4.4 = 9,605 (P = 0,05, contraste de dos colas).

20
QUIMIOMETRÍA

Ningún valor es significativo y, por tanto, se pueden combinar las varianzas:

2 2
Pino: s= ( 5−1 ) 0.26 + ( 5−1 ) 0.14 =0.0436
√ 5+ 5−2

2 2
Haya: s= ( 5−1 ) 0.80 + ( 5−1 ) 0.44 =0.4168
√ 5+ 5−2

2 2
Planta acuática: s= ( 5−1 ) 4.66 + (5−1 ) 2.63 =14.316
√ 5+ 5−2

Con la Ecuación:

( x´1− x́ 2 ) ( 2.15−2.45 )
t= = =2.27
Pino: 1 1 1 1
s
√ +
n1 n2
0.0436 +

5 5

( x´1− x́ 2 ) ( 5.12−7.27 )
t= = =5.27
Haya: 1 1 1 1
s
√ +
n1 n2
0.4168 +

5 5

( x´1− x́ 2 ) ( 23.08−32.1 )
t= = =3.73
Planta acuática: 1 1 1 1
s
√ +
n1 n2
14.316
√ +
5 5

Para un contraste de dos colas, los valores críticos son t8 = 2,31 (P = 0,05) y t8 = 3,36 (P =
0,01), lo que significa que las medias no difieren significativamente al nivel del 5% para las

21
QUIMIOMETRÍA

muestras de pino, pero sí difieren al nivel de significación del 1% en las muestras de haya y
de planta acuática.

9. Los datos dados en el ejemplo de la sección 3.11, para el número de roturas


realizadas por cuatro trabajadores diferentes, se reproducen a continuación:
24 17 11 9
Probar si:
a. El número de roturas del primer trabajador difiere significativamente de las
de los otros tres trabajadores.
b. El segundo, tercero y cuarto trabajadores difieren significativamente en la
falta de cuidado de cada uno de los otros.

Resolución:

Se tiene los siguientes datos:

Frecuencia Frecuencia
O-E (O - E)2/2
Observada, Oi esperada, Ei
24 15.25 8.75 5.020
17 15.25 1.75 0.201
11 15.25 -4.25 1.184
9 15.25 -6.25 2.561
Totales 61 0 X2 = 8.966

22
QUIMIOMETRÍA

a. El número de roturas del primer trabajador difiere significativamente de las de los


otros tres trabajadores.

La hipótesis nula es que el primer trabajador no difiere de los otros tres. Esto significa que
se espera que el primer trabajador tenga 15,25 roturas y que los otros tres tengan en total
15,25 × 3 = 45,75 roturas. El número de grados de libertad es 1; así pues, se debería aplicar
la corrección de Yates.

Frecuencia Frecuencia 1 (|Oi −Ei|− 12 )


Observada, Oi esperada, Ei
|Oi−E i| |Oi−E i|− 2
Ei
24 15.25 8.75 8.25 4.463
37 45.75 8.75 8.25 1.488
2
Totales 61 0 X = 8.966 5.951

El valor crítico para el grado de libertad 1 es 3,84 (P = 0,05). Dado que 5,951  3,84, la
hipótesis nula se descarta: hay evidencia de que el primer trabajador difiere de los otros
tres. Observemos que el contraste no muestra en qué dirección difiere el primer trabajador
de los otros. Esto se debe deducir a partir de los datos. En este caso, es evidente que el
primer trabajador es más propenso a los accidentes.

b. El segundo, tercero y cuarto trabajadores difieren significativamente en la falta de


cuidado de cada uno de los otros.

La hipótesis nula es que el segundo, tercero y cuarto trabajadores no difieren entre sí. Si
este es el caso, entonces se espera que el número total de roturas de 37 se divida por igual
entre cada uno de ellos, obteniendo frecuencias esperadas de 37/3. El cálculo de X 2 se
muestra en la siguiente tabla.

23
QUIMIOMETRÍA

2
Frecuencia Frecuencia |Oi−E i|
Observada, Oi esperada, Ei Ei
17 37/3 1.77
11 37/3 0.14
9 37/3 0.90
2
Totales X = 2.81

Existen dos grados de libertad; así pues, el valor crítico (P = 0,05) es 5,99. El resultado no
es significativo y no hay datos para afirmar que los tres últimos trabajadores difieren
significativamente en la falta de cuidado de cada uno de los otros.

10. Un nuevo procedimiento enzimático de análisis por inyección en flujo para


determinar peróxido de hidrogeno en agua fue comparado con un método
volumétrico redox convencional con permanganato potásico aplicando ambos
métodos a muestras de peróxido de uso farmacéutico. La siguiente tabla
proporciona la cantidad de peróxido de hidrogeno, en mg ml -1. Cada valor es la
media de cuatro réplicas.

Método Método del


Muestra n°
enzimático permanganato
1 31.1 32.6
2 29.6 31.0
3 31.0 30.3

(da Cruz Vieira, I and Fatibello - Filho, O. 1998. Analyst 123:1809)


Probar si los resultados obtenidos por ambos métodos difieren significativamente.

Resolución:

24
QUIMIOMETRÍA

El contraste t para datos emparejados es el más adecuado para este ejemplo, ya que se
emplean dos métodos en un número de muestras.

Método del
Método enzimático Diferencia
permanganato
31.1 32.6 -1.5
29.6 31 -1.4
31 30.3 0.7
     
Diferencia  
Media -0.7333  
Error típico 0.7172  
Mediana -1.4  
Desviación estándar 1.2423  
Varianza de la muestra 1.5433  
Rango 2.2  
Mínimo -1.5  
Máximo 0.7  
Suma -2.2  
Cuenta 3  
Nivel de confianza (95.0%) 3.0861  
Las diferencias entre la primera y la segunda medición son 1,5, 1,4 y 0,7 para la primera,
segunda y tercera muestras, respectivamente.

Desarrollamos la siguiente ecuación:

d́ √ n −0.7333 x √3
t= = =−1.02
sd 1.2423

El valor calculado de t es 1,02 y el valor crítico, t2, es 4,30 (P = 0,05, contraste de dos
colas). Los resultados obtenidos por los dos métodos no difieren significativamente.

25
QUIMIOMETRÍA

Con frecuencia, los estudiantes tienen dificultades a la hora de decidir si resulta apropiado
aplicar un contraste para datos emparejados o uno para datos no emparejados. Si los
tamaños muestrales son distintos, entonces está claro que no se puede llevar a cabo un
contraste para datos emparejados.

11. Seis analistas realizan seis determinaciones cada uno del contenido del mismo lote
de pastillas. Los resultados se muestran a continuación:

Analista Contenido de paracetamol (% m/m)


A 84.32 84.51 84.63 84.61 84.64 84.51
B 84.24 84.25 84.41 84.13 84.00 84.30
C 84.29 84.40 84.68 84.28 84.40 84.36
D 84.14 84.22 84.02 84.48 84.27 84.33
E 84.50 83.88 84.49 83.91 84.11 84.06
F 84.70 84.17 84.11 84.36 84.61 83.81

(Trafford, A. D., Jee R. D., Moffat, A. C. and Graham P. 1999. Analyst 124:163)

26
QUIMIOMETRÍA

Probar si existe alguna diferencia significativa entre las medias obtenidas por los
seis analistas.

Resolución:

Tabla ANOVA para Contenido Paracetamol por Analista

Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P


Entre grupos 0.571825 5 0.114365 2.57 0.0476
Intra grupos 1.33565 30 0.0445217
Total (Corr.) 1.90748 35

El StatAdvisor. La tabla ANOVA descompone la varianza de Contenido Paracetamol en


dos componentes: un componente entre-grupos y un componente dentro-de-grupos. La
razón-F, que en este caso es igual a 2.57, es el cociente entre el estimado entre-grupos y el
estimado dentro-de-grupos. Puesto que el valor-P 0.0476 de la prueba-F es menor que
0.05, existe una diferencia estadísticamente significativa entre la media de Contenido
Paracetamol entre un nivel de Analista y otro, con un nivel del 95.0% de confianza.

Tabla de Medias para Contenido Paracetamol por Analista con intervalos de confianza del 95.0%

Error Est.
Analista Casos Media (s agrupada) Límite Inferior Límite Superior
A 6 84.536 0.086141 84.4123 84.6611
7
B 6 84.221 0.086141 84.0973 84.3461
7
C 6 84.401 0.086141 84.2773 84.5261
7
D 6 84.243 0.086141 84.1189 84.3677
3
E 6 84.158 0.086141 84.0339 84.2827
3
F 6 84.293 0.086141 84.1689 84.4177
3
Total 36 84.309
2

El StatAdvisor. Esta tabla muestra la media de Contenido Paracetamol para cada nivel de
Analista. También muestra el error estándar de cada media, el cual es una medida de la
variabilidad de su muestreo. El error estándar es el resultado de dividir la desviación

27
QUIMIOMETRÍA

estándar mancomunada entre el número de observaciones en cada nivel. La tabla también


muestra un intervalo alrededor de cada media. Los intervalos mostrados actualmente están
basados en el procedimiento de la diferencia mínima significativa (LSD) de Fisher. Están
construidos de tal manera que, si dos medias son iguales, sus intervalos se traslaparán un
95.0% de las veces.

Medias y 95.0% de Fisher LSD


C o n t e n id o P a r a c e t a m o l

84.8

84.6

84.4

84.2

84
A B C D E F
A nalista

Se puede comprobar esta afirmación calculando la mínima diferencia significativa:

2 2
sx
√ n
x ( t h( n−1) )= √0.0445 x
6
x 2.04=3.43

Si tomamos t30 = 2,04 (P = 0,05, contraste de dos colas), se obtiene una mínima diferencia
significativa de 0,25. La comparación entre pares de trabajadores sugiere que el resultado
significativo se debe a que el trabajador A difiere de los trabajadores B, D y E. En este

28
QUIMIOMETRÍA

caso, hay 15 pares posibles de muestras para comparar, obteniendo un nivel de


significación efectivo de 1  0,9515 = 0,54 para este método. Esto señala que algunas
diferencias significativas entre analistas podría deberse a una variación aleatoria más que
una diferencia real entre medias de población. No obstante, téngase en cuenta que los
intervalos de confianza para los analistas A y E del diagrama anterior no se solapan.

La homogeneidad de varianza es un supuesto que se obtiene al realizar el ANOVA. El


resultado obtenido se ilustra a continuación.

Verificación de Varianza

Prueba Valor-P
Levene's 2.07121 0.0968935

Comparación Sigma1 Sigma2 F-Ratio P-Valor


A/B 0.120941 0.141622 0.729267 0.7375
A/C 0.120941 0.145934 0.686805 0.6902
A/D 0.120941 0.158325 0.583511 0.5688
A/E 0.120941 0.274912 0.193534 0.0957
A/F 0.120941 0.332425 0.13236 0.0445
B/C 0.141622 0.145934 0.941775 0.9491
B/D 0.141622 0.158325 0.800133 0.8127
B/E 0.141622 0.274912 0.265382 0.1717
B/F 0.141622 0.332425 0.181497 0.0845
C/D 0.145934 0.158325 0.849601 0.8624
C/E 0.145934 0.274912 0.281789 0.1908
C/F 0.145934 0.332425 0.192718 0.0949
D/E 0.158325 0.274912 0.331672 0.2511
D/F 0.158325 0.332425 0.226834 0.1292
E/F 0.274912 0.332425 0.68391 0.6869

El StatAdvisor. El estadístico mostrado en esta tabla evalúa la hipótesis de que la


desviación estándar de Contenido Paracetamol dentro de cada uno de los 6 niveles de
Analista es la misma. De particular interés es el valor-P. Puesto que el valor-P es mayor o
igual que 0.05, no existe una diferencia estadísticamente significativa entre las desviaciones
estándar, con un nivel del 95.0% de confianza. La tabla también muestra una comparación
de las desviaciones típicas para cada par de muestras. P-valores por debajo de 0.05, de los
cuales hay 1, indican una diferencia estadísticamente significativa entre las dos sigmas al
5% de nivel de significación.

12. Las siguientes cifras se refiere a la concentración de albumina, en gl-1, en el suero


sanguíneo de 16 adultos sanos:

29
QUIMIOMETRÍA

37 39 37 42 39 45 42 39 44 40 39 45 47 47 43 41
(Foote, J. W. and Delves, H. T. 1983. Analyst 108:492)
Las ocho primeras cifras corresponden a hombres y las segundas ocho cifras a
mujeres. Probar si la concentración media para hombres y mujeres difiere
significativamente.

Resolución:

Se utiliza el contraste F para la comparación:

Hombres Mujeres
Media 40.00 Media 43.25
Error típico 0.9820 Error típico 1.0815
Mediana 39 Mediana 43.5
Moda 39 Moda 47
Desviación estándar 2.7775 Desviación estándar 3.0589
Varianza de la muestra 7.7143 Varianza de la muestra 9.3571
Curtosis -0.1642 Curtosis -1.4985
Coeficiente de asimetría 0.7468 Coeficiente de asimetría -0.0749
Rango 8 Rango 8
Mínimo 37 Mínimo 39
Máximo 45 Máximo 47
Suma 320 Suma 346
Cuenta 8 Cuenta 8
Nivel de confianza (95.0%) 2.3220 Nivel de confianza (95.0%) 2.5573

s 2 9.3571
F= 12 = =1. 21
s 2 7.7143

30
QUIMIOMETRÍA

El valor crítico es F7.7 = 4,995 (P = 0,05) para un contraste de dos colas. Ya que el valor
calculado de F no excede a éste, llegamos a la conclusión de que las varianzas no difieren
significativamente.

Dado que las varianzas no difieren de forma significativa, se pueden combinar utilizando la
siguiente ecuación para calcular una estimación global de varianza.

2 ( n1 −1 ) s 21+ ( n2−1 ) s22


s=
n1 +n2−2

( 8−1 ) 9.3571+ ( 8−1 ) 7.7143


s2= =8.5357
8+ 8−2

s=2.92

Si utiliza la Ecuación:

( x´1− x́ 2 )
t=
1 1
s
√ +
n1 n2

( 43.25−40.00 )
t= =2.23
1 1
2.92 +

8 8

t=2.23

El valor crítico, t14 = 2,14 (P = 0,05, contraste de dos colas). Como el valor calculado de t es
superior a éste, las concentraciones medias de albúmina para hombres y mujeres difieren
significativamente.

31
QUIMIOMETRÍA

13. Se comparó un nuevo método espectroscópico de absorción atómica de llama para


determinar antimonio en la atmósfera con el método colorimétrico recomendado.
Para muestras de atmósfera urbana, se obtuvieron los siguientes resultados:

Antimonio encontrado (mg m-3)


Muestra n° Método nuevo Método estándar
1 22.2 25.0
2 19.2 19.5
3 15.7 16.6
4 20.4 21.3
5 19.6 20.7
6 15.7 16.8

(Castillo, J. R., J., Marinez, M. C. y Aznárez, J. 1982. Analyst 107:1488)


¿Difieren significativamente los resultados obtenidos por los dos métodos?

Resolución:

Un contraste t para datos emparejados es el más adecuado para este ejemplo, dado que se
emplean dos métodos para un número de muestras.

  Antimonio encontrado (mg m-3)  


Muestra n° Método nuevo Método estándar Diferencia
1 22.2 25 2.8
2 19.2 19.5 0.3
3 15.7 16.6 0.9
4 20.4 21.3 0.9
5 19.6 20.7 1.1
6 15.7 16.8 1.1

32
QUIMIOMETRÍA

Las diferencias entre la primera y la segunda medición son: 2,8; 0,3; 0,9; 0,9; 1,1; 1,1.

La media y la desviación estándar de estas diferencias son d = 1,183 y sd = 0,845,


respectivamente.

d́ √ n 1.1833 x √ 6
t= = =3.43
sd 0.8448

Diferencia
Media 1.1833
Error típico 0.3449
Mediana 1
Moda 0.9
Desviación estándar 0.8448
Varianza de la muestra 0.7137
Curtosis 3.9930
Coeficiente de asimetría 1.7363
Rango 2.5
Mínimo 0.3
Máximo 2.8
Suma 7.1
Cuenta 6
Nivel de confianza (95.0%) 0.8866

El valor calculado de t es 3,43 y el valor crítico, t5, es 2,57 (P = 0,05, contraste de dos
colas). Los resultados obtenidos por los dos métodos sí difieren significativamente.

33
QUIMIOMETRÍA

14. Para la situación descrita en la Sección 3.13


( H O =μ=3.0 % , H 1 =μ=3.5 % ,σ =0.036 % )calcular el tamaño mínimo de muestra
requerido para hacer que las probabilidades de error de Tipo I y II sean a lo sumo
iguales a 0.01.

Resolución:

Se supone que n es el tamaño de muestra requerido y que xc es el valor crítico para la media
muestral.

Si H0 es verdadera, entonces la distribución muestral de la media será normal con media


3,00 y desviación estándar = 0,036/√ n. Se necesita que P (media muestral ≥ xc) = 0,01. Esto
significa que F(z) = 0,99. Partiendo de la Tabla A.1 del Apéndice, el valor correspondiente
de z es 2,33.

34
QUIMIOMETRÍA

x−μ x́ c −μ
z= =
σ σ
√n
x´c −3.00
2.33=
0.036
√n
0.036
2.33 x = x´c −3.00
√n
Si H1 es verdadera, entonces la distribución muestral de la media será normal con media
3,05 y desviación estándar = 0,036/√ n. Necesitamos que P (media muestral ≤ xc) = 0,01.
Esto significa que F (z) = 0,01. Tomando la Tabla A.1 como referencia, el valor
correspondiente de z es -2,33.

x−μ x́ c −μ
z= =
σ σ
√n
x´c −3.05
−2.33=
0.036
√n
0.036
−2.33 x = x́ c −3.05
√n
Si se resta la ecuación 2 de la 1 se obtiene:

0.036
2 x 2.33 x =√ n
0.05

n=11.25

Al resolver esta ecuación, obtenemos n = 11.25, cifra que redondeamos al número entero
más cercano, es decir, 12.

35

Вам также может понравиться