Вы находитесь на странице: 1из 113

,

ESTAQ!?TICA
, ,

QUIMICA ANALITICA . . ._.


ESTADSTICA PARA
QUMICA
ANALTICA
Segunda Edicin
J. C. MILLER
JtYggeston and Queen Elizabetli l College, Leicester
y
J. N. MILLER
Decano de ciencias puras y aplicadas
Louglzborouglz University of Teclznology

Versin en espaol de
Roberto Izquierdo Hornillos
Profesor de Qumica Analtica
Universidad Complutense de Madrid
y
Carlos Mat Jimnez
Profesor de Estadstica
lCAl, Universidad Pontificia Comillas

Con la colaboracin de
Santiago Capella Vizcaino
Universidad Nacional Autnoma de Mxico

..
TT ADDISON-WESLEY IBEROAMERICANA
Argentina Brasil . Chile . Colombia . Ecuador . Espaa
Estados Unidos Mxico Per Puerto Rico Venezuela
Versin en espaol de la obra Statistics for Analytical Chemistry, Second Edition, de J.e.
Miller y J.N. Miller, publicada originalmente en ingls por Ellis Horwood, Londres,
Inglaterra. 1988 por le. Miller y J.N. Miller/Ellis Horwood Limited.

Esta versin en espaol es la nica autorizada.

ndice general

Prefacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . IX

Prefacio a la segunda edicin XI

Glosario de smbolos ............................... .xiii

1 Introduccin
1.1 Problemas analticos . .1
1.2 Errores en el anlisis cuantitativo .2
1.3 Tipos de errores . .3
Portada: Ricardo Aniaga 1.4 Errores sistemticos y aleatorios en el anlisis volumtrico .7
1.5 El manejo de errores sistemticos . 11
1.6 Planificacin y diseo de experimentos . 14
1.7 Calculadoras y computadores en los clculos estadsticos 15
Bibliografa 17
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2 Errores en el anlisis clsico. Estadstica de medidas repetidas


2.1 Media y desviacin estndar . . . . .20
1993 por Addison-Wesley Iberoamerican, S.A. 2.2 Distribucin de errores . . . . . . . .22
Wilmington, Delaware, E.U.A. 2.3 La distribucin muestral de la media .25
2.4 Lmites de confianza de la media 28
2.5 Presentacin de resultados . . . . . 31
2.6 Otros usos de los lmites de confianza .32
Impreso en Estados Unidos. Printed in U.S.A. 2.7 Propagacin de errores aleatorios .32
2.8 Propagacin ele errores sistemticos .36
ISBN 0-201-60140-0 Bibliografa 37
Ejercicios . .37
1 2 3 4 5 6 7 8 9 lO-AL-97 96 95 94 93
3 Pruebas de significacin 6.2 La mediana . 123
3.1 Introduccin . .40 6.3 La prueba de signos . 124
3.2 Comparacin de una media experimental con un valor conocido .40 6.4 La prueba de rachas de Wald- Wolfowitz 126
3.3 Comparacin de las medias de dos muestras .42 6.5 Pruebas basadas en el recorrido de los resultados 127
3.4 La prueba t por parejas . 44 6.6 La prueba de rangos y signos de Wilcoxon 129
3.5 Las pruebas de una y dos colas . .46 6.7 La prueba de suma de rangos de Wilcoxon y mtodos relacionados 131
3.6 La prueba F para la comparacin de desviaciones estndar .47 6.8 Pruebas no paramtricas sobre ms de dos muestras 135
3.7 Valores anmalos . . 49 6.9 Correlacin ordinal . 137
3.8 Anlisis de la varianza 51 6.10 Mtodos de regresin no paramtricos . . . . . 139
3.9 Comparacin de varias medias .52 6.11 La prueba de bondad del ajuste de Kolmogorov 141
3.10 La aritmtica de los clculos ANOVA .55 6.12 Conclusiones 145
3.11 La prueba chi cuadrada . 57 Bibliografa 145
3.12 Prueba de la normalidad de una distribucin 58 Ejercicios . . . . . 145
3.13 Conclusiones a partir de las pruebas de significacin 61
Bibliografa 63 7 Diseo experimental, optimizacin y reconocimiento de pautas
Ejercicios . . . . . . . . . . . . . 63 7.1 Introduccin . 147
7.2 Aleatorizacin . 148
4 Control de calidad y muestreo 7.3 Experimentos con bloques 148
4.1 Introduccin......................... .67 7.4 ANOVA de dos factores 149
4.2 Muestreo . . 67 7.5 Cuadrados latinos . . . . . 152
4.3 Estimacin y separacin de varianzas utilizando ANOVA .69 7.6 Diseos anidados y de clasificacin cruzada 153
4.4 Estrategia de muestreo . .70 7.7 Interaccin . 153
4.5 Ensayos de colaboracin: introduccin 71 7.8 El diseo factorial frente al de un factor cada vez 159
4.6 Representaciones grficas de dos muestras .72 7.9 Diseo factorial y optimizacin . 159
4.7 La preparacin de un ensayo de colaboracin 73 7.10 Incapacidad del mtodo de un factor cada vez para lograr el ptimo 163
4.8 Clculos en ensayos de colaboracin .75 7.11 Mtodo de la mxima pendiente o del gradiente 164
4.9 Diagramas de control 78 7.12 Optimizacin por el mtodo simplex 168
Bibliografa 84 7.13 Reconocimiento de pautas . 171
Ejercicios . 84 7.14 Mtodos de aprendizaje supervisados .. 173
7.15 Mtodos de aprendizaje no supervisados 176
5 Errores en anlisis instrumental; regresin y correlacin Bibliografa 178
5.1 Anlisis instrumental . 87 Ejercicios . 179
5.2 Grficas de calibracin en anlisis instrumental . 88
5.3 El coeficiente de correlacin momento-producto .90 Soluciones a los ejercicios 181
5.4 La recta de regresin de y sobre x . .95
5.5 Errores en la pendiente y ordenada en el origen de la recta de regresin .96 Apndice 1 Resumen de pruebas estadsticas 196
5.6 Clculo de una concentracin 98
5.7 Lmites de deteccin 100 Apndice 2 Tablas estadsticas 199
5.8 El mtodo de las adiciones estndar 103
5.9 El uso de rectas de regresin para comparar mtodos analticos 106 ndice de materias . . . . . . . 210
5.10 Rectas de regresin ponderadas 110
5.11 Regresin curvilnea 114
Bibliografa 119
Ejercicios . 119

6 Mtodos no paramtricos y de ejecucin rpida


6.1 I n t r o d u c c i n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
Prefacio

\Iwdir otro volumen a los numerosos textos de estadstica pudiera parecer una tarea
"1l1 excesivas garantas de xito; no obstante, la realidad es que por desgracia muchos
cientificos altamente calificados ignoran hasta los mtodos estadsticos ms elementales.
.Es mas asombroso an que los qumicos analticos, quienes practican una de las ciencias
lI1;~S cuantitativas de todas las existentes, no estn ms prevenidos que otros contra este
mal peligroso, pero sin lugar a dudas curable. Por lo tanto, es de esperar que este libro
pueda beneficiar a los cientficos analticos que deseen disear y realizar sus experimentos
en forma correcta, y extraer tanta informacin de los resultados como puedan. As mismo,
pretende atraer al creciente nmero de estudiantes que se especializan en qumica anlitica,
ya los que utilizan mtodos analticos en forma rutinaria en el trabajo de laboratorio.
Existen otras dos razones que nos han alentado a escribir este libro. Una es el enorme
impacto de la microelectrnica, en forma de microcomputadores y calculadoras de bolsillo,
sobre la estadstica: mediante estos aparatos, los cientficos activos han resuelto los
problemas que planteaban los procedimientos analticos difciles. La segunda es el rpido
desarrollo de los nuevos procedimientos "quimiomtricos", incluyendo el reconocimiento
de pautas, optimizacin, tcnicas de filtrado numrico, simulaciones, etc., todos ellos
factibles gracias a las facilidades que aportan los computadores. En el ltimo captulo de
este libro se intenta proporcionar al lector cuando menos una introduccin del potencial
de algunos de estos mtodos estadsticos ms novedosos. Sin embargo, no se ha incluido
ningn programa de computador en el libro; esto se debe, en parte, a las dificultades de
presentar programas que puedan ejecutarse en todos los tipos conocidos de microcompu-
tadores, y en parte a la existencia de una cantidad considerable de libros y programas de
computador adecuados y accesibles al pblico.
La disponibilidad de este enorme potencial de los computadores hace que el cientfico,
naturalmente, aplique mtodos estadsticos de manera racional y correcta. Para limitar la
extensin de este libro, y recalcar sus aspectos prcticos, no hemos intentado mostrar con
detalle las bases tericas de las pruebas estadsticas descritas. No obstante, hemos intentado
aclarar al analista cuales son las pruebas apropiadas para los tipos de problemas que
probablemente encontrar en el laboratorio. En el texto se incluyen ejemplos resueltos y,
al final de cada capitulo, ejercicios para el lector. Muchos de ellos se basan en los datos
proporcionados por trabajos de investigacin publicados en The Analyst. Nuestro profundo
agradecimiento al editor Phil Weston, por permitimos hacer uso de su distinguida revista.
Tambin agradecemos a nuestros colegas, amigos y familia su paciencia durante la
preparacin del libro; por otro lado en los apndices se citan individualmente las fuentes
de las tablas estadsticas; al editor de la serie, doctor Bob Chalmers; y a nuestros editores
por su eficiente cooperacin y consejos.

J. C. Miller
J. N. Miller

Prefacio a la segunda edicin

gran aceptacin que ha tenido la primera edicin de este libro nos ha animado a preparar
una segunda edicin revisada y ligeramente ampliada. Agradecemos en especial a quienes
han indicado errores de la primera edicin y nos sugirieron posibles mejoras. El profesor
D. Thorburn Burns nos ha ayudado mucho al sealamos los errores; tambin agradecemos
al profesor J. E. Colbeck por sus comentarios constructivos acerca de la nomenclatura.
Los principales cambios introducidos en esta edicin forman un nuevo captulo (4), en
el cual se trata por primera vez los ensayos de colaboracin y se cubre en gran medida el
muestreo y los diagramas de control. Se aadi material sobre errores de tipo 1 y tipo 2;
el uso secuencial de las pruebas de significacin; los mtodos no paramtricos, y las
grficas de calibracin no lineales. Por ltimo, se ampli el estudio del reconocimiento de
pautas y del diseo factorial, y se incorporaron soluciones ms detalladas a algunos de los
problemas.
De nuevo, agradecemos a nuestros editores; los editores de la serie, los doctores Bob
Chalmers y Mary Masson; y Phil Weston, editor de The Analyst, su ayuda y cooperacin
adicionales para la produccin de esta edicin.

J. C. Miller
J. N. MilIer
Glosario de smbolos

(1 ordenada en el origen de la recta de regresin


J pendiente de la recta de regresin
(' nmero de columnas en el ANOVA de dos factores
t. trmino de correccin en ANOVA de dos factores
F razn de dos varianzas
razn de intervalos
Ji nmero de muestras en el ANOVA de un factor
,u media aritmtica de una poblacin
'vi nmero de signos menos en la prueba de rachas de Wald-Wolfowitz
1/ tamao muestral
N nmero de signos ms en la prueba de rachas de Wald-Wolfowitz
nmero total de mediciones en ANOVA de dos factores
nmero de grados de libertad
I'ir probabilidad de r
Q Q de Dixon, utilizada para pruebas de valores anmalos
coeficiente de correlacin momento-producto
r nmero de filas en ANO VA de dos factores
coeficiente de correlacion de intervalos de Spearman
s desviacin estndar de una muestra
desviacin estndar de los residuos de y
desviacin estndar de la pendiente de la recta de regresin
desviacin estndar de la ordenada en el origen de la recta de regresin
desviacin estndar de los residuos de y de rectas de regresin ponderadas
desviacin estndar de los valores de x estimados utilizando rectas de regresin
,OH desviacin estndar de un blanco
S\I desviacin estndar de un valor de x extrapolado
S,o" desviacin estndar de un v310rde x estimado utilizando rectas de
regresin ponderadas
o desviacin estndar de una poblacin
varianza de una medicin
varianza muestral
cantidad utilizada en los clculos de los lmites de confianza y en pruebas
de significacin de la media (vase la Seco 2.4)
T gran total en el ANOVA
Td cantidad utilizada en pruebas de significacin de la media (vase la Seco 6.5)
r, Y T 2 -
W

Wj
estadsticos utilizados en la prueba de la suma de rangos de Wilcoxon
intervalo '''''============
peso dado a un punto en la recta de regresin
X media aritmtica de una muestra
Xo valor ele x estimado utilizando rectas de regresin
XI-:

x\v
valor de x extrapolado
media ari tmtica de valores de x ponderados
Introduccin
x 2
cantidadlltilizaela en contrastes de bondad del ajuste
y prediccin del valor de y por la recta de regresin
Yw media ari tmtica de los valores de y ponderados
)'B seal elel blanco
z variable Ilormal estndar
1.1 PROBLEMAS ANALTICOS

Un qumico analtico puede enfrentarse a dos tipos de problemas: en ocasiones se le pide


slo una respuesta cualitativa; por ejemplo, la presencia de boro en agua destilada es muy
perjudicial en la produccin de componentes microelectrnicos (" Contiene boro esta
muestra de agua destilada?"). Por otro lado un problema comn en la ciencia forense es la
comparacin de muestras de suelo ("Estas dos muestras de suelo pueden proceder del
mismo lugar?"). En otros casos, los problemas que se le plantean son cuantitativos
("Cunta albmina hay en esta muestra de suero sanguneo?", "cunto plomo hay en esta
muestra de agua del grifo?", "esta muestra de acero contiene pequeas cantidades de
cromo, tungsteno y manganeso; cunto de cada uno?"). stos son ejemplos tpicos
de anlisis cuantitativos de uno o varios componentes.
La qumica analtica moderna es una ciencia predominantemente cuantitativa. Es
obvio que en muchos casos una respuesta cuantitativa ser mucho ms valiosa que una
cualitativa; para un analista puede ser til decir que ha detectado boro en una muestra de
agua destilada, pero es mucho ms til para l poder definir cunto boro se encuentra
presente en dicha muestra. La persona que solicita el anlisis podra, una vez que cuenta
con esta respuesta cuantitativa, juzgar si la concentracin de boro es preocupante, consi-
derar cmo se puede reducir, etc.; pero si slo supiera que hay algo de boro le seria difcil
estimar la significacin del resultado. En otros casos slo tiene valor un resultado cuanti-
tativo. Por ejemplo, prcticamente todas las muestras de suero sanguneo humano contie-
nen albmina; la pregunta es, cunta?
Es importante observar que aun cuando se requiera una respuesta cualitat iva, se util izan
mtodos cuantitativos para obtenerla. Esto se ilustra en los ejemplos expuestos al principio
de esta seccin. En realidad, un analista nunca dira simplemente "Yo puedo o no puedo
detectar boro en esta muestra de agua". Utilizara un mtodo cuantitativo capaz de detectar
boro a niveles, supongamos, de 1 f/g!ml. Si la prueba diese un resultado negativo, podra
describirse en la forma "Esta muestra contiene menos ele I pg!ml de boro". Si el ensayo
dio U11 resultado positivo, se podra decir que la muestra contiene al menos 1 pg!ml de boro
Para comparar dos muestras de suelo se podra utilizar aproximaciones cuantitativas mucho es sustancialmente diferente de los otros tres. Aqu surge la pregunta: puede rechazar-o,
ms complejas. Por ejemplo, las muestras podran estar sujetas a un anlisis de tamaos de sin riesgo este cuarto valor de manera que, por ejemplo, el valor medio se presente COll1o
partculas que determinara las proporciones de partculas de suelo clasificadas en cierto 24.73 ml? En trminos estadsticos, el valor de 25.39 mI es un resultado anmalo?
nmero de tamaos, digamos diez. Entonces cada muestra se caracterizara por estos diez El importante tema del rechazo de los resultados anmalos se analiza con detalle en el
datos. Se puede usar procedimientos muy complejos (vase el Cap. 7) para brindar una captulo 3.
valuacin cuantitativa de su similitud, y se puede obtener una estimacin de la probabilidad Otro problema frecuente es la comparacin de dos o ms conjuntos de resultados.
de que las muestras tengan un origen comn, si se dispone de datos comparables de Suponga que un analista mide el contenido de vanadio en una muestra de acero usando dos
muestras de suelo que se sabe que son compatibles. mtodos distintos. Con el primero obtiene un valor medio de 1.04 %, con un error estimado
del 0.07%; con el segundo obtiene un valor medio del 0.95% y un error del 0.04%. Al
comparar estos resultados surgen varias preguntas: los dos valores medios son significa-
1.2 ERRORES EN EL ANLISIS CUANTITATIVO tivamente diferentes, o son indistinguibles dentro de los lmites de error experimental?
Uno de los mtodos es bastante menos propenso a errores que el otro? Cul de los dos
Una vez que aceptamos que los anlisis cuantitativos jugarn un papel predominante en valores medios est en realidad ms cerca de la verdad? De nuevo, en el captulo 3 se
cualquier laboratorio analtico, debemos aceptar tambin que los errores que aparezcan estudian stas y otras preguntas relacionadas.
en tales estudios son de gran importancia. Nuestro principio gua ser que l/O existen Para concluir esta seccin notemos que muchos anlisis se basan en mtodos grficos.
resultados cuantitativos vlidos si /lO van acompaados de alguna estitnarion de los En lugar de medir repetidamente la misma muestra, realizamos una serie de mediciones
er n.nc: 1>i"'I'''''!'' a ellos. Desde luego, este principio se aplica no solo a la qumica sobre un pequeo grupo de estndares los cuales tienen concentraciones conocidas que
auanuca, sino a cualquier campo de estudio en el que se obtengan resultados numricos cubren un intervalo considerable; de esta manera establecemos una curva de calibracin
experimentales. Podernos examinar rpidamente una serie de ejemplos sencillos que que puede utilizarse para estimar la concentracin de muestras estudiadas con el mistno
ilustran el principio y que adems plantean los tipos de problemas estadsticos que encon- procedimiento. En la prctica, por supuesto, todas las mediciones (las que se basan en
traremos y resolveremos en los prximos captulos. estndares y las que se efectan en muestras) estarn sujetas a errores. Por ejemplo, es
Supongamos que un qumico sintetiza un reactivo analtico creyendo que es comple- necesario calcular los errores en que se incurre al trazar la curva de calibracin, estimar el
tamente nuevo; lo estudia utilizando un mtodo espectromtrico y el compuesto da un valor error de la concentracin de una muestra determinada utilizando la curva, y estimar el lmite
de 104 (normalmente, la mayora de nuestros resultados se citarn en unidades elegidas de deteccin del mtodo, es decir, la cantidad de analito ms pequea que puede detectarse
con todo cuidado, pero en este ejemplo hipottico pueden utilizarse unidades arbitrarias). con un grado de confianza concreto. Estos procedimientos, especialmente frecuentes en
Al revisar los libros de referencia, el qumico encuentra que ningn compuesto descubierto anlisis instrumental, se describen en el captulo 5.
hasta el momento ha arrojado un valor de ms de 100 cuando se ha estudiado con el mismo Estos ejemplos representan slo una parte de los problemas que pueden surgir de la
mtodo en las mismas condiciones experimentales. La pregunta que surge naturalmente ocurrencia de errores experimentales en el anlisis cuantitativo. No obstante, como hemos
es: nuestro qumico descubri en realidad un compuesto nuevo? Por supuesto, la respuesta visto, los problemas deben resolverse si deseamos que los datos cuantitativos tengan algn
a esta pregunta reside en el grado de confianza que podemos asignar al valor experimental significado real. Por 10 tanto, resulta evidente que debemos estudiar con ms detalle los
de 104. Qu errores estn asociados con l? Si el estudio posterior indica que el resultado diferentes tipos de errores.
es correcto dentro de 2 unidades (arbitrarias), es decir, que el verdadero valor se encuentra
en el intervalo 104 2, entonces es posible que se haya caracterizado un nuevo material.
Pero si las investigaciones muestran que el error puede alcanzar hasta 10 unidades (es decir, 1.3 TIPOS DE ERRORES
104 10), entonces es muy probable que el verdadero valor sea en realidad menor que lOO,
en cuyo caso el nuevo descubrimiento dista mucho de ser cierto. En otras palabras, es Los cientficos experimentales hacen una distincin fundamental entre tres tipos de errores:
esencial conocer los errores experimentales (en este caso corno en cualquier otro) para crasos. al{~:ltl)";ih )' istemriticos. Los errores crasos se describen con facilidad; pueden
interpretar adecuadamente los resultados. En trminos estadsticos, este ejemplo conlleva- L.llll"c corno errores tan graves que no queda otra alternativa ms que abandonar el

ra la comparacin de los resultados experimentales con un valor supuesto o de referencia: experimento y empezar de nuevo. Como ejemplos se podran incluir la avera total de un
este tema se estudia con detalle en el captulo 3. instrumento, la cada o el derramamiento accidental de una muestra muy importante, o
Una situacin ms comn es la del analista que lleva a cabo varias determinaciones descubrir durante el desarrollo de un experimento que un reactivo que se supona puro, en
repetidas en el curso de un solo anlisis. (El valor y la significacin de tales repeticiones realidad estaba contaminado. Tales errores (que ocurren ocasionalmente incluso en los
se ver con detalle en el prximo captulo.) Suponga que un analista efecta cuatro veces laboratorios mejor controlados') normalmente se reconocen con mucha facilidad. En
un experimento volumtrico y obtiene valores de 24.69, 24.73, 24.77 Y25.39 ml. El primer consecuencia, en nuestro anlisis slo tenemos que distinguir con detenimiento entre los
aspecto por sealar es que los valores de titulacin se redondean a 0.01 ml; este aspecto errores aleatorios y los sistemticos.
tambin se analiza en el captulo 2. Tambin es evidente de inmediato que los cuatro valores Podemos hacer mejor esta distincin mediante el estudio cuidadoso de una situa-
son distintos debido a los errores inherentes a las medidas, y que el cuarto valor (25.39 ml) cin experimental real. Cuatro estudiantes (A-D) realizan un anlisis en el que titulan
exactamente 10.00 mI de hidrxido de sodio exactamente O.lM* con cido clorhdri- Tabla 1.1 Erroressistemticos y aleatorios
co exactamente O.lM. Cada uno realiza cinco rplicas del anlisis y obtiene los resultados
Estudiante Resultados (ml) Comentario
que se muestran en la tabla 1.1.
Los resultados obtenidos por el estudiante A tienen dos caractersticas importantes. 10.08
Primero, todos estn muy prximos; todos caen entre 10.08 y 10.12 mI. En trminos 10.11
A 10.09 Preciso
generales, diramos que los resultados son altamente reproducibles. La segunda caracte-
10.10 pero inexacto
rstica distintiva es que todos son demasiado altos; en este experimento (algo inusual) 10.12
conocemos de antemano la respuesta correcta: 10.00 mI. Resulta evidente que han surgido
dos tipos de errores completamente distintos en el experimento de este estudiante. En 9.88
10.14
primer lugar existen errores aleatorios, los cuales provocan que los resultados individua- B 10.02 Exacto
les caigan a ambos lados del valor medio (en este caso 10.10 ml). Los estadsticos afirman 9.80 pero impreciso
qu~ los errores aleatorios afectan la precisin, o reproducibilidad de un experimento. En 10.21
el caso del estudiante A, queda claro que los errores aleatorios son pequeos y, por lo tanto, 10.19
decimos que los resultados son precisos. Sin embargo, tambin existen errores sistem- 9.79
ticos, los cuales provocan que todos los resutados sean errneos en el mismo sentido (en C 9.69 Inexacto
este caso todos son demasiado altos). Los errores sistemticos afectan la exactitud, es decir, 10.05 e impreciso
la prnxf'nidrd (JI valor verdadero. En muchos experimentos, los errores aleatorios y 9.78
sistemticos no se detectan fcilmente con slo observar los resultados, sino que tambin 10.04
tienen orgenes muy distintos en cuanto a la tcnica experimental y al equipo que se utiliza. 9.98
Antes de examinar las causas de los errores en este experimento, podemos analizar D 10.02 Exacto
9.97 y preciso
brevemente los resultados obtenidos por los estudiantes B a D. El estudiante B ha obtenido
10.04
resultados que se encuentran en contraposicin directa con los del estudiante A. El
promedio de los cinco resultados (10.01 mI) est muy prximo al valor verdadero, de
manera que podemos caracterizar los datos como exactos, sin errores sistemticos sustan- Podemos aclarar esta diferencia con una extensin del experimento anterior. Por el
ciales. Sin embargo, la variedad de los resultados es muy grande, lo que indica una precisin camino normal el estudiante A, por ejemplo realizara las cinco medidas repetidas en una
insatisfactoria y la presencia de errores aleatorios sustanciales. La comparacin de estos sucesin rpida; pero es probable que no tardara ms de una hora en realizar el ejercicio
resultados con los obtenidos por el estudiante A muestra con claridad que los errores completo. Utilizara la misma serie de disoluciones y el mismo material de vidrio a lo largo
aleatorios y los sistemticos pueden ocurrir independientemente uno del otro. Esta conclu- del experimento; aadira la misma preparacin del indicador a cada matraz de titulacin,
sin se refuerza con los datos de los estudiantes C y D. El trabajo del estudiante C no es ni y permaneceran iguales la temperatura, la humedad y dems condiciones de laboratorio.
preciso (intervalo de 9.69 a 10.19 rnl) ni exacto (media 9.90 ml). El estudiante D ha logrado En tales circunstancias, la precisin medida sera la precisin dentro de rachas; esto se
a la vez resultados precisos (intervalo de 9.97 a 10.04 ml) y exactos (media 10.01 mI). La denomina repetitividad. Sin embargo, suponga que por alguna razn el mismo estudiante
distincin entre errores aleatorios y sistemticos, y entre precisin y exactitud, se resume realiz las titulaciones en cinco ocasiones diferentes. Es probable que en tales circunstan-
en la figura 1.1. cias usara recipientes de vidrio y preparaciones de indicador diferentes; as mismo, las
E! experimento aparentemente sencillo, descrito en los prrafos anteriores, merece condiciones del laboratorio tambin pudieron cambiar de una ocasin a otra. Por eso en
varios comentarios adicionales. Es muy importante mencionar que las palabras precisin este caso no sera sorprendente encontrar una gran variabilidad en los resultados. Este
y exactitud tienen significados completamente diferentes en la teora de errores, mientras conjunto de datos reflejara la precisin entre rachas del mtodo, y esto es a 10 que se
que se usan de manera indistinta en el lenguaje cotidiano. Por ejemplo, en varios diccio- debera asignar el trmino reproducibilidad. En la tabla 1.2 se resumen las definiciones
narios se menciona la exactitud como una definicin de precisin, y viceversa. Esta de los trminos utilizados y las relaciones entre ellos .
desafortunada confusin hace ms difcil recordar la diferencia principal entre los errores Se debe aprender otra leccin del experimento de titulacin. Es fcil apreciar que los
sistemticos y los aleatorios, a los cuales se refieren las palabras exactitud y precisin, valores obtenidos por el estudiante C son inaceptables, y que los del estudiante D son
respectivamente. Mencionaremos dos problemas adicionales de nomenclatura. En algunos los ms aceptables. Sin embargo, en ocasiones puede ocurrir que haya dos mtodos
textos se habla de errores "determinados" e "indeterminados" con el mismo significado disponibles para un anlisis concreto, de los cuales se piense que uno sea preciso pero
que errores sistemticos y aleatorios, respectivamente. As mismo, aunque utilizamos con inexacto, mientras que el otro, exacto pero impreciso. En otras palabras, es posible que
anterioridad la palabra "reproducibilidad" como una definicin aproximada de la precisin, tengamos que elegir entre los tipos de los resultados obtenidos por los estudiantes A y B
el convenio actual hace una distincin ciudadosa entre reproducibilidad y repetitividad. respectivamente. Entonces, qu tipo de resultado es preferible? No es posible dar una
respuesta categrica a esta pregunta, aunque slo sea porque la eleccin del mtodo
* El smbolo 1M indica I mol del material especificado por litro de solucin. analtico se basar, en la prctica, en el costo, la facilidad de automatizacin, la rapidez del
Resultado rimental y de nuestro equipo. En la prxima seccin se analiza esta importante distincin
adicional entre los elos grandes tipos ele errores.
correcto

a ! 1.4 ERRORES SISTEI\ITICOS y ALEATORIOS EN EL ANLISIS


I ..r.. VOLUI\ITRICO

Mediante el ejemplo del experimento volumtrico de los estudiantes se muestra con


b claridad que los errores sistemticos y aleatorios pueden ocurrir independientemente unos
de otros y surgir en diferentes etapas del experimento. Ya que la volumetra es un
1 l I I!
procedimiento relativamente simple y todava ampliamente usado, es importante exami-
narlo con detalle en este contexto. Se puede considerar que un anlisis volumtrico es
completo cuando involucra los siguientes pasos (algunos de los cuales se han omitido en
e el ejemplo de la seccin precedente con el fin de hacerlo ms sencillo).
11 ... ti
(1) Preparacin de una solucin estndar de uno de los reactivos. Esto supone (a) pesar
un pesasustancias o recipiente similar que contenga algn material slido; (b) transferir el
material slido a un matraz aforado y pesar de nuevo el pesasustancias con el fin eleobtener
por diferencia el peso del slido transferido, y (e) llenar el matraz con agua destilada hasta
d el enrase (suponiendo que se contempla una titulacin acuosa).
..l.: (2) Transferir una alcuota del material estndar a un matraz eletitulacin con ayuda de
9.70 una pipeta. Esto supone (a) llenar la pipeta hasta el enrase adecuado, y (b) vaciar el
10.00 10.30
contenido ele una manera especfica en el matraz de titulacin.
Volumen de titulador en mi (3) Titulacin del lquido en el matraz con una solucin del otro reactivo aadido de
Figura 1.1 Exactitud y precisin;representacin grficade los datos de la tabla 1.1. En (a)los datos una bureta. Esto implica (a) llenar la bureta y permitir que el lquido contenido en ella
son precisos pero inexactos; en (b) exactos pero imprecisos; en (c) inexactos e imprecisos, y en (d) escurra hasta que el menisco alcance un nivel constante; (b) aadir unas cuantas gotas de
exactos y precisos. solucin de indicador al matraz de titulacin; (e) leer el volumen inicial de la bureta; (d)
aadir poco a poco el lquido de la bureta al matraz de titulacin hasta que se juzgue que
anlisis y otros factores que se encuentran fuera de nuestra evaluacin elemental. Sin se ha alcanzado el punto final, y (e) medir el nivel final del lquido en la bureta.
embargo, es importante darse cuenta de que un mtodo que se encuentre sustancialmente Si bien un anlisis elemental de este tipo implica diez pasos diferentes, por lo general
libre de errores sistemticos puede an, si es muy impreciso, proporcionar un valor medio los siete ltimos se repiten, como hemos visto, varias veces. En principio, podramos
que est (por azar) bastante alejado del valor correcto. Por otra parte, un mtodo que es examinar cada paso para evaluar los errores aleatorios y sistemticos que pudieran ocurrir.
preciso, pero inexacto (estudiante A) puede convertirse en uno que sea preciso y exacto Enla prctica, es ms sencillo examinar por separado las etapas que utilizan pesadas [pasos
(estudiante D), si se descubren y eliminan los errores sistemticos. Tambin existirn casos 1 (a) y 1 (b)], Y las etapas restantes que conllevan el uso de equipo volumtrico. El lector
en donde, debido a que las medidas que se obtienen son absolutamente nuevas no sea advertir que la intencin no es proporcionar descripciones detalladas de las tcnicas
fa~ti?le controlar alguno de los errores sistemticos. Los errores aleatorios nunca se' pueden experimentales utilizadas en las diferentes etapas. De igual manera, no se exponen mtodos
ehm:nar, aun~ue mediante una tcnica cuidadosa se pueden minimizar, y realizando para calibrar pesas, material de vidrio, etc. (Estos temas se tratan con detalle en los libros
m~d~das repetidas se puede medir y evaluar su importancia. En muchos casos pueden citados en la bibliografa al final del captulo.) Entre las contribuciones para detectar los
eliminarse los errores sistemticos mediante controles adecuados de nuestra tcnica expe- errores, son de importancia las tolerancias de las pesas utilizadas en los pasos gravimtri-
cos, y del material de vidrio volumtrico. Algunas instituciones tales como la British
Tabla 1.2 Resumen de definiciones Staudards Institution (BSI) y la American Society for Testing and Materials (ASTM) han
publicado especificaciones estndar para estas tolerancias. Algunos valores de tolerancia
Tiposde errores
Aleatorios Sistemticos tpica se exponen en la tabla 1.3. La tolerancia de una pesa de 100 g de alta calidael puede
Afectan la precisin ser tan pequea como 0.25 mg, aunque para un peso usado en tareas de rutina la tolerancia
Afectanla exactitud podra ser hasta cuatro veces ms grande. De igual manera, la tolerancia para un matraz
La precisindentro de la rachas es la repetitividad Proximidad a la verdad
La precson entre las rachas es la reproducibilidad aforado elegraelo A ele250 mI es O. 12 ml; el material volumtrico de grado B por lo regu lar,
Tambin se conocen como errores indeterminados Tambin se conocencomo errores presenta tolerancias dos veces ms grandes que el material de vidrio grado A. Si una pesa
determinados o una pieza de material de vidrio est dentro de los lmites de tolerancia, pero no posee
Tabla 1.3 Ejemplos de tolerancias de pesos y de material de vidrio con estndares suministrados por cuerpos estatutarios y autoridades de normativas (vanse
Artculo los prrafos anteriores). Esta calibracin puede ser muy exacta, por ejemplo, de 0.01 mg
Tolerancia
para pesadas en el intervalo de 1 a 10 g. El efecto atmosfrico puede ser sustancial; por
Pesos (Clase 1) 0.25 mg ejemplo, Skoog y West (vase la bibliografa) presentan una muestra de un lquido orgnico
100g 0.034 mg
I g de densidad de 0.92 g/rnl que pesa 1.2100 g al aire, y que pesara 1.211 4 g al vaco, una
0.010 mg
10 mg diferencia de ms del 0.1 %. Aparte de usar procedimientos de calibracin, los cuales se
analizarn en la prxima seccin, pueden tomarse algunas precauciones experimentales
Pesos (Clase 3) 1.0 mg
100g sencillas para minimizar estos errores sistemticos; la ms importante es realizar todas las
0.10 mg
I g pesadas por diferencia, es decir, se pesa primero un pesafiltros con la muestra contenida
0.030 mg
10 mg en l, y despus sin ella. La diferencia entre las dos pesadas proporciona el peso de la
Material de vidrio (Grado A) muestra, y tambin elimina los errores sistemticos que surjan, por ejemplo de la humedad
0.25 mg
Probeta graduada de 50 mI u otros contaminantes en la superficie del recipiente (vase tambin la Seco 2.8). Si se toman
0.12mg
Matraz aforado de 250 mI
0.03 mg estas precauciones, los errores producidos en los pasos de la pesada sern mnimos, y es
Pipeta de 25 mI probable que en muchos experimentos volumtricos estos errores sean despreciables
0.05 lllg
Bureta de 50 mI
comparados con los que surjan por el uso del equipo volumtrco. De hecho, los mtodos
(Datos obtenidos de las Especificaciones estndar de ASTM E617-78 y E694-79; vase la bibliografa.) gravimtricos se usan generalmente para calibrar el material de vidrio volumtrico,
pesando (en condiciones estndar) el agua que contenga; resulta evidente que este proce-
dimiento es vlido tan slo debido a que los errores gravimtricos son despreciables
exactame.nte el peso ~ volumen correcto, surgir un error sistemtico. As pues, si el matraz comparados con los volumtricos.
aforado tiene en r,ealidad un volumen de 249.95 mi, este error se reflejar en el resultado En los procedimientos volumtricos los errores aleatorios provienen del uso de material
de todos los expenmentos basados en el uso de dicho matraz. La repeticin del experimento de vidrio. Al llenar un matraz aforado de 250 mI hasta la marca del aforo, el error (es decir,
no revelara el error, ya que en cada repeticin se supondr que el volumen es de 250.00 mi, la distancia entre el menisco y la marca) puede ser aproximadamente de 0.03 cm en el
cuane~o de hecho es menor que ste. No obstante, si se comparan los resultados de un cuello del matraz de dimetro de ca. 1.5 cm. ste corresponde a un error en volumen de
experimento en el que s~ ha utilizado este matraz con los de otros experimentos (p. ej., en 0.05 mi, slo un 0.02 % del volumen total del matraz. De igual manera, al llenar una pipeta
otros labora tonos) realizados con otros matraces, entonces el hecho de que todos los de transferencia de 25 mi el error aleatorio no debera exceder de 0.03 cm en una caa de
matraces tengan volmenes ligeramente diferentes contribuir a la variacin aleatoria 0.5 cm ele dirnetro; sta proporciona un error en volumen de ca. 0.006 mi, el 0.024% del
como ya se mencion, los errores aleatorios entre rachas afectan la reproducibilidad de los volumen total. El error en la lectura de una bureta (graduada en divisiones de 0.1 mi)
resultados.
es quizs de 0.01 a 0.02 ml, Cada titulacin implica dos lecturas (los errores /10 son
Por ,lo regular los procedimientos de pesada se encuentran asociados con errores simplemente aditivos, vase el captulo 2); si el volumen de titulacin es aproximadamente
alcatorIos muy pequeos. Es muy comn que en tareas de laboratorio rutinarias se utilicen 25 mi, el porcentaje de error es nuevamente muy pequeo. Es evidente que las condiciones
balanzas de cuatro cifras, y el error aleatorio que se comete no debera ser mayor que experimentales deberan planificarse de manera que el volumen de titulador no sea
o.aaa 1-0.0002 g (en el prximo captulo se describe con detalle el trmino estadstico demasiado pequeo (no menos de 10 mi), ya que de otra manera los errores seran
empleado para expresar errores aleatorios). Debido a que la cantidad que se pesa por lo considerables. (Esta precaucin es anloga a la de utilizar un compuesto estndar de alto
regular se encuentra alrederor de 1 g o ms, resulta evidente que el error aleatorio peso molecular para minimizar el error de pesada.) Adems, aunque un anlisis volumtrico
expre~ado en un porcentaje de la pesada efectuada, no es mayor del 0.02%. Un buel~ suponga varios pasos, y en cada uno de ellos se use una pieza de material de vidrio
material estndar para el anlisis volumtrico debera tener (entre otras caractersticas) un
volumtrico, es obvio que los errores aleatorios deberan ser pequeos si los experimentos
peso formula tan alto como sea posible, de manera que se minimicen estos errores aleatorios se realizan con cuidado. En la practica, un buen anlisis volumtrico debera tener una
de ~)esada cuando se prepare una solucin de una molaridad dada. En algunos anlisis se desviacin estndar relativa (vase el captulo 2) de no ms de 0.1 %. (Hasta hace poco, tal
utilizan "mlcrobalanzas" para pesar cantidades de pocos miligramos; pero los errores de precisin normalmente no se alcanzaba con los mtodos de anlisis instrumental, y an no
pesada cometleJos son slo unos pocos microgramos.
es comn, y constituy una de las mayores ventajas de las tcnicas analticas "clasicas".)
Los errores sistcmticos en las pesadas pueden ser apreciables y proceder de una serie Debemos recordar que, con habilidad y tomando todas las precauciones, los mtodos cl-
de . fuent
" es es t' I .I 1 les i '.
.ID ecic as, as cua es incluyen la adsorcin de la humedad en la superficie del
sicos pueden dar resultados con desviaciones estndar relativas, tan bajos como del 0.01 %.
~~c~plente de pe~ada; los errores provocados al no permitir que los recipientes calentados Los procedimientos volumtricos incorporan varias fuentes importantes de error siste-
se enfnen a la nusma temperatura que la balanza antes de pesar (este error es muy connin
ell gnvllll ,t d . 1 matico. Entre los principales se encuentran los errores de vaciado en el uso de material de
. . <, t J la cuan o se pesan cnso es); las pesas oxidadas o contaminadas por el polvo;
y el efecto b te de l' t . f '. , vidrio volumtrico; los errores de calibracin en el material de vidrio, y los "errores del
.' oyan e e e .1 a mas era, que acta en diferente medida sobre objetos de distinta indicador". Quizs el error ms comn en el anlisis volumtrico de rutina sea no dejar
densld' 1 e I f' I 1 '. J
. de. .on e 1Il e e ograr un trab;Jo mas exacto, se debe calibrar las pesas en relacin
pasar el tiempo suficiente para vaciar una pipeta, o para estabilizar el nivel del menisco en
la bureta. Tambin es importante recordar que hay dos tipos de pipetas, las que se vacan 1.5 EL MANEJO DE ERRORES SISTEMTICOS
por evacuacin, y las pipetas de soplado, en las que el ltimo lquido remanente debe ser
expulsado por la fuerza. Si se confunden los dos tipos, por ejemplo, soplando en una pipeta Gran parte del contenido de este libro tratar de la evaluacin de errores aleatorios, los
de vaciado, se incurrira ciertamente en un error craso! Los errores por vaciado tienen un cuales pueden estudiarse mediante un amplio conjunto de mtodos estadsticos. En muchos
efecto sistemtico y otro aleatorio: el volumen liberado invariablemente es menor que el casos supone, por conveniencia, que estn ausentes los errores sistemticos (aunque se
que debera ser. La temperatura a la que se realiza un experimento tiene dos efectos. El describiran los mtodos que contrastan la existencia de errores sistemticos). Es necesario
equipo volumtrico se calibra en forma convencional a 20C, pero la temperatura en un analizar en este momento los errores sistemticos con ms detalle: cmo surgen, y cmo
laboratorio analtico puede diferir con facilidad de sta en varios grados, y muchos pueden abordarse. En el ejemplo del anlisis volumtrico expuesto en la seccin 1.3 se
experimentos, por ejemplo los anlisis bioqumicos, se llevan a cabo en "habitaciones fras" muestra con claridad que los errores sistemticos hacen que el valor medio de una serie de
a ca. de 4 oc. En segundo lugar, la temperatura afecta tanto al volumen de material de vidrio mediciones repetidas se desve del verdadero valor. Se deduce que: (a) a diferencia de los
como a la densidad de los lquidos. El coeficiente de expansin para soluciones acuosas errores aleatorios, los sistemticos no se pueden apreciar con la simple repeticin de
diluidas es aproximadamente del 0.025 % por grado, mientras que para recipientes de mediciones, y (b) a menos que se conozca de ai,.' "d:';](10 verdadero de un anlisis
vidrio sdico variar casi un 0.003 % por grado en volumen, y para recipientes de vidrio (juna situacin muy unprobablel), pueden existir errores sistemticos muy grandes, que
borosilicatado la variacin ser del 0.001% por grado. Resulta evidente que los cambios pasen inadvertidos si no se toman las debidas precauciones. En otras palabras, es demasiado
en los volmenes del material de vidrio sern importantes slo en trabajos de gran fcil pasar por airo id' fuentes principales de error sistemtico. Un pequeo conjunto de
exactitud, e incluso slo si la temperatura es muy diferente de 20C. Adems, los efectos ejemplos clarificarn tanto los posibles problemas y sus soluciones.
de la expansin de las soluciones se autocompensarn en gran parte si todas las soluciones En los ltimos aos se ha mostrado mucho inters en las concentraciones de metales
se mantienen a la misma temperatura. El efecto es ms obvio en soluciones no acuosas. de transicin en muestras biolgicas tales como el suero sanguneo. Por ejemplo, se han
Los errores de indicador pueden ser muy importantes: quizs ms grandes que los realizado muchas determinaciones de los niveles de cromo en el suero con resultados
errores aleatorios en un anlisis volumtrico tpico. Por ejemplo, en la titulacin de cido sorprendentes. Diferentes qumicos han obtenido concentraciones de cromo, que varan
clorhdrico al 0.1 M, con hidrxido sdico al O.IM esperamos que el punto final correspon- desde < 1 a ca. de 200 ng/ml, todos ellos estudiando muestras de suero combinadas
da con un pI-I de 7. Sin embargo, en la prctica, estimamos este punto final usando un procedentes de individuos sanos. En general, se obtuvieron los resultados ms bajos
indicador como el naranja de metilo. En experimentos diferentes se muestra que esta recientemente y se hizo evidente que los resultados ms altos, al menos en parte, se deban
sustancia cambia de color sobre un intervalo de pI-I ca. 3-4. Por lo tanto, si la titulacin se a la contaminacin de las muestras por el cromo procedente de las jeringas de acero
realiza aadiendo la base al cido, el indicador conducir a un punto final aparente cuando inoxidable, los tapones de los tubos, etc. La determinacin de trazas de cromo, por ejemplo,
el pH sea ca. 3.5, es decir, justo antes del verdadero punto final. Es probable que el error por espectrometra de absorcin atmica es, en principio, relativamente directa, y no hay
sistemtico que se ocasiona aqu sea del 0.2%. Si la titulacin se realiza a la inversa, es duda en que los resultados alcanzados por cada grupo de qumicos son satisfactorios en
decir aadiendo cido a la base, el punto final indicado por el naranja de metilo estar en trminos de precisin, aunque en varios casos se pas por alto el gran error sistemtico
realidad un poco ms alejado del punto final verdadero, debido a la necesidad de alcanzar introducido por la contaminacin. Los errores metodolgicos sistemticos de este tipo son
un pH cido para conseguir el cambio de color. As pues, el error sistemtico debido al comunes: el lavado incompleto de un precipitado en un anlisis gravimtrico, y el error
indicador puede ser positivo o negativo de acuerdo con el diseo del experimento; para un producido por el indicador en un anlisis volumtrico (vase la Seco lA) son ejemplos muy
procedimiento dado ser siempre positivo o siempre negativo. En cualquier caso, se puede conocidos.
eval~Iar y corregir el error realizando un experimento en blanco, es decir, determinado qu A menudo se presenta otra clase de errores sistemticos, que surgen cuando se realizan
cantidad de base (o cido) es necesaria para producir el cambio de color del indicador ante hiptesis falsas sobre la exactitud de un instrumento analtico. Los analistas experimenta-
la ausencia del cido (base). Un error que se menciona rara vez es el de la "ltima gota". dos saben demasiado bien que los monocromadores en los espectrmetros se desajustan
~o se sabe con certeza qu cantidad de la ltima gota se requiere para alcanzar el punto paulatinamente de manera que son frecuentes los errores de varios nanmetros en las
final. Ya que se necesitar un volumen mayor o menor al de la mitad de la ltima gota, longitudes de onda seleccionadas, an as se realizan muchos anlisis fotomtricos sin
puede reducirse este error restando la mitad del volumen de una gota. efectuar los controles adecuados. Los aparatos muy sencillos tales como material de vidrio
En cualquier procedimiento analtico, ya sea clsico o instrumental, es posible consi- volumtrico, cronmetros, pH-metros y termmetros, pueden mostrar errores sistemticos
derar y estimar la fuentes de error sistemtico y aleatorio que surjan en cada una de las sustanciales, si bien una gran mayora del personal de laboratorio utiliza con regularidad
etapas del experimento; es deseable que el analista haga esto con un cuidadoso diseo estos instrumentos como si fueran siempre exactos. Adems, la disponibilidad creciente de
experiI~lental, ya que le permitir evitar fuentes de error mayores (vanse las Secs. 1.5 y instrumentos controlados por microprocesadores o microcomputadores ha reducido al
1.6). Sin embargo, vale la pena sealar que en los anlisis volumtricos los errores son mnimo el nmero de operaciones y el nivel de pericia de los operadores. En estas
bastante inusuales en el sentido de que no implican ninguna etapa individual que tenga un circunstancias, es irresistible la tentacin de considerar que los resultados de los instru-
error mucho mayor que los errores de otras etapas. En muchos otros anlisis, en la prctica mentos son perfectos, a pesar de que de todas maneras estn sujetos a errores sistemti-
el e~ror global est dominado por el error generado en un nico paso; este aspecto se cos (a menos que posean suficiente "inteligencia" para poder autocalibrarse, vase la
analizara en el prximo captulo.
seccin 1.7).
Los errores sistemticos no slo surgen de procedimientos y de aparatos; pueden surgir onda errores de absorbancia e inexactitud del paso ptico, ya qlW ocurren igualmente en
tambin de sesgos humanos. Algunos qumicos padecen algn grado de astigmatismo o la calibracin y en la medicin de la muestra. Todas las fuentes principales ele error
daltonismo (lo ltimo es ms comn en los hombres que en las mujeres) que podra sistemtico son, slo en principio, eliminadas con tal eleque las condiciones para la muestra
provocar errores en la lectura de instrumentos y otras observaciones. Varios autores han v la calibracin sean de hecho equivalentes (por ejemplo, suponemos que la longitud ele
registrado numerosos prejuicios, por ejemplo, una tendencia que favorezca los nmeros onda y las escalas de absorbancia no se alteran durante el experi/llel~to.) .'
pares sobre los impares, o incluso los dgitos O y 5 sobre otros dgitos, en la presentacin Por ltimo, quizs la proteccin ms efectiva contra los errores sistemattcos sea el uso
de resultados. Por lo tanto, queda claro que las diversas clases de errores sistemticos son de materiales de referencia y mtodos estndar. Antes de comenzar el experimento, se
un riesgo constante, y a menudo oculto, para el analista, de manera que para minimizarlos calibra cada pieza de equipo mediante un proceso adecuado. Ya hem~s :is.to cmo
deben examinarse los sucesivos pasos con sumo cuidado. Se dispone de diferentes aproxi- puede calibrarse el equipo volumtrico mediante el uso de mtodos gravlll1etncos. ASI
maciones a este problema, y se debe considerar cualquiera de ellas o todas en cada uno de mismo, se puede calibrar la escala de las longitudes de onda del espectrmetro con.la ayuda
los procedimientos analticos. de fuentes de luz estndar, las cuales muestran lneas de emisin estrechas a longitudes de
Deberan tomarse las primeras precauciones antes de empezar cualquier trabajo expe- onda bien establecidas, y la escala de absorbancia del espectrmetro se calibra con filtros
rimental. El analista debera considerar con cuidado cualquier etapa del experimento que estndar slidos o lquidos. Del mismo modo, la mayor parte de los equipos se pueden
est a punto de realizar, el aparato que se utilice, el muestreo y el procedimiento analtico calibrar de manera que se conozcan de antemano los errores sistemticos. La importan-
que se vaya a adoptar. En esta primera etapa, debera intentar identificar las fuentes cia de esta rea de la qumica (y de otras ciencias experimentales) se refleja en el amplio
probables de error sistemtico, tales como las funciones del instrumento que necesitan trabajo de organismos como el National Physical Laboratory (en Inglaterra), National
calibracin, y los pasos del procedimiento analtico donde los errores tienen mayor Bureau 01 Standards (en Estados Unidos), y organizaciones similares en.otra.s partes. del
pro~~bilidad de ocurri.r. Tambin debe considerar las pruebas que puedan efectuarse para mundo. Se han escrito volmenes completos sobre libros de la estandanzaclon de tipos
verificar los errores sistemticos. Pueden ser de gran valor las previsiones de este tipo particulares de equipos (vase la bibliografa), y una serie de organizaciones comerciales
(veremos en la prxima seccin que debe prestarse igual atencin a las fuentes de error se especializan en la venta de materiales de referencia estndar. . .
aleatorio) y, por lo regular, vale la pena el tiempo invertido. Por ejemplo, una buena Si los errores sistemticos se producen en el transcurso de procesos qUlmlcos o como
reflexin de este tipo podra haber revelado la posibilidad de que existiera contaminacin resultado del uso de reactivos impuros, en lugar de originarse en el equipo, puede emplearse
en el experimento de determinacin de cromo descrito con anterioridad. una forma de comparacin alternativa, es decir, la determinacin debe repetirse mediante
La segunda accin contra los errores sistemticos radica en el diseo del experimento un procedimiento completamente independiente. Si se utilizan dos (o ms) mtodo.s fsicos
en cada etapa. Ya se ha visto (Sec, lA) que la pesada por diferencia puede eliminar algunos o qumicos no relacionados al efectuar un anlisis, y si conducen en forma consistente a
errores sistematicos gravimtricos: puede suponerse que estos errores existen con la misma resultados que muestran slo diferencias aleatorias, entonces es razonable suponer que no
extensin en ambas pesadas, de manera que el proceso de sustraccin los elimina. Otro hay errores sistemticos significativos. Resulta evidente que, para que esta aproximacin
ejemplo de planificacin experimental lo proporciona el error de la longitud de onda del sea vlida, cada paso de los dos experimentos tiene que ser independiente. Como en el
espectrmetro descrito anteriormente. Existen dos procedimientos para determinar la caso de la determinacin de cromo en suero, no ser suficiente sustituir el paso de la
concentracin de una muestra por espectrometra de absorcin. En el primero se estudia espectrornetra de absorcin atmica por un mtodo calorimtrico o por espectrometra de
la muestra ~~] una clula del espectrmetro de 1 cm a una longitud de onda de 400 nm, y la plasma, es decir, los errores sistemticos slo se revelaran si se alteran a~lem<s los m~tod~s
concentracin del componente ensayado se determina a partir de la ecuacin conocida A de muestreo, por ejemplo, eliminando o minimizando el uso delmatenal de acero 1lI0XI-
= ecl [donde A, E, e y 1 son respectivamente la absorbancia medida, el valor de referencia dable. Otro aspecto importante es que las comparaciones deben hacerse con base en el
aceptado d.e. la absorbancia molar (unidadesl.molt.cm') del componente ensayado, la intervalo de concentraciones total para el cual se usa un procedimiento analtico. Por
concentracl~n mo.Jar de este analito, y el paso (cm) de la clula del espectrmetro). Aqu ejemplo, el mtodo del verde de bromocresol que se utiliza con frecuel~cia para ~a
pueden surgir vanos errores sistemticos; la longitud de onda podra ser, como ya se ha determinacin de albmina en suero, se correlaciona con mtodos alternativos (p. ej.,
comentado, por ejemplo, de 405 nm en vez de 400 nm, con lo cual el valor de referencia inmunolgicos) a niveles normales o altos de albmina; pero cuando los niveles de
~Ie E.es inadec~Iado; el valor de E podra ser incorrecto en cualquier caso; el paso ptico de albmina son anormalmente bajos (stos son inevitablemente los casos ele mayor inters
a~elula po~na no.ser ex.actamente de 1 cm. De manera alternativa, el analista puede em- clnico), la concordancia entre los dos mtodos es escasa, y el mtodo elel colorante
I~ltar una sen~ de disoluciones de la sustancia ensayada de concentracin conocida, y medir proporciona en forma consistente y errnea concentraciones de albmina ms altas '. Las
LI absorbancla de cada una a 400 nm, (Una de estas soluciones de calibracin sera un aproximaciones estadsticas utilizadas en las comparaciones de los mtodos se descnben
~:I':J/C.~~ e~~ele~ir, conte~]~ra toelos los reactivos analtic~s. excepto el de la sustancia que se con detalle en los captulos 3 y 5.
c, iya; Hase la seccion 1.4.) Entonces, se podna utilizar los resultados con el fin de El predominio de los errores sistemticos en el trabajo analtico cotidiano se puede
construir una lnea de calibracin para el anlisis ele la muestra ensayada en las mismas aclarar por medio de los resultados de los ensayos de colaboracin. Para un analista
condiCIones eXI)e
' c nIuen" t a Ies. E;s ta . Importante
. .
aproxlmaclOn . . al anlisis
. . . .instrumental se experimentado y capaz es natural creer que s, por ejemplo, encuentra la ng/n~l e.le un
descnbe con , det'JII
" c'el]. e'1 capi't U l0_.5 C uanelo se uti'1'Iza este segundo mtodo no se requiere frmaco en una muestra de orina, entonces otros analistas obtendran resultados similares
el valor de E v s v:
Ian
e anu l os errores eIe bid I os a Ios desplazamientos
. ele las' longitudes ele para la misma muestra, y las diferencias slo se deberan a errores aleatorios. Por desgracia,
en la prctica esto se encuentra lejos de la verdad. En muchos trabajos de colaboracin en de observaciones de la velocidad de una reaccin catalizada por enzimas. El ana lito es a
los que intervienen diferentes laboratorios, incluso cuando se examinan, mediante los menudo el sustrato, es decir, el compuesto que cambia en la reaccin catalizada. por la
mismos procedimientos experimentales y los mismos tipos de experimentos, partes alcuo- enzima, Supongamos que se busca la mxima velocidad de reaccin en un experimento
tas de una muestra preparadas y distribuidas meticulosamente, la variacin en los resultados concreto, y que la velocidad en la prctica depende (entre otros factores) del pH de la
a menudo excede en mucho lo que razonablemente se podra esperar de los errores mezcla de reaccin, la temperatura y la concentracin de enzima. Cmo se pueden
aleatorios. La conclusin ineludible es que en muchos laboratorios no se detectan o corrigen encontrar las condiciones ptimas? Es fcil identificar una aproximacin posible. El ana-
una serie de errores sistemticos, tanto positivos como negativos. La importancia evidente lista podra realizar una serie de experimentos en los cuales la concentracin d~ enzima .y
de esta situacin preocupante, que tiene serias implicaciones para todos los cientficos la temperatura permanezcan constantes, pero se vare el pH. En cada caso podna detern:l-
analticos, ha alentado muchos estudios sobre la metodologa de los ensayos de colabora- narse la velocidad de la reaccin catalizada por la enzima y se podra obtener el valor del
cin, y la evaluacin estadstica de sus resultados. Este tema se analiza con mayor detalle pH ptimo, supongamos que es de 7.5. Podra realizarse una segunda se.~ie de experimentos
en el captulo 4. sobre la velocidad de reaccin, manteniendo constante el pH a 7.5 y fijando la concentra-
cin de enzima nuevamente, pero se variara la temperatura; as se obtendra una tempe-
ratura ptima, supongamos de 40C. Por ltimo, una serie de experimentos con pH 7:5 y
1.6 PLANIFICACIN Y DISEO DE EXPERIMENTOS 40C, pero con variaciones de enzima, indicaran el nivel ptimo de.enzin:a. R.e.sulta. tedIOSO
aproximarse asi a la optimizacin del experimento: en ejemplos de mvest~gaclon mas. reales
Muchos qumicos consideran las pruebas estadsticas como mtodos que slo se utilizan pueden necesitarse ms de tres factores experimentales. A ello se ana de ademas otra
para juzgar los resultados de un experimento concluido. Aunque esto de hecho es un rea objecin fundamental que supone que las variables o factores (pH, temperatura, concen-
de aplicacin esencial de la estadstica, hemos visto que no vale la pena considerar resultado traciones de enzima) afectan la velocidad de reaccin de manera independiente. Esto puede
cuantitativo alguno si no va acompaado por una estimacin de sus errores. Tambin es no ser verdad. Por ejemplo, se ha encontrado que con un pH de 7.5 la temperatura ptima
necesario estar consciente de la importancia de los conceptos estadsticos en la planifica- es de 40C. Sin embargo con un pH diferente, la temperatura ptima podra no ser de 40C.
cin y el diseo de experimentos. En la seccin anterior se subrayaba la importancia de En otras palabras, estos factores pueden afectar la velocidad de reaccin en una forma
intentar predecir errores sistemticos, lo cual permite al analista hacer planes para despus interactiva, y las condiciones establecidas en las series de experimentos que se acaban
valorarlos. Las mismas consideraciones se aplican a los errores aleatorios. Como veremos de describir pueden no ser en realidad las ptimas. Una vez comenzada la primera serie de
en el captulo 2, la combinacin de errores aleatorios de las partes individuales de experimentos en diferentes condiciones, se puede obtener entonces Ul.1a .seri:. diferent.e
un experimento para dar un error global requiere el uso de frmulas estadsticas sencillas. de valores "ptimos". Con este ejemplo sencillo queda claro que la opunnzacion expen-
En la. practica, el error global est dominado a menudo por el error en una etapa del mental puede ser un problema en extremo complejo. Este importante aspecto de la
experimento, en tanto que otros errores muestran efectos insignificantes cuando todos los estadstica, aplicado a la qumica analtica, se considera con ms detalle en el captulo 7.
errores se combinan en forma correcta. De nueva cuenta, es obvio que se espera identificar,
~lIfes de ql~e.ell!piece el experimento, en dnde puede surgir el error dominante, y entonces
mtentar minimizarlo, Aunque los errores aleatorios nunca pueden eliminarse, en realidad 1.7 CALCULADORAS Y COMPUTADORES EN LOS CLCULOS
l)lJe~en minimizarse atendiendo particularmente las tcnicas experimentales: un ejemplo ESTADSTICOS
sencillo es el de mejorar la precisin de un experimento espectromtrico usando una clula
de.I:1Uestra a temperatura constante. En consecuencia, para los errores aleatorios y siste- Ninzn qumico puede desconocer los sorprendentes avances que recientemente han
~TlalI~O.S la moraleja es clara: antes de comenzar el experimento, hay que esforzarse por surgido en el mbito de la microelectrnica. Estos avances han hecho p~si?le la con~tr~lc
d:1'f1f'r 0 f hs fuentes graves de error, de manera que el experimento pueda disearse para cin de aparatos que simpl ifican en gran medida los clculos estadsticos. El rpido
nunmuzar tales errores. crecimiento de la "quimiometria" (la aplicacin de mtodos matemticos a la solucin de
, Tdl.l)L! i debemos hacer algunas consideraciones preliminares sobre otros aspectos an problemas qumicos de todos los tipos) se debe a la facilidad con que pueden manejarse
mas sutlle~ del diseo experimental. En muchos anlisis, encontramos que una o ms grandes cantidades de elatos, y realizar clculos complejos, con calculadoras y compu-
caractensucas deseables del mtodo (p. ej., sensibilidad, selectividad velocidad de mues- tadores.
treo, :Jajo costo, etc.) dependen de una serie de factores experimentales, Al disear el Estos aparatos estn a disposicin del qumico analtico en varios niveles de comple-
expenmcnto, hay que intentar que se use de manera adecuada la combinacin ptima de jidad y costo, como se indica a continuacin.
estos fa~tores, y obtener la mejor sensibilidad, selectividad, etc. Sin embargo, pueden ser
lleces~nosalgunos experimentos preliminares o conocimientos anteriores; la optimizacin (1) Las calculadoras de bolsillo son muy baratas, muy confiables y capaces de realizar
de.b,era rea1tzarse (con el fin de conservar recursos y tiempo) antes de que el mtodo se muchos clculos estadsticos de rutina pulsando un nmero mnimo de teclas. Muchas
utilice en forma rutinaria o se haga un uso generalizado del mismo. calculadoras, provistas de funciones preprogramadas, permitirn los clculos de la
La ~omplejidad de los procedimientos de optimizacin puede aclararse con la ayuda media y la desviacin estndar (vase el cap. 2) y de regresin lineal y correlacin
de llll ejemplo
, ,E I iliISIS en71matlco,
n cana .., 1a concentracin
. del analito se oetermin:l :1 ":lrtir (",';. ....c-o 01 ro")n '\\ A r'\fr':lC' ''11'1I1'1r1r\r'1c CP lpc nllPl'-1p ~n~nt~r t~rip.t;1' ;:)r1icl011::l1p:s ()
programarlas el usuario para realizar otros clculos, tales como lmites de confianza que dichos sistemas sofisticados se pueden basar en microprocesadores o micro-
(vase el cap. 2); pruebas de significacin (vase el cap. 3), y regresiones no linea- computadores.
les (vase el cap. 5). Para muchos clculos en laboratorios donde se realiza investiga- (4) Grandes computadores, por ejemplo los denominados minicomputadores y compu-
cin analtica o anlisis de rutina, las calculadoras de este tpo pueden resultar ms tadores centrales, se utilizan ahora nicamente para el control de instrumentos muy
adecuadas. Sus desventajas residen en la imposibilidad de manejar cantidades grandes grandes y complejos, o para clculos especializados, tales como los que usan bases de
de datos, y los problemas que surgen del limitado nmero de cifras significativas datos extensas o que requieren muchas iteraciones. Sin embargo, parece que en cuanto
incorporadas a sus algoritmos (vase el cap. 2). se mejore la velocidad y capacidad de memoria de los computadores personales,
(2) Los microcomputadores, que en algunos casos tienen un costo ligeramente mayor al disminuir el uso de grandes aparatos en los laboratorios analticos.
de las calculadoras, se encuentran en la actualidad en muchos laboratorios analti-
cos, deben programarse para realizar los clculos estadsticos ms sencillos (aunque Es muy importante para el qumico analtico recordar que la disponibilidad de todos
se encuentran disponibles en el mercado paquetes de software estadstico), pero estos intrumentos de manejo de datos aumenta, en vez de disminuir, la necesidad de
pueden manejar grandes cantidades de datos. Por lo regular utilizan ms cifras que las un slido conocimiento de los principios en los que se basan los clculos estadsticos. Un
calculadoras, aunque a veces tambin se presentan problemas de este tipo durante computador o calculadora realizar con rapidez cualquier prueba estadstica o clculo
los clculos estadsticos. Los microcomputadores pueden convertirse tambin, con la seleccionado por el usuario, [011[0 si ese pracedinuento es adecuado o 110 para los daros en
ayuda de un programa de computador, en excelentes procesadores de textos (este libro estudio. Por ejemplo, un programa de mnimos cuadrados lineal determinar una lnea recta
se escribi y se tradujo mediante este sistema!), y esta posibilidad es de mucha ayuda sea cual sea la serie de valores de x y y que se pretenda ajustar, an en los casos en que la
para elaborar informes sobre trabajos de laboratorio y documentos similares. Otros inspeccin visual muestre de inmediato que dicho programa es inadecuado (vase el
programas muy valiosos son las "hojas de clculo", las cuales fueron diseadas Cap. 5). De nueva cuenta, un programa sencillo para probar la significacin de la diferencia
inicialmente para el mundo de los negocios y las finanzas, pero las posibilidades de entre las medidas de dos series de datos puede suponer que las varianzas (vase el Cap. 2)
realizar clculos Illuy complejos de hileras y columnas de nmeros, pueden adaptarse de las dos series sean similares; no obstante, el programa realizar a ciegas los clculos
con facilidad a clculos estadsticos tales como las regresiones lineales (vase el requeridos y proporcionar un "resultado" aun cuando las varianzas difieran significativa-
Cap. 5). Quizs la mayor importancia de los microcomputadores es que pueden mente. Incluso, series muy completas de programas de computador suelen ser incapaces
interconectarse con facilidad a casi todo tipo de equipos electrnicos de laboratorio. de proponer mtodo estdistico apropiado para un conjunto de datos especficos. Entonces,
Entonces el microcomputador puede utilizarse para optimizar y controlar las opera- el analista debe usar sus conocimientos de estadstica, y su sentido comn, para asegurar
ciones del instrumento, recoger, grabar y procesar todos los datos resultantes, y que se realiza el clculo adecuado. Como ya hemos sealado, cuando los microprocesado-
producir una copia impresa de los resultados calculados. Pueden conectarse varios res estn incorporados en los instrumentos analticos, el usuario a menudo ignora la
intrurnentos a un nico computador y, mediante el uso de sistemas de redes, pueden naturaleza exacta de los clculos realizados con los datos experimentales. Esta es una
conectarse varios computadores a un alrnacen de datos centralizado, como un sistema situacin indeseable, aunque la renuencia de los fabricantes ele instrumentos a divulgar
de disco duro. Los microcomputadores pueden convertirse tambin en terminales de programas ele computador de dficil desarrollo es bastante comprensible.
un computador central cuando se necesita manejar una gran cantidad de clculos En este libro no se pretende ele ninguna manera proporcionar listas completas ele
complejos. programas ele computador para clculos estadsticos. En el mercado se encuentran dispo-
(3) Muchos instrumentos de laboratorio llevan incorporados sus propios microcompu- nibles programas excelentes para muchos de los mtodos que se describen en los captulos
tadores. Estos sistemas se disean especficamente para controlar el instrumento de siguientes, incluyendo las tcnicas ms avanzadas corno la regresin no lineal (Cap. 5); ~I
que se trata por medio de funciones preprograrnadas. No poseen la flexibilidad de los reconocimiento ele pautas, y la optimatizacin simplex (Cap. 7). En general, se debe elegir
sistemas del microcomputador (a menudo el usuario no se da cuenta de las tcnicas cuidadosamente paquetes de los programas para adecuarlos a la marca y el modelo del
de programacin y de los algoritmos de clculo utilizados, y no es capaz de cambiar- computador que se vaya a utilizar.
los), pero pueden realizar clculos de alta complejidad y operaciones de control. Un
avance reciente en esta rea es el desarrollo de los denominados instrumentos "inteli-
gentes" en los que el microprocesador de control (o microcomputador) es capaz de BIBLIOGRAFA
calibrar el instrumento, de diagnosticar funciones incorrectas y corregirlas, y de
optimizar las especificaciones de un instrumento. Dichos desarrollos continan mejo- l. Muchos libros de texto convencionales de qumica analtica incluyen secciones o captulos
rando, y aumentan en forma progresiva la eficiencia de los laboratorios analticos a un referentes al tratamiento estadstico de resultados experimentales. Estas secciones son muy
costo relativamente bajo. Las investigaciones recientes en sistemas expertos y en los variadas en su cobertura, aunque un buen ejemplo es el captulo 3 de Fu udatnentals 01Analytical
mtodos de inteligencia artificial producirn instrumentos que en realidad proporcio- Chcmistry de Skoog D. A. Y West D. M., 4a ed., Nueva York, lIolt Sauders, 1982.
nen a los usuarios "consejos" sobre los mejores parmetros de operacin, o fijen estos 2. Se han escrito muchos libros de estadstica general. Entre ellos, Factsfroni Figures de Moroney
parmetros de manera automtica a la luz de la introduccin de datos muestra les y de M. J., Penguin Books, es un documento clsico atractivo y de mucho prestigio. Una publicacin
la "experiencia" del instrumento. De nueva cuenta hay muchas razones para pensar ms reciente y que merece ser leda, es Statistics in Acrion de Sprent, Peter, Penguin Books. Un
buen nmero de textos estadsticos estn dirigidos a usuarios cientficos (no necesariamente 3. Se ha determinado cuatro veces el nmero ele lugares ele unin por molcula en una muestra ele
qumicos); Statistics for Technology de Chatfield, Christopher, Chapman & Hall, Londres, es anticuerpos monoc!onaelos, con resultados de 1.95, 1.95, 1.92, 1.97. Comente la exactituel y la
un ejemplo excelente. Tales libros proporcionan un contenido terico general, muy asequible, precisin de estos resultados.
de muchos de los mtodos que se describen en este volumen.
4. Analice el grado de exactitud y precisin deseables en los siguientes anlisis:
3. Todos los usuarios de la estadstica requieren una buena serie de tablas estadsticas. Se
recomienda Elementary Statistics Tables de Neave, Henry R., Allen & Urbis, Londres, por su (i) Determinacin de la concentracin de lactato en muestras de sangre humana.
clara exposicin de tablas y de las pruebas estadsticas asociadas. (ii) Determinacin de uranio en una muestra de mineral.
(iii) Determinacin de una droga en plasma sanguneo despus de una sobredosis,
4. Varios cuerpos estatutarios y profesionales en Inglaterra, Estados Unidos y otros pases publican (iv) Estudio de la estabilidad de un reactivo calorimtrico por determinacin de su absor-
manuales y monografas sobre procedimientos estadsticos recomendados y estndares, y sobre bancia a una longuitud de onda durante un periodo de varias semanas.
materiales estndar. Como ejemplos se incluyen al British Standards Institute (p. ej., BS 5497,
Precision of Tests Methods, Part J - Guide to the Determination ofRepeatability and Reprodu- 5. Para cada uno de los siguientes experimentos, intente identificar las principales fuentes proba-
cibility of a Standard Test Method y BS 1797, Calibration of Volumetric Glassware), la bles de error sistemtico y aleatorio, y plantee de qu manera pueden minimizarse dichos errores:
Association of Official Analytical Chemists (Youden, W. J. y Steiner, E. H., Statistical Manual
of tlie ADAC, 1975), la Intemational Organisation for Standardisation (ISO) (p. ej., IS4259, (i) El contenido de hierro de un gran trozo de mineral se determina tomando una peq~eiia
Petroleum Products - Determination and Application ofPrecision Data in Relation to Methods muestra, disolvindola en cido, y titulando con sulfato cerico despus de reducir el
ofTests) y la American Society for Testing and Materials (ASTM) (p. ej. Standard Specifications Fe(III) a Fe(II).
E617-78, Laboratory Weights and Precision Mass Standards, y E694-79, Volumetric Ware). (ii) Se utiliza el mismo muestreo y procedimiento de disolucin de (i), aunque el hierro se
determina colorimtricamente despus de aadir un reactivo quelante y de extraer al
5. Las monografas que describen procedimientos estndar y materiales en reas especficas de complejo coloreado resultante en un disolvente orgnico. . .. .
estudio est.in ejemplificadas por Knowles, A. y Burgess, C. Eds., Standards in Absorption (iii) El contenido de sulfato en una solucin acuosa se determina gravnnetncamente con
Spectromctrv, y Miller, J. N. Ed., Standards in Fluorescence Spectrometry, ambas publicadas cloruro brico como precipitante.
por Chapman & Hall en conjunto con el grupo de espectrometria de U'V, La National Bureau of
Standards de Estados Unidos publica monografas que acompaan a su extenso catlogo de
materiales estndar, Un ejemplo reciente, que describe el uso de sulfato de quinina como
est.indar en espectrometra de fluorescencia, es la Publicacin Especial de la NBS No 260-64
J980 de Velapoli, R. A. Y Mielenz, K. D.

6. Recientemente se encuentran disponibles varios libros que describen mtodos estadsticos y


proporcionan listas de programas de computador en BASIC. stos incluyen dos libros de Lee,
J. D. y Lee, T. D., Statistics and Computer Metliods in BASIC y Statistics and Numerical Methods
in BASIC for Biologists, ambos publicados por Van Nostrand Reinhold; Basic Statistical
Computing de Cooke, D., Craven, A. H. y Clarke, G. M., publicado por Amold; BASIC
Microconiputing and Biostatistics de Rogers, D. W., publicado por Humana Press Inc.

EJERCICIOS

1. Una muestra estndar de suero sanguneo humano contiene 42.0 g de albmina por litro. Cinco
laboratorios (A-E) realizan cada uno seis determinaciones (en el mismo da) de la concentracin
de albmina, con los siguientes resultados (en gil):

A 42.5 41.6 42.1 41.9 41.1 42.2


B 39.8 43.6 42.1 40.1 43.9 41.9
C 43.5 42.8 43.8 43.1 42.7 43.3
D 35.0 43.0 37.1 40.5 36.8 42.2
E 42.2 41.6 42.0 41.8 42.6 39.0
Comente la exactitud y precisin de cada una de estas series de resultados.

2. Utilizando la misma muestra y mtodo del ejercicio 1, el laboratorio A realiza otras seis
determinaciones de la concentracin de albmina en un tiempo de seis das sucesivos. Los
valores obtenidos son 41.5, 40.8, 43.3, 41.9, 42.2, 41.7 gil. Comente estos resultados.
B, e y D son 0.17, 0.21 Y 0.033 mi respectivamente, y establecer as una confirmacin
cuantitativa de las afirmaciones sobre la precisin realizadas en el captulo 1.
Muchas calculadoras de bolsillo proporcionan los resultados de estos clculos si se
introducen en ellas los valores de x. Sin embargo, se debe tener cuidado en pulsar la tecla
correcta para obtener la desviacin estndar. Algunas calculadoras proporcionan dos valo-
res diferentes para la desviacin estndar, uno calculado utilizando la ecuacin (2.2) y el
otro sustituyendo (11 - 1) por 11 en el denominador de esta ecuacin. (La razn de estas dos
formas diferentes se explica en la pg. 23.) Por supuesto, para valores grandes de Il la
diferencia es despreciable.
Por desgracia, al calcular una desviacin estndar, la calculadora puede redondear
nmeros de manera tal que puede obtenerse un valor errneo (incluso cero). Esto sucede
Errores en el anlisis clsico. normalmente cuando existen diferencias entre los valores introducidos en el cuarto o
subsiguientes dgitos significativos, dependiendo del tpo de calculadora. Por ejemplo,
Estadstica de medidas repetidas muchas dan como cero la desviacin estndar de los tres valores 100.000, 100.001 Y
100.002, mientras que de hecho es 0.00 l. Este problema se puede superar codificando los
valores, es decir, restando una cantidad fija a cada uno, por ejemplo, en este caso 100.000
para obtener 0.000, 0.00 I Y 0.002. Puesto que la desviacin estndar mide la variabilidad
en torno a la media, la desviacin estndar de esos valores codificados es la misma que la
de los valores originales. (La media de los valores originales se obtiene aadiendo 100 a
la media de los valores codficados.) La codificacin de valores tambin reduce el trabajo
2.1 MEDIA Y DESVIACIN ESTNDAR y posibles errores al introducir la informacin en una calculadora. En este ejemplo
concreto, el clculo podra haberse realizado an con ms rapidez y con menos tendencia
En este captulo se introducen algunos conceptos estadsticos fundamentales y se aplican al error tomando los valores codificados como O, 1 Y 2: en tal caso debe tenerse especial
;\ situaciones habituales en el anlisis clsico es decir, se realizan mediciones repetidas de cuidado de decodificar el resultado que aparece en la pantalla de la calculadora.
la misma cantidad. En el captulo 1 se expusieron los diversos tipos de errores al considerar
Jos resultados de repetir cinco veces una valoracin hecha por cuatro estudiantes: estos
datos se reproducen a continuacin. Tabla 2.1 Clculos de la media y la desviacin estndar para los resultadosdel estudiante A

x,(ml)
Estudiante Resultados (ml)
A 10.08 10.11 10.09 10.10 10.12 10.08 0.0004
B 9.88 10.14 10.02 9.80 10.21 10.11 0.0001
C 10.19 10.09 0.0001
9.79 9.69 10.05 9.78 10.10 O. ()()()()
D 10.04 9.98 10.02 9.97 10.04 10.12 0.0004
Total 50.50 0.0010
Para comparar estos resultados se utilizaron dos criterios, el valor promedio y el grado de
varia bilidad (dispersin). El valor promedio utilizado fue la media aritmtica x, (en forma i = 50.50/5 = 10.10 mi
5= yO 0010/4 = 0.016 rnl
abreviada, media) que es la suma de todas las mediciones dividida por el nmero de
mediciones:

x= z:: x.In

(2.1) El clculo de la tabla 2.1 fue muy simple porque los valores de (x; - X)2 se podran
calcular mentalmente. Por lo regular esto no es as y para simplificar la aritmtica se puede
La medida ms utilizada de la variabilidad es la desviacin estndar, s. sta se define utilizar una forma alternativa de la ecuacin (2.2), si no se dispone de una calculadora
por la frmula: programada para clculos estadsticos:

"o ,,'
I
-- --~ ~ - ~ -

": t; (~. x,)-


s = \/z:: (x, - x)2/(n - 1)
1 (2.2) s= -- (2.3)
\I (n -
~

1) n(n - 1)
El clculo de la desviacin estndar de los resultados de A se muestra en la tabla 2.1. El
lector debera comprobar que las desviaciones estndar de los resultados de los estudiantes
La media y la desviacin estndar pueden calcularse tambin con un computador Esta tabla indica que, en la tabla 2.2, el valor de 0.46 .Jg/ml aparece una vez, el valor de
utilizando un programa BASIC de unas pocas lneas. Este programa slo sera til si 0.4 7 ,L/g/mI aparece tres veces y as sucesivamente. El lector puede comprobar que la media
el propio computador fuese recogiendo los datos o si se analizase una gran cantidad de estos resultados es 0.500 .Jg/ml y la desviacin estndar es 0.0165 fJg/ml. (Estos valores
de ellos. Ejemplos de dichos programas aparecen en los libros de la bibliografa del se expresan de manera arbitraria con tres cifras significativas: este importante aspecto de
captulo 1. la presentacin de resultados se analiza al final del captulo.) La distribucin de los
E! cuadrado de s es una cantidad estadstica muy importante conocida como la resultados puede apreciarse con facilidad dibujando un histograma como el de la figura
varianza; su significacin se manifestar en el captulo dedicado a la propagacin de 2.1. En l se muestra que las medicioues estn distribuidas en forma casi simtrica en torno
errores. As mismo se emplea mucho el coeficiente de variacin (CV), tambin conocido a la media, con las mediciones agrupadas respecto al centro.
como la desviacin estndar relativa (DER), que se define por 100 s/x. El CV o DER,
cuyas unidades se expresan obviamente en porcentaje, es un ejemplo de error relativo; es
decir, una estimacin del error dividida por una estimacin del valor absoluto de la cantidad
medida. Los errores relativos se utilizan con frecuencia en la comparacin de las precisio-
nes de los resultados que tienen diferentes unidades o magnitudes, y son importantes en el
y

clculo de la propagacin de errores.

2.2 DISTRIBUCIN DE ERRORES

Aunque la desviacin estndar proporciona una medida de la dispersin de un conjunto


de resultados alrededor del valor medio, no indica la forma en que estn distribuidos los
resultados. Para aclarar esto se requiere un gran nmero de mediciones como las expues-
tas en la tabla 2.2, en la cual se proporcionan los resultados de 50 determinaciones repetidas

Tabla 2.2 Resultados de 50 determinaciones de concentracin de ion nitrato, en Jig/ml

0.51 0.51 0.51 0.50 0.51 0.49 0.52 0.53 0.50 0.47
0.51 0.52 0.53 0.48 0.49 0.50 0.52 0.49 0.49 0.50
0.49 0.48 0.46 0.49 0.49 0.48 0.49 0.49 0.51 0.47
0.51 0.51 0.51 0.48 0.50 0.47 0.50 0.51 0.49 0.48
11 x
0.51 0.50 0.50 0.53 0.52 0.52 0.50 0.50 0.51 0.51
Figura 2.1 Histograma de los datos de concentracin de ion nitrato de la tabla 2.3.

de la concentracin de ion nitrato, dada con dos cifras significativas, en una muestra con-
creta de agua. Estos resultados se pueden resumir en una tabla de frecuencias (tabla 2.3). Estc conjunto de 50 mediciones constituye una muestra de un gran nmero de ellas
(en teora infinita) que se pueden tomar de la concentracin de nitrato. Este conjunto de
posibles mediciones se denomina poblacin. Si /10 hay errores sistemticos, entonces la
Tabla 2.3 Tabla de frecuencias para las mediciones de concentracin de ion nitrato media de la poblacin, indicada por .J es el verdadero valor de la concentracin de nitrato
que se intenta determinar. La media, x, de la muestra nos proporciona una estimacin de .J.
Concentracin de ion
De manera similar, la poblacin tienen una desviacin estndar simbolizada por (J. El valor
nitrato (Jig/ml) Frecuencia
de la desviacin estndar, s, de la muestra nos proporciona una estimacin de (J. El uso de
0.46 1 la ecuacin (2.2) nos da una estimacin insesgada de (J. Si en vez de (I! - 1) utilizamos I!
0.47 3
en el denominador de la ecuacin, el valor que se obtiene de s tiende a subestimar (J (vase
0.48 5
0.49 10 la pg. 21).
0.50 10 Las mediciones de concentracin de ion nitrato que aparecen en la tabla 2.2 presentan
0.51 13 slo valores discretos debido a las limitaciones del mtodo de medicin. En teora, una
0.52 5 concentracin puede tomar cualquier valor ele manera que para describir la forma de la
0.53 3
poblacin, de la que se ha extrado una muestra, se necesita una curva continua. El modelo
matemtico que habitualmente se emplea es la distribucin normal o Gaussiana descrita
por la ecuacin y

(2.4)

d. e. = 02
y su forma se muestra en la figura 2.2. No es necesario recordar esta frmula complicada,
aunque algunas de sus propiedades generales son importantes. La curva es simtrica
respecto a 1-' y cuanto mayor sea el valor de a mayor ser la variabilidad de la curva, como

1O -

J1 x
I
Figura 2.3 Distribuciones normales con la misma media perodiferentes valores de desviacin
5 .- r---- -----
estndar.

~
estudiar las medias muestrales, cualquier desviacin de la normalidad en una poblacin no
es generalmente importante en el contexto de las pruebas estadsticas utilizadas con ms
frecuencia.
~ I I I I I I I La distribucin normal no slo se aplica cuando se hacen mediciones repetidas de un
0.46 0.48 0.50 0.52 mismo especimen; tambin los resultados obtenidos a menudo se adaptan a la distribucin
normal cuando se mide la misma magnitud para diferentes muestras. Por ejemplo, si
Concentracin de ion nitrato, ,ugJml
medimos las concentraciones de albmina en suero sanguneo procedentes de humanos
Figura 2.2 La distribucin normal, y = exp[-(x - ,u)2/202l/ uf2it. La media se indica con u. adultos sanos, encontraremos que los resultados estarn aproximadamente distribuidos de
manera normal. Sin embargo, en este segundo tipo de poblacin, es decir, una medida sobre
se muestra en la figura 2.3. Un anlisis un poco ms detallado demuestra que, cualesquiera cada serie de especmenes, no es raro que existan otras distribuciones. En concreto, se
que sean los valores de 1-' y a, aproximadamente el68 % de los valores de la poblacin caen encuentra con frecuencia la denominada distribucin log-normal: en esta distribucin los
dentro de 1 a de la media; cerca del 95 % de los valores se ubican dentro de 2 a de la logaritmos de las concentraciones (u otras caractersticas), cuando se representan frente a
media, y casi el 99.7 % de los valores se encuentran dentro de 3 a de la media (figura 2.4). la frecuencia, proporcionan una curva de distribucin normal. Por ejemplo, la concentra-
Esto significa que si las concentraciones de ion nitrato que aparecen en la tabla 2.3 se cin de anticuerpos en suero sanguneo humano es aproximadamente una distribucin
distribuyen normalmente, cerca del 68 % caeran en el intervalo de 0.483 a 0.517; alrededor lag-normal (figura 2.5), y los tamaos de la partcula de gotas formadas por nebulizadores
del 95% en el intervalo de 0.467 a 0.533, y el 99.7% en el de 0.450 a 0.550. De hecho, en fotometra de llama pueden seguir tambin esta distribucin.
33 de los 50 resultados (66%) caen entre 0.483 y 0.517; 49 (98 %) entre 0.467 y 0.533, y
todos los resultados se ubican entre 0.450 y 0.550, de manera que la concordancia con la
teora es bastante satisfactoria. 2.3 LA DISTRIBUCIN MUESTRAL DE LA MEDIA
~~nqu~ no se pueda demostrar que las mediciones repetidas de cualquier cantidad
anahtica siempre van a estar distribuidas normalmente, las pruebas indican que por lo Yahemos visto que la media de una muestra de mediciones nos proporciona una estimacin
general esta hiptesis est al menos muy cerca de la verdad. Adems, como veremos al del valor verdadero, 1-', de la magnitud que se quiere medir. Sin embargo, ya que las
%
y
(i)
1O

Media = 1.09 g/I

~-1(]' ~+1(]' x
y
(ii)

1.O 2.0 3.0 4.0


Concentracin, g/I
95%
Figura 2.5 Una distribucin aproximadamente log-nonnal: concentracin de anticuerpos de in-
munoglobulina M en suero de varones. Observe la asimetra de la curva.

'----.-:::::..-_--l... ~ _ la media de varios valores que en uno solo. Mucha gente piensa que cuantas ms
~-2(]'
mediciones se tomen ms confiable ser nuestra estimacin de fl, el valor real. Para
x
y corroborar esta idea volvamos a la determinacin de ion nitrato descrita en la seccin 2.2.
(iii) En casos como el estudiado (concentracin del ion nitrato), por lo regular es poco prctico
realizar 50 mediciones repetidas. Un nmero ms verosmil sera 5 y podemos ver cmo
las mediciones de las muestras de este tamao estn distribuidas alrededor de fl, si
consideramos los resultados de la tabla 2.2 como 10 muestras en las que cada una de ellas
99.7% contiene 5 resultados. Si tomamos cada columna como una muestra, las medias son 0.506,
0.504, 0.502, 0.496, 0.502, 0.492, 0.506, 0.504, 0.500, 0.486. Resulta evidente que estas
mediciones se encuentran ms agrupadas entre s que las mediciones originales. De la
misma forma que stas eran muestras de una poblacin infinita de posibles mediciones,
estas medias son una muestra de las posibles medias de muestras de 5 mediciones de la
poblacin global. La distribucin de estas mediciones muestrales se denomina distribu-
x cin muestral de la media o distribucin en el muestreo de la media; su media es la
Figura 2.4 Propiedades de la distribucin normal: (i) aproximadamente el 68% de los valores caen misma que la de la poblacin original y su desviacin estndar se denomina error estndar
dentreo de 1u.de la media; (ii) cerca de195% de los valores se ubican dentro de 2ude la media; de la media (e.e.m.). Existe una relacin matemtica entre el e.e.m. y la desviacin
(1Il) el 97% de los valores se encuentran dentro de 3u de la media. estndar, a, de la distribucin de mediciones individuales, la cual es independiente de la
forma en que estn distribuidas. Si Il es el tamao de la muestra, la relacin es:

mediciones individuales estn distribuidas en torno al valor verdadero con una dispersin e.e.m. = o/V-;Z (2.4)
que depende de la precisin, es poco probable que la media de la muestra sea exactamente
Igual al valor verdadero. Por esta razn es ms til proporcionar un intervalo de valores Como es de esperar, a mayor 11, menor ser la dispersin de las mediciones muestrales en
que contenga casi con seguridad el valor verdadero. La amplitud de este intervalo depende torno a u. Este trmino utilizado universalmente, el error estndar de la media, podra
de dos factores. El primero es la precisin de las mediciones individuales, las cuales de- conducir al lector a pensar que a/m mide la diferencia entre x y u. Esto no es as: a/m
penden a su vez de la varianza de la poblacin. El segundo es el nmero de mediciones proporciona una medida de la incertidumbre que hayal estimar fl a partir de x, como se
de la muestra. El slo hecho de repetir mediciones implica que se tiene ms confianza en ver en la siguiente seccin.
Otra propiedad de la distribucin muestral de la media es que, aun cuando la pobla- J1 - 1.96( al.f1l) <X< J1 + 1.96( al.f1l) (2.5)
cin original no est distribuida normalmente, tiende a la distribucin normal cuando
aumenta n. Este resultado se conoce como teorema del lmite central. Este teorema es de (Se utiliza en esta ecuacin el valor exacto de 1.96 en lugar del valor aproximado, 2, que
suma importancia, ya que muchas pruebas estadsticas se realizan sobre la media y se supone se emplea frecuentemente.)
que se distribuye en forma normal. Debido a que en la prctica se puede suponer una Sin embargo, en la prctica por lo regular disponemos de una muestra, de media
distribucin casi normal para las distribuciones de las mediciones repetidas, es razonable conocida, y buscamos un intervalo para J1, el valor verdadero. Puede reordenarse la
asumir que las medias de muestras muy pequeas (digamos> 5) se distribuyan normalmente. ecuacin (2.5) y expresarse de la siguiente forma:

X - 1.96( al.f1l) < J1 < X + 1.96( al.f1l) (2.6)


2.4 LMITES DE CONFIANZA DE LA MEDIA
La ecuacin (2.6) proporciona el intervalo de confianza a195% de la media. De manera
Ahora que conocemos la forma de la distribucin muestral de la media, podemos regresar similar, el intervalo de confianza al 99.7% est dado por:
al problema de utilizar una muestra para definir el intervalo dentro del cual podamos
suponer de manera razonable que se encuentra el valor verdadero. (Recuerde que al hacer X - 2.97(al.f1l) < J1 < X + 2.97(al.f1l) (2.7)
esto se supone que no existen errores sistemticos.) Este intervalo se conoce como el
intervalo de confianza y los valores extremos de dicho intervalo se llaman lmites de Otro intervalo de confianza que se utiliza con frecuencia es el intervalo de confianza al
confianza. El trmino "confianza" implica que podemos afirmar con un grado de confianza 99 % que est dado por:
dado, es decir, con una cierta probabilidad, que el intervalo de confianza si incluye al valor
verdadero. Por supuesto, el tamao del intervalo de confianza depender de la certeza que X - 2.58( al.f1l) < J1 < X + 2.58( al.f1l) (2.8)
queramos tener de que se incluya el valor verdadero: cuanto ms grande sea la certeza, ms
grande ser el intervalo requerido. La ecuacin (2.6) se puede utilizar para calcular los lmites de confianza al 95% para la
En la figura 2.6 aparece la distribucin muestral de la media para muestras de tamao concentracin de ion nitrato. Se tiene que x ~ 0.500 Y n = 50. Lo nico que se desconoce
n. Si suponemos a partir de ahora que la distribucin es normal, entonces el 95 % de las en la ecuacin es a. Para muestras grandes como sta, s proporciona una estimacin
mediciones muestra les se encontrarn el el intervalo dado por: suficientemente exacta de a y puede sustituirse por sta. De este modo, el intervalo de
confianza al 95% para la concentracin de ion nitrato es:
y
0.500 - 1.96 x 0.01651150 < J1 < 0.500 + 1.96 x 0.01651150

y los lmites de confianza resultantes son:

J1 = 0.5000 0.0046 J1g/ml

A medida que el tamao de la muestra se hace ms pequeo, la incertidumbre al utilizar


s para estimar a aumenta. A fin de permitir esto, la ecuacin utilizada para calcular los
lmites de confianza se modifica por la siguiente:

J1 ~ x t(s/.f1l) (2.9)

El valor adecuado de t depende tanto de (n - 1), que se conoce como nmero de grados de
libertad (cuyo smbolo habitual es v), como del grado de confianza requerido. [El trmino
"grados de libertad" se refiere al nmero de desviaciones independientes (Xi - x) que se
utilizan al calcular s. En este caso, dicho nmero es (11 - 1), porque cuando se conocen (11 - 1)
desviaciones, la ltima se puede deducir si se utiliza el resultado obvio 2.: (z, - x) = O]. En
~-1.96(J//n 1-I+1.96(1/ln x
i
la tabla 2.4 se recogen los valores de t. En dicha tabla puede apreciarse que para muestras
Figura 2.6 Distribucin muestral de la media, en la que se muestra el intervalo dentro del cual de tamao superior a 50, los valores de t son muy prximos a los valores de 1.96 y de 2.58
se encuentra el 95% de la mediciones muestrales. utilizados en las ecuaciones (2.6) y (2.8), respectivamente. Esto confirma la validez de la
hiptesis utilizada antes al calcular los lmites de confianza para la concentracin de nitrato. 2.5 PRESENTACIN DE RESULTADOS
El uso de esta tabla puede aclararse con un ejemplo.
Como ya 10 sealamos, los resultados experimentales cuantitativos carecen de inters si
Ejemplo, Se determin el contenido de ion sodio de una muestra de orina utilizando un no van acompaados de una estimacin de los errores ocurridos en su medida. Una prctica
electrodo selectivo de iones, y se obtuvieron los siguientes valores: 102, 97, 99, 98, usual en la bibliografa de qumica analtica es citar la media como la estimacin de la
10 1, 106 mM. Cuiles son los lmites de confianza al 95 y 99%, para la concentracin cantidad medida y la desviacin estndar como la estimacin de la precisin. Menos
de ion sodio'? frecuente es citar el error estndar de la muestra en lugar de la desviacin estndar, es decir,
La media y la desviacin estndar de estos valores son 100.5 mM y 3.27 mM, dando el resultado en la forma de los lmites de confianza al 95 % de la media. Ya que no
respectivamente. Hay seis mediciones y por lo tanto 5 grados de libertad. El valor de t existe un convenio universal, es importante establecer la forma empleada y, suponiendo
calculado usando la tabla 2.4 para determinar los lmites de confianza al 95% es de que el valor de n est dado, las tres formas se pueden convertir unas en otras utilizando las
ecuaciones (2.4) y (2.9).
Un aspecto que se relaciona con la presentacin de resultados es el redondeo de la
Tabla 2.4 Valores de t para intervalos de confianza respuesta. El principio importante en este caso es que el nmero de cifras significativas
dadas indica la precisin del experimento. Por ejemplo, sera absurdo dar el resultado de
Grados de libertad Valores de t para intervalos de confianza de un anlisis volumtrico como 0.107 846M, pues ningn analista podra alcanzar la preci-
95% 99% sin implicada de 0.000 001 en una cantidad medida de 0.1, es decir, 0.001 %. En la prctica,
12.71 se acostumbra fijar corno cifras significativas todos los dgitos que sean seguros, ms el
63.66
2 4.30 9.92 primero incierto. Por ejemplo, la media de los valores 10.09, 10.11, 10.09, 10.10 y 10.12,
.\
3.18 5.84 es 10.102, y su desviacin estndar es 0.013 04. Por supuesto, existe incertidumbre en la
4 2.78 4.60 segunda cifra decimal; los resultados son todos 10.1 con una cifra decimal, pero difieren
5 2.57 4.03
lO
en la segunda. Mediante el mtodo sugerido, el resultado podra expresarse como:
2.23 3.17
20 2.09 2.85
30 2.04 2.75 xs= 1O.1O0.01 (n=5)
50 2.01 2.68
--------_.-
lOO 1.98 2.63 Si se hubiera constatado que este resultado es un redondeo inaceptable de la desviacin
estndar, entonces se podra dar como:

2.57 y, de la ecuacin (2.9), los lmites de confianza al 95% estn dados por: x s = 10.10 2 0.0 h (n = 5)

.J ~ 100.5 2.57 x 3.27/.f6 donde el uso de los subndices nos indica que el dgito slo se proporciona para evitar la
~ 100.5 3.4 mM prdida de informacin. El lector podra decidir si fue til o no.
De igual manera, cuando se calculan los lmites de confianza [vase la Ec. (2.9)], no
De igual manera, los lmites de confianza al 99% estn dados por: es necesario dar el resultado de ts/.fIl con ms de dos cifras significativas. El valor de x
debera darse, en este caso, con el correspondiente nmero de cifras decimales.
.J ~ 100.5 4.03 x 3.27/.(6 El nmero de cifras significativas citado se utiliza a menudo en lugar de una estimacin
~ 100.5 5.4 mM especfica para sealar la precisin de un resultado. Por ejemplo, se considera que en el
nmero 0.104 6M las tres primeras cifras decimales son ciertas, pero existen dudas acerca
Si la muestra procede de una poblacin de la que se sabe que se distribuye lag-normal, de la cuarta. Sin embargo, puesto que existe incertidumbre en la ltima cifra, podra ser
entonces los valores individuales de deberan transformar tomando sus logaritmos antes cualquiera desde 0.000 05 a 0.000 5; este mtodo proporciona una estimacin pobre de la
de calcular los lmites de confianza. Puesto que los valores transformados estarn distri- precisin y no es recomendable. A veces se recalca la incertidumbre en la ltima cifra al
buidos normalmente, entonces los lmites de confianza de la media se pueden calcular como utilizar los formatos 0.1 04(6)M, o ms comn 0.104 6M, pero sigue siendo preferible dar
se ha explicado con anterioridad. Sin embargo, observe que los valores de la media y la una estimacin especfica de la precisin tal como la desviacin estndar.
desviacin tpica de la muestra se calculan utilizando los valores originales no transforma- Un problema que puede surgir es si un 5 debera redondearse por encima o por debajo.
dos. Como resultado de la asimetra ele la distribucin Iog-norrnal (vase la Fig. 2.5), el Por ejemplo, si 9.65 se redondea a una sola cifra decimal, podra convertirse en 9.6 9.77
n.ltervalo de confianza de la media, calculado como se ha descrito anteriormente, no es Es evidente que los resultados tendrn sesgo si un 5 se redondea siempre hacia el valor
sImtrico con respecto a la media muestral. superior; este sesgo puede evitarse redondeando el 5 al nmero par ms prximo, dando,
es este caso, 9.6. De la misma forma 4.75 se redondea a 4.8.
Cuando hay que utilizar varias cantidades para calcular un resultado fina) (vase la etapas, y cada una de ellas se encuentra sujeta a errores (vase el captulo 1). El clculo
seccin 2.7), stas no deben redondearse demasiado porque se producir una prdida de final puede conllevar operaciones tales como sumas, restas, multiplicaciones o divisiones
precisin innecesaria. Una buena regla es dejar un dgito detrs de la ltima cifra signifi- de dos o ms cantidades, o elevar alguna cantidad a una potencia.
cativa y dejar el posterior redondeo hasta que se llegue al resultado final. La misma regla Es muy importante sealar que los procedimientos utilizados para combinar errores
se aplica cuando se usan la media y la desviacin estndar en pruebas estadsticas tales aleatorios y errores sistemticos son completamente distintos. Esto se debe a que algunos
como las pruebas F y t (vase captulo 3): se debera utilizar en los clculos los valores no errores aleatorios se compensan entre s, mientras que cada error sistemtico ocurre en un
redondeados de x y s. sentido definido y conocido. Por ejemplo, si el resultado final de un experimento, x, est
dado por x ~ a + b; si a y b tienen un error sistemtico de + 1, es evidente que el error
sistemtico de x es de +2. Sin embargo, si a y b tienen un error aleatorio de l, el
2.6 OTROS USOS DE LOS LMITES DE CONFIANZA error aleatorio de x no es 2: esto se debe a que habr ocasiones en que el error aleatorio en
a ser positivo mientras que en otras en b ser negativo (o viceversa).
Los lmites de confianza se pueden utilizar como una prueba para detectar errores sistema- En esta seccin slo se considera la propagacin de errores aleatorios (los errores
ticos, como se muestra en el siguiente ejemplo. sistemticos se consideran en la seccin 2.8). Si se conoce la precisin de cada observacin,
entonces se pueden usar reglas matemticas sencillas para estimar la del resultado final.
Ejemplo. Se comprueba la escala de absorbancia de un espectrmetro a una longitud Estas reglas se resumen a continuacin.
de oncla concreta usando una solucin estndar con una absorbancia de 0.470. Diez
mediciones de absorbancia con el espectrmetro dieron x = 0.461 y s = 0.003. Encuentre
el intervalo de confianza al 95 % de la absorbancia media y decida si se encuentra (i) Combinaciones lineales
presente un error sistemtico. En este caso el valor final, y, se calcula a partir de una combinacin lineal de cantidades
Los lmites de confianza al 95 % de las absorbancias medidas por el espectrmetro medidas a, b, e, etc., por:
son [Ec. (2.9)]:
(2.10)
!! ~ x t(s/.f1)
~ 0.461 2.26 x 0.003/ ITO donde k, ka, k" k etc., son constantes. La varianza (definida como el cuadrado de des-
= 0.461 0.002 viacin estndar) tiene la propiedad de que la varianza de una suma o diferencia de
cantidades independientes es igual a la suma de sus varianzas. Se puede demostrar que
(El valor de t se obtuvo a partir de la tabla A.l que se encuentra en los apndices, la si os, ab, a., etc., son las desviaciones estndar de a, b, e, etc., la desviacin estndar de y,
cual es una versin mas completa de la tabla 2.4.) ay, est dada por:
Ya que este intervalo de confianza no incluye la absorbancia conocida de 0.4 70, es
probable que exista un error sistemtico. En el prximo captulo se tratar otra (2.11)
aproximacin al mismo problema.
Ejemplo. En una titulacin, la lectura inicial en una bureta es de 3.51 mI y la lectura
Tambin se pueden usar los lmites de confianza cuando se realizan mediciones a cada final es de 15.67 mI, ambas con una desviacin estndar de 0.02 ml. Cul es el volumen
uno de una serie de ejemplares. Por ejemplo, si se requiere el peso medio de una pastilla del titulante utilizando y cul es su desviacin estndar?
en un gran lote, se consumira demasiado tiempo en pesar cada una. De igual manera, si
se usa un mtodo analtico destructivo, como la espectrometra de absorcin atmica, para Volumen utilizado = 15.67 - 3.51 = l2.16ml
analizar el lote y establecer el contenido medio, sera imposible examinar cada tableta. En Desviacin estndar = V(0.02)2 + (0.02? = 0.028 mI.
ambos casos, podra tomarse una muestra del lote (que en tales circunstancias forma la
poblacin) y a partir de la media y la desviacin estndar de la muestra se podra encontrar Este ejemplo aclara el aspecto importante de que la desviacin estndar del resultado
un intervalo de confianza para el valor medio de la cantidad medida. final es mayor que la de las lecturas individuales de la bureta, incluso aunque el
volumen utilizado se calcule a partir de una diferencia, pero es menor que la suma de
las desviaciones estndar.
2.7 PROPAGACIN DE ERRORES ALEATORIOS
(ii) Expresiones multiplicativas
En el trabajo experimental, se calcula con frecuencia la cantidad que se va a determinar a Si y se calcula a partir de una expresin del tipo:
partir de una combinacin de cantidades observables. Ya hemos visto, por ejemplo, que
IIlCluso una operacin relativamente simple como un anlisis volumtrico, implica varias y ~ kablcd (2.12)
(donde a, b, e y d son cantidades medidas independientemente y k es una constante) (El smbolo del mdulo 11 significa que la magnitud de la cantidad encerrada en l se toma
entonces existe una relacin entre los cuadrados de las desviaciones estndares relativas: sin tener en cuenta el signo, por ejemplo: 1-21 = 2.)

(2.13) (iii) Otras funciones


Si y es una funcin general de x:
Ejemplo. El rendimiento cuntico de fluorescencia, 1J, se calcula a partir de la expresin: y = (x) (2.16)

entonces las desviaciones estndar de x y y estn relacionadas por:

donde los parmetros implicados se definen a continuacin, con una estimacin de sus
desviaciones tpicas entre parntesis: (2.17)

lo = intensidad de la luz incidente (0.5%)


Ir = intensidad de luz fl uorescen te (2 %) Ejemplo: la absorbancia, A, de una solucin est dada por:
E = absortividad molar (l %)
A = - 10g(1) (2.18)
e = concentracin (0.2 %)
1= paso ptico (0.2 %) donde Tes la transmitancia. Si el valor medio de Tes 0.501 con una desviacin estndar
k es una constante del instrumento. de 0.001, calcule A y su desviacin estndar.
Tenemos:
De la ecuacin (2.13), la desviacin estndar relativa de 1J est dada por:
A = - lag 0.50 1 ~ 0.300
d.e.r. = Y(2 2 + 0.2 2 + 0.2 2 + 0.5 2+ 12 )
= Y(4 + 0.04 + 0.04 + 0.25 + 1) Tambin:
= V5.33
=2.3% dA/dT = - (1oge)/T = -0.434/T
Puede observarse que la desviacin estndar relativa del resultado final no es mucho
de manera que de la ecuacin (2.17)
mayor que la mayor de todas las desviaciones estndar relativas usadas para calcularlo
(es decir, 2 % para Ir.) Esto es, fundamentalmente, una consecuencia de elevar al
aA = 1ar (-loge/1)1
cuadrado las desviaciones estndar relativas y explica una cuestin de importancia
= 10.001 x (-0.434/0.501)1 = 0.0008 7
general: cualquier esfuerzo por mejorar la precisin de un experimento debe dirigirse
a mejorar la precisin de los valores menos precisos. Como corolario de esto, no vale
Es importante observar que para este mtodo experimental muy utilizado se pueden
la pena esforzarse por incrementar la precisin de los valores ms precisos. Esto no
encontrar las condiciones para que sea mnima la desviacin estndar relativa. La desvia-
significa que los errores pequeos no sean importantes: stos, en muchas etapas de un
cin estndar relativa de A est dada por
experimento, tales como las del anlisis volumtrico analizados con detalle en el
captulo 1, producirn un error apreciable en el resultado final. 100ur loge
e.e.m, de A ~ 100aA/A = -"-------'-...::....:...;'"- (2.19)
Es importante resaltar que cuando una cantidad se eleva a una potencia, p.ej. b" Tlog T
entonces no se calcula el error como para una multiplicacin, es decir, b x b x b, debido a
La derivada de esta expresin con respecto a Tmuestra que el coeficiente de variacin de
que las cantidades implicadas no son independientes. Si la relacin es:
A es mnimo cuando T = l/e = 0.368.

y = b" (2.14)
Ejemplo: La ecuacin de Nernst, aplicada en el anlisis potenciomtrico, es
entonces las desviaciones tpicas de y y b estn relacionadas por:
E = EO + (RT/nF)lnc

G, =
\'
Ib
llG,
1

1
(2.15 ) donde E es el potencial de electrodo que se mide; EO es el potencial de electrodo estndar
. I
del ion que se determina; T es la temperatura absoluta; 11 es el nmero de electrones
que participan en la serniclula correspondiente; e es la concentracin del ion; R es la diferencia entre dos pesadas, se eliminan los errores sistemticos. Procedimientos como
F.
constar~te .de los gases, y es la constante de Faraday. Obtenga una expresin para ste, considerados en forma cuidadosa, pueden minimizar a menudo los errores sistemti-
la desviacin estndar relati va de la concentracin, suponiendo que T ~ 298 K Y que cos, como se describi en el captulo l. Sin embargo, es preciso sealar que esto se
no tiene error. Calcule el valor de la desviacin estndar relativa si n = 1 Y la d.e. de E aplica slo a una balanza electrnica con una nica pesa de referencia interna; cuando se
es 0.001 V.
usa una balanza "pasada de moda" con una serie de pesas individuales, stas deben
Si se reescribe la ecuacin de Nernst y se sustituyen los valores numricos de T. R calibrarse, y hacerse las correcciones correspondientes (y todava tendrn un error de ca-
y Fresulta: '
librado aleatoriol).

e = exp 40n(E - EO)}


(ii) Expresiones multiplicativas
Derivando con respecto a E:
Si y se calcula a partir de cantidades mediciones utilizando la ecuacin (2.12), entonces se
utilizan errores sistemticos relativos:
dc/dE ~ 40nexp 40n(E - EO) J
(tiy/y) = (D.a/a) + /M/b) + (D.c/c) + (D.d/d) (2.21)
de manera que de la ecuacin (2.17)
Cuando se eleva una cantidad a alguna potencia, entonces se emplea la ecuacin (2.15),
u, ~ 4011 UL exp {401l(E - EO) J
se omite el smbolo del mdulo y se sustituyen las desviaciones estndar por errores
~" 40nc UL
sistemticos.

As, la desviacin estndar relativa de e es


(iii) Otras funciones
100uJc = 100 x 40/w%
La ecuacin correspondiente es idntica a la ecuacin (2.17), pero se omite el smbolo del
mdulo y se sustituyen las desviaciones estndares por errores sistemticos.
Cuando 11 o. 1 Y UF es 0.001 V, tenemos

d.e.r. de c =100 x 0.001 x 40 = 4%


BIBLIOGRAFA

En contraste con el ejemplo anterior, la desviacin estndar relativa es constante. Davies, O. L. y Goldsmith, P. L., Statistical Methods in Researeh and Production. Londres,
Longmans, 1982. Se trata con ms detalle el tema de este captulo.
Mritz, P., Captulo 1 en Compreliensive Analytical Chemistry Vol. Xl, Svehla, G. Ed., Amsterdam,
2.8 PROPAGACIN DE ERRORES SISTEMTICOS Elsevier, 1981. En este artculo se profundiza en la aplicacin de la teora de errores a los mtodos
analticos.
La reglas de combinacin de errores sistemticos pueden dividirse tambin en tres grupos: Skoog, D. A. Y West, D. M., Fundamentals oi Analytical Chemistry, 4a ed., Nueva York, Holt
Saunders, 1982. Se describe el uso de la estadstica en la evaluacin de datos analticos.
Topping, J., Errors of Observation and tlieir Treatment, Londres, Chapman & Hall, 1962. Se trata
(i) COII/billacioncs lineales de manera ms completa la teora de errores y se estudia la teora de que los errores se distribuyen
normalmente.
Si. \" se calcula a partir de cantidades medidas usando la ecuaCIOIJ (2.10), y los errores
slskm;lt'coS
. .. de'a"b , "A
e e tc., son esa, u
by"!J.C, etc., entonces el error sistemtico de y tiv
se calcula a partir de: ' .,
EJERCICIOS

(2.20) l. Para investigar la reproducibilidad de un mtodo para la determinacin de selenio en alimentos,


se realizaron nueve mediciones sobre un lote de arroz tostado, con los siguientes resultados:
Ht'CllerdeCllWlcyerrores 'iq'r 'f' . . ..
, " . .. " : s. ( na ICOSSOn!;llllopOSIIIVOscolllonegativosyqucestossignos
d. h( IIl1lcIUlr"l' en el calculo de tiv. . Muestras Selenio, fJg/g
El error si.skm;it, ico tC.llal PIIl.'dl' ser;l Yt'ces cero. Por l'jl'llI!Jlo suponga que se usa una I 0.07
I nl'll . . .'. . . , te . , , 2 0.07
U;I: IZ, con error slsten;(lco de -()J) 1 g P;II"<I lt's;I(Lis utilizadas en la preparacin de
3 0.08
, SOlllclon est.indar, Puesto que el I)('SO de soluro utiliz.rdo se calcula a partir de una 4 0.07
. , . una (ISO
8. Se utIlIZO li 1ucron
.. d e O. 1M de acido para
e ,
valorar 10 mi de una solucin de lcali de O.IM
Muestras Selenio, .glg
y se registraron los siguientes volmenes de cido:
5 0.07
6 0.08 9.88,10.18,10.23,10.39,10.25 m!.
7 0.08
8 0.09 Calcule los lmites de confianza de la media al 95% y utilcelos para decir si existe alguna
9 0.08 evidencia de error sistemtico.
(Moreno Domnguez, T., Garca Moreno, C. y Marin-Font, A., Analyst, 1983,108,505). En este problema se consideran los errores aleatorios involucrados en la preparacin de ~na
Calcule la media, la desviacin estndar y la desviacin estndar relativa de estos resultados. 9. disolucin estndar. Se prepar un volumen de 250 mi de una disolucin 0.05M de un reactivo
de peso molecular 40, por diferencia de pesada. La desviacin estndar de cada pesada fue de
2. Siete mediciones de pH de una solucin reguladora proporcionaron los siguientes resultados: 0.000 1 g: cul fue la desviacin estndar y la desviacin estnda~ relativa del peso del reactivo
utilizado? La desviacin estndar del volumen del disolvente utlhza~o f~e de ~.05 mI. E~prese
5.12,5.20,5.15,5.17,5.16,5.19,5.15. esto como una desviacin estndar relativa. De aqu calcule la desviacin estandar relativa de
molaridad de la solucin.
Calcule el verdadero pH al nivel de confianza del (i) 95% Y (ii) 99%. (Suponga que no existen Repita el clculo para un reactivo de peso molecular 392.
errores sistemticos.)
!
El producto de solubilidad del sulfato de bario es 1.3 ~ O~IO, con una desviacin estnd~r de
3. Diez anlisis de la concentracin de albmina dieron una medida de 20.92 gil, Yuna desviacin 10. 0.1 x 1O~ 10 Calcule la desviacin estndar de la solubilidad calculada del sulfato de bario en
estndar de 0.45 gil. (Foote, J. W. y Delves, H. T., Analyst, 1983, 108,492.)
agua.
Calcule los lmites de confianza de la medida al 95%.

4. Se midi la concentracin de plomo en el fluido sanguneo para una muestra de 50 nios de un


gran colegio prximo a una calle concurrida. La medida muestral fue 10.12 ngJml y la desviacin
estndar fue 0.64 ngJml. Calcule el intervalo de confianza al 95% para la concentracin media
de plomo de todos los nios de la escuela.
Qu tamao debera tener la muestra para reducir la longitud del intervalo de confianza a
0.2 ngJml (es decir iO.! ngJml)?

5. En una investigacin de la exactitud y precisin de un mtodo para la determinacin de


arprinocida en comestibles preparados, se realizaron seis determinaciones repetidas de una
formulacin preparada que contiene 10.2% de arprinocida. Los resultados fueron:

10.4,10.4, 10.6, 10.3, 10.5, 10.5%.

(Stong, J. D. YFink, D. w., Analyst, 1982,107, 113).


Calcule la media, la desviacin estndar y los lmites de confianza para la media al 95% y
99% Se encuentra el valor de 10.2% dentro de los lmites de confianza al nivel del (i) 95%
Y (ii) del 99%?

6. La medida de la concentracin de haptoglobina en suero sanguneo tomada de una muestra al


azar de ocho adultos sanos dio los siguientes resultados:

1.82,3.32, 1.07, 1.27,0.49,3.79,0.15,1.98 gil

Calcule la media y la desviacin estndar de estos resultados.


Suponiendo que la distribucin de la haptoglobina es log-normal en la poblacin como
conjunto, calcule el intervalo de confianza al 95 % para la concentracin media de haptoglobina
para el conjunto de la poblacin.

7 Diez mediciones de la relacin entre las reas de dos picos en un experimento de cromatografa
lquida dieron los siguiente valores:

0.2911,0.2898,0.2923,0.3019,0.2997,0.2961, 0.2986, 0.2902, 0.2882.

(Jonvel, P. y Anderman, G., Analyst, 1983.108,411).


Calcule la media, la desviacin estndar y los lmites de confianza de la media al 99%.
probable ser que la hiptesis nula sea verdadera. Por lo regular, la hiptesis nula se rechaza
cuando la probabilidad de que la diferencia observada ocurra por azar es menor que 1 de
cada 20 veces (es decir, 0.05 5%), y en este caso se dice que la diferencia es significativa
al nivel de 0.05 (o 5 %). Si utilizamos este nivel de significacin rechazamos en promedio
la hiptesis nula, cuando sea de hecho verdadera, una de cada veinte veces. Para estar ms
seguros de que se toma la decisin adecuada, se utiliza un nivel de significacin ms pe-
queo, por lo regular 0.01 0.00 I (l % o O. l %). El nivel de significacin se indica
escribiendo, por ejemplo, P (es decir, la probabilidad) ~ 0.05. Es importante tener en cuenta
que si se acepta la hiptesis nula no significa que hayamos probado que sea verdadera,
slo que no hemos demostrado que sea falsa. Ms adelante en este capitulo se analizar la
probabilidad de aceptar una hiptesis nula cuando sea de hecho falsa.
Pruebas de significacin Para decidir si la diferencia entre .J y x es significativa, la ecuacin (2.9):

.J = x (ts/In
(donde n es el tamao muestral) se escribe de otra forma:

(3.1 )
3.1 INTRODUCCIN
y se calcula un valor de t sustituyendo los resultados experimentales en esta ecuacin. Si
Una de las propiedades ms importantes de un mtodo analtico es que se encuentre libre ITI (es decir, el valor de t sin considerar el signo) es mayor que un cierto valor crtico,
de errores sitemticos, es decir, el valor dado para la cantidad de analito debera ser el valor entonces se rechaza la hiptesis nula. El valor crtico de ITI para un nivel de significa-
verdadero. Esta propiedad se puede comprobar al aplicar el mtodo a una muestra estndar cin concreto se encuentra en la tabla A. l. Por ejemplo, para un tamao de muestra de 10
que contenga una cantidad conocida de ana lito (vase el Cap. 1). Sin embargo, como se (es decir, 9 grados de libertad) y un nivel de significacin de 0.01, el valor crtico de Itl
vio en el captulo anterior, los errores aleatorios no permiten que la cantidad medida sea es 3.25.
exactamente igual a la cantidad conocida incluso aunque no hubiera error sistemtico. Para
decidir si la diferencia entre la cantidad medida y la cantidad conocida se puede justificar Ejemplo. En un mtodo para determinar mercurio por la tcnica de absorcin atmica
por estos errores aleatorios, puede aplicarse una prueba estadstica que se denomina prueba de vapor fro, se obtuvieron los siguientes valores para un material de referencia que
de significacin. Como su nombre lo indica, esta aproximacin prueba si son significativas contiene 38.9 % de mercurio:
las diferencias entre los dos resultados, o si se pueden justificar slo por variaciones
aleatorias. Las pruebas de significacin se han utilizado en forma amplia en la evaluacin 38.9,37.4,37.1 %
de los resultados experimentales. En este captulo se consideran varias pruebas que son
tiles particularmente para los qumicos analticos. (Hou, P. K., Lau, O. W. y Wong, M. C.,Analyst, 1983,108,64.)
Hay alguna evidencia de error sistemtico?
La media de estos valores es de 37.8% y la desviacin estndar de 0.964%. Si se
3.2 COMPARACIN DE UNA MEDIA EXPERIMENTAL CON UN VALOR adopta la hiptesis nula de que no hay error sistemtico, es decir, .J = 38.9% Y se utiliza
CONOCIDO la ecuacin (3. 1) resulta

/\1 realizar una prueba de significacin comprobamos la veracidad de una hiptesis Itl ~ 1(37.8 - 38.9) x 13/0.9641 ~ 1.98
,jcnorninac!a hiptesis nula. Como observamos en el prrafo anterior, adoptamos como
hiptesis nula aquella mediante la cual un mtodo no se encuentra sujeto a errores De la tabla A.1, para 2 grados de libertad, el valor crtico de ITI es 4.3 (P = 0.05). Ya que
sisternaticos. El trmino nulo se utiliza para indicar que no hay ms diferencia, entre lo el valor observado de Itl es menor que el valor crtico, no se rechaza la hiptesis nula:
observado y el valor conocido, que la que puede atribuirse a la variacin aleatoria. no hay evidencia de error sistemtico. Hay que sealar nuevamente que esto no
Suponienc!o que esta hiptesis nula es verdadera, se puede utilizar la teora estadistica para significa que no existan errores sistemticos, sino que no se ha podido constatar su
calcular la probabilidad (es decir, la posibilidad) de que la diferencia observada entre la existencia.
media muestral, x, y el verdadero valor, .J, se deba solamente a un error aleatorio. Cuando
ms pequea sea la probabilidad de que la diferencia observada ocurra por azar, menos
3.3 COMPARACIN DE LAS MEDIAS DE DOS MUESTRAS verdadera, la probabilidad de que haya una gran diferencia debida al azar es menor que
1 entre 1000.
Otra forma por la que los resultados de un mtodo analtico nuevo pueden comprobarse es
por comparacin de los obtenidos utilizando un segundo mtodo (quizs un mtodo de El siguiente ejemplo, es otra aplicacin de esta prueba, en donde se emplea para decidir si
referencia). En este caso tenemos dos medias muestra les XI y X2. Si tomamos como hiptesis
un cambio en las condiciones de un experimento afecta el resultado.
nula que los dos mtodos dan el mismo resultado, necesitamos comprobar si (XI - X2) difiere
en forma significativa de cero. Si las dos muestras tienen desviaciones estndar que no
Ejemplo. En una serie de experimentos para la determinacin de estalla en ~roductos
sean significativamente diferentes (vase seccin 3.6, en donde se presenta un mtodo para
alimenticios, las muestras se llevaron al punto de ebullicin con HCl a reflujo durante
probar esta suposicin), se puede calcular una estimacin conjunta de la desviacin
diferentes tiempos. Los resultados fueron:
estndar a partir de la dos desviaciones estndar individuales SI y S2 utilizando la ecuacin:

Tiempo de reflujo (min) Estalla encontrado (mg/kg)


(3.2) 55,57,59,56,56,59
30
70 57,55,58,59,59,59
Se puede demostrar que entonces t est dado por:
(Analytical Methods Commitee, Analyst, 1983, 108, 109.)
(3.3)
Es diferente la cantidad media de estalla encontrada para los dos tiempos de ebulli-
Donde t tiene ni + n: - 2 grados de libertad.
cin?
La media y la varianza (cuadrado de la desviacin estndar) para los dos tiempos
Ejemplo. En una comparacin de dos mtodos para la determinacin de boro en
son:
muestras de plantas se obtuvieron los siguientes resultados (Jig/g):

1 mtodo espectrofotorntrico: media = 28.0; desviacin estndar = 0.3


30min XI = 57.0 Si = 2.80
2 mtodo fluorirntrico: media = 26.25; desviacin estndar = 0.23
75 min S2 = 2.57
1

Para cada mtodo se realizaron diez determinaciones.


(Anarez, J., Bonilla, A. y Vidal, J. c., Analyst, 1983, 108, 368.) La hiptesis nula adoptada es que el tiempo de ebullicin no influye en la cantidad de
estalla encontrada. De la ecuacin (3.2), el valor para la varianza est dado por:
Estos dos mtodos dan resultados cuyas medidas difieren significativamente?
La hiptesis nula adoptada es la que la media de los resultados dada por ambos S2 = (5 x 2.80 + 5 x 2.57)/1 O
mtodos es la misma. De la ecuacin (3.2), el valor de la desviacin estndar conjun-
= 26.85
ta es:
S = 1.64
S2 = (9 X 0.3 2 + 9 x 0.23 2)/18
= 0.0715
t se calcula a partir de la ecuacin (3.3):
S = 0.267

(57.0 - 57.8)/1.64V(I/6 + 1/6)


De la ecuacin (3.3):
- 0.84
(28.0 - 26.25)/0.267Y(1I1O + 1110)
Hay 10 grados de libertad, de manera que el valor crtico dc 111 es 2.23 (P = O:O~). ~l
14.7 valor observado de Itl es menor que el valor crtico, por lo tanto, se acepta la hiptesis
nula: no hay pruebas eleque el periodo de ebullicin afecte la tasa ele recuperacin.
Hay 18 grados de libertad, por lo tanto (tabla A.l) el valor crtico de Itl (P = 0.05) es
2.1; puesto que el valor experimental de Itl es ms grande que ste, de la diferencia entre Si no es vlido suponer quc las desviaciones estndar ele las poblaciones son iguales,
los resultados es significativa al nivel del 5 % Yse rechaza la hiptesis nula. De hecho, un mtodo aproximado consiste en modificar la ecuacin (3.3) por:
ya que el valor crtico de /11 para P = 0.001 es aproximadamente de 3.9, la diferencia
:~s significativa incluso al nivel del 0.1%. En otras palabras, si la hiptesis nula es
(3.4 )
y calcular el nmero de grados de libertad a partir de: Muestras Oxidacin hmeda Extraccin directa
1 71 76
2 61 68
grados de libertad = { (Sr/n1 + si/nz)Z ) -2 (3.5) 3 50 48
(sz/n )Z (s~/n)Z
_1_1_ + _L_Z_
4 60 57
nI + 1 nz + 1
(Smith, B. M. YGriffits, M. B., Analyst, 1982,107,253.)
el resultado se redondea al nmero entero ms cercano.
Los dos mtodos proporcionaron valores para las concentraciones medias de plomo
Ejemplo. La siguiente tabla proporciona la concentracin de tiol en sangre de dos que difieran significativamente?
grupos de voluntarios, el primer grupo es "normal" y el segundo sufre artritis reuma- La prueba para comparar dos medias (vase la Seco 3.3) no es apropiada en este
toide. caso, ya que cualquier variacin debida al mtodo se ver afectada por causa de las
diferencias entre las muestras comparadas. Se resuelve esta dificultad al observar
Concentracin de tiol ( mM ) la diferencia entre cada par de resultados dados por dos mtodos. Si adoptamos la
Normal Reumatoide hiptesis nula de que no existen diferencias significativas en las concentraciones dadas
1.84 2.81 por los dos mtodos, se puede probar si la media de las diferencias difiere significati-
1.92 4.06 vamente de cero.
1.94 3.62 Para los pares de valores anteriores las diferencias son -5, -7, 2 Y 3. La media de
1.92 3.27 las diferencias.xj, es -1.75 y la desviacin estndar de las diferencias, Sd, es 4.99. Puesto
1.85 3.27 que ..td = O, la ecuacin (3.1) para calcular t se transforma en:
1.91 3.76
2.07 (3.6)

(Banford,1. c., Brown, D. H., McConnell, A. A., McNeil,C. 1., Smith,W. E., Hazelton, donde t tiene (/1- 1) grados de libertad. Si se sustituye en la ecuacin (3.6) resulta un
R. A. YSturrock, R. D., Analyst, 1983,107,195.) valor de t = -0.7. El valor crtico de Itl es 3.18 (P = 0.05) Ypuesto que el valor calculado
de Itl es menor que ste, se acepta la hiptesis: el mtodo no da valores significativa-
De los datos anteriores tenemos que: mente diferentes para las concentraciones medias de plomo.

/11 = 7, X = 1.921, s = 0.076 Hay varias circunstancias por las cuales puede ser necesario o deseable disear un
/12 = 6, X2 = 3.465, S2 = 0.440 experimento de manera que se analice cada muestra por cada uno de los dos mtodos
y, de este modo, los resultados surjan emparejados en forma natural. Algunos ejemplos
De nueva cuenta, la hiptesis nula es que la concentracin media de tiol es la misma son:
para los dos grupos. Si se sustituye en la ecuacin (3.4) resulta t = 8.5 Y de la ecuacin
(3.5) se obtienen 5 grados de libertad. El valor crtico de Itl (P = 0.001) es 4.03, de manera (a) la cantidad de muestra disponible que se va a examinar slo es suficiente para una
que se rechaza la hiptesis nula: la concentracin media de tiol es diferente para los dos determinacin por cada mtodo;
grupos. (b) los mtodos se van a comparar utilizando una gran variedad de muestras de
diferente procedencia y posiblemente con concentraciones muy distintas (vase el prximo
prrafo);
3.4 LA PRUEBA t POR PAREJAS (e) las muestras que se van a examinar pueden presentarse durante un periodo extenso
por lo que es necesario eliminar los efectos de las condiciones ambientales tales como
Con frecuencia ocurre que deben compararse dos mtodos de anlisis por medio del estudio temperatura, presin, etctera.
de .muestras que contienen, de manera sustancial, diferentes cantidades de analito como
se ilustra en el siguiente ejemplo: ' Como es comn que los mtodos analticos se apliquen en un amplio intervalo de
concentraciones, a menudo se compara un mtodo nuevo con uno estndar mediante el
Ejemplo. La siguiente tabla proporciona la concentracin de plomo (..tgJl) determinado anlisis de muestras en las que las caractersticas del analito puedan variar en varias
por dos mtodos diferentes para cada una de las cuatro muestras: potencias de diez. En este caso resulta inadecuado utilizar la prueba t por parejas, ya que
su validez se apoya en la hiptesis de que cualquier error, ya sea aleatorio o sistemtico,
es independiente de la concentracin. En intervalos de concentracin amplios dicha t ~ (25.228 - 25.00) x /6/0.238 ~ 2.35
hiptesis no tiene por que ser del todo cierta. El mtodo estadstico preferido en estos casos
es la regresin lineal: ms adelante se describe su aplicacin (vase la Seco 5.9). De la tabla A.1 el valor crtico de t para 5 grados de libertad es 2.02 (P ~ 0.05, prueba
de una cola). Puesto que el valor observado de t es mayor que ste, se rechaza la
hiptesis nula y hay evidencia de sesgo positivo.
3.5 LAS PRUEBAS DE UNA Y DOS COLAS
Es interesante observar que si en el ejemplo anterior se hubiera realizado una prueba de
Los mtodos analizados hasta el momento es este captulo se refieren a probar la diferencia dos colas (1/1 ~ 2.57), 110 se habra rechazado la hiptesis nula. La explicacin de este
entre dos medias en cualquieir direccin. Por ejemplo, el mtodo descrito en la seccin hecho aparentenmente contradictorio, reside en que la decisin de efectuar una prueba de
3.2 prueba si existe diferencia significativa entre el resultado experimental y el valor una o dos colas depende del grado de conocimiento a priori, ya que en este caso se
conocido para el material de referencia, sin tener en cuenta el signo de la diferencia. En sospechaba o esperaba sesgo positivo. Por supuesto, resulta esencial que se tome la decisin
muchas situaciones de este tipo, el analista no tiene una idea preconcebida, previa a las sobre si la prueba ser de una o dos colas antes de realizar el experimento, y no despus,
mediciones experimentales, con relacin a si la diferencia entre la media experimental y cuando los resultados podran prejuzgar la eleccin. En general, se encontrarn ms
el valor de referencia ser positiva o negativa. situaciones en las que se empleen pruebas de dos colas que de una cola, y se detectarn
De esta manera, es necesario contar con una prueba que cubra esta posibilidad: sta se con facilidad las relativamente raras circunstancias en las que sea necesario emplear
denomina prueba de dos colas (o bilateral). Sin embargo, en algunos casos puede ser pruebas de una cola.
apropiado utilizar un tipo diferente de prueba. Por ejemplo, en un experimento se espera
incrementar la velocidad de reaccin aadiendo un catalizador; es evidente que antes de
empezar el experimento slo se tiene inters en que la velocidad nueva sea mayor que la 3.6 LA PRUEBA F PARA LA COMPARACIN DE DESVIACIONES
anterior y, por lo tanto, slo es necesario probar un incremento, Este tipo de prueba se llama ESTNDAR
de una cola (o unilateral). Para una valor dado de n y un nivel de probabilidad concreto,
el valor crtico para una prueba unilateral difiere de una bilateral. En una prueba unilateral, Las pruebas de significacin descritas hasta ahora en este captulo se utilizan para comparar
para un incremento, el valor crtico de t (en lugar de 1/1) para P = 0.05 es aquel que es medias y, por lo tanto, para detectar errores sistemticos. En muchos casos, tambin es
superado con una probabilidad del 5%. Ya que se supone que la distribucin muestral de importante comparar las desviaciones estndar, es decir, los errores aleatorios de dos
la media es simtrica, esta probabilidad es la mitad de la probabilidad de que sea importante conjuntos de datos. Esta comparacin, como en el caso de las pruebas de medias, puede
en la prueba bilateral. De esta manera, para encontrar el valor adecuado para la prueba de tener dos formas; o bien probar si el Mtodo A es ms preciso que el Mtodo B (es decir,
una cola se busca en la columna de P ~ 0.10 en la tabla A.l. En forma similar, para una la prueba de una cola) o si los mtodos A y B difieren en su precisin (o sea, la prueba de
prueba de una cola con P = 0.01, se emplea el valor en la columna P = 0.02. Para una prueba dos colas). As, si quisiramos probar si un mtodo analtico nuevo es ms preciso que uno
de una cola para Ull decremento; el valor crtico de t ser de la misma magnitud pero con estndar, deberamos utilizar la prueba de una cola; si quisiramos probar si dos desvia-
un signo negativo.
ciones estndar difieren significativamente (por ejemplo, antes de aplicar la prueba 1, vase
la seccin 3.3), sera adecuado una prueba de dos colas.
Ejemplo. Se sospecha que una valoracin cido-base tiene un error de indicador En la prueba F se considera la razn de las dos varianzas muestra les, es decir, la razn
significativo y, por lo tanto, tiende a dar resultados con un error sistemtico positivo de los cuadrados de las desviaciones estndar. La cantidad calculada (F) est dada por:
(es decir, un sesgo positivo). Para comprobar esto, se utiliza una disolucin de cido
exactamente O.lM para valorar 25.00 mi de otra disolucin de una base, exactamente (3.7)
O 1M con los siguientes resultados (ml):

25.06 25.18 24.87 25.51 25.34 25.41


s7 s7
y se disponen los valores y en la expresin anterior, de manera que F sea siempre ~ 1.
La hiptesis nula adoptada es que las poblaciones de donde se toman las muestras sean
normales, y que sean iguales las varianzas de las poblaciones. Si la hiptesis nula es
Pruebe la existencia de sesgo positivo en estos resultados.
verdadera, entonces la razn de varianzas debera estar prxima a l. Las diferencias
respecto de 1 se deben a variaciones aleatorias, pero si la diferencia es demasiado grande
De estos datos se tiene:
no se podr atribuir a esta causa: si el valor calculado de F excede un cierto valor (obtenido
de las tablas), entonces se rechaza la hiptesis nula. Este valor crtico de F depende del
media ~ 25.228 ml; desviacin eSl<ndar ~ 0.238 ml,
tamao de las dos muestras, del nivel de significacin y del tipo de prueba realizada. Los
valores para P ~ 0.05 estn ciados en las tablas A.2 y A.3; el uso de las tablas se aclara en
Si adoptamos la hiptesis nula de que no hay ningn sesgo, es decir, f1 ~ 25.00, y
utilizamos la ecuacin (3.1) resulta los siguientes ejemplos.
Ejemplo. Se compar un mtodo propuesto para la determinacin de la demanda de
tabla A.2 se emplea la tabla A.3. De esta tabla, tomando como el nmero de grados de
oxgeno en aguas residuales con un mtodo estndar (sales de mercurio). Se obtuvieron
libertad tanto del numerador como del denominador igual a 9, el valor crtico obtenido
los siguientes resultados para una muestra de aguas residuales:
para F es 4.026. El valor calculado es menor que ste, por lo tanto no hay diferencia
significativa entre las dos varianzas a un nivel del 5%.
Media (mg/I) Desviacin estndar (mgjl)
Mtodo
Como en el caso de la prueba t, en la prueba F se puede emplear otros niveles de
estndar 72 3.31 significacin y los valores crticos se encuentran en las tablas que aparecen en la biblio-
Mtodo
grafa al final del captulo 1. Se debe tener cuidado en la eleccin .de la ta~la. c.orre.c.ta,
propuesto 72 1.51 dependiendo de si es una prueba de uno o dos colas: para un a% de nivel de slg.mfIcaclOn,
Para cada mtodo se realizaron 8 determinaciones. los a% puntos de la distribucin F se utilizan para una prueba de una cola, mientras que
1
para una prueba de dos colas se usan los puntos 2a%.
(Ballinger, D., Lloyd, A. y Morrish, A.,Allalyst, 1982,107,1047.)

Es la precisin del mtodo propuesto significativamente ms grande que la del mtodo


estndar? 3.7 VALORES ANMALOS
Tenemos que decir si la varianza del mtodo estndar es significativamente mayor
que la del mtodo propuesto. F est dado por la razn de varianzas: Es muy frecuente que las personas que realizan experimentos se enf:enten a l~ situ<~~in
en que uno (o posiblemente ms) de los resultados obtenidos en una sene de med,ldas dlfle:a
del resto de manera inexplicable. Estas medidas se denominan resultados anomalos. En
algunos casos, se puede atribuir un resultado anmalo a un error humano. Por ejemplo, si
se obtienen los siguientes resultados en una titulacin:
Se hicieron ocho determinaciones, por lo tanto, el nmero de grados de libertad es 7
en cada caso, como est indicado por los subndices. En este caso hay que utilizar la
12.12,12.15,12.13,13.14,12.12 mi
prueba de una cola, ya que slo nos interesa si el mtodo propuesto es ms preciso que
el mtodo estndar. En la tabla A.2, el nmero de grados de libertad del denominador
entonces es casi seguro que el cuarto valor corresponda a un error en la escritu~a y que
est dado en la columna de la izquierda, y el nmero de grados de libertad del
debiera leerse como 12.14. Sin embargo, incluso cuando los valores que son obviamente
numerador, en la parte superior. El valor crtico de F es, en este caso, 3.787 (P = 0.05).
errneos han sido eliminados o corregidos, todava quedan aquellos que pudieran ser
Ya que el valor calculado de F (4.8) lo excede, la varianza del mtodo estndar es
valores anmalos. Deberamos conservarlos, o deberamos buscar un valor medi~ para
significativamente mayor que la del mtodo propuesto a un nivel de probabilidad del
5 %, es decir, el mtodo propuesto es ms preciso. comprobar estadsticamente si deben ser rechazados o no? Por supuesto, los valores finales
de la media y la desviacin estndar dependern de que hayan sido rechazados o no los
valores anmalos. Puesto que el anlisis sobre la precisin y la exactitud de un mtodo
Ejemplo. En el ejemplo que se encuentra al principio de la seccin 3.3 (determinacin
depende de estos valores finales, siempre tiene que quedar claro si han sido rechazados los
de boro en plantas), se supuso que las varianzas de los dos mtodos no diferan
valores anmalos y, en tal caso, por qu.
significativamente. Esta hiptesis se puede probar ahora. Las desviaciones estnclar
Hasta aqu el anlisis de los errores se ha basado en la hiptesis de que la distrib~cin
eran 0.3 y 0.23 (cada una obtenida de 10 medidas de un ejemplar de una planta
de medidas repetidas es normal (o aproximadamente). Una razn para la presencIa de
cIetermll1ada). Calculando F de manera que sea mayor o igual que 1, tenemos:
valores anmalos puede ser que la afirmacin anterior no sea vlida: nosotros suponemos
un modelo concreto, es decir, normal, para la poblacin a partir de la cual se extraen las
medidas, y debido a que este modelo no es correcto, se obtiene un resultado sorprendente.
En esta seccin slo se describirn pruebas de valores anmalos que supongan una
sn ern bargo, en este caso no tenemos ninguna razn para esperar, de antemano, que
poblacin normal. Si no se admitiera la poblacin normal, entonces no se debera emplear
la varianza de un mtodo deba ser mayor que la del otro; por ello usaremos una prueba
las pruebas descritas en este captulo (a menos que las muestras sean grandes, ya qu~ e~
de dos colas. Los valores crticos que se proporcionan en la tabla A.2 son los valores
este caso las distribuciones muestra les llegan a ser normales), sino que se debena sustiturr
que F supera con una probabilidad de 0.05, suponiendo que deben ser mayores que 1.
por los mtodos no paramtricos apropiados descritos en el captl~lo 6. Estos ltimos ?or
El) una prueba de dos colas, la razn entre una varianza y otra podra ser mayor o menor
lo general son insensibles a los valores anmalos y por ello se evita el problema de SI se
que 1, pero si F se calcula de' manera que sea siempre mayor que 1, entonces la
rechazan o no dichos valores.
probabilidad de que supere el valor crtico dado en la tabla A.2 ser doble. Por ello,
Una forma (entre varias pruebas diferentes) de estudiar una medida sospechosa es
estos valores crticos no son apropiados para una prueba de dos colas y en lugar de la
comparar la diferencia entre ella y la medida ms prxima en tamao, con la diferencia
entre las medidas ms grande y ms pequea, El cociente de estas diferencias (prescindien- trabajo analtico), el rechazo de un valor origina una gran variacin sobre la media y sobre
do del signo) se denomina Q de Dixon. la desviacin estndar. En concreto, debe evitarse el hecho de tomar tres medidas y
rechazar la que difiere ms de las otras dos. Se puede demostrar que, en promedio, se
Q = [valor sospechoso - valor ms cercano 1/ (valor ms grande - valor ms pequeo) (3.8) obtiene una estimacin ms confiable de la media utilizando el valor que est en medio de
los tres, ms que utilizando la media de los dos que no fueron rechazados.
Los valores crticos de Q para P ~ 0.05 Y P = 0.01 se encuentran en la tabla A.4. Si el De la misma manera que se han descrito anteriormente pruebas para un valor anmalo,
valor de Q calculado supera el valor crtico, se rechaza el valor sospechoso. tambin existen otras para dos valores anmalos. Sin entrar en detalle, podemos encontrar
dos valores sospechosos: los dos prximos, o uno a cada extremo del intervalo de valores,
Ejemplo. Se obtuvieron los siguientes valores para la concentracin de nitrito (mgjl) lo que produce una reduccin en el valor calculado de Q. En el primer caso habr una
en una muestra de agua de ro: reduccin en el numerador, y en el segundo un incremento en el denominador de la fraccin.
En cualquier caso, el efecto de la medida ms extrema estar enmascarado en la prueba
0.403,0.410,0.401,0.380 Q por la presencia del otro valor anmalo posible. ste se puede comprobar al considerar
los siguientes valores:
La ltima medida es sospechosa, debera ser rechazada?
Tenemos: 2.1,2,0,2,1,2.3,2.9,2.3,3.1,2.2,2.0,2.3

Q ~ I 0.380 - 00401 1/(004 10 - 0.380) = 0.021/0.03 ~ 0.7 Obviamente 2.9 Y3.1 son los valores sospechosos, pero el valor calculado de Q es:

De la tabla AA, para un tamao de muestra 4, el valor crtico de Q es 0.831 (P = 0.05). Q = (3.1 - 2.9)/(3.1 - 2.0) ~ 0.18
Ya que el valor calculado de Q no lo supera, debe aceptarse la medida sospechosa.
un valor que no es significativo (P = 0.05), En estos casos, lo apropiado es una prueba
En una situacin ideal, habra que tomar nuevas medidas cuando aparezca un valor para un par de valores anmalos; las referencias de stos aparecen en la bibliografa al final
sospech~so, en ~special si slo se han tomado inicialmente unos pocos valores. Esto podra del captulo.
aclarar SI debera rechazarse el valor sospechoso o no y, si se mantuviera, tambin reducira Los valores anmalos aparecen tambin en otros clculos estadsticos, como en los
su efecto sobre la media y la desviacin estndar. mtodos de regresin lineal que se describirn en el captulo 5. Estos casos se analizan
tambin en textos avanzados.
Ejemplo. Si se aaden tres muestras medidas a las dadas en el ejemplo anterior,
quedara:
3.8 ANLISIS DE LA VARIANZA
0.403,0.410,0.401,0.380,0.400,0.413,0.411
En la seccin 3.3 se describi un mtodo para comparar dos medias y probar si diferan en
se debera an mantener el 0.380?
forma significativa. En el trabajo analtico se presentan a menudo comparaciones en las
El valor de Q calculado es ahora: que intervienen ms de dos medias. Algunas situaciones de este tipo son: comparar la
concentracin media de protena en una solucin para muestras almacenadas en condicio-
Q = 10.380 - 0.4001/(0.413 - 0.380) = 0.606 nes diferentes; comparar los resultados medios obtenidos de la concentracin de un analito
utilizando diferentes mtodos; comparar la media de los resultados en una valoracin
El valor crtico de Q (P = 0.05) para un tamao muestral 7 es 0.570, por 10que la medida obtenidos por diferentes operadores que usan los mismos aparatos. En tociosestos ejemplos
sospechosa se rechaza a un nivel de significacin del 5%. hay dos posibles fuentes de variacin. La primera, que siempre est presente, se debe al
error aleatorio en la medida, lo cual se analiz con detalle en el captulo anterior: este tipo
') e Es importante tener en cuenta que par.a un nivel de significacin del5% hay todava un de error provoca diferentes resultados aunque las medidas se repitan en las mismas
- %de nesgo, o 1 de cada 20, de rechazar incorrectamente un valor sospechoso. Esto puede condiciones. La segunda fuente de variacin posible se debe a lo que se conoce como factor
tener un efecto considerable a la hora de estimar la precisin del experimento. Por ejemplo, controlado o de efecto fijo: para los ejemplos anteriores los factores de control son,
para los 7 valores de la concentracin de nitrito dados anteriormente, la desviacin estndar respectivamente, las condiciones bajo las cuales se almacen la solucin, el mtodo de
es de. 0.011 mg/l, pero cuando se rechaza el valor sospechoso la desviacin estndar se anlisis empleado y los operadores que realizaron la titulacin. El anlisis de la varianza
convIerte el.1 0.0056 mgjl, es decir, la precisin parece haber mejorado en un factor de 2. (conocido como ANOVA, del ingls Analysis ofVariance) es una tcnica estadistica muy
, En el ejemplo anterior se subraya la importancia de ser cauto al rechazar valores poderosa que se utiliza para separar y estimar las diferentes causas de variacin. En los
anomalos. Cuando las medidas se repiten slo unas pocas veces (lo que es normal en un ejemplos anteriores, se puede utilizar para separar la variacin debida al error aleatorio de
Tabla 3.2 Generalizacin de la tabla 3.1
cualquier otra variacin provocada al cambiar el factor de control. De esta manera, probar
Media
si una alteracin del factor de control ocasiona diferencias significativas entre los valores
medios obtenidos. Muestra 1 XII XI2 Xlj XI"

Tambin se puede emplear las tcnicas ANOVA en situaciones donde hay ms de una Muestra 2 X21 X22 X2j X2"
fuente de variacin aleatoria. Por ejemplo, considere la pureza de un barril de cloruro
sdico. Las muestras se toman al azar de diferentes partes del barril, y se realizan los
mismos anlisis sobre las muestras. Adems del error aleatorio en la medicin de la pureza, xi} XiII Xi
Muestra i Xii X2
habr tambin diferencias en la pureza de las muestras en las distintas partes del barril.
Puesto que las muestras se eligen al azar, esta variacin ser aleatoria y esto se conoce
como factor de efecto aleatorio. De nueva cuenta, en este caso puede utilizarse el ANOVA Xhj Xh" X.
Muestra h Xhl Xh2
para separar las fuentes de variacin. media global = !_
Ambos tipos de anlisis estadsticos, en donde hay un factor, ya sea controlado o
aleatorio, adems del error aleatorio de las medidas, se conoce como ANOVA de un factor.
Los procedimientos aritmticos son similares en los casos de un factor de efecto fijo y uno
de efecto aleatorio. En este captulo se presentan ejemplos del primer caso y en el prximo una poblacin con media J1 y varianza ~. Con base en esta hiptesis se puede. es~i.mar ~.
captulo del segundo, en donde se considera con ms detalle el muestreo. Las situaciones de dos formas; una estudia la variacin dentro de cada muestra, y la otra la vanacion entre
ms complejas en las que existen dos o ms factores, posiblemente interactuando entre s, las distintas muestras.
se consideran en el captulo 7 (Diseo experimental).

(i) Variacin dentro de la muestra . .. . _2


3.9 COMPARACIN DE VARIAS MEDIAS Para cada muestra se puede calcular una vananza utilizando la frmula L(X - x) ltn - 1).
Si usamos los valores de la tabla 3.1, tenemos que las varianzas de las muestras son:
En la tabla 3.1 se muestran los resultados obtenidos en una investigacin acerca de la (102 - 101)2 + (100 - 101)2 + (10 1 - 101)2
estabilidad de un reactivo fluorescente en diferentes condiciones de almacenamiento. Los Muestra A 3- 1
valores dados son las seas de fluorescencia (en unidades arbitrarias) de soluciones diluidas
= 1
de la misma concentracin. Se tomaron tres medidas sobre cada muestra. En la tabla se
muestra que los valores medios son diferentes para las cuatro muestras. Sin embargo, (101 - 102)2 + (101 - 102)2 + (104 - 102)2
sabemos que, debido al error aleatorio, incluso si no ha cambiado el valor verdadero que Muestra B 3- 1
queremos medir, la media muestral puede variar de un muestra a otra. Con las pruebas = 3
ANO VA se verifica si la diferencia entre las medias muestrales es demasiado grande para
(97 - 97)2 + (95 - 97? + (99 - 97?
explicarse por medio de los errores los aleatorios. Muestra C 3- 1
=4
Tabla 3.1 Seales de fluorescencia para soluciones en diferentes condiciones de almacenamiento (89 - 91? + (91 - 91)2 + (93 - 91?
Muestra D 3- 1
Condiciones Medidas repetidas Media
=4
A recientemente preparada 102, 100, 101 101
B una hora en la oscuridad 101,101, 104 102 Al promediar estos valores resulta:
C una hora con luz tenue 97,95,99 97
D una hora con luz brillante 90,92,94 92 estimacin de ~ dentro de la muestra = (l + 3 + 4 + 4)/4 = 3
Media global 98

Esta estimacin tiene 8 grados de libertad: la estimacin de la varianza de ca?a m.~estra


tiene 2 grados de libertad y hay 4 muestras. Destaca el hecho de qu~ esta estimacin no
El problema se puede generalizar si se consideran h muestras, cada una con n elemen- depende de las medias de las muestras; por ~je~plo, si. toda~.las medidas de la muestra A
tos, como se expone en la tabla 3.2, en donde Xi} es la j-sima medida de la i-sima se incrementaran en cuatro unidades, no vanana la estimacion de ~.
muestra. Las medias de las muestras son X}, X2, X3, ... , X" Y la media de todos los valores La frmula general para la estimacin de ~ dentro de las muestras es:
agrupados juntos es X. La hiptesis nula adoptada es que todas las muestras se extraen de
estimacin dentro de las muestras de ~ = E E (x ij - xJ 2l h(n - 1) (3.9)
i j
la estimacin entre muestras es significativamente ms grande, se utiliza una prueba F de
una cola (vase la Seco 3.6):
El suma.torio sobre} y la divisin por (n - 1) se refiere a la varianza de cada muestra' el
sumatono sobre i y la divisin por h promedia estas varianzas muestrales. La expresi; f\8 62/3 20.7
'. 3
1a ecuacion en = =
.9 se conoce como un cuadrado medio, puesto que es la suma de trminos
cuadrticos di:idida por el nmero de grados de libertad. Ya que en este caso el nmero (Recuerde que se utiliza cada cuadrado medio, as que no es necesario elevar al cuadrado
de grados de libertad es 8 y el cuadrado medio es 3, la suma de los trminos cuadrticos posteriormente.) De la tabla A.2 se obtiene que el valor crtico de Fes 4.066 (P ~ 0.05).
es 3 x 8 ~ 24.
Puesto que el valor calculado de F es mayor que ste, la hiptesis nula se rechaza: las
medias muestrales difieren en forma significativa.
Se puede alcanzar un resultado significativo en un ANOVA ele un factor por varias
(ii) Variacin entre muestras
razones: por ejemplo, que una media difiera de las dems; que todas las medias difieran
Si todas las muestras se ~~traen de l~na pob~acin cuya varianza es a~, entonces sus medias entre s; que las medias estn en dos grupos distintos, etc. Una forma sencilla para explicar
proceden ~~ una poblacin con vananza a'/n (vase la distribucin muestral de la media un resultado significativo es colocar las medias en orden creciente y comparar la diferencia
en la seCCIOn 2.3~. As, si la hiptesis nula es verdadera, la varianza de las medias de Ias entre los valores adyacentes con una cantidad llamada la diferencia significativa menor.
muestras proporciona una estimacin de a~n. De la tabla 3.1: sta est dada por sf2[il X th(n _ 1), en donde s es la estimacin dentro de las muestras de o
y hin - 1) es el nmero de grados de libertad de esta estimacin. Para el ejemplo anterior,
varianza de la media muestral = (101 - 98)2 + (102 - 98)2 + (97 - 98? + (92 _ 98)2
las medias muestrales colocadas en orden creciente de tamao son:
62 4- 1
3 Xo = 92 Xc = 97 XA = 101 XB ~ 102

de manera que: y la menor diferencia significativa es f3 x .(2/3) x 2.306 (P = 0.05), lo cual da 3.26. Al
comparar este valor con las diferencias entre las medias, se sugiere que Xo y Xc difieren sig-
" 2 62
estimacin entre muestras de ao = - x3 = 62 nificativamente entre s y tambin difieren de XA y XIJ , mientras que XA y XIl no difieren en
3
forma significativa entre s, es decir, la exposicin a la luz es lo que afecta la fluorescencia.
El mtodo de la mnima diferencia significativa descrito antes no es del todo riguroso:
Esta estimacin tiene 3 grados de libertad, ya que se ha calculado a partir de 4 medias
se puede demostrar que conduce a demasiadas diferencias significativas. Sin embargo, es
muestrales. Note que esta estimacin de a~ no depende de la variabilidad dentro de cada
una prueba de ejecucin simple cuando el ANOVA indica que hay diferencias significativas
mu~stra, ya que se cal~ula con las medias muestra les. Sin embargo, si por ejemplo la media entre las medias. Otros mtodos ms rigurosos se describen en la bibliografa que aparece
de la muestra D cambiase entonces tambin cambiara esta estimacin de a~.
En general, tenemos: al final de este captulo.

estimacin de a~ entre muestras = n 1.: (Xi - x)2/(h - 1) 3.10 LA ARITMTICA DE LOS CLCULOS ANO VA
(3.10)

que d~ .nuevo es un :'cuadrado medio" el cual supone dividir una suma de trminos Al utilizar ANOVA para probar la diferencia entre varias medias, se estim a~ de dos formas
~uadratIcos entre el numero de grados de libertad. En este caso, el nmero de grados de distintas. Si la hiptesis nula fuese verdadera, a~ tambin podra estimarse de una tercera
hbertad es 3 y el cuadrado medio es 62, por lo que la suma de los trminos cuadrticos es forma, tratando los datos como si fueran una muestra grande. Esto implicara sumar los
3 x 62 = 186.
cuadrados de las desviaciones a la media total:
Si resumimos los clculos realizados hasta aqu:

cuadrado medio dentro de las muestras = 3 con 8 g..


l

cuadrado medio entre muestras = 62 con 3 g.1.


= 210
y dividir por el nmero de grados de libertad, 12 - 1 ~ 11.
Si 1 hi .
si a. 1.lpo~esls n~la e~ correcta, estas dos estimaciones de a~ no deberan de diferir en forma Este mtodo de estimar a~ no se utiliza en el anlisis debido a que la estimacin depende
g~lflc~~lva. SI es mcorrecta, la estimacin de a~ entre muestras ser mayor que la de las dos variaciones: dentro y entre muestras. Sin embargo, existe una relacin algebraica
estImacIOn dentro de las muestras, debido a la variacin entre muestras. Para probar si exacta entre esta variacion total y las fuentes de variacin que contribuyen a ella la cual,
especialmente en los clculos ms complicados de ANOVA, conduce a una simplificacin
Tabla 3.3 Resumen de sumas de cuadrados y grados de libertad
Grados de
Fuente de variacin Fuente de variacin Suma de los cuadrados libertad Cuadrado medio
Suma de cuadrados Grados de libertad ----
Entre muestras 702/ - (-24)2/12 = 186 3 186/3 ~ 62
Entre muestras nFi i - i )2 = 186 h-l = 3 Dentro de las muestras por diferencia = 24 8 24/8 = 3
Dentro de las muestras ;: f (x'i - i,J2 = 24 h(n - 1) 8
Total 258 - (-24)2/12 = 210 11

TOlal 11 (xii - i)2 = 210 hn - 1 11


3.11 LA PRUEBA CHI CUADRADA

del trabajo .aritmtico. En la tabla 3.3 en donde se resumen las sumas de cuadrados y los Las pruebas de significacin descritos hasta ahora en este captulo han sido, en general,
grados de libertad, se muestra la relacin entre las fuentes de variacin Se ob ' pruebas acerca de si la media de varias observaciones difiere significativamente del valor
l . '. . servara que
os valores de la vanacion total, dados en la ltima fila de la tabla son la sum d l l propuesto por la hiptesis nula. Los datos utilizados han tornado la forma de observaciones
d 1 dos nri . , a e os va ores
e as oS'pnmera~ filas, tanto para la suma de cuadrados como para los grados de libertad. que, aparte de cualquier redondeo, se han medido en una escala continua. En contraposicin
Esta propiedad aditiva se mantiene para todos los clculos de ANOVA d it en esta seccin se tratan las frecuencias es decir, el nmero de veces que ocurre un suceso
libro. escn os en este
dado. Por ejemplo, en la tabla 2.3 se proporcionan las frecuencias de los diferentes valores
, De la misma manera que el clculo de la varianza, hay frmulas que simplifican el obtenidos de la concentracin de ion nitrato cuando se tomaron 50 medidas en una muestra.
calculo de la suma de cuadrados. Estas frmulas se resumen en la tabla 34 I l Corno se analiz en el captulo 2, por lo regular se supone que estas medidas se extraen de
.'1' l .. . . en a cua se
un Iza a notacin antenor y tambin se introducen los smbolos: una poblacin que se distribuye normalmente: la prueba chi cuadrada se puede utilizar para
probar si las frecuencias observadas difieren en forma significativa de las que cabra esperar
mmero total de medidas = N = nh con esta hiptesis nula. Puesto que el clculo requerido en este caso es relativamente
suma de las medidas en la z-sima muestra = Ti complicado, no ser descrito aqu. (Al final del captulo se proporciona un ejemplo
suma de todas las medidas, gran total = T ilustrativo desarrollado con detalle.) El principio de la prueba chi cuadrada se comprende
mejor en el siguiente ejemplo:
Tabla 3.4 Frmula para clculos de ANOVA de un factor
Ejemplo. A continuacin se muestra el nmero de roturas en el material de vidrio
Fuente de variacin
SUl11a de cuadrados informadas por 4 trabajadores de un laboratorio a lo largo de cierto periodo. Hay
Grados de libertad
alguna prueba de que los trabajadores difieran en su habilidad?
Entre muestras ;: Tf/n - T2/N h- 1
Dentro de las muestras Nmero de roturas: 24,17,11,9.
por diferencia por diferencia
2
Total LLx
I 1 IJ
- T2/N
La hiptesis nula adoptada es que no hay diferencias en su habilidad. Si los
N 1
trabajadores utilizan el laboratorio el mismo tiempo, se esperara, a partir de la hiptesis
nula, el mismo nmero de roturas por cada trabajador. Puesto que el nmero total de
Se puede entender el funcionamiento de las frmulas en la tabla 3 4 SI' se renit l '1 l roturas es 61, el nmero de roturas esperada por trabajadores es 61/4 = 15.25. Por
de ANOV . pi en os ca cu os
, A para los elatos de la tabla 3.1. El clculo de los cuadrados de la media se expone supuesto, en la prctica no es posible que haya un nmero no entero de roturas: ste
mas adelante. A todos los valores de la tabla 3 1 se les ha restado 100 l . lifi corresponde a un concepto matemtico. La distribucin "igual" ms prxima y mane-
'd b . ., . , o que slmp I tea
~~nsl era ~emente la antmetIca. Note que esto no afecta la estimacin de la varianza entre jable desde un punto de vista prctico es 15, 15,15,16, en algn orden determinado.
uestras ni dentro de las muestras, ya que se ha restado la misma cantidad de cada valor. Se trata de responder la pregunta de si la diferencia entre las frecuencias observadas y
esperadas es tan grande que deba rechazarse la hiptesis nula. Si considerarnos una
Ti Tf serie de lanzamientos de un dado se puede entender mejor por qu existen ciertas
A 2 o 1
B 3 9 diferencias entre los dos conjuntos de frecuencias: sera muy sorprendente, por ejem-
1 1 4
C 6 36 plo, si en 30 lanzamientos aparecieran exactamente con la misma frecuencia los
-3 -5 - 1 -9
D 81
-lO -8 -6 -24 576
nmeros 1, 2, 3, etc. El clculo de chi cuadrada, X\ que es la cantidad utilizada para
T = -24 probar la existencia de diferencias significativas, se muestra a continuacin.
;:Tf = 702
n= 3 h = 4 N = 12 El: xl = 258
ifi pecial denominado papel de probabilidad normal. Este mtodo se
en un papeI gra ICO es
Frecuencia observada, Frecuencia esperada, E O-E (O - E)2/E explica mejor con un ejemplo.
24 15.25 8.75 5.020
17 15.25 1.75 0.201 . l U '1' 1 de probabilidad normal para probar si los valores siguientes
Ejemp o. ti Ice pape
11 15.25 -4.25 1.184 proceden de una poblacin normal:
9 15.25 -6.25 2.561
109,89,99,99,107,111,86,74,115,107,134,113,110,88,104.
0.00 x2 = 8.966
En la tabla 3.5 se muestran los datos acomodados en ord~n crecient~. En la,segUn~a
Note que el total de la columna O - E es siempre cero, con 10 cual se dispone de una columna aparecen las frecuencias acumuladas en cada rnedida, es decir, el numero e
forma til para verificar los clculos.
Si X2 supera un cierto valor crtico, se rechaza la hiptesis. El valor crtico depende,
como en otras pruebas de significacin, del nivel de significacin de la prueba y del Tabla 3.5
nmero de grados de libertad. En un ejemplo de este tipo, el nmero de grados de Frecuencia acumulada en %
Medida Frecuencia acumulada
libertad es uno menos que el nmero de clases utilizado, es decir, 4 - 1 = 3 en este caso.
Los valores crticos de X2 para P = 0.05 aparecen en la tabla A.5. Para 3 grados de 1 6.3
74 12.5
libertad, el valor crtico es 7.81. Puesto que el valor calculado de X2 es mayor que ste 86 2
3 18.8
se rechaza la hiptesis nula a un nivel de significacin del 5%: se han encontrado 88 25.0
pruebas de que los trabajadores difieren significativamente en su habilidad. 89 4
6 37.5
99 43.8
7
r
En este clculo de se obtiene un resultado significativo debido al alto nmero de roturas 104
107 9 56.3
62.5
realizadas por el primer trabajador. Para estudiar esto ms ampliamente se pueden realizar 109 10
11
68.8
pruebas chi cuadrada adicionales. Una de ellas prueba si el segundo, tercero y cuarto 110 75.0
trabajadores difieren significativamente entre s: en este caso, cada frecuencia esperada es 111 12
13 81.3
(17 + 11 + 9)/3. (Note el hecho de que la prueba t no puede aplicarse aqu, ya que estamos 113 87.5
115 14
manejando frecuencias y no variables continuas.) Otras pruebas que permiten analizar si 15 93.8
134
el primer trabajador difiere del resto, es tomar a los tres restantes como un grupo. En este
caso hay dos clases: las roturas hechas por el primer trabajador con una frecuencia esperada
de 15.25 y el total de roturas correspondientes a los otros tres: con una frecuencia
esperada de 15.25 x 3 = 45.75. En estos casos, donde hay slo dos grupos y, por lo tanto,
100
un grado de libertad, se debe aplicar un ajuste conocido como correccin de Yates; esto
implica sustituir O - E por 10 - E I - 0.5, por ejemplo, 4.5 se convierte en 4. Ests pruebas
adicionales se muestran en un ejercicio al final de este captulo.
En general, la prueba chi cuadrada debera utilizarse solamente si el nmero total de Cll
observaciones es 50 o ms y las frecuencias individuales esperadas no son menores que 5.
-e
Cll
:::l
Esto no es una regla rgida: al final del captulo aparece una referencia en la que se E
profundiza en este punto, y se describen tambin otras aplicaciones de la prueba chi :::l
o
Cll
cuadrada. Cll
50
'0
l:
Gl
:::l
3.12 PRUEBA DE LA NORMALIDAD DE UNA DISTRIBUCIN o
...Gl
U.

Como se ha sealado en este captulo, muchas pruebas estadsticas suponen que los datos
utilizados proceden de una poblacin normal. En la seccin anterior se mencion un
mtodo para probar esta hiptesis, utilizando la prueba chi cuadrada. Por desgracia,
este mtodo slo se puede utilizar si hay 50 o ms datos. En el trabajo experimental lo Medida
normal es tener pocos datos. Una forma visual simple de comprobar si un grupo de datos
La curva de frecuencias acumuladas de una distribucin normal.
procede de una poblacin normal es representar una curva de frecuencias acumuladas Figura 3.1
medidas menores o iguales que dicha medida. En la tercera columna se muestra la probar la normalidad, en ella se proporciona tambin una perspectiva de las diferentes
frecuencia acumulada en porcentaje; ste se ha calculado utilizando la frmula: pruebas de normalidad. En la seccin 6.11 se describe otro mtodo, el mtodo de Ko!mo-
gorov-Smirnov que, entre otras aplicaciones, se puede emplear para probar la normalidad.
% frecuencia acumulada = lOO x frecuencia acumuladaf( n + 1) En esa seccin aparece un ejemplo desarrollado.

Donde n es el nmero total de medidas (existen razones matemticas para dividir por
n + 1 en lugar de n): Si los datos proceden de una distribucin normal, la grfica que 3.13 CONCLUSIONES A PARTIR DE LAS PRUEBAS DE SIGNIFICACIN
presenta la frecuencia acumulada frente a las medidas tendr forma de curva en S, como
se muestra en la figura 3.1. Hasta ahora, en este captulo nos hemos dedicado a los diferentes tipos de prue~a de
significacin. En esta seccin profundizaremos ms en lo referente a las conclusiones
El p~pel de probabilidad normal tiene una escala no lineal en el eje del porcentaje de que se pueden extraer de una prueba de significacin. Como se explic e~ la seccin 3.2,
frecuencia acumulada, lo que convierte la curva en forma de S en una lnea recta. Los datos una prueba de significacin, por ejemplo, al nivel P = 0.05, supone un nesgo del 5% de
d.e!a tabla a~1terior, representados en dicho papel, aparecen en la figura 3.2: los puntos se que se rechazar una hiptesis nula incluso aunque sea verdadera. A este tipo de error se
sitan aproxlmada~e~tes~bre una lnea recta, lo cual confirma la hiptesis de que los datos le conoce como error de tipo 1: el riesgo de este error se puede reducir al alterar el nivel
proceden de una distribucin normal. de significacin de la prueba a P = 0.01 o incluso a P ~ 0.001. Sin embargo, ste no es el
nico tipo de error posible: tambin se puede mantener una hiptesis nula aun cuando sea
falsa. Este es el denominado error de tipo 2. Para calcular la probabil.idad de est~ tifO ~e
error es necesario postular una alternativa a la hiptesis nula, conocida como hiptesis
99 alternativa.
98 Considere un producto qumico del cual se piensa que contiene el 3 % de fsforo por
pesada. Al parecer, esta proporcin se ha incrementado y, para probar esto, se ha an~lizado
95 la composicin empleando un mtodo estndar con una desviacin estndar conocida del
Cll
0
'O 90 0.03%. Suponga que se toman 4 medidas y se realiza una prueba de significacin al nivel
.! 0 P = 0.05. Es necesario que dicha prueba sea de una cola, al estar interesados slo en un
::J
E 80 0
::J 0
incremento. La hiptesis nula es:
o 70 0
Cll
Cll 60 0 hiptesis nula, = 3.0%
'
e
Cll
50
40 e
&
::J o
o 30 0
...
Cll
u. o
20
~
0
10 o
5 e
2
1

70 80 90 100 110 120 130


I
Medida I
I

\
\
Figura 3.2 Representacin de la probabilidad normal para el ejemplo de la seccin 3.12. Tipo 2 \
\
\
,,
,
u~ mtodo para probar la normalidad es utilizar una cantidad que mida cunto se
aproximan a una r~cta los puntos representados en el papel de probabilidad normal. El 3.00 -r 3.05
x
Xc
calculo de esta ~antldad, el coeficiente de correlacin, r, se describe en un captulo posterior
(Sec. 5.3). Al fmal de este captulo aparece una referencia bibliogrfica para el uso de r al
Figura 3.3 Errores de tipos 1 y 2.
La lnea continua de la figura 3.3 indica la distribucin muestral de la media si la hiptesis
nula fuese verdadera. Esta distribucin muestral tiene una media 3.0 y una desviacin . unstancias en donde se dispone de dos o ms pruebas para probar la misma hiptesis,
circ . d idi '1 1 .
puede ser til comparar la potencias de las pruebas con el fin de eCI Ir cua es a mas
estndar (es decir, error estndar de la media) a/m = 0.03/14%. Si la media muestral cae
por encima del valor crtico indicado, Xc, se rechaza la hiptesis nula. Por lo tanto, la regin adecuada. .
sombreada, con rea 0.05, representa la probabilidad de un error de tipo 1. Los errores de tipo 1 y 2 son tambin relevantes cuando se aplican secuencialmente
Supongamos que tenernos la hiptesis alternativa: pruebas de significacin. Un ejemplo de esta situacin es la aplicacin de la prueba. t ~ I~
diferencia entre dos medias, despus de utilizar en primer lugar la prueba F para decidir SI
hiptesis altenativa, f.J = 3.05% se pueden juntar o no las varianzas de las muestr~s .(~ans.e las Secs. 3.3 y 3.6). Los do~
errores de tipo 1 y 2 pueden surgir de la prueba F inicial; SI ocurre ~lg~no de ellos querra
decir que los niveles de significacin establecido~ para ~a subsiguiente prueba t son
La lnea punteada de la figura 3.3 indica la distribucin muestral de la media si la hipteisis
incorrectos debido a la forma incorrecta en que ha SIdo aplicada la prueba t.
alternativa fuese verdadera. incluso si ste fuese el caso, se aceptar la hiptesis nula si la
Este ejemplo resalta la conclusin general de que las pruebas de significaci~n no dan
media muestral cae por debajo de z, La probabilidad de este error de tipo 2 se representa
respuestas indiscutibles: ms bien ayudan a la ~nterpretaci~ .de los datos expenmentales
con el rea rayada. El diagrama pone de manifiesto la interdependencia de los tipos de
al dar las probabilidades de que ciertas conclusiones sean vlidas.
error. Por ejem.plo, si se cambia el nivel de significacin a P = 0.01 para reducir un riesgo
de un error de tipo 1, Xc aumentar y el riesgo de un error de tipo 2 se incrementar tambin.
De manera recproca, una disminucin en el riesgo de un error de tipo 2 slo puede lograrse
por un incre~ento en la probabilidad de un error de tipo l. La nica manera por la que BIBLIOGRAFA
pueden reducirse ambos errores (para una hiptesis alternativa dada) es aumentar el tamao
Bamett, V. Y Lewis, T., Outliers in Statistical Data, Nueva York, Wiley, 1978. Un tratamiento muy
de la muestra. Por ejemplo, el efecto de incremento n hasta 9, se ilustra en la figura 3.4: la
completo de la filosofa del rechazo de valores anmalos y las pruebas empleadas. .
disminucin resultante en el error estndar de la media produce una disminucin de ambos
tipos de error, para un valor de xc. Box, G. E. P, Hunter, W. G. y Hunter, J. S., Statistics for ~xperilllentalists,Nueva York, Wlley, 1978.
Proporciona ms detalles sobre los contrastes entre medias en el ANVA.
Campbell, R. c., Statistics for Biologists, Cambridge, Cambridge University Press, 1974. Propor-
ciona pruebas de la homogeneidad de varianzas y de normalidad.

DaVles, O . L . y Goldsmith " P L. Statistical Methods in Research . and Production, rLondres,
.
/ ...... \
I \
Longmans, 1972. Proporciona ms detalles acerca de los errores de TIpos 1 y 2 Y otras ap icaciones
I \
I \ de la prueba chi cuadrada.
I \
I
,
,
\ Filliben, J. J., Technometrics, 1975,17,111. Describe el uso de r al probar la normalidad, y estudia
I
I \
\
otras pruebas de normalidad.
I \
I \
\
Kowalski, B. R. (Ed.), Chemometrics: Theory and App~ication, A~erican Chemical Society, 1?77,
\
\
Washington. El captulo 11 describe pruebas de normalidad y analiza el efecto de la no normalidad
\
\ en las pruebas paramtricas.
\
\
Miller, J. c., Statistics for Advanced Level, Cambridge, Cambridge University Press, 1983. Propor-
\
, ciona un ejemplo de la prueba chi cuadrada para normalidad.
,
I \

I
I \
\
Sokal, R. R. Y Rohlf, F. J., Biometry, Freeman, 1969. Da informacin detallada de las pruebas de la
I \
\
homogeneidad de varianzas.
I
\
I
I
,
I
I ,,
\

I \
\
Tipo 2 \
\
-,
-,
EJERCICIOS
3.00
1. Utilizando una grfica de probabilidad normal, pruebe si el siguiente conjunto de datos podra
haber sido obtenido de una poblacin normal:
Figura 3.4 Errores de tipo 1 y 2 al aumentar el tamao de la muestra.
11.68, 11.12,8.92,8.82, 10.31, 11.88,9.84, 11.69,9.53,10.30,9.17, 10.04, 10.65, 10.91, 10.32,
8.71,9.83,8.90, 10.40
La probabilidad de que se rechace una hiptesis nula falsa se denomina la potencia de
una ~rueba; esto es (l - probabilidad de un error de tipo 2). En el ejemplo expuesto es una 2. Los datos expuestos a continuacin estn tomados del ejemplo de la seclcin ~.3 YI se refieren a
lunclOll de la media especificada en la hiptesis alternativa, y depende tambin del tamao la concentracin de tiol en sangre. Verifique si el dato 2.07 no es un va 01' anoma o.
de la muestra, el nivel de significacin de la prueba, y si sta es de una o dos colas. En
1.84 1.92 1.94 1.85 1.91 2.07
3. Los siguientes datos proporcionan la recuperacin de bromuro adicionado a muestras con Estao encontrado (mg/kg)
Tiempo de ebullicin (min)
contenido vegetal, medido mediante un mtodo de cromatografa gas-lquido. La cantidad de 57,57,55,56,56,55,56,55
bromuro potsico aadido a cada vegetal fue la misma. 30
75 51,60,48,32,46,58,56,51
Tomate 777 790 759 790 770 758 764 .Jgjg
Pepino 782 773 778 765 789 797 782 .Jgjg Pruebe si d b llicic . I
(a) la variabilidad de los resultados es ms grande para tiempos e e u icion mas argos.
(b) las medias difieren significativamente.
(Roughan, J. A., Roughan, P. A. Y Wilkins, J. P. G., Analyst, 1983,108,742.)
8. Los datos dados en el ejemplo de la seccin 3.12, para el nmero de roturas realizadas por cuatro
(a) Pruebe si la recuperacin en los vegetales tiene varianzas que difieran significativamente. trabajadores diferentes, se reproducen a continuacin:
(b) Pruebe si las tasas de recuperacin medias difieren significativamente.
24,17,11,9
4. Los siguientes resultados muestran el porcentaje del agua intersticial total recuperada al
centrifugar muestras de piedras areniscas tomadas de diferentes profundidades.
Pruebe si . d I d I t
(a) el nmero de roturas del primer trabajador difieren significativamente e as e os o ros
Profundidad de la muestra (m) Agua recuperada, %
tres trabajadores; . .' . I f I d 'd d
7 33.3 33.3 35.7 38.1 31.0 33.3 (b) el segundo, tercero y cuarto trabajadores difieren slgmflcatlvamente en a a ta e cm a o
8 43.6 45.2 47.7 45,4 43.8 46.5 de cada uno de los otros.
16 73.2 68.7 73.6 70.9 72.5 74.5
23 72.5 70.4 65.2 66.7 77.6 69.8 9. Los siguientes resultados se obtuvieron al comprar un mtodo nuevo y .ell ofici~~ pa)ra
la determinacin de fenilbutazona. (Las cifras se refieren a los porcentajes dlltodo
e recuperacin.
(Wheatstone, K. G. Y Gelsthorpe, D., Analyst, 1982, 107, 731.)
Mtodo nuevo Mtodo oficial
Demuestre que el porcentaje de agua recuperada difiere significativamente de diferentes 99.35 99.53
Media
profundidades. Utilice el mtodo de la menor diferencia significativa descrito en la seccin 3.9 0.185 0.152
Varianza
para encontrar las causas de este resultado significativo. 3
Tamao de muestra 3
5. Al leer en una bureta 0.01 mI, un analista tiene que estimar la cifra final. La siguiente tabla de (Amer, M. M., Taha, A. H., EI-Zeany, B. A. Y EI-Sawy, O. A., Analyst,1982, 107,908.)
frecuencias proporciona las ltimas cifras de 50 lecturas. Realice una prueba de significacin
adecuada para determinar si se prefieren algunos dgitos a otros. Pruebe si los resultados medios obtenidos por los dos mtodos difieren significativamente.
Dgito 0123456789
10. La siguiente tabla proporciona la cantidad (en mgjrnl) de clorhidra:o de efe.drina en~ontrada en
Frecuencia 16453112837 preparaciones farmacuticas de Ephedrine Elixir B. P., po~ ~os metodos .dlferente~. espectros-
copia ultravioleta de derivadas y un mtodo de ensayo oficial. (La cantidad nommal en cada
6. Para evaluar un mtodo espectrofotomtrico con el fin de determinar titanio, se aplic el mtodo muestra fue de 3 mg/ml.)
a muestras de aleaciones conteniendo diferentes cantidades certificadas de titanio. Los resulta-
dos (% Ti) se muestran a continuacin. Muestra nmero Mtodo de derivadas Mtodo oficial
1 2.964 2.913
Muestra Valor certificado Media Desviacin estndar 3.000
2 3.030
1 0.496 0.482 0.0257 3 2.994 3.024
2 0.995 1.009 0.0248
3 1.493 1.505 0.0287 (Davidson, A. G. YElsheikh, H., Analyst, 1982,107,879.)
4 1.990 2.002 0.0212
Pruebe si los resultados obtenidos por ambos mtodos difieren significativamente.
Para cada aleacin se realizaron 8 determinaciones repetidas.
11. Las siguientes cifras se refieren a la concentracin de albmina, en g/l., en el suero sanguneo
(Qiu Xing-chu y Zhu Ying-quen,Analyst, 1983,108,641.)
de 16 adultos sanos:

Para cada aleacin pruebe si el valor medio difiere significativamente del valor certificado. 37,39,37,42,39,45,42,39,44,40,39,45,47,47,43,41

7. La siguiente tabla muestra otros resultados del artculo citado en la seccin 3.3, concerniente a (Foote, J. W. y Delves, H. T., Analyst, 1983, 108,492.)
la extraccin y detenninacin de estao en comestibles (Analyst, 1983, 108, 109). Los resultados
p:oporcionan los niveles de estao recuperado del mismo producto despus de ebullicin a Las primeras 8 cifras corresponden a hombres y.las s~gu.ndas.8 cifras a mujeres. Pruebe si la
diferentes tiempos en un recipiente abierto. concentracin media para hombres y mujeres difiere significativamente.
12. Se compar un nuevo mtodo espectroscpico de absorcin atmica de llama para d t .
ti . 1 . f . e errnmar
an imonio en a atrns era con el metodo calorimtrico recomendado. Para muestras de atms-
fera urbana se obtuvieron los siguientes resultados:

Antimonio encontrado (mg/rrr')


Muestra mmero Mtodo nuevo Mtodo estndar
1 22.2 25.0
2 19.2 19.5
3 15.7 16.6
4 20.4 21.3
5 19.6 20.7
6 15.7 16.8

(Castillo, J. R., Lanaja, J., Martinez, M. c. y Aznrez, J., Analyst, 1982,107, 1448.)
Control de calidad y muestreo
Difieren significativamente los resultados obtenidos por los dos mtodos?

4.1 INTRODUCCIN

Las pruebas estadsticas descritas en el captulo anterior se aplicaron a situaciones mucho


ms sencillas que las que se presentan en realidad en los laboratorios analticos. Entonces
asumamos que no se presentaba ninguna dificultad o error al obtener las muestras qumicas
que posteriormente seran suministradas para el anlisis. En la prctica, el muestreo causa
problemas en bastantes anlisis directos. El anlisis de boro en muestras de plantas (vase
la Seco 3.3) podra complicarse en la prctica si los niveles de boro varan en diferentes par-
tes de una nica planta, o de una planta a otra. Tambin deben tratarse otros dos problemas:
las variaciones existentes cuando se aplica el mismo mtodo a una muestra o muestras si-
milares en diferentes laboratorios, y la aplicacin de la estadstica a mediciones repetidas
sobre muestras que tenen caractersticas que pueden variar con el tiempo, tales como los
sucesivos artculos de una lnea de produccin. En estos estudios se aplican mtodos esta-
dsticos convencionales (p. ej. pruebas para valores anmalos, pruebas ANOVA, etc.) a
situaciones que son muy importantes en el desarrollo y la aplicacin de mtodos analticos.

4.2 MUESTREO

Este tema es de fundamental importancia porque si no se toma en cuenta la etapa de


muestreo de un anlisis con la consideracin que merece, puede ser que los mtodos
estadsticos descritos en este libro no sean vlidos al aplicarse a los resultados. Un analista
tiene que tratar con muestras ya que en muchos casos es impracticable o imposible analizar
todo el objeto en estudio. Por ejemplo, es impracticable analizar un tanque lleno de leche
para examinar el contenido en grasa, y es imposible analizar toda el agua de un ro para
estudiar un determinado contaminante. Adems, muchas tcnicas analticas son destructi-
vas y no pueden aplicarse a la totalidad de un objeto de valor.
Para ilustrar algunos aspectos del muestreo consideremos la siguiente situacin: dis-
ponemos de un gran lote de pastillas y deseamos obtener una estimacin del peso medio
De la muestra aleatoria pueden calcularse la media, x, y la varianza S2. Existen dos
de una pastilla. En vez de pesar todas las pastillas, tomamos unas pocas (supongamos diez) contribuciones al valor de S2; la varianza muestral, a~, debida a las diferencias entre los
y pesamos cada una de ellas. En este ejemplo el lote de tabletas forma la poblacin y las
elementos de la muestra, por ejemplo, pastillas que tienen distintos p~os, Yla varia~~a
diez pastillas pesadas constituyen una muestra de esta poblacin (vase la Seco 2.2). Si la
en la medicin, a~, por ejemplo, errores aleatorios al pesar cada past~lIa ..En la s~~cIon
muestra se va a utilizar para deducir las propiedades de la poblacin, entonces debe ser lo
siguiente se describe cmo pueden separarse Yestimarse estas dos contnbucIOnes utilizan-
que estadsticamente se denomina como una muestra aleatoria. Esta muestra es tomada
de tal modo que todos los miembros de la poblacin tienen la misma posibilidad de ser doeIANOVA.
incluidos. Slo entonces sern vlidas las ecuaciones como la (2.9), que proporciona los
lmites de confianza de la media. Debemos apreciar que el trmino "aleatorio" tiene, en
4.3 ESTIMACIN Y SEPARACIN DE VARIANZAS UTILIZANDO ANOVA
sentido estadstico, un significado diferente de "casual". Aunque en la prctica un analista
puede diseminar las pastillas sobre una mesa e intentar tomar una muestra de diez de una
En la seccin 3.8 se describi el uso de ANOVA de un factor para probar las diferencias
manera casual, dicho mtodo podra ocultar un sesgo inconsciente. El mejor modo de
entre medias cuando existe una posible variacin debido a un factor de efecto f~jo. En esta
seccin consideraremos la situacin en donde existe un factor de efecto aleatorio, o sea, l~
obtener una muestra aleatoria es mediante el uso de una tabla de nmeros aleatorios. A
cada miembro de la poblacin se le asigna un nmero de tal manera que todos los nmeros
variacin en el muestreo; por lo tanto, el ANO VAde un factor no se utiliza para ~robar SI
tengan la misma cantidad de dgitos, por ejemplo, 001, 002, 003, etc. Entonces, los
varias medidas muestra les difieren significativamente, sino para separar y estimar las
nmeros aleatorios se leen de una tabla de nmeros aleatorios (vase la tabla A.6),
diferentes fuentes de variacin. En la tabla 4.1 se muestran los resultados de la prueba de
partiendo de un punto arbitrario que proporcione, por ejemplo, 964,173, etc., y los nmeros
pureza de un barril de cloruro sdico. Se tomaron cin~o incrementos d.e.~uestra,. de A a E,
correspondientes de la poblacin constituirn la muestra. Un procedimiento alternativo (y
de diferentes partes del barril elegidos al azar, y se realIzaron cuatro anahsI~ re~~tIdos ~obr~
mucho ms simple), que se utiliza algunas veces, es el de seleccionar los elementos de una
cada muestra. Como se explic anteriormente, hay dos fuentes de vanacIO~l posibles:
poblacin a intervalos regulares, por ejemplo, tomar una de cada cien pastillas de una lnea a.
aquella debida al error aleatorio en la medicin de la pureza, dada por la vanan.z en la
de produccin. Este procedimiento no es completamente satisfactorio, ya que podra existir
medicin, a~, Yla que se debe a las variaciones re en la pureza de cloruro S?dICO en
una periodicidad coincidente en el peso de las pastillas. La importancia de la aleatoriedad 2ales
diferentes puntos, dada por la varianza muestra!, al. Puesto que el cuadrado medio dentro
de la muestra es evidente. De nuevo, si las ltimas pastillas tomadas hubieran presentado
de las muestras no depende de la media muestral (vese la Seco 3.9) puede u~arse para
una disminucin gradual del peso durante la produccin del lote, entonces esta muestra
estimar a~. El cuadrado medio entre muestras no se puede utilizar para estimar al en f~r~a
proporcionara un valor completamente errneo del peso medio del lote completo.
directa, ya que la variacin entre medias muestrales se debe al error aleatorio en la m~dIcl0n
En el ejemplo anterior, la poblacin est constituida por elementos discretos obvios
y a las posibles variaciones en la pureza. Se puede d~mostrar que el cuadrado medio entre
los cuales nominalmente son los mismos, o sea, las pastillas. El muestreo de materiales
como rocas, polvo, gases y lquidos, para los que esto no se cumple, se denomina muestreo las muestras proporciona una estimacin de a~ + na (donde, c~mo en la S~c. 3:~, n es e~
nmero de mediciones repetidas). Sin embargo, antes de realizar una estimacion de al
a granel. La falta de unidades identificables conduce a cierta confusin en la nomenclatura,
entonce~ de~era considerarse "muestra" en el sentido coloquial de "una pequea parte
debera hacerse una prueba para ver si difiere significativamente de 0, com~ar~n.do ~os
del c?nJunto , de manera que una muestra correspondiese a una pastilla del ejemplo cuadrados medios entre y dentro de las muestras'. si no difieren de manera sIgmfIcatlva
anter.IOr, o debera considerar el significado estadstico de varias pequeas partes tomadas entonces al
2
= y ambos cuadrados medios estiman
2
ao.
de diferentes lugares del grueso de manera que una muestra correspondiese a varias
tabletas? Para evitar esta confusin en el desarrollo posterior, a una pequea parte tomada
Tabla 4.1 Prueba de pureza de cloruro sdico
del grueso se le denominar incremento de muestra y a un grupo de tales incrementos se
le llamar muestra bruta. Media
Muestra Pureza (%)
. Si un material a granel fuera perfectamente homogneo, slo sera necesario un
lllcremen:o de muestra para determinar las propiedades de la totalidad. En la prctica 98.8,98.798.9,98.8 98.8
A 99.0
los materiales a granel no son homogneos por diversas razones; por ejemplo, las aleacio- B 99.3,98.7,98.8,99.2
98.3,98.5,98.8,98.8 98.6
n~~ y los sedimentos estn formados por partculas microscpicas con diferente composi- e 97.6
D 98.0,97.7,97.4,97.3
cron y ?uede ser que no estn uniformemente distribuidas en el conjunto, o puede ser que 99.3,99.4,99.9,99.4 99.5
los fluidos no sean homogneos en una escala molecular, debido a los gradientes de E
('onc~ntracin. Tal falta de homogeneidad se detecta slo tomando incrementos de muestra
de diferentes partes del conjunto. Para obtener una muestra bruta aleatoria deberan
~~marse d.ichos incrementos en puntos del conjunto elegidos al azar. Esto se puede hacer
A continuacin se desarrolla el clculo de los cuadrados medios utilizando las frmulas
,,1 se co~sIdera el grueso o el conjunto como una coleccin de celdillas y si se seleccionan de la tabla 3.4. A todos los valores de la tabla 4.1 se les resta 98.5, para simplificar la
las celdillas que van a ser muestreadas, utilizando nmeros aleatorios como se describi aritmtica.
anteriormente.
Muestra A 0.3 0.2 0.4
Ti T7 posible. El trmino debido a la varianza de la medicin puede ser reducido ya sea utilizando
0.3 1.2 1.44
Muestra B 0.8 0.2 0.3 un mtodo de anlisis ms preciso o incrementando n, el nmero de mediciones repetidas;
0.7 2.0 4.00
Muestra e -0.2 0.0 0.3 0.3 pero no hay que esforzarse por hacer que la varianza de la medicin sea menor que un
0.4 0.16
Muestra D -0.5 -0.8 -1.1 -1.2 dcimo de la varianza muestral, ya que cualquier reduccin posterior no mejorar en
-3.6 12.96
Muestra E 0.8 0.9 1.4 0.9 4.0 16.00 absoluto la varianza total (que es la suma de las dos). Es preferible, en cambio, tomar un
T=4.0 IT;=34.56 nmero mayor de incrementos de muestra, ya que el intervalo de confianza disminuye
i
cuando aumenta h. Si se ha utilizado una muestra preliminar para estimar s, entonces el
n = 4 h = 5 N= 20 IIx~ = 9.62 tamao de la muestra requerido para lograr un tamao dado del intervalo de confianza se
I J
puede calcular de manera aproximada (vese el Cap. 2, Ej. 4).
Por Una estrategia de muestreo con materiales a granel es tomar h incrementos de muestra
Fuente de variacin Suma de cuadrados diferencia Grados de libertad y mezclarlos antes de hacer n mediciones repetidas. La varianza de la media de stas
Entre las muestras 34.56/4 - 4.0 2/20 = 7.84 4
mediciones es: a~/l + ai/h). Esta varianza total debera compararse con la resultante de
Dentro de las muestras 7.84/4 = 1.96
Cuadrados medios = 0.98 15 0.98/15 = 0.0653
analizar n veces cada incremento de muestra y promediar las medias de los incrementos,
Total 9.62 - 4.0 2/20 = 8.82 19 siendo entonces la varianza a~/lh + a7/h (vese lo anterior). Obviamente la ltima varianza
es la ms pequea, dando por resultado una media con ms presicin, aunque se requieren
Ya que el cuad:ado medio entre las muestras es mayor que el cuadrado medio dentro d ms mediciones (nh frente a n). El conocimiento de los valores a~ y a7 de experiencias
las muestras, al puede diferir significativamente de O Utilizando la pruba F e anteriores, y los costos de muestreo y anlisis, pueden utilizarse para calcular el costo de

1os dos cuadrados medios . para comparar
tenernos: las estrategias de muestreo relativas. Por lo general se usar el esquema ms econmico
que proporcione el grado de precisin requerido.
F4,15 = 1.96/0.0653 = 30 En el caso de los materiales a granel la varianza muestral depende del tamao del
incremento de muestra relativo a la escala de no homogeneidades, y disminuye con el
De la tabla A.2 se desprende que el valor crtco de F es 3.056 (P = O05) El I aumento del tamao del incremento de muestra. En algunas experiencias puede ser
calculad d F I 2 " " va or
o e es mayor, por o tanto al difiere slgmficativamente de O. El cuadrado medio necesario seleccionar un lmite superior de la varianza muestral, de manera que puedan
entr~ las muestras da el valor de 0.065 3 como una estimacin de a~, puesto que el cuadrado detectarse cambios en la media. Pueden tomarse mediciones preliminares para decidir el
medio entre muestras se estima como a~ + nai tenemos: tamao del incremento de muestra mnimo para proporcionar un nivel aceptable de
varianza muestral.
estimacin de ai = (cuadrado medio entre muestras - cuadrado medio
dentro de las muestras)/n
= (1.96 - 0.0653)/4
= 0.47 4.5 ENSAYOS DE COLABORACIN: INTRODUCCIN

Los ensayos de colaboracin pretenden dar respuesta a la siguiente pregunta: "Si la misma
4.4 ESTRATEGIA DE MUESTREO muestra (o una serie de partes alicuotas idnticas de una nica muestra) se analiza por el
mismo mtodo en diferentes laboratorios, los resultados obtenidos sern los mismos dentro
Si se real' T . d
. Iza un ana ISIS e cada uno de los h incrementos de muestra (vese el eiem lo de los lmites de error aleatorio? Muy a menudo se supone que, con el uso de instrumentos
anten?:, Seco 4.3) entonces los lmites de confianza de la media estn dados J PI idnticos en diferentes laboratorios, se obtendrn resultados muy similares cuando se aplica
ecuaclOn (2.9): por a
un mtodo particular a muestras idnticas por cientficos expertos. Por desgracia, la amplia
experiencia prctica, ha mostrado en repetidas ocasiones que esto no se cumple y que
J.L = x t(5/Vh) incluso pueden obtenerse resultados muy divergentes an cuando se piense que se han
tomado todas las precauciones experimentales. Por ejemplo, en un estudio del nivel de
donde - I di d ..
. x es a me la e las tnediciom-, y 52 la varianza de ellas; S2 es una estimacin de la cidos grasos polinsaturados en una muestra de aceite de palma, realizado en 16laborato-
vananza total el que es la sum d i ' . rios diferentes, [ste vari entre 5.5% y 15.0%! La gran variacin fue muy notoria por el
2. " a e as vananzas muestra les y de mediciones es decir 2
;. a~ (vease la Sec..1.6 Y 2.7), Y el/ h (que es estimada por S2/ h) es la varianza d~ la medi; ;0 hecho de que no fue un anlisis de trazas y de que se utiliz un mtodo para determinar
le. valor de cada IIlcremento de muestra es la media de n mediciones repetidas entonces la cidos grasos relativamente sencillo por espectrometra de absorcin, despus de saponi-
~aanan~a.~e la I~e.dia se convi~rte en (a~n + a7)/h = a~nh + a7/h. Es obvio que p~ra alcanzar ficar y digerir con una enzima la muestra original. En otra situacin, al determinar el
preclslOn mxima se reqlllere que la varianza de la media sea tan pequea como fuera porcentaje de aluminio en una muestra de piedra caliza, en diez laboratorios, se obtuvieron
valores en el intervalo del 1.11% al 1.9%.
Estos resultados divergentes deben considerarse con extrema cautela; implican que, laboratorio. Tambin se determinan los valores medios de X y Y Y se dibujan lneas
por ejemplo, una muestra de un alimento que al parecer supera una prueba de seguridad horizontales y verticales a travs del punto (X, 1), con lo cual se divide el diagrama en
en un laboratorio, es probable que no la supere si se examina en otro. El suero sanguneo cuatro cuadrantes.
de un individuo puede parecer completamente normal en un laboratorio y, sin embargo, Si los resultados de los diferentes laboratorios varan por completo debido a errores
indicar un estado patolgico en otro. Tales posibilidades son claramente inaceptables: los aleatorios, las determinaciones de X y Yen cada caso pueden dar resultados que son a la
mtodos analticos que se utilizan en laboratorios diferentes tienen que elegirse con cuidado vez demasiado altos, o demasiado bajos, X alto y Y bajo, o X bajo y Y alto. Estos cuatro
a fin de minimizar las variaciones entre laboratorios y los consiguientes problemas de resultados seran igualmente probables y daran aproximadamente el mismo nmero de
interpretacin de sus resultados. Generalmente slo se adoptarn los mtodos que propor- puntos en cada uno de los cuatro cuadrantes del diagrama. Pero si los errores sistemticos
cion~n pequeas variaciones entre los laboratorios para su uso en anlisis estndar y son la causa predominante de la variacin, podremos esperar que un laboratorio que obtiene
confiables. Se ha prestado mucha atencin al diseo de ensayos de colaboracin, de manera un valor alto de X tiende tambin a obtener un valor alto de Y. Esto conducira a un
que, con el mnimo esfuerzo, produzcan la mxima cantidad de informacin sobre las predominio de puntos en los cuadrantes superior derecho e inferior izquierdo del diagrama,
fuentes y la magnitud de los errores entre los laboratorios. y ste es de hecho el resultado obtenido en prcticamente todos los ensayos de colabora-
cin. Es obvio que, ante la hipottica ausencia de errores aleatorios, todos los puntos
deberan caer sobre la diagonal de 45 del diagrama. En la prctica, ya que en alguna medida
4.6 REPRESENTACIONES GRFICAS DE DOS MUESTRAS los errores aleatorios estn siempre presentes, los puntos caen dentro de una elipse la cual,
tiene esta diagonal como su eje mayor. La longitud de la perpendicular desde un punto
La alarmante dispersin de resultados obtenidos en diferentes laboratorios durante ensa- individual a la diagonal da una medida del error aleatorio, y la perpendicular interseca a la
yos de colaboracin se podra explicar, en principio, por los errores aleatorios de las diagonal en un punto a una distancia de (X , y) que est relacionado con el error sistemtico
mediciones, o por la presencia de diferentes errores sistemticos en diferentes laboratorios. de ese laboratorio. Es evidente que esta aproximacin de dos muestras a los ensayos de
En la prctica, la evidencia es abrumadora en cuanto a que las variaciones son causadas colaboracin puede proporcionar mucha informacin til. Youden ha sealado otras
por errores sistemticos. Este resultado se demuestra mucho mejor usando un diagrama ventajas de esta aproximacin, las cuales se analizarn en la seccin 4.8.
para dos muestr~s (o X - Y), ideado por W. 1. Youden. El principio en que se basa es que
a cada laborat~r~o que cola~ora en el ensayo se le debe enviar dos muestras similares (X y
Y), Y se le solicita que realice una determinacin de cada una. Los resultados se grafican 4.7 LA PREPARACIN DE UN ENSAYO DE COLABORACIN
como se muestra en la figura 4.1, donde cada punto es un par de resultados de un nico
El propsito de un ensayo de colaboracin es claro: evaluar la variacin en los resultados
de un mtodo analtico concreto (a menudo uno nuevo o modificado) cuando se efecta en
una serie de laboratorios. Los resultados se podran utilizar para decidir si el mtodo mismo
es apto para uso general, y quizs tambin para identificar aquellos laboratorios a los que
o se les podra confiar un trabajo analtico importante, por ejemplo, con repercusiones para
o
la salud pblica o de otro tipo de normatividad. De esta manera, al parecer es fcil establecer
o este ensayo. Un nico laboratorio "de arbitraje" (a menudo, en la prctica, un laboratorio
Muestra y
del gobierno) debera enviar una o ms muestras a otros laboratorios, junto con instruccio-
o o
nes detalladas sobre los mtodos analticos que se deban utilizar. Los laboratorios de
colaboracin analizarn las muestras de acuerdo con estas instrucciones, y devolvern sus
o
o o resultados al centro de arbitraje, en donde se evaluarn utilizando mtodos estadsticos. En
o o la prctica, se emplea una buena cantidad de trabajo para establecer y llevar a cabo dicho
o o ~~ ensayo, y se deben tomar decisiones muy importantes antes de enviar las muestras.
o 00 o o <, o Un experimento preliminar decisivo es la prueba de "entereza". Como observamos en
o o o --
o X, y el captulo 1, incluso los experimentos analticos muy sencillos suponen varios pasos
o
0 individuales y, quizs, el uso de un cierto nmero de reactivos. As, muchos factores
0
o experimentales (por ejemplo, temperatura, composicin del disolvente, pH, humedad,
pureza de reactivos y concentracin, etc.) afectarn los resultados, y es esencial que dichos
factores se identifiquen y estudien antes de emprender cualquier ensayo de colaboracin.
Muestra X En algunos casos, un mtodo resulta ser tan sensible a pequeos cambios en un factor, que
en la prctica es muy difcil de controlar (por ejemplo, reactivos de alta pureza), de manera
Figura 4.1 Una representacin grfica de dos muestras de Youden. que se rechaza por ser impracticable antes de que se efecte el ensayo. En otros casos el
ensayo continuar, pero se prevendr a los colaboradores de aquellos factores que deben a insatisfactorio. Otra alternativa es numerar todos los laboratorios disponibles y seleccio-
ser controlados con cuidado. Aunque en el captulo 7 se expone un anlisis ms completo nar a los participantes, mediante una tabla de nmeros aleatorios (vese la Seco 4.2). Por
del diseo experimental, es importante indicar aqu que puede obtenerse mucha informa- supuesto, no se permite seleccionar slo laboratorios de clase alta.
cin de un nmero relativamente pequeos de experimentos. Suponga que se cree que siete La preparacin, el empaquetado y el envo de las muestras es otro elemento importante
factores experimentales (A a G) podran afectar los resultados de un anlisis. Estos factores del ensayo. Es normal tener una reserva de muestra y dividirla entre los laboratorios
tienen que ser probados con (al menos) dos valores, denominados niveles, para ver si son participantes (el arbitro retiene algunas muestras para permitir cualquier experimento
realmente significativos. As, si se pens que la temperatura afectaba el resultado, debemos adicional necesario). Si la muestra no es homognea por naturaleza, pueden surgir los
realizar experimentos preliminares a dos temperaturas (niveles) y comparar los resultados. problemas de muestreo analizados en las secciones precedentes.
De manera similar, si la pureza de los reactivos puede ser importante, se deben realizar
experimentos con lotes de reactivos de alta y baja pureza. Podra pensarse que sern
7
necesarios 2 experimentos preliminares para cubrir todas las combinaciones posibles de 4.8 CLCULOS EN ENSAYOS DE COLABORACIN
siete factores a dos niveles. Sin embargo, en la prctica slo ocho experimentos proporcio-
narn informacin importante. Los dos niveles de los factores se denominan + y -, y la Cuando se concluye el trabajo experimental de un ensayo de colaboracin, y se envan los
tabla 4.2 muestra cmo estn situados en los ocho experimentos, cuyos resultados se datos al organismo de arbitraje, debe realizarse la evaluacin estadstica de los resultados.
denominan Y, Y2, ... , Ys. El efecto de alterar cada uno de los factores de su nivel alto al Estos clculos deberan revelar hasta qu punto la variacin entre los laboratorios partici-
bajo se calcula fcilmente. As el efecto de cambiar B de + a - est dado por: (y + Y2 + Ys pantes se debe a errores sistemticos. En esta seccin se consideran los clculos inherentes
+ Y6)/4 - (Y3 + Y4 + Y7 + ys)/4. Cuando las siete diferencias de los factores A a G hayan sido a dos casos muy simples de ensayos de colaboracin, y tambin algunos de los problemas
calculados en su totalidad de este modo, es fcil identificar cualquier factor que tenga un que pueden surgir en la prctica.
efecto preocupante en los resultados. Se puede demostrar que cualquier diferencia que sea Quizs el caso ms sencillo de ensayo sea aquel en el que a cada laboratorio
ms de dos veces la desviacin estndar de mediciones repetidas es significativa y debera participante se le envia una nica muestra y sobre ella se realizan mediciones repetidas.
estudiarse posteriormente. Este simple conjunto de experimentos, conocido tcnicamente Deben analizarse los resultados enviados al organismo de arbitraje para separar la variacin
como diseo factorial incompleto, tiene la desventaja de que no se pueden detectar las entre las repeticiones de la variacin entre laboratorios. El siguiente ejemplo muestra que
interacciones entre los factores. Este tema se analizar en el captulo 7. esto se puede hacer mediante una aplicacin simple del ANOVA de un factor: en este caso,
tenemos un factor de efecto aleatorio, como se describi en la seccin 4.3.
Tabla 4.2 Pruebade entereza para siete factores Ejemplo: se envi una muestra de pienso medicinal que contiene el factor de crecimien-
Experimento Factores to olaquindox a cinco laboratorios, cada uno de los cuales realiz anlisis por duplicado
Resultado utilizando cromatografa lquida de alta resolucin con un detector ultravioleta. Se
A B e D E F G obtuvieron los siguientes resultados:
1 + + + + + + + y
2 + +
Laboratorio Olaquindox encontrado (rng/kg)
+ Y2
3 + 1 23.0 22.2
+ + Y3
4 + 2 23.8 22.6
+ + Y4
5 + +
3 21.0 23.8
+ ys
+ 4 26.5 27.1
+ + Y6
+ + 5 21.4 21.4
+ Y7
8 + + + ys (Datos tomados de Analytical Methods Commitee, Analyst, 1985, 110, 75).
Estime las variaciones aleatorias y entre laboratorios en este ensayo.
Los clculos ANOVA comienzan restando 20 a cada resultado, lo cual da:
Otro aspecto que se debe establecer antes de comenzar el ensayo es el nmero de
laboratorios participantes. Por supuesto ste no debera ser demasiado pequeo, ya que los Laboratorio T ~
resultados tendran escasa aplicacin general. Puesto que las diferencias sistemticas entre 1 3.0 2.2 5.2 27.04
2 3.8 3.6 7.4 54.76
laboratorios causarn muchas de las variaciones en los resultados, es ms adecuado enviar
3 1.0 3.8 4.8 23.04
unas poca~ ~uestras a numerosos laboratorios que enviar muchas muestras a unos pocos, 4 6.5 7.1 13.6 184.96
au~]q~e utilizar un gran nmero de laboratorios ser costoso y emplear tiempo. En la 5 1.4 1.4 2.8 7.84
practIca, muchos ensayos de colaboracin se realizan en forma satisfactoria con 10 a 20 T= 33.8 L~ = 297.64
laboratorios. Si el centro de arbitraje conoce a los participantes, puede ser correcto 2
seleccionar deliberadamente un intervalo de laboratorios variando en calidad de excelente n=2 h=5 N=IO LLX'i =
I J
153.26
La tabla ANOVA es, entonces: resultado obtenido por cada laboratorio para la muestra A puede incluir un error
sistemtico. El mismo error se incluir presumiblemente en aquel resultado de labora-
Fuente de Grados de Cuadrado torio para la muestra simil~r B. Por 10 tanto, la diferencia D ( = A - B) tendr eliminado
variacin Suma de cuadrados libertad medio este error, de manera que la diversidad de los valores de D proporcionar una estimacin
Entre laboratorios (297.64/2) - (33.W/l0 = 34.576 4 8.644
Dentro del laboratorio por diferencias
de los errores aleatorios o de la medicin. En forma similar A y B pueden sumarse para
= 4.440 5 0.888
Total 153.26 - (33.W/l0 ~ 39.016 9 dar T, cuya diversidad proporciona una estimacin de la variacin global en los
resultados. La varianza de medicin se estima entonces por:
Ya que el cuadrado medio entre laboratorios es mayor que el de dentro de los
laboratorios, se utiliza la prueba F para ver si esta diferencia es significativa. El valor 2 _ r.(D-D?
(4.1)
de F en este caso est dado por: <1 0 - 2(n-l)

F4,5 = 8.644/0.888 = 9.734 y la varianza global, 02, debida a todas las fuentes de error, se estima por:

E? valor. crtico de F4 ,5 (P = 0.05, tabla A.2) es 5.192, por 10 que se concluye que la
(4.2)
diferencia entre los dos cuadros medios es significativa. Esto indica que la variacin
sis~emtica entre laboratorios (Ji
se encuentra muy por encima de cero, y puede
estimarse como [(cuadrado medio entre muestras) - (cuadrado medio dentro de las Advierta que cada una de estas ecuaciones incluye un 2 en el denominador. Esto se
muestras)J/n (vase la Seco 4.3). El valor resultante para (Ji
es 3.878 mostrando justifica porque tanto D como T dan estimaciones de los errores en los dos conjuntos
c~arame~te ~ue la ~~an parte de la variacin de los resultados se debe por supuesto a de resultados, los cuales se restan y suman a D y Trespectivamente. Los resultados de
diferencias sisternaticas entre laboratorios. este ensayo se pueden expresar en una tabla como la siguiente:

En la seccin 4.6 se mostr que un ensayo en el que cada laboratorio realiza una sola 1 2 3 4 5 6 7 8 9
medicin sobre cada una de dos muestras similares, proporciona informacin valiosa A 35.1 23.0 23.8 25.6 23.7 21.0 23.0 26.5 21.4
ac~r~a de los errores aleatorios y los sistemticos. Esta aproximacin tiene la ventaja B 33.0 23.2 22.3 24.1 23.6 23.1 21.0 25.6 25.0
D 2.1 -0.2 1.5 1.5 0.1 -2.1 2.0 0.9 -3.6
adicional de que los laboratorios participantes no tienden a suprimir una o ms determina- T 68.1 46.2 46.1 49.7 47.3 44,1 44.0 52.1 46.4
ciones repetidas, y que se pueden estudiar muchos materiales sin considerar un gran nmero
de experimentos. Otros clculos obtenidos a partir de la tercera y cuarta filas de datos muestran que D =
0.244, y T = 49.33, Yde aqu que la estimacin de (J~ sea (1.383)2, y la estimacin de
Ejemplo. Se dete~n~naron en nueve laboratorios (1-9) los niveles de plomo (en ng/g) 02 sea (5.296)2. Por tanto, Fs,s = (5,296/1.383)2 = 14.67. El valor crtico (P = 0.05) es
en dos muestras similares (A y B) de frmulas de leche en polvo para nios, utilizando 3.44 (tabla A.2). El valor experimental 10 supera ampliamente, de manera que se
espectrome tra de absorcin atmica con horno de grafito. Los resultados fueron: concluye que 02 es de hecho mucho ms grande que (J~. Esto implica, como hemos
visto, que la variacin entre laboratorios no puede explicarse slo por errores de
Muestra Laboratorios medicin aleatorios, y que se han producido errores sistemticos entre laborartorios.
1 2 3 4 5 678 9
A 35.1 23.0 23.8
La componente de 02 debida a estos errores sistemticos, (Ji, se calcula a partir de:
25.6 23.7 21.0 23.0 26.5 21.4
B 33.0 23.2 22.3 24.1 23.6 23.1 21.0 25.6 25.0
(4.3)
Es~i~e la variacin global entre laboratorios y sus componentes aleatorios y siste-
maticos. Note de nuevo la aparicin del 2 en la ecuacin porque se estudian dos muestras. Aqu
es fcil calcular que la estimacin de (Ji
es (3.615)2.
Este ejemplo difiere del anterior en que existen diferencias entre las muestras as
como entre los laboratorios. Por el procedimiento normal, tal situacin debera ser Aunque los ensayos de colaboracin de este tipo parecen muy simples tienen tambin
tr.atada por un ANOVA de dos factores (vase la Seco 7.7). Sin embargo, en este sus problemas. A veces ocurre que un laboratorio no puede tomar las medidas sobre las dos
ejemplo hay solamente dos muestras, elegidas deliberadamente con un contenido o sobre todas las muestras que le mandan, quizs porque se haya perdido o daado una
analtico similar, de manera que no existe inters en evaluar la diferencia entre ellas. muestra durante el envo, o a causa de errores accidentales en el propio laboratorio. La
A~en~s, se puede hacer los clculos por un camino que es numrica y conceptualmente desaparicin de datos presenta problemas de interpretacin que se tratan con profundidad
mas simple que un ANOVA de dos factores. Al realizar el clculo observamos que el en textos ms avanzados.
i
Otro problema avanzado en ensayos de colaboracin es el de los valores anmalos; es 30 .
decir, uno o ms laboratorios pueden generar resultados que al parecer se encuentran fuera 11 + ~~-,-- Linea de accin superior
o .jn l--------------------;-L''=n-:.e-:a de alerta superior
de lugar con respecto al resto. En el segundo ejemplo anterior, resulta obvio que los 20 ~------------~-~---'-_.--'--~---

resultados obtenidos por el laboratorio 1 son considerablemente ms altos que los otros 11+ - , o o
o yln o Valor objetivo
datos, y la aplicacin de la prueba Q (Sec. 3.7) muestra que estos resultados podran ser o
11
rechazados al nivel de probabilidad P ~ 0.05. Si se vuelven a calcular los valores de a~ y
~_-----!IiL--,...--:::_--------
0 u O
20
d- para los laboratorios restantes se demostrara que, aunque el ltimo valor sigue siendo 11 ~~--
L lea de alerta inferior
mayor, la prueba F indica que la diferencia ya no es significativa (P = 0.05). Esto es, si se o .jn
Lnea de accin inferior
eliminase el laboratorio I del ensayo, toda la variacin restante podra deberse slo a errores ::lo
11--~

de medicin aleatorios. En la prctica, el organismo de arbitraje intentar establecer si o .jn


existe alguna razn concreta en cuanto a los resultados de este laboratorio. Si se dispusiera
de tal explicacin, podra plantearse la posibilidad de rechazar los datos.
Muchos ensayos de colaboracin son bastante ms complejos que los vistos hasta
ahora. Por lo regular, se suelen enviar varias muestras a cada uno de los laboratorios
participantes (entre 10 y 20), cada uno de los cuales tomara dos o ms mediciones repetidas
sobre cada muestra. Al efectuar la evaluacin estadstica de los resultados de tales ensayos
Tiempo
se debe tener en cuenta tanto la variacin entre las muestras como los errores de medida
aleatorios y las variaciones entre laboratorios. Dichos clculos se examinan posteriormente Figura 4.2 Un diagrama de Shewhart tpico.
en el captulo 7.

cada 1000), en el caso de que esto ocurra lo normal ser det,ener el proc.e~o e investigar I~
4~ DIAGRAMAS DE CONTROL sucedido. La probabilidad de que x caiga entre cada par de Imeas de accion y de alerta esta
prxima a 0.025 (es decir, 1 en 40): un punto que cayera aqu n~ sera causa de preocupa-
Con mucha frecuencia surge la necesidad de controlar peridicamente la fabricacin de un cin, pero si dos puntos consecutivos caen en esta zona habr~a que detener el ~ro~~so.
producto, quizs para observar si los artculos individuales contienen, en promedio, la Se puede observar que un diagrama de control muestra una sene de ~:uebas de significa-
cantidad correcta de una sustancia dada, y para asegurar que no existe demasiada variacin. cin, correspondiendo las lneas de aviso y de accin a los valores cuneos para ": 0.05.y
Una forma de hacerlo es tomando pequeas muestras a intervalos regulares. Considere la P = 0.003 respectivamente. En ocasiones el proceso se podra detener cuando esta toda VIa
situacin concreta en que se controla el peso de las pastillas que salen de una lnea de bajo control (un error de Tipo 1, vase la Seco 3.13), aunque, el riesgo de que esto suceda
produccin. Idealmente la medida del peso de cada pastilla debera ajustarse a un valor
es bajo. .
exacto, Jo, aunque en la prctica habr cierta variacin aleatoria de una pastilla a otra. Esta Existen dos razones por las que los puntos podran empezar a caer fuera de las lineas
variacin se debe en parte al error aleatorio al realizar la medicin y en parte a las de accin. La primera, la media de los artculos producidos conocida como media del
diferencias reales en peso entre las pastillas. Suponga que conocemos el tamao de la proceso, puede haber derivado hacia fuera del valor obje~ivo; en se~undo lugar uede F
variacin aleatoria global, medida por la desviacin estndar de la poblacin, a, de existir un incremento en la variacin, de manera que las lineas de aviso y de accion no
experiencias anteriores; si el proceso est bajo control, es decir que, los pesos de las indiquen las probabilidades correctas, sino que estn demasiado prximas al valor objetiv~.
pastillas producidas si tienen el peso medio Jo, y desviacin estndar a, entonces para Recprocamente, un descenso en la variacin sgnifica qu~ puede no de.t~ctarse. un.camblO
muestras de Il pastillas, cerca del 95 % de las medias muestrales se encontrarn incluidas en en la media del proceso, debido a que las lneas de aviso y de accion no indican las
el intervalo Jo 2a/fIl y aproximadamente el 99.7% dentro del intervalo Jo 3a/fIl probabilidades correctas y estn demasiado lejos del valor objetivo. ~or estas razones es
[vase Cap. 2, Ecs. (2.5) Y (2.7)). Un diagrama de control es una grfica en la que importante estudiar la variacin de un proceso as como su valor medio, Esto se ~1ace con
se presentan consecutivamente los valores de las medias muestra les de manera que se mayor facilidad utilizando el intervalo, w (es decir, la diferencia entre el valor mas grande
pueda tomar cualquier accin correctora lo ms rpido posible. En la figura 4.2 se mues- y el ms pequeo) de cada muestra tomada. El diagrama de She:vhart adecl~~do se puede
tra un tipo de diagrama de control, conocido como diagrama de Shewhart, para el pro- construir con la ayuda de tablas que proporcionan las lneas de aviso y de accion, y el valor
ceso descrito. Se representa el valor de la media muestral, x, en funcin tiempo, y objetivo de w para valores diferentes de 1/ y a (vase la bibliografa de este captulo): Los
cuando el proceso esta bajo control los valores de x se distribuyen normalmente en torno diagramas de medias e intervalos se utilizan simultneam.ente: y se toman acciones
a Jo. Hay tambin dos pares de lneas horizontales en el diagrama: las lneas de alerta en apropiadas si los puntos caen fuera de las lneas sobre cualquier diagrama.
,Lio 2 a/fIl y las lneas de accin en po 3 a/fIl. El objeto de estas lneas est indicado Todava no hemos considerado con detalle cmo establecer IIn valor para a; esto es
por sus propios nombres. Puesto que la probabilidad de que una media caiga fuera de las decisivo al construir los diagramas de control para x y w; a veces a se denomina capacidad
lneas de accin, cuando el proceso est bajo control, es solamente 0.003 (es decir, 3 de
del proceso, debido a que mide la variacin inherente. Ya que es una desviacin estndar
de una poblacin debe estimarse a partir de una muestra muy grande, por ejemplo, de
pastillas. Esto podra causar dificultades: necesitamos estar seguros de que cuando se tomen 90- Lnea de accin superior
estas medidas no habr derivas en la media del proceso que proporcionaran un valor
errneamente alto de u, pero no hemos construido tadava el diagrama para seguir la Lnea de alerta superior
media! Este problema circular se supera tomando un gran nmero de pequeas muestras 8 5~-----------------
durante un periodo. A partir de cada muestra se puede calcular una estimacin de la varianza
Valor objetivo
dentro de muestras que no se ve afectada por las posibles variaciones entre las muestras.
Estas estimaciones se pueden promediar para dar un valor de la capacidad del proceso 8 O ~--i:~----e-=--~--------
[vase la Seco 3.9 (i)]. En la prctica, por lo general se utilizan los intervalos de las muestras,
Lnea de alerta inferior
ya que esto conduce a clculos ms simples, aunque implica el mismo principio. o
Una consideracin importante al utilizar un diagrama de Shewhart es la rapidez con
que se detecta un cambio brusco en la media del proceso. Cuando sta cambia, el siguiente
punto no caer necesariamente fuera de las lneas de aviso o de accin; por ejemplo, si
cambia en 3 u/m, entonces existe una probabilidad de 1/2 de que el siguiente punto caiga 70
fuera de las lneas de accin, pero si la media del proceso cambia en 1 u/m, esta
probabilidad se reduce a 1/40. El nmero promedio de puntos que se deben representar
antes de que sea detectado un cambio en la media del proceso se denomina longitud media
de racha (LMR). Por supuesto, ello depende del tamao del cambio en la media del
proceso en comparacin con u/m: cuanto mayor sea el cambio, se detectar con ms 1O 15
5
rapidez. Por ejemplo, si la media del proceso cambia en 1 u/m, entonces la LMR antes Nmero de observacin
de que una media muestral caiga fuera de las lneas de accin es aproximadamente de 50.
Si el proceso se detiene cuando dos puntos consecutivos caen fuera de la lnea de alerta, Figura 4.3 Diagrama de Shewhartpara los datos de la tabla 4.3.
la LMR queda aproximadamente dividida por dos. Puesto que la LMR depende del
cambio en la media del proceso comparada con u/Ifl, se puede reducir aumentando el
tamao de la muestra: el mayor tamao que puede tomarse en la prctica suele estar dado
por consideraciones de costos y tiempos: por lo regular se toman tamaos de muestra entre Tabla 4.3 Clculo de la suma acumulada: valor objetivo = 80; u/.fIl (conocido) = 2.5
4 y 6.
Un tipo diferente de diagrama de control, conocido como diagrama de sumas acumu- Nmerode (Media muestral) -
Media muestral (valor objetivo) SA
ladas (DSA), utiliza todas las medias muestrales previas, en lugar de la ltima o de las dos observacin
ltimas como hace el diagrama de Shewhart. SA son las siglas del trmino "suma 82 +2 +2
1 +1
acumulada", es decir, la suma de las desviaciones de las medias muestrales del valor 2 79 -1
80 O +1
objetivo, acumuladas de atrs hacia adelante. Un ejemplo aclarar el clculo: 3
78 -2 -1
4 +1
5 82 +2
Ejemplo. En la tabla 4.3 se proporciona el valor de la media para una serie de muestras. 79 -1 O
6
Se sabe que el valor de u/m es 2.5 y la figura 4.3 muestra el diagrama de Shewhart 7 80 O O
para las medias naturales. Se ve que, aunque no quedan puntos fuera de las lneas de 79 -1 -1
8
78 -2 -3
aviso, una serie de valores cae a un lado del valor objetivo. 9
80 O -3
En la tabla 4.3 tambin se muestra el clculo de las sumas acumuladas. Es obvio 10
76 -4 -7
que si el proceso est bajo control, las desviaciones positivas y negativas son igual- 11
77 -3 -10
12
mente probables, por lo que la suma acumulada debera oscilar alrededor de cero; estos 76 -4 -14
13
valores se encuentran representados en la figura 4.4. Para ofrecer una buena impresin 76 -4 -18
14
75 -5 -23
visual, el DSA aparece dibujado de tal forma que la distancia correspondiente a 15
2 u/m sobre el eje vertical es igual a la distancia entre observaciones sucesivas sobre
el eje horizontal.
Del DSA se desprende que la media del proceso cambi despus de tomar la octava
muestra. Una ventaja del DSA es que indica en qu punto el proceso se sali de control.
30

<l:
20 (f)
<l:
CIl

1O
5 1O 15 Nmero de observacin
O
0 o
o 0
Nmero de observacin o o
o
- 1O o
o
o
-20
o
-3O

Figura 4.4 Diagrama de sumas acumuladas (SA) para los datos de la tabla 4.3.

Figura 4.5 Uso de un delimitador V con el proceso bajo control.

Para probar si una tendencia en un DSA indica que la media del proceso ha cambiado
y que esto no se puede atribuir a simples variaciones aleatorias, puede utilizarse un
delimitador V. Como se muestra en la figura 4.5 un delimitador en forma de V, de
preferencia grabado en plstico claro para poder superponerse (transparencias convencio-
nales), se sita en el DSA con su eje horizontal y su vrtice a una distancia d a la derecha
de la ltima observacin. El semingulo entre los brazos de la V se denomina e. Se dice
<l:
que el proceso est bajo control si todos los valores de la SA caen entre los brazos de la V, CIl
como se indica en la figura 4.5. La figura 4.6 ilustra una situacin en la que el proceso est
fuera de control: dos de los valores de SA se encuentran fuera del brazo superior de la V,
lo que indica que la media del proceso ha cado por debajo del valor objetivo (vanse las
Figs. 4.3 y 4.4). Por supuesto, el rendimiento del delimitador depender de los valores Nmero de observacin
elegidos para ey d. Cuanto mayor sea el valor de d (y menor el valor de e), ms probable
ser que un valor dado caiga fuera de los brazos de la V. Estos valores deben elegirse de
manera que aparezcan pocas falsas alarmas cuando el proceso est bajo control pero que
se detecta rpidamente un cambio importante en la media del proceso. Otros detalles acerca
de la dependencia de la LMR de e y d para diferentes cambios en la media del proceso se
encuentran en una monografa !.c.!. citada en la bibliografa de este captulo. En general,
la LMR para un DSA es inferior que para un diagrama de Shewhart con el mismo tamao
de muestra.
Un DSA tambin puede utilizarse para estimar el tamao del cambio ocurrido en la
media del proceso cuando ste se encuentra fuera de control. Si, por ejemplo, la media del
proceso disminuye en .6., entonces cada media muestral, en promedio, ser el valor objeti va
menos .6.. Como resultado, la SA disminuir en promedio en .6. para cada punto repre-
sentado. As pues, la pendiente promedio de la lnea que une los puntos de la SA Figura 4.6 Uso de un delimitador V con el proceso fuera de control.
proporciona una medida del cambio en la media del proceso y, por consiguiente, la
correccin necesaria.
Los mtodos descritos en esta seccin se pueden utilizar tambin para controlar la Esquema 1: Tome 5 incrementos de muestra, mzc.lelos y re~l.i~e un anli~is por duplicado.
exactitud y precisin de los anlisis de rutina en el laboratorio. A intervalos de tiempo fijos Esquema 2: Tome 3 incrementos de muestra y realice un anlisis por duplicado de cada una.
sobre una muestra estndar, se toma un nmero pequeo de muestras repetidas, y la media
Demuestre que la varianza de la medicin es la misma para ambos esquemas.
y el intervalo de las mediciones repetidas se representan sobre los diagramas de control.
El diagrama de control para la media controla la exactitud, y la concentracin conocida de Qu relacin entre costo de muestreo y costo de anlisis se debe sobrepasar para que e! segundo
analito en el estndar es el valor objetivo. Para el intervalo, esta consideracin controla la esquema sea el ms econmico?
precisin, y el valor objetivo es la capacidad del proceso. De nuevo es necesario establecer
un valor para la capacidad del proceso con el fin de construir los diagramas de control. En 2. Los datos de la tabla adjunta dan la concentracin de albmina medida en el suero sanguneo
de un adulto. Se tom una muestra de sangre durante cuatro das consecutivos y se determin
este caso, la capacidad del proceso estar limitada por el error aleatorio que se produce al
la concentracin de albmina en e! suero por triplicado.
tomar las medidas, en lugar del error que se comete al preparar un estndar. Esto se puede
verificar al preparar una serie de estndares y que cada uno contenga el mismo nivel Da Concentracin de albmina (normalizada, unidades arbitrarias)
(nominal) de analito, y haciendo una serie de mediciones repetidas sobre cada estndar. Se 1 63 61 62
puede utilizar ANOVA para verificar que la varianza entre estndares no sea significativa 2 57 56 56
comparada con el error aleatorio de las mediciones y tambin para estimar esto ltimo. 3 50 46 46
4 57 54 59
Aqu "repetidas" significa una medicin repetida de tal forma que se repiten todas las
etapas del anlisis, estimando de esta manera todas las posibles contribuciones al error Demuestre que la concentracin media para los diferentes das difiere significativamente. Estime
aleatorio. la varianza de la variacin da a da (es decir, "la variacin muestral").

3. Para estimar las varianzas de medicin y muestrales se determin la concentracin de halofu-


BIBLIOGRAFA ginona en hgado de pollo, se tomaron cuatro incrementos de muestra de diferentes ~artes de!
hgado y se hicieron mediciones por triplicado sobre cada una de ellas. Se obtuvieron los
siguientes resultados (mg/kg):
Davies, o. L. y Goldsmith, P. L., Statistical Metliods in Researcli and Production, Londres,
Longmans, 1972. Proporciona ejemplos detallados de cmo se establece la capacidad de procesos Mediciones repetidas
Muestra
en la construccin de diagramas de control.
A 0.25 0.22 0.23
Kateman, G. y Pijpers, F. E., Quality Control in Analytical Chemistry, Nueva York, Wiley, 1981. B 0.22 0.20 0.19
Proporciona un tratamiento muy detallado del muestreo. C 0.19 0.21 0.20
Montgomery, D. C., lntroduction to Statistical Quality Control, Nueva York, WiJey, 1985. Da un D 0.24 0.22 0.22
tratamiento detallado de todos los aspectos del control de la calidad.
Neave, B. R., Elementary Statistics Tables, Londres, Allen & Unwin, 1981. Contiene una tabla con Verifique que la varianza muestral es significativamente ms grande que la varianza de medicin
una descripcin detallada de sus usos para construir diagramas de Shewhart para x y w. y estime ambas varianzas.

Wernimont, G. T., Use ofStatistics to Develop and Evaluate Analytical Methods, Spendley, W. (Ed.), Se proponen dos esquemas disponibles de muestreo:
Association of Official Analytical Chemists, Virginia, Arlington, 1985. Diseado como el sucesor
actualizado de Youden y Steiner (vase ms abajo). Esquema 1: Tome 6 incrementos de muestra, mzclelos y haga mediciones por cuadruplicado.
Woodward, R. B. y Goldsmith, P. L., Cummulative SUIll Techniques, Monografa LC.L No. 3, Esquema 2: Tome 3 incrementos de muestra y sobre cada uno haga mediciones por duplicado.
Edinburgo,Oliver & Boyd, 1964. Un tratamiento detallado de DSA.
Youden, W. J. y Steiner, E. B., Statistical Manual ofthe Association ofOfficial Analytical Chemists, Calcule la varianza total de la media para cada esquema.
Association of Official Analytical Chemists, Virginia, Arlington, 1975. Un manual clsico sencillo
y bien escrito sobre los ensayos de colaboracin. 4. Para estimar la capacidad de un proceso, se hicieron mediciones sobre 6 muestras de tamano 4,
como se muestra en la tabla adjunta (en la prctica se necesitaran al menos 25 de tales muestras).
Bartley,1'. F., Computerized Qualit Control: Programs for the Analytical Laboratory. Chichester, Estime la capacidad de! proceso, a. Si e! valor objetivo es 50, calcule las posiciones de las lneas
Horwood, 1987. Proporciona programas de computador para utilizarlos en control de calidad: los de aviso y de accin de un diagrama de Shewhart para la media muestra!.
programas tambin se encuentran disponibles en disquetes.
Muestras Valores
1 48.8 50.8 51.3 47.9
2 48.6 50.6 49.3 49.7
EJERCICIOS 48.2 51.0 49.3 50.3
3
4 54.8 54.6 50.7 53.9
Se proponen dos esquemas de muestreo para una situacin en la que se sabe, por anteriores 5 49.6 54.2 48.3 50.5
experiencias, que la varianza muestra! es 10 Y la varianza de medicin es 4 (en unidades 6 54.8 54.8 52.3 52.5
arbitrarias).
5. En un ensayo de colaboracin, se enviaron dos muestras muy similares de aceite (A y B) a 15
laboratorios, cada uno de los cuales realiza una determinacin del nivel de cadmio en cada
muestra utilizando la tcnica de emisin de plasma por acoplamiento inductivo. Se obtuvieron
los siguientes resultados:

Laboratorio Niveles de Cadmio (ppm)


A B
1
2
3
4
8.8
3.8
10.1
8.0
10.0
4.7
12.1
11.0
=============i=
5 5.0 4.7
6 5.2 6.4
7
8
6.7
9.3
8.7
9.6
Errores en anlisis instrumental;
9
10
6.9
3.2
7.5
2.8
regresin y correlacin
11 9.7 10.4
12 7.2 8.3
13 6.5 6.8
14 9.7 7.2
15 5.0 6.0

Dibuje el diagrama de estas dos muestras para estos datos y comente la principal fuente de
error en el ensayo de colaboracin. Estime la varianza global, la varianza de medicin, y el s.i ANLISIS INSTRUMENTAL
componente de error sistemtico de la varianza de los resultados.
Las tcnicas de anlisis clsico o "qumica hmeda" como volumetras y gravimetras se
utilizan todava en muchos laboratorios y tambin se ensean ampliamente en cursos de
Qumica Analtica. Dichas tcnicas suministran excelentes introducciones a la manipula-
cin y otras prcticas requeridas en el trabajo analtico; son ideales para anlisis de alta
precisin, especialmente cuando se utiliza un pequeo nmero de muestras, y son necesa-
rias para el anlisis de materiales estndar. Sin embargo, en este momento no hay duda de
que muchos anlisis se efectan por mtodos instrumentales. Las tcnicas que utilizan
espectrometria de absorcin y emisin a varias longitudes de onda, diferentes mtodos
electroqumicos, espectrometra de masas, cromatografa gaseosa y lquida, y mtodos ra-
dioqumicos y trmicos, probablemente suponen el 90% de todo el trabajo analtico actual,
o incluso ms. Hay varias razones para esto.
(1) Los mtodos instrumentales pueden realizar anlisis que son difciles o imposibles
por los mtodos clsicos. Mientras que stos pueden detectar slo rara vez especies
qumicas a niveles de submicrogramos, muchos mtodos instrumentales son sorprenden-
temente sensibles. Por ejemplo, los mtodos luminiscentes han detectado molculas
orgnicas a nivel de lO-1 8M. Por 10 general, slo es posible determinar un analito a la vez
por mtodos de "qumica hmeda", si bien la espectrometra de plasma puede determinar
diez o ms elementos simultneamente (y a muy bajas concentraciones), mientras que los
mtodos que combinan HPLC (cromatografa lquida de alta resolucin, high-performance
liquid chromatography) con deteccin espectroscpica pueden identificar y determinar
muchos componentes de mezclas orgnicas complejas en pocos minutos. An ms, el
intervalo de concentracin de un mtodo concreto de anlisis clsico est normalmente
limitado por consideraciones terico-prcticas. As, titulaciones con AEDT (EDTA, en
ingls) pueden realizarse con xito con concentracin de reactivo del orden de 1O-4M,
aunque se establece un lmite superior (-o. 3M ) por la solubilidad del AEDT en agua. El
intervalo de concentracin til en mtodos clsicos es generalmente de 2 a 3 rdenes de
magnitud (es decir, potencias de 10). Por el contrario, algunos mtodos instrumentales
pueden determinar concentraciones de analito en el intervalo de seis o ms rdenes de
magnitud: esta caracterstica tiene importantes repercusiones para el tratamiento estadsti-
co de los resultados, como veremos en la prxima seccin.
Seal
(2) Para una gran variedad de muestras, el anlisis instrumental suele ser ms rpido y
a menudo ms barato que los mtodos manuales que requieren de mucha mano de obra.
En anlisis clnicos, por ejemplo, se presenta con frecuencia la necesidad de realizar el
mismo anlisis en una veintena o incluso en cientos de muestras de sangre o suero
sanguneo o plasma cada da; a pesar del alto costo inicial del equipo, esto, se realiza, por
lo general, usando sistemas completamente automticos. La automatizacin ha llegado a
ser un aspecto tan importante en qumica analtica, que la facilidad con la cual puede
automatizarse una tcnica concreta a menudo determina si se utiliza o no.
Un mtodo automtico tpico ofrece la posibilidad de procesar muestras a razn de cien
por hora o ms: el equipo tomar un volumen medido de muestra, la diluir adecuadamente,
provocar una o ms reacciones, y determinar y registrar la concentracin del anal ita o
un derivado producido en las reacciones. Evidentemente en el anlisis automtico surgirn
problemas especiales de estimaciones de error; los errores sistemticos, por ejemplo, deben
ser identificados y corregidos tan rpido como sea posible.
(3) Los instrumentos analticos modernos pueden ponerse fcilmente en interfaz con
computadores. La tendencia actual consiste en utilizar microcomputadores de 8 bits o
16 bits con dispositivos de almacenamiento de informacin de disco duro o blando. Tales
sistemas pueden traer consigo un grado de perfeccionamiento razonable en el control del
instrumento y manejo de datos. Por ejemplo, el computador puede controlar tiempos de
muestreo o aparatos de inyeccin mediante activacin elctrica con conmutadores. Una Nmero de observacin
vez que se han obtenido los resultados analticos, el computador puede procesar los datos, Figura s. Procedimiento de calibracin en anlisis instrumental: O puntos de calibracin;
realizando operaciones tales como la generacin de derivadas de espectros o transformadas muestra problema.
de Fourier. Tambin puede evaluar los resultados estadsticos -el tema recurrente de este
libro-, y comparar los resultados analticos con datos almacenados en su memoria, as
como comparar espectros y otros datos. Todos estos recursos se consiguen con compu- obtener la concentracin de analito en cualquier muestra problema por interpolacin, como
tadores de bajo costo que funcionan a velocidades aceptables. Otra posibilidad importante se indica en la figura 5.1. Este procedimiento general plantea varias preguntas estadsticas
es el desarrollo de instrumentos "inteligentes" que realizan, por ejemplo, procesos de importantes.
optimizacin automticos (vase el Cap. 7). No hay duda de que con los recursos de los
computadores y su rpida incorporacin a la gran mayora de los instrumentos analticos, (1) Es lineal la grfica de calibracin? Si es una curva, qu forma tiene?
stos aumentarn su potencialidad y eficencia. (2) Teniendo en cuenta que cada uno de los puntos de la lnea de calibracin est sujeto
a errores, cul es la mejor lnea recta (o curva) que pasa por esos puntos?
(3) Suponiendo que la calibracin es realmente lineal, cules son los errores estimados
5.2 GRFICAS DE CALIBRACIN EN ANLISIS INSTRUMENTAL y los lmites de confianza para la pendiente y la ordenada en el origen de la recta?
(4) Cuando la grfica de calibracin se usa para el anlisis de una muestra problema,
La capacidad de las tcnicas de anlisis instrumental para manejar un intervalo amplio de cules son los errores y los lmites de confianza para la concentracin determinada?
concentraciones de analito significa que se calculan los resultados, y se evalan los errores (5) Cul es el lmite de deteccin del mtodo? Esto es, cul es la menor concentracin
aleatorios de una manera concreta, que difiere de la que se utiliza cuando se repite una sola de analito que se puede detectar con un nivel de confianza predeterminado?
medicin varias veces. El procedimiento habitual es como sigue. El analista toma una serie
de muestras (normalmente tres o cuatro, y posiblemente alguna ms) en las que se conoce Antes de abordar estas preguntas detalladamente, debemos considerar una serie de
la concentracin de analito. Estas calibraciones estndar se miden en el instrumento aspectos sobre el trazo de grficas de calibracin. Primero, por lo regular,.es esencial ~ue
analtico en las mismas condiciones que las usadas para las muestras problema (es decir, los estndares de calibracin cubran el intervalo completo de concentraciones requerido
las "desconocidas"). Una vez que se ha establecido la grfica de calibracin, se puede en los anlisis subsiguientes. Con la importante excepcin del "mtodo de las adiciones
valores de x, por lo general, se denomina x y la media de los valores de y, y: la posicin (x,
estndar", que se tratar en una seccin posterior, la concentracin de muestras problema
se determina normalmente por interpolacin y no por extrapolacion. En segundo lugar, es y) se conoce como el "centro de gravedad" de todos los puntos.
Para estimar si los puntos experimentales se ajustan bien o no a una lnea recta,
muy importante incluir el valor de una muestra "en blanco" en la curva de calibracin.
calculamos el coeficiente de correlacin momento-producto, r. Para simplificar, deno-
La muestra en blanco no contiene ningn analito agregado deliberadamente, pero contiene
minaremos a este dato estadstico como "coeficiente de correlacin" debido a que en las
los mismos disolventes, reactivos, etc., que las otras muestras problema, y est sujeta
ciencias cuantitativas es el ms usado; sin embargo, encontraremos otros coeficientes de
exactamente a la misma secuencia del procedimiento analtico. La seal del instrumento
dada por la muestra en blanco no ser a menudo cero. Desde luego, est sujeta a correlacin en el captulo 6. El valor de r est dado por:
errores, como los otros puntos de la calibracin, y no tiene sentido, en principio, sustraer
el valor del blanco de los otros valores estndar antes de dibujar la grfica de calibracin.
Finalmente, se debe subrayar que la curva de calibracin se representa siempre con la (5.2)
respuesta del instrumento en el eje vertical (y) y la concentracin estndar sobre el eje
horizontal (x). Esto se debe a que muchos de los procedimientos que se describen en las
secciones siguientes suponen que todos los errores se presentan en los valores de y y que Un minucioso estudio de esta ecuacin muestra que r puede tomar valores en el intervalo
las concentraciones estndares (valores de x) se encuentran libres de error. Este supuesto de -1 ~ r ~ + l. Como se indica en la figura 5.2, un valor de r de -1 describe una correlacin
se analiza posteriormente. negativa perfecta, es decir, todos los puntos experimentales estn en la lnea recta de
pendiente negativa. En forma similar, cuando r = + 1, tenemos una correlacin positiva
El lector debera considerar que los mtodos descritos ahora siguen generando contro-
perfecta, ya que todos los puntos estn exactamente en una lnea recta de pendiente
versia, lo cual es patente en muchas reuniones cientficas y trabajos originales acerca de
la calibracin. Muchas de estas controversias derivan del hecho de que los mtodos
utilizados generalmente se apoyan en dos supuestos. El primero es el que mencionamos en
el prrafo anterior, o sea, que los errores en la calibracin slo ocurren en los valores de y.
En muchos anlisis instrumentales de rutina, este supuesto puede estar bien justificado.
Los estndares pueden prepararse con un error de ca. 0.1 % o inferior (vase el Cap. 1),
mientras que las mediciones instrumentales podran tener un coeficiente de variacin del y
1 al2 % o mayor. No obstante, con la aparicin en los ltimos aos de algunos instrumentos
automticos de alta precisin nuevamente se han cuestionado estos supuestos, lo que ha
llevado a algunos usuarios a preparar sus disoluciones estndar por peso en lugar de usar
la combinacin de peso y volumen, que es menos exacta.
El segundo supuesto es que la magnitud de los errores en y sea independiente de la
concentracin de analito. El sentido comn indica que es improbable que esto sea verdad:
si, por ejemplo, los errores relativos en la medicin son constantes, los errores absolutos
aum~~tarn a medida que aumenta la concentracin de analito. Como veremos, es posible
modificar el procedimiento estadstico teniendo en cuenta tales factores; sin embargo, en
la prctica los procedimientos modificados (y bastante ms complejos) parece que no se
adoptan en muchos de los casos donde deberan utilizarse.

5.3 EL COEFICIENTE DE CORRELACIN MOMENTO-PRODUCTO


o o
Aqu se analiza el primer problema planteado en la seccin anterior: es lineal la repre-
o o
sentacin grfica de la calibracin? Supongamos que la representacin de una lnea recta r =O
toma la expresin algebraica: o
o
y ~ bx + Q (5.1) o
o
donde b es la pendiente de la recta y Q su ordenada en el origen (punto donde corta al eje x
y). Los puntos individuales sobre la lfnea se denotarn por (Xl, Yl) (normalmente la lectura
del "bl anca ") , (X2, Y2 ) , (X3, Y3) ... (X, y)... (x YII), es decir,
lI ,
. hay n puntos. La media
. de los Figura 5.2 El coeficiente de correlacin momento-producto, r.
25
positiva. Cuando no existe correlacin entre x y y, el valor de r es cero. En la prctica
analtica, las grficas de calibracin proporcionan frecuentemente valores numricos de r
mayores que 0.99; los valores de r menores que 0.90 son relativamente poco comunes. Un
ejemplo tpico de un clculo de r ilustra una serie de aspectos importantes.

Ejemplo. Se ha examinado una serie de soluciones estndar de fluorescena en un 20


fluormetro, y condujo a las siguientes intensidades de fluorescencia (en unidades
arbitrarias) :

Intensidad de fluorescencia: 2.1 5.0 9.0 12.6 17.3 21.0 24.7


Concentracin, pgJml: O 2 4 6 8 10 12 Cll
'(3
e 15
Ql
Determine el coeficiente de correlacin, r. o
I/l
En la prctica, estos clculos seguramente se realizarn en una calculadora progra- ...o
Ql
Y
mable o en un microcomputador, pero es importante, e instructivo, examinar un resul- ~
:;:
tado calculado manualmente. Los datos se presentan en una tabla, como la que sigue.

y. X 10
Xi Xi - (Xi - X)2 Yi - Y (y - Y)2 (Xi X)(y Y)
O 2.1 -6 36 -11.0 121.00 66.0
2 5.0 -4 16 -8.1 65.61 32.4
4 9.0 -2 4 -4.1 16.81 8.2
6 12.6 O O -0.5 0.25 O Pendiente = 1.93
8 17.3 2 4 4.2 17.64 8.4
10 21.0 4 16 7.9 62.41 31.6 5
12 24.7 6 36 11.6 134.56 69.6
42 91.7 O 112 O 418.28 216.2
x = 42/7 = 6; Y = 91.7/7 = 13.1 Ordena en el origen = 1.52

Los nmeros que se encuentran por debajo de la lnea, al pie de las columnas, son en
cada caso las sumas de los nmeros de la tabla. [Note que I(x, - x) y I(y - y) ambos o 2 4 6 8 10 12

son cero.] Usando estos totales y la ecuacin (5.2), tenernos


Concentracin, pg/ml

1 Figura 5.3 Grfica de calibracin de los datos dE LA Pg. 92.


r = 216.2/012 x 418.28)2"
= 216.2/216.44
= 0.9989
Aunque los coeficientes de correlacin son sencillos de calcular, tambin son mal
Do~ observaciones se siguen de este ejemplo. Como se muestra en la figura 5.3, aunque interpretados con facilidad. Debe tenerse en cuenta que el uso de la ecuacin (5.2)
vanos de los puntos se desvan notablemente de la "mejor" lnea recta (calculada utilizando generar un valor de r aun cuando los datos sean claramente de carcter no lineal. En la
los principios de la seccin siguiente), el valor de r es muy cercano a 1. La experiencia figura 5.4 se muestran dos ejemplos en los que un clculo de r llevara a conclusiones
muestra que aun con grficas de calibracin bastante pobres a la vista los valores errneas. En la figura 5.4(a), los puntos de la grfica de calibracin pertenecen a una curva;
corres.~ondientes de r son altos. En tales casos, el numerador y el deno~inador en la esta curva es suficientemente suave, aunque se obtiene un alto coeficiente de correlacin
e~uaclOn (5.2) son aproximadamente iguales. Entonces es muy importante realizar el cuando se aplica la ecuacin (5.2). De este ejemplo deducimos que siempre hay que
calc~lo con un I~mero adecuado de cifras significativas. En el ejemplo dado, despreciar representar fsicamente la curva de calibracin (en papel milimetrado o en monitor de
la~ .clfras.despues. del pu~to decimal dara un valor incorrecto de r de exactamente 1, Y computador): si no es as, del clculo de r se puede deducir errneamente una relacin
utilizar s?lo una CIfra decimal supondra un valor incorrecto de r de 0.9991. Este aspecto de carcter lineal. La figura 5.4(b) es una advertencia de que un coeficiente de correla-
es esp~clalmente importante cuando se usa una calculadora o microcomputador para cin cero no significa exactamente que y y x no estn relacionados, sino que no estn
determinar r; tales herramientas no siempre proporcionan suficientes cifras. linealmente relacionados.
5
Y
5.4 LA RECTA DE REGRESIN DE Y SOBRE x
(a)
4
En esta seccin, suponemos que existe una relacin lineal entre la seal analtica (y) y la
/
V
/ concentracin (x), y mostramos cmo calcular la "mejor" lnea recta a travs de los puntos
3
/
/ '" de la grfica de calibracin, cada uno de los cuales est sujeto a un error experimental.
"/
/ Hasta aqu hemos supuesto que todos los errores se encuentran en y (vase la Seco 5.2),
2 // ahora trataremos de buscar la recta que minimice las desviaciones en la direccin y entre
/
los puntos experimentales y la lnea calculada. Ya que algunas de esas desviaciones
(tcnicamente conocidas como los residuos de y) sern positivas y otras negativas, es
rezonable intentar minimizar la suma de los cuadrados de los residuos. Esto explica el
r = 0.986 uso frecuente del trmino "mtodo de los mnimos cuadrados" para este procedimiento.
O
5 La lnea recta buscada se calcula basndose en este principio: la lnea debe pasar por el
(bl r = O "centro de gravedad" de los puntos, (x, y). Puede demostrarse que
4
E {(x - i) (y - y)}

b =-------::-- (5.4)

a = y - bi (5.5)

La lnea calculada de esta forma se conoce como la recta de regresin de y sobre x, es


decir, la recta indica cmo vara y cuando x se ajusta a los valores elegidos. Es muy
O'"'--.........---.L--..L...-_--O"_--J.~ importante notar que la recta de regresin de x sobre y no es la misma recta (excepto en el
O 2 3 4 5 caso muy improbable donde todos los puntos caigan sobre una lnea recta, exactamente
x cuando r ~ 1. La recta de regresin de x sobre y (que tambin pasa por el centro de gravedad
de todos los puntos) supone que todos los errores ocurren en la direccin X. Si se mantiene
Figura 5.4 Interpretaciones errneas del coeficiente de correlacin, r. rigurosamente el convenio de que la seal analtica se representa siempre sobre el eje y y
la concentracin sobre el eje x, debemos usar siempre la recta de regresin de y sobre.x en
los experimentos de calibracin.
Como hemos visto, los valores de r obtenidos en anlisis instrumental son generalmente
muy altos, de manera que un valor calculado, junto con la propia grfica de calibracin, Ejemplo. Calcule la pendiente y ordenada en el origen de la recta de regresin para los
suele ser suficiente para asegurar al analista que de hecho ha obtenido una relacin lineal datos expuestos en el ejemplo anterior (Sec. 5.3).
til. Sin embargo, en algunas circunstancias, se obtiene valores de r mucho ms bajos; una En la seccin 5.3 calculamos que, para esta curva de calibracin:
de estas situaciones se analizar posteriormente en la seccin 5.9. En estos casos ser
necesario utilizar una prueba estadstica adecuada para ver si el coeficiente de correlacin I(x-x)(y-y) =216.2; I(x-x)2=112; x=6; y=13.1.
i i
es realmente significativo, considerando el nmero de pares de valores usados en su
clculo. El mtodo ms simple es calcular un valor t (vase el captulo 3 para un estudio
Usando la ecuaciones (5.4) y (5.5) calculamos que
ms completo de la prueba t), usando la ecuacin
b ~ 216.12/112 ~ 1.93
a = 13.1 - (1.93 6) = 13.1 - 11.58 = 1.52
(5.3)
La ecuacin para la recta de regresin es y = 1.93x + 1.52.

El valor calculado de t se compara con el tabulado al nivel de significacin deseado, usando Es obvio que los trminos utilizados para calcular r son necesarios tambin en el clculo
una prueba t de dos colas y (n - 2) grados de libertad. La hiptesis nula en este caso es que de a y b: esto se facilita con una calculadora o un programa de computador sencillo.
no existe correlacin entre x y y. Si el valor calculado de t es mayor que el tabulado, la Los resultados de los clculos de la pendiente y ordenada en el origen se representa en
hiptesis nula se rechaza; esto es, se concluye que existe una correlacin significativa. la figura 5.3. De nuevo es importante recalcar que la ecuaciones (5.4) y (5.5) no deben
emplearse mal porque slo darn resultados tiles cuando un estudio previo (clculo de r
y una inspeccin visual de los puntos) indique que una lnea recta es coherente con el y
experimento que se trata. Para calcular rectas de regresin pueden usarse tambin mtodos
no paramtricos (es decir, mtodos que no hacen suposiciones acerca de la naturaleza de ,
la distribucin del error): este tema se trata en el prximo captulo. 6

5.5 ERRORES EN LA PENDIENTE Y ORDENADA EN EL ORIGEN Xs , Ys Cj)


A '
DE LA RECTA DE REGRESIN X s, Ys '

.,
La recta de regresin calculada en la accin anterior se utilizar en la prctica para X 4 Y4
estimar la concentracin de las muestras problema por interpolacin, y quizs tambin O X 4, Y4
para estimar el lmite de deteccin del procedimiento analtico. Los errores aleatorios en
los valores de la pendiente y de la ordenada en el origen son importantes, por lo que
consideramos ahora las ecuaciones utilizadas para calcularlos. Primero debemos calcular
el dato estadstico Sy/x , que est dado por:

_{7 yy},
(Yi -
(5.6)
Sy/x -
n- 2

Se comprueba que esta ecuacin utiliza los residuos de y, Yi - Ji, donde los valores Ji son
los puntos sobre la recta de regresin calculada, correspondientes a los valores individuales
de x es decir, los valores de y "ajustados" (Fig. 5.5). El valor de J para un valor de x dado x
se calcula rpidamente a partir de la ecuacin de regresin. La forma de la ecuacin
(5.6) es similar a la de la ecuacin de la desviacin estndar de una serie de mediciones Figura 5.5 Los residuosde y de una regresinlineal.
repetidas [Ec. (2.2)]; pero difiere en que las desviaciones (yi - y), son sustituidas por los
residuos, (yi - Yi), Y el denominador contiene el trmino (n - 2) en vez de (n - 1). En un
clculo de regresin lineal el nmero de grados de libertad (vase la Seco 2.4) es (n - 2). Ejemplo. Calcule la desviacin estndar y los lmites de confianza para la pendiente y
Esto refleja el hecho obvio de que para representar una lnea recta slo se necesitan dos la ordenada en el origen de la recta de regresin calculada en la seccin 5.4.
puntos. Es posible que no realicemos este tipo de clculo directamente en una calculadora
Despus de obtener un valor de Sy/x, podemos calcular Sb y Sa, las desviaciones estndar programable, aunque se han desarrollado programas de computador tiles (vase la
para la pendiente (b) y la ordenada en el origen (a). stas estn dadas por: bibliografa del captulo 1). Aqu se efecta el clculo manualmente, utilizando una
tabla estructurada como antes.

(5.7) ,
2 (yi -),i)2
Xi Xi Yi Yi lYi - Yil
O O 2.1 1.52 0.58 0.3364
X; }' 2 4 5.0 5.38 0.38 0.1444
s; = Sy/x { n ~Xi if
- (5.8) 4
6
16
36
9.0
12.6
9.24
13.10
0.24
0.50
0.0576
0.2500
1

8 64 17.3 16.96 0.34 0.1156


10 100 21.0 20.82 0.18 0.0324
Los valores de Sb y Sa se pueden utilizar de la manera usual (vase el Cap. 2) para estimar
12 144 24.7 24.68 0.02 0.0004
lmites de confianza para la pendiente y la ordenada en el origen. As, los lmites de
confianza para la pendiente estn dados por b ts., donde el valor de t se obtiene para un Lxl ~ 364 L(yi - )')2 = 0.9368
;
nivel de confianza deseado y (n - 2) grados de libertad. De manera similar, los lmites de
confianza para la ordenada en el origen estn dados por a ts.; A partir de la tabla, y utilizando la ecuacin (5.6) se obtiene
Syjx = /0.936815 = /0.18736 ~ 0.4329. Como se esperaba, la ecuacin (5.10) se reduce a la (5.9) si ni = 1. Como siempre, los
lmites de confianza pueden calcularse como Xo tsxQ, con (n - 2) grados de libertad. Como
De la seccin 5.3 sabemos que f(Xi - x? ~ 112, Y la ecuacin (5.7) puede utilizarse para
mencionamos antes, un programa de computador simple realizar todos estos clculos,
mostrar que
aunque muchas calculadoras preprogramables no sern del todo adecuadas.
Sb = 0.4329/1TiT = 0.4329/10.58 = 0.0409. Ejemplo. Usando los datos del ejemplo de la seccin 5.3, determine los valores de Xo y
SxQ ylos lmites de confianza de Xo para soluciones con intensidades de fluorescencia
El valor de t para (n - 2) = 5 Yel nivel de confianza del 95% es 2.7 (tabla A.1). Entonces
los lmites de confianza al 95% para b son de 2.9, 13.5 Y23.0 unidades.
Los valores de Xo se calculan fcilmente utilizando la ecuacin de regresin
b = 1.93 2.57 x 0.0409 = 1.93 0.11 determinada en la seccin 5.4, y ~ 1.93x + 1.52. Sustituyendo los valores de yo 2.9, 13.5
y 23, obtenemos los valores de Xo de 0.72,6.21 y 11.3 pg/ml respectivamente.
La ecuacin (5.8) requiere conocer xl, calculado de la tabla como 364. As, podemos Para obtener los valores de SxQ correspondientes a los valores de Xo utilizamos la
escribir ecuacin (5.9), recordando de las secciones precedentes que 11 = 7, b = 1.93, Syjx =
0.4329, Y = 13.1, Y (Xi - X)2 = 112. Los valores de yo 2.9, 13.5 Y 23.0 proporcionan
i
Sa ~ 0.4329/ (364;784) = 0.2950 unos valores de SxQ de 0.26, 0.24 y 0.26, respectivamente. Los lmites de confianza
correspondientes al nivel del 95 % (t = 2.57) son 0.72 0.68, 6.21 0.62 y 11.3 0.68
de manera que los lmites de confianza son
pg/ml respectivamente.
a = 1.52 2.57 x 0.2950 ~ 1.52 0.76
Este ejemplo aclara un aspecto de cierta importancia. Es obvio que los lmites de
En est~ ejem~l~, el. nmero necesario de cifras significativas no es grande, pero es confianza son bastante ms pequeos (es decir mejores) para el resultado de Yo = 13.5 que
c~nvem~nte utilizar siempre el nmero mximo disponible durante el clculo, redondeando para los otros dos valores de yo. El estudio de la ecuacin (5.9) confirma que mientras que yo
solo al final, se aproxima a y, el tercer trmino dentro del parntesis se aproxima a cero, y yo al valor
mnimo. La forma general de los lmites de confianza para una concentracin calculada se
muestra en la figura 5.6. Adems, en un anlisis prctico un experimento de calibracin de
5.6 CLCULO DE UNA CONCENTRACIN este tipo proporcionar los resultados ms precisos cuando la seal del instrumento medida
corresponda a un punto prximo al centro de gravedad de la recta de regresin.
~n~ vez determinadas la pendiente y la ordenada en el origen de la recta de regresin es Si deseamos mejorar (es decir reducir) los lmites de confianza en este experimento de
fcil calcula: un valor.de x correspondiente a cualquier valor de y medido. Pero surge un calibracin, las ecuaciones (5.9) y (5.10) muestran que se puede considerar al menos
proble~~ mas complejo cuando necesitamos estimar el error en una concentracin calcu- dos aproximaciones. Podemos aumentar 11, el nmero de puntos de la calibracin de la
lada utilizando una recta .de regresin. El clculo de un valor de x para un valor de y dado recta de regresin, y podemos hacer ms de una medicin de Yo, y utilizar el valor medio
conll~va el uso de la pendiente (b) y la ordenada en el origen (a) y, como vimos en la seccin de dichas m mediciones en el clculo de xo. Los resultados de tales procedimientos
anterior, ambos valores estn sujetos a error. Como resultado, la determinacin del error pueden establecerse considerando los tres trminos dentro de los parntesis, en las dos
e~l el valor de ~ es extremadamente compleja y muchos profesionales utilizan la siguiente ecuaciones. En el ejemplo anterior, el trmino predominante en los tres clculos es el
formula aproximada: primero, o sea la unidad. Se sigue que en este caso (yen muchos otros) puede llevarse a
cabo una mejora en la precisin midiendo Yo varias veces y usando la ecuacin (5.10) en
lugar de la ecuacin (5.9). Si, por ejemplo, se ha calculado el valor de yo de 13.5 como la
s. = Svix (y.o-.Yf}1
~ { 1 + -1 + ~==--:.:..----'--'-. media de cuatro determinaciones, entonces el valor de SxQ y los lmites de confianza seran
\,' b ti b 22.- (XI - X)2 (:1.9 )
l 0.14 y 6.21 0.36 respectivamente; ambos resultados indican que se ha mejorado sustan-
En esta ecuacin.~o es el valor experimental de ya partir del cual se determina el valor Xo cialmente la precisin. Por supuesto, si se hacen muchas mediciones repetidas (suponiendo
d.e l~ .concentraclOn; SxQ es la desviacin estndar de Xo, y los otros smbolos tienen su que se dispone de suficiente muestra) se genera mucho ms trabajo y se obtiene slo un
signifcado usu~l. En.algunos casos, un analista puede realizar varias lecturas para obtener beneficio adicional pequeo: el lector puede verificar que 8 mediciones de Yo producirn
el valor de Yo; SI se dispone de m lecturas, entonces la ecuacin para SxQ se convierte en un valor de SxQ de 0.12 y unos lmites de confianza de 6.21 0.30.
El efecto de 11, el nmero de puntos de calibracin, sobre los lmites de confianza en la
determinacin de la concentracin en ms complejo. Esto se debe tambin a que tenemos
(:1.10 ) que considerar la presencia de cambios en el valor de t. El uso de de un gran nmero de
muestras de calibracin supone preparar muchos estndares exactos para incrementar slo
marginal mente la precisin (vanse los efectos de incrementar ni, descritos en el prrafo
de fondo". Es obvio que esta descripcin da al analista un buen margen de libertad
para decidir la definicin exacta del lmite de deteccin, basada en una adecuada interpre-
Seal
/ tacin de la frase "significativamente diferente". En la prctica, existe muy poco acuerdo
/
/ / entre los profesionales y los organismos oficiales sobre este punto, por lo que esta rea
I / resulta tan controvertida como otros aspectos del tratamiento estadstico del anlisis de
/ / calibracin. Una definicin que se utiliza comnmente en la bibliografa de la qumica
/ / analtica es que el lmite de deteccin es la cantidad de concentracin de analito que
/ / proporciona una seal igual a la seal del blanco, YB, ms dos veces la desviacin estndar
/ / del blanco, SB' Recientes recomendaciones de organismos pblicos (particularmente esta-
/ / dounidenses) sugieren que el criterio debera de ser:
/ /
/ ~ -- y- YB = 3s B (5.11)
I / (x. y)

/1 / La significacin de esta ltima definicin se aclara con mayor detalle en la figura 5.7.
I / Un analista que estudia concentraciones traza se enfrenta a dos problemas: por un lado no
/ / desea dar un informe de la presencia de anal ita cuando est realmente ausente, pero por
ji / otro, tampoco pretende informar que el analito est ausente cuando de hecho est presente.
/ / La posibilidad de que ocurra cada uno de estos errores debe minimizarse bajo una defini-
/ cin lgica de un lmite de deteccin. En la figura, la curva A representa la distribucin
/ normal de valores medidos de la seal de! blanco. Sera posible identificar un punto y = P,
/ hacia el borde superior de esta distribucin, y pretender que sera improbable que una seal
ms grande que sta se debiese al blanco (Fig. 5.7), mientras que se supondra que una
seal menor que P indica una muestra en blanco. Sin embargo, para que una muestra d
Concentracin una seal promedio P, el 50% de las seales observadas ser menor que sta, ya que
Figura 5.6
tendr una distribucin normal (de la misma forma que para el blanco, vase ms adelante)
Forma general de los limites de confianza para una concentracin determinada utili-
zando una recta de regresin no ponderada. que se prolonga por debajo de P (curva B). La probabilidad de concluir que esta muestra
no difiere de la del blanco cuando de hecho lo hace es por lo tanto del 50%. El punto P,

anterior). Por otra parte, no es adecuado usar valores de n pequeos: en tal caso no slo
1/n se.r g.rande, sino que el nmero de grados de libertad n - 2, se har muy pequeo, y se Lmite de Lmite de
necesitaran valores muy grandes de t en el clculo de los lmites de confianza. En muchos decisin deteccin
Ys
ex~e~imento~,como en el ejemplo dado, aproximadamente seis puntos de calibracin sern
suficientes; SI es necesario el analista ganar precisin extra repitiendo mediciones de yo.

5.7 LMITES DE DETECCIN

Como hemos visto, una de las ventajas de utilizar mtodos instrumentales de anlisis es
que SO~l capaces de ~~t~ctar'y. determinar cantidades de ana lito mucho ms pequeas que
los metod~s de analIsls. clsicos. Esta ventaja permite apreciar la importancia de las
c~nc.e~traclOnes en el nivel de trazas en muchos materiales, por ejemplo en muestras
bioigicas y medioambientales, contribuyendo as al desarrollo de muchas otras tcnicas
en las.cuales los lmites de deteccin bajos son el mejor criterio para aplicarlas con xito.
Es ~~ldente q~e los mtodo~ estadsticos son importantes para la evaluacin y la compa-
raclOn. ~e 111m tes de deteccin, En trminos generales, se puede describir el lmite de )
~etecclOn de un analito como aquella concentracin que proporciona una seal en e!
instrumento (v) significativamente diferente de la seal de una muestra en "blanco" o "seal
Figura 5.7 Definiciones de (a) el limite de decisin y (b) el lmite de deteccin.
25
llamado el lmite de decisin, es insatisfactorio como un lmite de deteccin, ya que
soluciona el primero de los problemas mencionados antes, pero no el segundo. Un punto Y,23.0
ms adecuado est en y = Q (vase la Fig. 5.7), de manera que Q est situado al doble de
la distancia que existe entre Ys y P. Se puede demostrar que si ys - Q es 3.28 veces la a = Ya = 1.52 0.30
desviacin estndar del blanco, SIJ, entonces la probabilidad de que cada uno de los dos b = 1.93 0.04
tipos de error ocurra (indicados por las reas sombreadas de la figura 5.7) es slo del 5%. 20
Si, como se sugiere en la ecuacin (5.11), la distancia YIJ - Q es slo 3s lJ, la probabilidad r = 0.9989
de cada error es aproximadamente del 7%; muchos analistas deberan considerar que esta sI'" s B = 0.433
y x
definicin del lmite de deteccin es razonable.
Es preciso insistir de nuevo en que esta definicin es completamente arbitraria, y est LOO = 0.67pg/ml

abierta para que cualquier analista proponga una alternativa ante un propsito concreto. ca Sx "'0.25
'(3 15
Por ejemplo, existen ocasiones en que un analista est ansioso de evitar a toda costa la e
Ql
posibilidad de informar sobre la ausencia de analito cuando de hecho est presente, pero olJ) !'
11
lo contrario no es relativamente preocupante. Est claro que cuando se cite un lmite de ...O
Ql
=
deteccin en un trabajo o informe, debe proporcionarse la definicin utilizada para ~

obtenerlo. Se han realizado algunos intentos para definir otro lmite, el "lmite de cuanti- :
ficacin" (o "lmite de determinacin"), considerado como el lmite ms bajo para medi- 10
ciones cuantitativamente precisas, en oposicin a la deteccin cualitativa. Se ha sugerido
un valor de yu + 10s13 para este lmite, aunque en la prctica no se ha utilizado ampliamente. 11

A continuacin analizaremos cmo se obtienen en la prctica los trminos YIJ y Ss '~"


cuando se utiliza una recta de regresin convencional para la calibracin, tal como se
describi en las secciones precedentes. Un supuesto fundamental del mtodo de los
mnimos cuadrados sin ponderar que ya hemos estudiado en este captulo es que cada punto 5
en la representacin grfica (incluido el que representa al blanco o ruido de fondo) tiene
una variacin distribuida normalmente (slo en la direccin de y) con una desviacin Ye+ 3Sf

estndar estimada por Sy/x [vase la Ec. (5.6)]. sta es la justificacin para representar las
a Ya
curvas de distribucin normal con la misma amplitud que refleja la figura 5.7; por lo tanto
L.o.d
es apropiado utilizar SYlr en lugar de Sn en la estimacin del lmite de deteccin. Por
O
supuesto, se puede realizar el experimento con el blanco varias veces y obtener un valor O 2 4 6 8 10
independiente para Sil, pero es un procedimiento que lleva tiempo, y en la prctica el uso Concentracin, pg/ml
de S,r es bastante adecuado. El valor de a, la ordenada en el origen calculada, puede
utilizarse como una estimacin de yn, la propia seal del blanco; debera ser una estimacin Figura 5.8 Resumen de los clculos usando los datos de la pg. 92.
ms exacta de Yll que el solo valor de la medicin del blanco, YI.
representacin sea lineal, puede ser medida en cualquier punto de ella. Por el contrario: ~l
Ejemplo. Estime el lmite de deteccin para determinar la fluorescena estudiada en las lmite de deteccin de un mtodo se calcula con ayuda de la zona ?e la representacin
secciones anteriores.
cercana al origen, y utiliza tanto la pendiente como la ordenada al ongen.
Se utiliza la ecuacin (5.11) con los valores de YIJ (= a) y Sil (= s.1/}) calculados
previamente. El valor de yen el lmite de deteccin est dado por 1.52 + 3 x 0.432 9,
es decir, 2.82. El uso de la ecuacin de regresin conduce a un lmite de deteccin de
5.8 EL MTODO DE LAS ADICIONES ESTNDAR
0.67 pg/ml. La figura 5.8 resume todos los clculos realizados a partir de los datos para
determinar la fluorescena. analista desea determinar la concentracin de plata en muestras de
Supongamo S que un . " S' tili 1 todos
desechos fotogrficos por espectrometria de absorcin atmica. 1 u 1 iza ~s m
Es muy importante evitar la confusin entre el lmite de deteccin de una tcnica con de las secciones anteriores, podra efectuar una calibracin ~n el esp~ctrof?,tometro con
su sensibilidad. Esta confusin surge, probablemente, porque no existe una palabra que . d 1 de plata pura y utilizar la grfica de calibracin resultante
signifique "tener un lmite de deteccin bajo"; la palabra "sensible" se utiliza generalmente soluciones acuosas e una sa . t 'todo slo es
en la determinacin de plata en las muestras problema. Sin embargo, ~~ e me
con este propsito, lo que da lugar a demasiada ambigedad. La sensibilidad de una tcnica vlido si una solucin acuosa pura de plata da la misma seal de absorclOn que una muestra
se define correctamente como la pendiente de una lnea de calibracin y, siempre que la
fotogrfica de desecho que contenga la misma concentracin de plata. En otras palabras, seal
cuando se usan soluciones puras para establecer la grfica de calibracin se supone que no
hay "efectos de matriz", es decir, disminucin o aumento en la seal de absorbancia de
plata debido a la presencia de otros componentes en la muestra. Frecuentemente, tal
suposicin no es vlida en muchas reas del anlisis. Los efectos de matriz ocurren incluso
con mtodos tales como la espectrometra de plasma que tienen la ventaja de estar
relativamente libres de interferencias.
La primera solucin posible a este problema es tomar una muestra de desechos
fotogrficos que sea similar a la muestra problema pero libre de plata, y aadirle cantidades
conocidas de una sal de plata para formar soluciones estndar. Entonces, la grfica de
calibracin se establecer utilizando una matriz aparentemente adecuada; sin embargo, en Seal de muestra
/
muchos casos esta aproximacin es impracticable. No se eliminarn efectos de matriz que /
difieran en magnitud de una muestra a otra, y quiz no sea posible obtener una muestra de /
la matriz que no contenga analito, por ejemplo, es improbable que se consiga una muestra /
de residuos fotogrficos sin plata. De esto se desprende que todas las mediciones analticas,
/
/
incluyendo la grfica de calibracin, de alguna manera deben realizarse con la propia /
muestra. Esto se logra en la prctica usando el mtodo de adiciones estndar, el cual se
/
utiliza mucho en la espectrometra de absorcin atmica y emisin y tambin se aplica en
( ) Cantidad aadida
el anlisis electroqumico y en otras reas. Se toman volmenes iguales de solucin
Cantidad de analito en
problema, pero todas salvo una son "tratadas" por separado con cantidades conocidas y la muestra del problema
diferentes del ana lito, y todas se diluyen al mismo volumen. Despus se determinan las
seales instrumentales para todas estas soluciones y los resultados se representan como se Figura 5.9 El mtodo de las adiciones estndar.
muestra en la figura 5.9. Como de costumbre, la seal se representa en el eje y; mientras
que en el eje x la escala se expresa en trminos de las cantidades de ana lito aadidas (ya
sea como peso absoluto o como concentracin). La recta de regresin (no ponderada) se Plata adicionada, J1g por mi de 30
o 5 10 15 20 25
solucin de muestra original
calcula de la manera usual, si bien el espacio ocupado por ella se extrapolar al punto sobre 0.32 0.41 0.52 0.60 0.70 0.77 0.89
Absorbancia
el eje x donde y = O. Est claro que esta interseccin negativa sobre el eje x corresponde a
la cantidad de analito en la muestra del problema. El anlisis de la figura muestra que este Determine la concentracin de plata en la muestra, y obtenga los lmites de confianza
valor est dado por alb, la razn de la ordenada en el origeny la pendiente de la recta de al 95% para esta concentracin. ,
regresin. Ya que a y b estn sujetas a error (vase la Seco 5.5), el valor calculado tambin Las ecuaciones (5.4) Y (5.5) conduce a a ~ 0.3218 Y b = 0.0186. La razon entre estas
estar obviamente sujeto a error. Sin embargo, en este caso la cantidad no se predice a partir cifras proporciona la concentracin de plata en la muestra proble~na de 17.3 f.lg/mI.
de un nico valor medido de y, de manera que la frmula de la desviacin estndar SXE' del Los lmites de confianza para este resultado se pueden detenmnar con la ayuda
valor extrapolado de x (XE) no es la misma que en la ecuacin (5.9). En su lugar, se utiliza: . . (.1
de la ecuacion 5 2) . A 001094 ,y-n
qui' Sy/x es. - .601 4 ,Y'-~ (x I - X)2 ~ 700. El valor de

SxE es entonces 0.749 Y los lmites de confianza son 17.3 2.57 x 0.749, es decir 17.3
S {1
=~ -+ 2 y-2}i (5.12) 1.9 f.lg/ml.
XE b n b E (x, -
, i?
Aunque es una aproximacin elegante al problema com~l de efectos .de inter~e~e.ncia
Al aumentar nuevamente el valor de 11, se mejora la precisin de la cantidad estimada: en por la matriz, el mtodo de las adiciones estndar tie~en vanas desventajas: es, dificil de
general, deberan usarse al menos seis puntos en un experimento de adiciones estndar. automatizar, y puede utilizar cantidades de muestra mas gran,des que en otros m~t,odos. En
Adems, la precisin se mejora maximizando L, (Xi - :~'l, as las soluciones de calibracin trminos estadsticos, su principal desventaja es que es un metod~ de extrapol~clOn, por lo
tanto es menos preciso que las tcnicas de interpolaci~ '.En el ejemplo antenor podemos
cubriran, si fuera posible, un intervalo considerable. Los lmites de confianza para se
ver que, si una concentracin desconocida de plata adicionada a la muest~a, de desechos
XE
determinan, como siempre, como XE tsa:
fotogrficos proporcionase un valor de absorvancia de 0,~5, la concenlracto de la plat~
Ejemplo. La concentracin de plata en una muestra de desechos fotogrficos se adicionada debera ser 17.6 f.lg/ml, con lmites de confianza ~e 17.6 1:6. f.lg/m~. ~I
determin por espectrometra de absorcin atmica con el mtodo de las adiciones comparamos este resultado con el obtenido en el e~el~plo, es ev~dente la mdica mejona
estndar. Se obtuvieron los siguientes resultados. en los lmites de confianza. Como hemos visto, los lmites de confianza para un punto sobre
una recta de regresin varan con el valor de y, y alcanzan un mnimo cuando y ~ y (vase a b
la Seco 5.6). En la prctica, como se muestra en este ejemplo y en el de la seccin 5.6, esta
variacin en los lmites de confianza con el cambio en y probablemente no es muy grande,
de manera que los lmites de confianza no son significativamente malos incluso para un
resultado derivado de una extrapolacin sustancial.

5.9 EL USO DE RECTAS DE REGRESIN PARA COMPARAR MTODOS e


ANALTICOS

Si un qumico analtico desarrolla un mtodo nuevo para determinar un analito concreto,


desear validarlo (entre otras tcnicas) aplicndolo a un conjunto de muestras ya estudiadas
medi~nte otro procedimiento estndar o de prestigio. Al realizar tal comparacin, el

principal inters ser la identificacin de errores sistemticos (proporciona el nuevo O
el /
mtodo resultados significativamente ms altos o ms bajos que el procedimiento estable- O e
cido?). En los casos donde un anlisis se repite varias veces sobre un intervalo de r-
'W
concentracin muy limitado, tal comparacin puede hacerse usando las pruebas estadsti- ::lE
cas descritas en un captulo anterior (vanse las Seccs. 3.2 y 3.3). Dichos procedimientos
no sern adecuados en anlisis instrumental, los cuales a menudo se utilizan sobre
intervalos de concentracin grandes. ,o,
/0

Cuando se comparan dos mtodos a diferentes concentraciones de analito, se adopta /


/
/
~ - ...- -.- ... ..
-

normalmente el procedimiento que ilustra la figura 5.10. Uno de los ejes de la grfica de
regresin s.e utiliza ~ara los resultados obtenidos por el nuevo mtodo, y el otro para los MTODO B
)
que se obtienen aplicando el de comparacin o referencia a las mismas muestras. (La
Figura 5.10 El uso de una recta de regresin para comparar dos mtodos anal~icos: (a) muestra
impo.rt~ncia de asignar un eje a cada mtodo se analiza posteriormente.) As cada punto de una concordancia perfecta entre los mtodos para todas las muestras; de (b) a (f) Ilustra los resulta-
la grfica representa una nica muestra analizada por dos mtodos separados. Los mtodos dos de varios tipos de errores sistemticos (vase texto).
de la.s secciones precedentes se han aplicado para calcular la pendiente (b), la ordenada en
el ongen (a) y el coeficiente de correlacin (r) de la recta de regresin. Queda claro que si
y) podra detectar slo una forma del analito, mientras que el segundo detectara ambas
cada muestra conduce a un resultado idntico con ambos mtodos analticos la recta de
regresin tendr una ordenada en el origen de cero, y una pendiente y un' coeficiente formas.
En la prctica, el analista con frecuencia desea realizar una prueba para contrastar una
?e correlacin de 1 (vase la Fig. 5.lOa). En la prctica, por supuesto, esto nunca ocurre
ordenada en el origen significativamente diferente de cero, y una pendiente significativa-
incluso cuando los errores sistemticos estn completamente ausentes, los aleatorios
mente diferente de 1. Tales pruebas se realizan determinando los lmites de confianza para
aseguran que los dos procedimientos analticos no darn resultados que concuerden
a y b, generalmente al 95% de nivel de significacin. De este modo, el clculo es muy
exactamente en todas la muestras. .
similar al descrito en la seccin 5.5, y es ms til realizarlo utilizando un programa de
. Pueden ocurrir desviaciones de la situacin "ideal" (a = 0, b = r = 1) en una serie de
c'rcu~lstancias diferentes. En primer lugar, es posible que la recta de regresin tenga una computador sencillo.
pen~'ente de 1, pero no una ordenada en el origen de cero; o sea que un mtodo de
Ejemplo. El nivel de plomo de diez muestras de jugo de fruta de determin por un nuevo
ana lisis puede producir un resultado ms alto o ms bajo que el otro en una cantidad fija.
mtodo de anlisis potenciomtrico de redisolucin (stripping) (APR) empleando un
Tal error podra ocurrir si se calcul errneamente la seal de fondo de uno de los mtodos
electrodo de trabajo de carbn vitrificado, y los resultados fueron comparados con los
(vase la Fig. 5.lOb). Una segunda posibilidad es que la pendiente de la recta de regresin
obtenidos mediante la tcnica de espectrometra de absorcin atmica sin llama (EAA).
sea> 1 o < 1, 10 que indica que puede darse un error sistemtico en la pendiente de una
Se obtuvieron los siguientes datos (todo los resultados en ,ug/ml).
de las grficas de calibracin individuales (Fig. 5.lOc). Desde luego, estos dos errores
pueden ocurrir simultneamente (Fig. 5.lOd). Otros tipos posibles de error sistemtico se
5 6 7 8 9 10
manifiestan si l~ representacin grfica es una curva (Fig. 5. lOe). Problemas de especiacin Muestra 1 2 3 4
125 205 205 215 240 350
rueden p~oporcl?n~rresulta~ossorprendentes (Fig. 5.1 Of). Este tipo de representacin gr- Resultados EAA 35 75 75 80
120 200 220 200 250 330
Resultados APR 35 70 80 80
'.ca podra sur~lr SI un analito se encuentra en dos formas qumicas distintas, en propor-
ciones que vanan de una muestra a otra. Uno de los mtodos (;:)(lu rf':nrpsf':nhrl" pn ,,1 ,,po (Mannino. S.. Analvst, 1982.107, 1466).
Estos. resultados se representan en una lnea de regresin (vase la Fig. 5.11), con
sistemticos. Incluso si las rectas de regresin son ligeramente curvadas, el coeficiente de
los obtenidos por EAA en el eje x y los que resultaron por APR en el eje y. Usando 1
mtodos de las secciones precedentes puede observarse fcilmente que: os correlacin podra haber sido 1 (vase la Seco 5.3). Es evidente, por 10 tanto, que el clculo
de r tiene menor importancia en el presente contexto que el establecimiento de lmites de
a = 3.87, b = 0.968; r = 0.9945 confianza para la pendiente y ordenada en el origen. En algunos casos puede encontrarse
que el valor de r no es muy prximo al, aun cuando la pendiente y ordenada en el origen
Clculos adicionales muestran que: no sean significativamente diferentes de 1 y Orespectivamente. Tal resultado sugerira una
precisin muy pobre para uno o ambos de los mtodos bajo estudio. Por supuesto la
S)!' = 10.56; s; = 6.64; Sb = 0.0357 precisin de los dos mtodos puede determinarse y compararse por los mtodos de los
captulos 2 y 3. En la prctica es preferible que esto se haga antes de representar la recta
usando valores . de t adecuados para 8 grados de libertad (t = 2 .31) dan de regresin que compara los dos mtodos, la razn de esto se explica posteriormente, El
, . an los si .
os sIgUIentes segundo aspecto es que, si bien es claramente deseable comparar los mtodos en un
lmites de confianza al 95 % para la pendiente y ordenada en el origen:
intervalo de concentraciones tan amplio como sea posible, en la prctica quiz no sea
a = 3.87 15.34 y b = 0.963 0.083 factible obtener muestras reales con concentraciones de analito igualmente espaciadas en
el intervalo. En el ejemplo dado, los jugos de fruta examinados tienden a agruparse con
contenidos en plomo claramente similares, de manera que las muestras que contengan
De e.s~os resultados se. de~~ren?e que la pendiente y ordenada en el origen calculadas
plomo entre ca. 130 y 200 flg/l Y entre 260 y 320 flg/l no se podran estudiar. Tambin
no difieren en forma
. significativa
. " de los valores "ideales" de 1 y O respec tiivamente, y veremos esto ms adelante.
por 10 tanto no existen diferencias sIstemticas entre las dos series de resultados.
Este mtodo, aunque a nivel internacional se ha adoptado prcticamente en estudios
comparativos de mtodos instrumentales, est abierto a serias objeciones tericas por
E~ :~lacin c~n ~ste ej~mplo ~ue.den mencionarse otros dos aspectos. En primer lugar,
la rev'sI~n de la bibliografa de quumca analtica muestra que los autores se preocupan con varias razones. En primer lugar, se ha recalcado a travs de todo este captulo, que la recta
de regresin de y sobre x se calcula bajo el supuesto de que hay errores despreciables en
frecuencia de los ~alores del. coeficiente de correlacin en estudios comparativos; sin
los valores de x y se supone que todos los errores ocurren en la direccin y. Mientras que
embargo, en este ejemplo no Juega un papel directo al establecer si ocurren o no errores
esto es generalmente vlido en la generacin de una grfica de calibracin para un nico
mtodo analtico, no puede justificarse cuando la recta de regresin se usa con propsitos
350 de comparacin. En tal caso se puede tomar como cierto que los errores aleatorios existirn
en ambos mtodos analticos, es decir, en ambas direcciones de x y y. Esto sugerira que
O las ecuaciones utilizadas en el clculo de la propia recta de regresin pudieran no ser
300 vlidas. Sin embargo, ensayos prcticos y simulaciones muestran que la presente aproxi-
~
Ol macin conduce a resultados sorprendentemente fiables, siempre que se cumplan tres
::t
250 O condiciones.
ex::
a.
<t
(/) 1. El mtodo ms preciso se representa en el eje x: Por eso se realizan investigaciones
o 200 preliminares sobre las precisiones de los dos mtodos (vase lo expuesto anteriormente),
'O
s 2. Un nmero razonable de puntos (al menos 10, como en el ejemplo anterior) se
'3
(/) 150 representan en la comparacin. Ya que los lmites de confianza se basan en n - 2 grados
Cll
ex:: de libertad, es importante evitar valores pequeos de n.
100 3. Los puntos experimentales deberan cubrir el intervalo de concentracin de inters
de una manera aproximadamente uniforme: como hemos visto, puede ser difcil que se
cumpla este requisito en estudios comparativos sobre muestras reales.
50
Existe una segunda objecin terica al utilizar la recta de regresin de y sobre x como
se calcul en las secciones 5.4 y 5.5, en la comparacin de dos mtodos analticos. Esta
o 50 100 150 200 250 300 350 recta de regresin no slo supone que los errores en la direccin x son cero, sino tambin
Resultados EAA pgjl. que los errores en los valores de y son constantes, es decir que no varan con la concentra-
cin, y por lo tanto todos los puntos tienen igual ponderacin cuando se calculan la
Figura 5.11 Comparacin de dos mtodo s a!la1',' .1 ',
1 ICOS. a representacin muestra los datos de la pendiente y la ordenada en el origen. Este supuesto probablemente carezca de validez en
pag,93,
la prctica. En muchos anlisis, la desviacin estndar relativa (coeficiente de variacin)
es aproximadamente constante en un intervalo de concentraciones: el error absoluto
aumenta de este modo con la concentracin del analito, en vez de tener el mismo valor en
todas las concentraciones. Por consiguiente las rectas de regresin "no ponderadas" tienen
tambin una validez muy cuestionable en otras situaciones, es decir, cuando se aplican a Seal
grficas de calibracin para un nico procedimiento analtico. En principio, se deberan
utilizar en su lugar rectas de regresin ponderadas. Este concepto se desarrolla en la
siguiente seccin. Mientras tanto, puede reafirmarse que, a pesar de las objeciones tericas,
las rectas de regresin no ponderadas proporcionan informacin til en estudios compara-
tivos si se cumplen los requerimientos enunciados anteriormente.

5.10 RECTAS DE REGRESIN PONDERADAS

Los comentarios hechos en las seccciones anteriores sobre clculos de regresin conven-
cionales o no ponderados indican que los ponderados quizs deberan adoptarse ms
frecuentemente. Los clculos que conllevan la utilizacin de los mtodos de regresin
ponderados son slo un poco ms complicados que los de las secciones anteriores, y pueden
realizarse fcilmente en un microcomputador, pero requieren informacin adicional de los
errores que surgen en los diferentes niveles de concentracin, o al menos la formulacin
de supuestos adicionales acerca de tales errores. Esto explica quizs por que los clculos de
regresin no ponderada se usan con menos frecuencia. En esta seccin se esbozan las
aplicaciones de los mtodos de regresin ponderada. Se supone que la recta de regresin
ponderada se utiliza para la determinacin de un nico analito y no para comparar dos
Concentracin
mtodos separados.
Consideremos con ms detalle la simple situacin que surge cuando el error en el Figura 5.12 La ponderacin de errores en un clculo de regresin.
clculo de una regresin es aproximadamente proporcional a la concentracin del analito.
Cuando los errores en los diferentes puntos de la grfica de calibracin se expresan por
"barras de error" (vase la Fig. S.12), stas se alargan a medida que aumenta la concentra- y
cin. En este caso es evidente que debe calcularse la recta de regresin para dar una pon- (S.1S)
deracin adicional a aquellos puntos donde las barras de error son ms cortas: es ms
a = Yw - ss;
importante que la recta calculada pase cerca de tales puntos que de los que representan con- x- y Y- w representan las coordenadas del centro de gravedad
in (S . IS) ,w
centraciones ms altas con los errores ms grandes. Este resultado se logra cuando se da a E n la ecuacto
ponderado (x w,Yw) por el que debe pasar la recta de regresin ponderada. Estas coordenadas
cada punto una ponderacin inversamente proporcional a la varianza correspondiente, s2;
este procedimiento lgico es de aplicacin general. As, si los puntos individuales se de-
estn dadas por: Xw= L wx;/n y Yw = L, wy;/n.
notan con (x" YI), (X2, Y2), etc., como es habitual, y las correspondientes desviaciones es-
tndar son SI, S" etc., entonces las ponderaciones individuales, W, W, etc., estn dadas por: Ejemplo. Calcule las rectas de regresin ponderada y no ponderada.~ara los siguientes
datos de calibracin. Calcule tambin para cada recta la concentraclOn de las muestras
(S. 13) problema con absorbancias de 0.100 y 0.600.

8 10
Como se ver las ponderaciones se han puesto en una escala de tal manera que su suma Concentracin, flg/ml o 2 4 6
0.158 0.301 0.472 0.577 0.739
sea igual al nmero de puntos sobre la representacin grfica: esto simplifica los subsi- Absorbancia 0.009
0.004 0.010 0.013 0.017 0.022
guientes clculos. La pendiente y la ordenada en el origen de la recta de regresin estn Desviacin estndar 0.001
dadas por:
La aplicacin de las ecuaciones (S.4) y (S.S) muestra que la ~endiente y la ordenada en
L w,xy, - nxwy.. el origen de la recta de regresin /10 ponderada son r~spectlvamente O.072S y 0.0133.
b = ----::----::-- (5.14) Las concentraciones correspondientes a las absorbancias 0.100 Y0.600 son 1.20 y 8.09
L, w,x - nx~ J1gJml respectivamente.
La recta de regresin ponderada es un poco ms tediosa en cuanto a su calculo: en mtodo de regresin ponderada proporciona resultados mucho ms reales. En la seccin
a.usencia de un programa de computador es habitual establecer una tabla como la que 5.6 utilizamos la ecuacin (5.9) para estimar la desviacin estndar (sx) y por lo tanto los
sigue. intervalos de confianza de una concentracin calculada usando un solo valor de y y una
recta de regresin no ponderada. Al aplicar esta ecuacin a los datos del ejemplo anterior
Xi Yi Si l/sr W W,X , WY ~~ Wxr vemos que los lmites de confianza no ponderados para las soluciones con absorbancias de
o 0.009 0.001 1000000 5.535 o 0.0498 o
~~-'--

o 0.100 y 0.600 son 1.20 0.65 y 8.09 0.63 Ilg}ml respectivamente. Como en el ejemplo
2 0.158 0.004 62500 0.346 0.692 0.0547 de la seccin 5.6, estos intervalos de confianza son muy similares. Sin embargo, en el
0.1093 1.384
4 0.301 omo 10000 0.055 0.220 0.0166 0.0662 0.880 ejemplo presente tal resultado no es completamente real; los datos experimentales muestran
6 0.472 0.013 5917 0.033 0.198 0.0156 0.0935 1.188 que los errores de los valores y observados, aumentan a medida que aumentan los propios
8 0.577 0.017 3460 0.019 0.152 0.0110 0.0877 1.216
10 0.739 0.022 2066 0.011 0.110 O.OOSI
valores de y; es la situacin esperada para un mtodo que tenga una desviacin estndar
O,()813 1.100
SUMAS: 1083943 5.999 1.372 0.1558 0.4380 5.768 relativa aproximadamente constante. Podramos esperar que este incremento en Si con el
de y tambin se reflejara en los lmites de confianza de las concentraciones determinadas:
--~_._~---

De estos nmeros queda claro que Yw ~ 0.1558/6 = 0.0260 Y X W = 1.372/6 = 0.229. los lmites de confianza para la solucin con una absorbancia de 0.600 seran mucho ms
Mediante la ecuacin (5.14), b se calcula a partir de grandes (es decir, peores) que los de la solucin con una absorbancia de 0.100.
En los clculos de regresin ponderados, la desviacin estndar (sxw) de una concen-
b = 0.43R - (6 x 0.22<) x 0.(26) _ tracin prevista est dada por:
5.76R - [6 x (0.22<)2] - O.073R

de manera que a est dado por 0.0260 - (0.073 x 0.229) = 0.0091. (5.16)
~stos valores para a y b pueden utilizarse para mostrar que los valores de absor-
~ancla de 0.100 y 0.600 corresponden a concentraciones de 1.23 y 8.0 I Ilg/ ml respec-
tivamente. En esta ecuacin, s(y/x)w est dada por:

La cuidadosa comparacin de los resultados de los clculos de regresin ponderada y


no ponderada es muy instructiva. Los efectos del proceso de ponderacin son claros; el
(5.17)
centro de graveda~ I~onderado (x w , Yw~ est mucho ms cerca del origen de la grfica que
el n? ponderac~o (x, y), y la ponderacin dada a los puntos ms prximos al origen y en
particular al pr~~er punto (0,0:009) que tiene el menor de todos los errores asegura que la
recta de .regreslOn ponderada tiene una ordenada en el origen muy prxima a este punto. y Wo es una ponderacin adecuada para el valor de yo. La ecuacin (5.16) es claramente
La pendiente y la ordenada en el origen de la recta ponderada son notablemente similares similar en su forma a la (5.9). Ello confirma que los puntos cercanos al origen, donde las
:.Ias de la recta n~ ponderada, aunque los resultados de los dos mtodos proporcionan ponderaciones son ms altas, y los cercanos al centro de gravedad, donde yo- Ywes pequeo,
<llores muy parecidos para las concentraciones de muestras que tienen absorbancia de tendrn los lmites de confianza ms pequeos (vase la Fig. 5.13). La principal diferencia
~.100 y 0.600. ~o debe suponerse que ~sos valores semejantes surgen simplemente debido entre las dos ecuaciones es el trmino l/wo en la ecuacin (5.16). Ya que Wo disminuye
que. e~ este ejemplo los puntos experimentales se ajustan muy bien a una lnea recta. En bruscamente a medida que aumenta y, este trmino asegura que los lmites de confianza
la practica, las rectas de regresin ponderada y no ponderada derivadas de una serie de aumentan cuando aumenta yo, como esperbamos.
datos experimentales, tienen pendientes y ordenadas en el origen similares incluso si es La aplicacin de la ecuacin (5.16) a los datos del ejemplo anterior muestra que las
relevante la dispersin de los puntos respecto a la recta. soluciones problema con absorbancias de 0.100 y 0.600 poseen intervalos de confianza
As, pod~<lmos pensar que los clculos de regresin ponderada son poco recomen- para las concentraciones calculadas (1.23 y 8.01 Ilg}ml) de 0.12 y 0.72 Ilg/ml,
dables; requieren ms informacin (en la forma de las estimaciones de la desviacin respectivamente. Vemos que estos intervalos de confianza son proporcionales a las absor-
estndar en varios puntos sobre la representacin grfica), y son ms complejos de ejecutar bancias de las dos soluciones. Adems, el intervalo de confianza para la muestra menos
pero aparente.mente proporcionan datos muy similares a los obtenidos a partir del mtodo' concentrada de las dos es ms pequeo que en los clculos de regresin no pondera-
mucho mas 1 d .. ' . '
. " sirnp e, ere~reslon no ponderada. DIchas consideracione, de hecho pueden dos, mientras que para la muestra ms concentrada ocurre lo contrario. Todos estos
Justlf~car que en la pracuca se desprecien los clculos de regresin ponderada, Pero un resultados concuerdan mucho ms con el experimento de calibracin real que con los re-
q.ulmlco analtico que utiliza mtodos instrumentales no emplea clculos de regresin sultados de los clculos de regresin no ponderada.
:lInplen~ente para determinar la pendiente y la ordenada en el origen de la grfica de Entonces podemos concluir que, si bien los clculos de regresin ponderados son ms
~ltbraclOn y las concentraciones de muestras problema. Tambin quiere obtener estima- complicados que sus homlogos no ponderados, dan resultados mucho ms reales para los
crones. de lo S errores o l'rmiites d e con filanza de esas concentraciones y en este contexto
\ el lmites de confianza de concentraciones previstas en anlisis instrumental convencional.
situacin en donde la grfica de calibracin es lineal (o aproximadamente lineal) a bajas
Seal I concentraciones de analito, y sin embargo se vuelve curva a altas concentraciones. En otros
/ casos, por ejemplo en inmunoensayos y en la respuesta de algunos electrodos selectivos
/ de iones, la grfica de calibracin es obviamente curva en todas las concentraciones, y en
/ este caso an necesitamos respuestas a la lista de preguntas de la seccin 5.2, si bien
/ plantearn problemas estadsticos mucho ms complicados que en el caso de experimentos
/ ,/
de calibracin lineales. La solucin completa a estos problemas est fuera del alcance de
/ ,/
este libro, aunque merece la pena darle cierta atencin preliminar. El lector puede consultar
// .: ' la bibliografa para tratamientos ms completos.
La primera pregunta es: cmo detectamos la curvatura en una grfica de calibracin?
/ / Esto es, cmo distinguimos entre una grfica que se ajusta mejor por una lnea recta, y
/ / una que se ajusta mejor por una curva poco pronunciada? Puesto que el grado de curvatura
/ / puede ser pequeo, y/o suceder slo en parte de la grfica, esto no es una pregunta trivial.
/ /
Adems, a pesar de su amplio uso para probar la bondad del ajuste de grficas lineales, el
/ //
coeficiente de correlacin momento-producto (r) es de poco valor al probar la curvatura:
II / hemos visto (Sec. 5.3) que las lneas con una curvatura obvia todava pueden dar valores
/ / de r muy elevados. Naturalmente, un analista esperara que alguna prueba de curvatura se
I ~(- .) pudiera aplicar con bastante facilidad en trabajos de rutina sin clculos extensos; algunas
/ / XW l Yw
/ I de estas pruebas estn disponibles, y se basan en la utilizacin de los residuos de y en las
/ grficas de calibracin.
/ Como hemos visto (Sec. 5.5) un residuo de y, Yi - Yi, representa la diferencia entre un
valor experimental de y y el valor calculado yde la recta de regresin para el mismo valer
de x. Si es apropiada una grfica de calibracin lineal, y si los errores aleatorios en los
Concentracin valores de y estn distribuidos normalmente, los residuos en s mismos deberan estar
Figura 5.13 Forma general de los lmites de confianza para una concentracin determinada utili- distribuidos normalmente en tomo al valor cero. Si esto no ocurre en la prctica, entonces
zando una rectade regresin ponderada. (despreciando la posibilidad de que los propios errores experimentales no estn distribuidos
normalmente) debemos sospechar que la recta de regresin ajustada no es la correcta. En
el desarrollo del ejemplo dado en la seccin 5.5, los residuos y obtenidos fueron +0.58,
Adems, los mtodos de regresin ponderados pueden ser esenciales cuando se obtenga -0.38, -0.24, -0.50, +0.34, +0.18 y +0.02; est claro que estos valores suman cero
una recta por transformaciones algebraicas de una representacin intrnsecamente curva (teniendo en cuenta los posibles errores de redondeo, esto debe ser siempre verdadero), y
(vase ms adelante, Seco 5.11). En la actualidad existen programas, para varios tipos de aproximadamente estn distribuidos en forma simtrica en tomo a cero. Aunque es
computadores personales, que realizan los clculos de regresin ponderados, por lo que se imposible tener la certeza -especialmente con un nmero pequeo de puntos- de que
debera fomentar ms el uso de este mtodo.
estos residuos estn normalmente distribuidos, tampoco existe evidencia en contra en este
caso, es decir, no hay evidencia para justificar una grfica de calibracin no lineal.
5.11 REGRESIN CURVILNEA Se sugiere una segunda prueba sobre la inspeccin de los signos de los residuos
anteriormente expuestos. Si nos trasladamos a lo largo de la grfica de calibracin, es decir,
cuando aumenta x, supondremos que existen residuos positivos y negativos en orden
Hasta aqu, nuestro estudio de los mtodos de calibracin se ha centrado en experimentos
aleatorio si los datos estn bien ajustados a una lnea recta. Si, al contrario, intentamos
de donde suponemos que la respuesta del instrumento es proporcional a la concentracin de ajustar una lnea recta a una serie de puntos que caen realmente sobre una curva suave,
analito. Esto es usualmente vlido, ya que los qumicos analticos utilizan tales mtodos entonces los signos de los residuos no tendrn un orden aleatorio ms amplio, sino que se
siempre que pueden, y toman precauciones experimentales para asegurar que la linealidad producirn secuencias de valores positivos y negativos. Examinando de nuevo los residuos
de la respuesta se conserve, en lo posible, en un amplio intervalo de concentraciones. Tales expuestos anteriormente encontramos que el orden de los signos es + - - - - + + +. Para
precauciones incluyen el control de la anchura de lnea de emisin de una lmpara de ctodo probar si estas secuencias se residuos + y - indican la necesidad de una lnea de regresin
h~e~o .en espectrometra de absorcin atmica, y la posicin del porta muestras para no lineal, necesitamos conocer la probabilidad de que tal ordenacin pudiera ocurrir por
mmmzar los efectos del filtro interno en la espectrofluorimetra molecular. Sin embargo,
azar; tales clculos se describen en el prximo captulo. Desafortunadamente debido al
a pesar de tales esfuerzos, muchos mtodos analticos proporcionan grficas de calibracin
pequeo nmero de puntos es muy probable que stas y otras secuencias pudieran
curvas en una parte del intervalo de concentracin de inters. En concreto es muy usual la
realmente ocurrir por azar, de manera que cualquier conclusin que se extraiga debe tratarse
con gran precaucin. Probablemente la eleccin entre mtodos de regresin lineales y
35
curvilnea sea ms efectiva si se utilizan las tcnicas de ajuste de curvas esbozadas O
posteriormente. O
En la situacin donde una grfica de calibracin sea lineal sobre parte de su intervalo, 30
y curva en otra, es de gran importancia para el qumico analtico establecer el intervalo so- ro /
bre el que se supone linealidad. En el siguiente ejemplo se esbozan aproximaciones posibles 'C:; /
c: 25 e
a este problema. III
o
en
...o
III
20
Ejemplo. Analice el intervalo de calibracin lineal del siguiente experimento de :::l
fluorescencia. ;:

15
Intensidad de fluorescencia 0.1 8.0 15.7 24.2 31.5 33.0
Concentracin, flg/ml O 2 4 6 8 10 10

El anlisis de los datos muestra que la parte de la grfica prxima al origen se adapta
bastante bien a una lnea recta con una ordenada en el origen prxima a cero y una 5
pendiente cercana a 4. La fluorescencia de la solucin estndar de 10 JgJml es
claramente inferior a la esperada si se tiene en cuenta estas bases, y existe alguna
posibilidad de que la desviacin de la linealidad afecte tambin a la fluorescencia o 2 4 6 8 10
estndar de 8 JgJml. En primer lugar, se aplican clculos de regresin lineal (no
concentracin, ,ug/ml
ponderada) a todos los datos; de la aplicacin de los mtodos de las secciones 5.3 y 5.4
se obtienen resultados a = 1.357, b= 3.479 Y r = 0.9878. De nuevo tenga en cuenta que Figura 5.14 Regresin curvilnea: identificacin del intervalo lineal. Los datos usados son los de
el valor alto de r puede ser engaoso, aunque se pueda utilizar en un sentido compara- la pg. 116; se muestran las rectas de regresin no ponde~adas a travs de t~dos los puntos ( __ ),
tivo (vase ms adelante). En este caso los residuos de y son -1.257, -0.314, +0.429, a travs de los cinco primeros puntos (- - -), y a traves de los cuatro pnmeros puntos (....).
+1.971, +2.314, y -3.143, Yla suma de los cuadrados de los residuos es igual a 20.981.
La tendencia de los valores de los residuos sugiere que el ltimo valor de la tabla est cuadrados de 0.14. Con esta lnea de calibracin el residuo de y para la solucin de 8
probablemente fuera del intervalo lineal. Jg/ml es -0.5: este valor es ms grande que los otros residuos pero no en una .canti?ad
Esta sospecha se confirma aplicando las ecuaciones de regresin lineal slo a los significativa. De este modo podemos concluir que es razonablemente seguro incluir el
cinco primeros puntos, resultando a ~ 0.100, b = 3.950 Y r = 0.9998. La pendiente y la punto (8, 31.5) dentro del intervalo lineal del mtodo. Al tomar una decisin marginal
ordenada en el origen estn mucho ms cerca de los valores esperados para la parte de de este tipo, el qumico analtico tendr en cuenta la exactitud requerida en sus
la grfica ms prxima al origen, y el valor de r es mayor que el primer clculo. Los resultados y el valor reducido de un mtodo para el cual el intervalo de calibracin es
residuos de los primeros cinco puntos de esta segunda ecuacin de regresin son O, O, muy corto. Los clculos descritos anteriormente se resumen en la figura 5.14.
-0.2, +0.4 y -0.2, con una suma de cuadrados de slo 0.24. El uso de la segunda
ecuacin de regresin muestra que la fluorescencia esperada de un patrn de lOJg/ml Una vez que se ha tomado la decisin de que una serie de puntos de calibracin no se
es 39.6, es decir, el residuo es -6.6. El uso de la prueba t (Cap. 3) mostrara que este ajustan satisfactoriamente a una lnea recta, el analista puede jugar otra carta antes de
ltimo residuo es significativamente ms grande que el promedio de los otros: en forma resignarse a los complejos clculos de regresin curvilnea. Puede ser capaz de transfor-
alternativa se podra aplicar una prueba (Sec. 3.6) para demostrar que es un "residuo mar los datos de manera que una relacin no lineal cambie a una lineal. Un mtodo
anmalo" entre los residuos. En este ejemplo, los clculos, aunque tediosos, son particularmente comn es representar lag y y/o lag x en vez de yo x. ~sto genera r~laciones
necesarios: el gran residuo del ltimo punto, unido con los residuos muy bajos de los lineales de curvas originales de la forma y = px". Tales transformaciones se aplican muy
otros cinco puntos y una suma de cuadrados enormemente reducida, confirma que el regularmente a los resultados de ciertos mtodos, por ejemplo inmunoensayos. Es impor-
intervalo lineal del mtodo no llega ms all de 10 Jg/ml. tante sealar que la transformacin puede afectar tambin a la naturaleza de los errores en
Despus de establecer que el ltimo punto puede excluirse del intervalo lineal, los diferentes puntos de la grfica de calibracin. Suponga que en una serie de mediciones
podemos repetir el proceso para estudiar el punto (8, 31.5). Podemos realizarlo de la forma y ~ px", las magnitudes de los errores aleatorios en y son independientes de x;
calculando la recta de regresin slo para los primeros cuatro puntos de la tabla, con la transformacin de los datos en forma lineal al tomar logaritmos generar datos cuyos
los resultados a = O, b = 4.00, r ~ 0.9998. El valor del coeficiente de correlacin sugiere errores en lag y l/O son independientes de los x. En este caso, y en cualquier otro donde la
que esta lnea se ajusta tan bien a los puntos como la anterior, en la cual se usaban cinco forma esperada de la ecuacin se conozca a partir de consideraciones tericas o de
puntos. Los residuos de este tercer clculo son +0.1, O, -0.3, y +0.2, con una suma de experiencia de mucho tiempo, es posible aplicar ecuaciones de regresin ponderadas
(vase la Seco 5.10) a los datos transformados. Se puede demostrar que, si los datos de la la actualidad con notable xito a travs de la aplicacin de funciones a trozos (splines).
forma general y ~ (x) se transforman en una ecuacin lineal Y = BX -i- A, el factor de En la prctica, se usan ms las splines cbicas, de manera que la aproximacin consiste
ponderacin, W, utilizado en las ecuaciones (5.14) a (5.17) se obtiene de la relacin: en ajustar una curva mediante una serie de ecuaciones cbicas. Estas "partes" cbicas estn
unidas en p puntos llamados "nudos", y es esencial que las dos primeras derivadas de los
W = (1/ [dY /dy ] )2
(5.18) dos trozos coincidentes en cada nudo sean iguales. As pues, una spline cbica completa
tiene (p - 1) trozos o segmentos, cada uno con cuatro coeficientes (es decir, de la forma y
En este ejemplo, y = px', de manera que Y = In y, y d}'; /dy = d In y /dy = l/y. As, ~ a + bx + er + dx 3) . Es necesario calcular (p - 1) (111 + 1) coeficientes donde 111 sea el orden
w, = jf. Desafortunadamente, no existen muchos casos de qumica analtica donde la forma del polinomio, tres en este caso. Las estrategias utilizadas en estos clculos son demasiado
matemtica exacta de una ecuacin de regresin no lineal se conozca con certeza, de modo complejas para que las consideremos aqu, pero es notable que se hayan apl icado con xito
que esta aproximacin tiene un valor restringido. funciones de spline a ensayos de competencia obligatoria como radioinmunoensayos, a
T~mbin debera considerarse que, en contraste con la situacin descrita en el prrafo espectrometra de emisin atmica, y a experimentos de cromatografa gas-lquido.
antenor, los resultados se pueden transformar para generar datos que podran tratarse por Si la curvatura de la grfica de regresin no es demasiado severa, y si los puntos de
mtodos no ponderados. Datos de la forma y = bx, con errores en la direccin y claramente calibracin no estn demasiado separados (condiciones usualmente satisfechas en trabajos
dependientes de x estn sujetos algunas veces a transformaciones lag-lag: los errores en analticos prcticos), puede usarse un mtodo sencillo, aunque aproximado, en lugar de la
lag y tienen entonces una variacin sensiblemente menor con lag x, de manera que los datos aproximacin compleja del ajuste de curvas. Esto conlleva el trazo de una lnea recta entre
transformados se pueden estudiar mediante ecuaciones de regresin no ponderadas. cada par de puntos y el clculo de concentraciones utilizando la interpolacin lineal, es
Si una simple transformacin algebraica no puede convertir los datos experimentales decir, la curva se trata como una serie de segmentos cortos y rectos. Este mtodo no
en fo~a l~n.eal, ser necesario ajustar una curva al conjunto de puntos de calibracin, y proporciona, por supuesto, lmites de confianza para las concentraciones calculadas, pero
despues utilizar esta curva para determinar la concentracin de muestras problema. El su sencillez lo hace muy atractivo y los errores sistemticos son, a menudo, sorprendente-
ajuste de una c.urva p~ede ser un proceso iterativo complejo, en el cual los programas de mente pequeos. Este punto se aclara en uno de los ejercicios al final del captulo.
computadores interactivos que muestren los resultados de las iteraciones sucesivas sern
de gran ayuda para el analista. Una estrategia frecuente es tratar de ajustar una curva de
expresin general y = a + bx + ex 2 + dx' + ... , es decir, un polinomio en x. El xito BIBLIOGRAFA
del proceso de ajuste a una curva puede valorarse, precisamente como en los clculos de
regresin lineal, mediante el mtodo de los mnimos cuadrados, el programa del compu- Aeton, F. S., Analysis of Straight Line Data, Nueva York,Dover, 1966. Un tratamiento general bien
tador buscar la curva que minimice la suma de los cuadrados de los residuos de y. Se escrito y extenso, con abundancia de ejemplos, incluyendo algunos de qumica. A pesar de su ttulo,
dispone de mtod.os no linea.les ponderados, con un inevitable incremento en la compleji- tambin hace referencia a la regresin curvilnea.
dad. Todos los mtodos de ajuste de curvas deben aplicarse con sentido comn, si se tiene Caulcutt, R. y Boddy, R., Statistics for Analytical Chemists, Londres, Chapman & Hall, 1983. Una
n puntos en la grfica de calibracin, el polinomio de orden ms alto que puede utilizarse aproximacin totalmente pragmtica, falto de teora estadstica, pero lleno de ejemplos de sentido
comn. Orientado hacia la qumica analtica industrial.
es el d~ orden (n - 1.). En general, se adoptar el polinomio de orden ms bajo que
proporciona un buen ajuste, y frecuentemente ser satisfactoria una ecuacin cuadrtica o Davies, O. L. y Ooldsmith, P. L., Statistical Methods in Researeh and Production, Londres,
Longmans, 1982. Un tratamiento bastante completo de los mtodos de regresin y correlacin, que
cbica. Es muy importante sealar, sin embargo, que las curvas de calibracin encontradas pone un considerable nfasis sobre conceptos avanzados tales como regresin curvilnea y problemas
en la prctica se obtienen a menudo de la superposicin de dos o ms fenmenos fsicos. de regresin mltiple.
En tll~orimetra, por ejemplo, las representaciones seal contra concentracin pueden ser Draper, N. R. y Smith, H., Applied RegressionA nalysis, Nueva York,Wiley, 1966. Un trabajo clsico
aproximadamsnre lineales en solucin muy diluida, pero a altas concentraciones exhibirn en este campo, con una cobertura de mximo alcance.
curvatura debido a (a) el tipo de ptica utilizada y (b) la falla de supuestos algebraicos Kaiser, H. y Menzies, A. c., The Limit of Detection of a Complete Analytical Procedure, Londres,
s~bre los que se pronostique una representacin lineal. Los efectos (a) y (b) son indepen- Hilger, 1968. Una interesante discusin sobre limites de deteccin.
dientes, de manera que pueden aparecer en la prctica muchas curvas de diferente forma. Snedecor, O. W. y Cochran, W. O., Statistical Methods, Iowa State University, 1967. Aporta una
(Por razones de este tipo las curvas de forma conocida y pronosticable rara vez se excelente cantidad de procedimientos de regresin y correlacin.
encuentran. en el trabajo analtico, vase 10 anterior). Esto es tan importante que las Liteanu, C. y Rica, 1., Statistical Theory and Methodology ofTrace Analysis, Chichester, Horwood,
representacIOnes de regresin no lineales no sonjams extrapolables ms all de las regio- 1980. Amplia cobertura de mtodos de anlisis de trazas.
nes exploradas realmente en el proceso de ajuste de la curva.
Si las grficas de calibracin no lineal son de hecho el resultado de la superposicin de
dos o. ms procesos fsico-qumicos, parace oportuno sugerir que no debemos esperar EJERCICIOS
eC~Iaclones algebraicas sencillas que ajusten los puntos de calibracin con plena satisfac-
Clono Por qu no intentar ajustar los puntos de una curva que conste de varias secciones
1. En un laboratorio provisto de equipo polarogrfico se tomaron seis muestras de polvo a varias
distancias del polargrafo y se determin el contenido de mercurio de cada muestra. Se
unidas con diferente forma matemtica? Esta es exactamente la aproximacin utilizada'en obtuvieron los siguientes resultados.
Distancia al polargrafo, m: 1.4 3.8 7.5 10.2 11.7 15.0 8. Una determinacin con un electrodo selectivo de iones (ES!) del sulfato procedente de sulfato
Concentracin de mercurio, ng/g: 2.4 2.5 1.3 1.3 0.7 1.2 reducido por bacterias se compar con una determinacin gravimtrica. Los resultados obteni-
dos se expresaron en miligramos de sulfuro.
Examine la posibilidad de que la contaminacin de mercurio surja del polargrafo.
Muestra: 123 4 5 6 7 8 9 10
2. La respuesta dc un ensayo colorimtrico para glucosa (GLU) se control con la ayuda de Mtodo ESI: 108 12 152 3 106 11 128 12 160 128
soluciones estndar de glucosa. Determine el coeficiente de correlacin a partir de los siguientes Gravimetra: 105 16 113 O 108 11 141 11 182 118
datos, y comente los resultados.
Comente la conveniencia del mtodo ESI para esta determinacin de sulfuro. (Al-Hitti, 1. K.,
Concentracin de GLU, mM: o 2 4 6 8 10 Moody, G. 1. YThomas, 1. D. R., Analyst, 1983,108,43.)
Absorbancia 0.002 0.150 0.294 0.434 0.570 0.704
9. En la determinacin de plomo en solucin acuosa por espectrometra de absorcin atmica con
3. Se obtuvieron los siguientes resultados cuando se analizaron una serie de soluciones estndar atomizacin en cmara de grafito, se obtuvieron los siguientes resultados.
de plata por cspcctromctria de absorcin atmica de llama.
Concentracin de plomo, ng/ml: 10 25 50 100 200 300
Concentracin ngjml: o 5 10 15 20 25 30 Absorbancia: 0.05 0.17 0.32 0.60 1.07 1.40
Absorbancia: 0.003 0.127 0.251 0.390 0.498 0.625 0.763
Examine el intervalo de calibracin lineal de este experimento. (Basado en Giri, S.K., Shields,
Determine la pendiente y la ordenada en el origen de la grfica de calibracin, junto con sus c.x., Littlejohn, D. y Ottaway, J.M., Analyst, 1983,108,244.)
limites de confianza.
10. En un anlisis instrumental se obtuvieron los siguientes datos (unidades arbitrarias).
4 Utilizando los datos del ejercicio 3, estime los limites de confianza para las concentraciones de
plata en: (a) una muestra que proporciona una absorbancia de 0.308, 0.314, 0.347 Y 0.312 en Concentracin: o 1 2 3 4 5 6 7 8 9 10
cuatro anlisis separados. Seal: 0.2 3.6 7.5 11.5 15.0 17.0 20.4 22.7 25.9 27.6 30.2

5. Estime el limite de deteccin del anlisis de plata de los datos del ejercicio 3. Trace la grfica de calibracin, y compare las concentraciones correspondientes a las seales
de 5, 16 Y 27 unidades, (a) ajustando una lnea recta a los puntos, (b) ajustando la curva y = 4x
6 El contenido de oro de una muestra de agua de mar concentrada se determin por espectrometra _ 0.lx2, (c) tratando la curva como una serie de segmentos lineales entre (Xl, YI) Y (X2, Y2), (X2,
de absorcin atomica mediante el mtodo de las adiciones estndar. Los resultados obtenidos Y2) y (X3, Y3), etc., y (d) tratando la curva como una serie de segmentos lineales utilizando slo
fueron los siguientes. puntos (Xl, Yl), (X3, Y3), (X5, Y5), etctera.

Oro aadido, ng por ml


de muestra concentrada: o 10 20 30 40 50 60 70
Absorbancia: 0.257 0.314 0.364 0.413 0.468 0.528 0.574 0.635

Estime la concentracin del oro en la muestra de agua de mar, y determine los lmites de
confianza para esta concentracin.

La 0uorescencia de una serie de soluciones cidas de quinina fue determinada 5 veces; los
resultados se exponen a continuacin:

Concentracin, ngjml: O 10 20 30 40 50
Intensidad de fluorescencia: 4 22 44 60 75 104
(unidades arbitrarias) 3 20 46 63 81 109
4 21 45 60 79 107
5 22 44 63 78 101
4 21 44 63 77 105

Determine la pendiente y ordenada en el origen (a) la recta de regresin no ponderada y (b) la


recta de regresron ponderada. Calcule, utilizando ambas rectas de regresin, los limites de
confianza para la concentracin de las disoluciones con intensidades de fluorescencia de 15 y
90 unidades.
6.2 LAMEDIANA

En los captulos anteriores se ha utilizado la media aritmtica o promedio como la "medida


de tendencia central" de un conjunto de resultados. Esto es bastante lgico cuando se
supone la distribucin (simtrica) normal, aunque en estadstica no paramtrica se utiliza
habitualmente en su lugar la mediana. Para calcular la mediana de 11 observaciones, se
disponen en orden creciente (en el caso improbable de que 11 sea muy grande, este
proceso de ordenacin puede realizarse rpidamente con programas sencillos qu~ se
encuentran disponibles para la mayora de los microcomputadores). Entonces, la mediana
se define como el valor de la observacin que ocupa el lugar ~(11 + 1) si 11 es impar, y el
promedio de las observaciones que ocupan los lugares ~n y dn
Mtodos no paramtricos + 1) si n es par. La
determinacin de la mediana de una serie de resultados experimentales generalmente no
y de ejecucin rpida requiere muchos clculos. Adems, en muchos casos puede ser una medida de tendencia
central ms realista que la media artitmtica.

Ejemplo. Determine la media y la mediana para los cuatro valores siguientes de una
titulacin.

61 INTRODUCCIN
25.01 25.04 25.06 25.21 ml

Este capitulo describe una serie de mtodos estadsticos tiles que difieren en un aspecto
importante de los discutidos hasta ahora. Todas las pruebas desarrolladas en los captulos Es fcil calcular que la media de de estas cuatro observaciones es de 25.08 ml y que la
anteriores suponen que los datos que se analizan siguen la distribucin normal (Gaussiana). mediana es de 25.05 ml -en este caso es el promedio del segundo y tercer valores, ya
La validez ele esta hiptesis se basa en el teorema del lmite central (vase el Cap. 2), que que las medidas estn ordenadas numricamente. La media es mayor que cualquiera
demuestra que la distribucin muestral de la media puede ser aproximadamente normal de los tres valores ms prximos entre s (25.01, 25.04 Y 25.06 rnl) y de este modo
aunque la poblacin de referencia tenga una distribucin muy diferente: la aproximacin puede ser una medida de tendencia central menos realista que la mediana. En lugar de
mejora a medida que el tamao de la muestra aumenta. calcular la mediana podramos utilizar los mtodos del captulo 3 para probar el valor
Sin embargo, existen varias razones por las cuales deberamos estar interesados en 25.21 como un posible resultado anmalo, y determinar la media de acuerdo con el
mtodos que no requieran tal hiptesis. En primer lugar, algunos conjuntos de datos que resultado obtenido, pero esta aproximacin implica clculos extras y supone que los
interesan a los qumicos analticos no se distribuyen normalmente. Por ejemplo (vase el datos proceden de una distribucin normal.
Clp. 2). las concentraciones de anticuerpos en el suero sanguneo de un grupo de personas
diferentes puede expresarse aproximadamente como una distribucin lag-normal: dichos Este simple ejemplo ilustra una propiedad valiosa de la mediana: sta no se ve afectada
resultados no son en absoluto infrecuentes cuando se realiza una medicin concreta sobre por los resultados extremos o anmalos. Los lmites de confianza (vase el Cap. 2) para la
cada elemento de un grupo humano o de animales. En segundo lugar, en muchos experi- mediana se pueden estimar con la ayuda de la distribucin binomial. Este clculo puede
mentos utilizamos de hecho muestras pequeas de datos (p. ej. slo 3 4 titulaciones en

realizarse aun cuando el nmero de mediciones sea pequeo, pero no es habitualmente


uumalisis volumtrico), de manera que incluso el teorema del lmite central sera de escasa necesario en qumica analtica donde la mediana se utiliza por lo general slo como una
relevancia. Finalmente, los mtodos de los captulos precedentes exigen, a menudo, estimacin rpida de un promedio. El lector puede consultar la bibliografa para mayor
1;; i!C!1OS clculos detallados; en contraposicin, muchos de los mtodos que se describen
informacin.
't! este captulo simplifican en gran parte, los clculos. De hecho, algunas de las pruebas
En estadstica no paramtrica la medida habitual de dispersin (que sustituye a la
realizan mentalmente con suma facilidad, caracterstica muy deseable para efectuar una desviacin estndar) es el recorrido intercuartlico. Como ya hemos visto, la mediana
nrueba.
divide la muestra de mediciones en dos mitades iguales; si cada una de stas se divide
Los mtodos estadsticos que no suponen una forma especfica de la distribucin de la posteriormente en otras dos mitades, los puntos de divisin se denominan cuartiles
cual se tornan los datos, se denominan mtodos no paramtricos o de distribucin libre. inferior y superior. Al hacer este clculo se utilizan varios convenios diferentes; de
El: las siguientes secciones se dar una idea general de una serie de mtodos no param-
nuevo, el lector interesado puede consultar la bibliografa. El recorrido intercuartlico no
neq", y en muchos de ellos slo se describirn las operaciones de las pruebas sin entrar
es muy usado en el trabajo analtico, pero varias pruebas estadsticas se pueden ejecutar
, t '11] desarrollo terico detallado.
con l.
6.3 LA PRUEBA DE SIGNOS
en muchas situaciones prcticas, un analista utilizar siempre el mismo valor de 11, es decir,
tomar siempre el mismo nmero de lecturas o muestras, y podr memorizar con facilidad
La prueba de signos es uno de los mtodos no paramtricos ms simples y se empez a las probabilidades correspondientes a los diversos signos + o -.
estudiar por primera vez a principios del siglo XVIII. Se puede utilizar de diferentes formas La prueba de signos puede utilizarse tambin como una alternativa no paramtrica a la
la ms simple se ilustra con el siguiente ejemplo. '
prueba t por parejas (vase la Seco 3.4) para comparar dos grupos de resultados para las
mismas muestras. As, si se examinan diez muestras con cada uno de los dos mtodos, A y
Ejemplo. Un preparado farmacutico exige tener un contenido mediano del 8% de un B, se puede contrastar si los dos proporcionan lecturas significativamente diferentes,
constituyente concreto. En la prctica se encontraron lotes que contenan 7.3, 7.1, 7.9, calculando para cada muestra la diferencia en los resultados, es decir [(resultado obtenido
9.1, 8.0, 7.1, 6.8 Y 7.3 % del constituyente. Al nivel de significacin del 5%, indica por el mtodo A) - (resultado obtenido por el mtodo B)]. La hiptesis nula ser que los
esto que la mediana exigida es incorrecta? .
dos mtodos no proporcionan resultados significativamente diferentes -en la prctica esto
significar nuevamente que la probabilidad de obtener un signo ms (o un signo menos)
En el captulo 3 (vase la Seco 3.2) se demostr que tales problemas podran abordarse es 0.5. Ahora se puede comparar el nmero de signos ms o menos obtenidos con la
utilizando la prueba t despus de calcular la media y la desviacin estndar de los datos probabilidad que se deriva de la ecuacin (6.1). En los ejercicios que se encuentran al final
experimentales. ~a prueba t supone que los datos se distribuyen normalmente. La prueba de este captulo aparece un ejemplo de esta aplicacin de la prueba de signos.
de signos prescinde de tal hiptesis y es mucho ms fcil de realizar. A cada valor Otro uso de la prueba de signos es indicar una tendencia. Esta aplicacin se ilustra
experimental se le resta a su vez, la mediana postulada, y se considera el signo de cada mediante el siguiente ejemplo.
resultado. Se ignoran por completo aquellos valores que son iguales a la mediana postulada.
En este caso, por tanto, disponemos efectivamente de siete valores experimentales seis de Ejemplo. El nivel de una hormona en el plasma sanguneo de un paciente se mide a la
ell?s inferiores a la mediana y a los que individualmente se les da el signo menos, y uno misma hora cada da durante diez das. Los datos resultantes son:
mas .grand~ que la mediana al que se le da el signo ms. Para contrastar si esta preponde-
rancia de .s:gnos menos es significativa utilizamos la ley binomial. Esta ley establece que Da 234 678 9 10
1 5
la probabilidad de que aparezcan r signos menos entre 11 signos est dada por: Nivel, ng/ml 5.8 7.3 4.9 6.1 5.5 5.5 6.0 4.9 6.0 5.0
P(r) = "C,p'q(" - ,)
(6.1) Existe alguna evidencia de que haya una tendencia en la concentracin de hormona?

donde "e indica el nmero de combinaciones de r elementos de un total de 11 elementos Utilizando mtodos para mtricos , sera posible elaborar una grfica de regresin lineal
P es la. ~robabilidad de que aparezca un signo menos en uno de los resultados y q es 1; de tales datos y contrastar si su pendiente difiere significativamente de cero (vase el
probabilIdad de que no aparezca un signo menos en uno de los resultados, es decir, q = 1 Cap. 5). Tal aproximacin supondra que los errores se distribuyen normalmente y que
- p ', ~a que la ~ediana se define de manera que la mitad de los resultados experimentales cualquier tendencia que apareciese sera del tipo lineal. La aproximacin no pararn-
se sita por encuna de ella y la otra mitad por debajo, queda claro que si la mediana es 8.0 trica es de nuevo ms simple. Los datos se dividen en dos grupos iguales de la siguiente
en este caso~ entonces p y q deberan ser~. Utilizando la ecuacin (6.1) encontramos que forma:
P(6) ~ 7C~ (:i)6 ~ 2 ~ 7/128. De manera similar podemos calcular que la probabilidad de
obtener siete signos menos, P(7), es 1/128. Por lo tanto, en general la probabilidad 5.8 7.3 4.9 6.1 5.5
de obtener seis o ms signos negativos en nuestro experimento es 8/128. La cuestin slo 5.5 6.0 4.9 6.0 5.0
c?n~iste en saber si los datos difieren significativamente de la mediana postulada. Por con-
siguiente, debemos realizar una prueba de dos colas (vase el Cap. 3), es decir, debemos Al resultado del primer da se le resta el del sexto da, al del segundo da el del sptimo,
c~lcular la probabilidad de obtener 6 o ms signos idnticos (o sea, ~ 6 signos ms o ~ 6 etc. Los signos de las diferencias entre los pares de valores en las cinco columnas se
signos menos), cuando se toman al azar siete resultados. Esto es claramente 16/128 = 0.125. determinan de esta manera y son +, +, O, +, +. Como es habitual, el valor O se ignora,
Lll~~O comparamos esta cifra con 0.05, es decir, realizamos la prueba al nivel de signifi- y quedan cuatro resultados, todos ellos positivos. La probabilidad de obtener cuatro
cacion ?el 5%. Puesto que el valor experimental es mayor que 0.05, nuestra hiptesis nula signos idnticos en cuatro pruebas es claramente 2 x (1/16) = 0.125. (Observe que
(es decir, que los datos proceden de una poblacin de mediana 8.0) no se puede rechazar. nuevamente se utiliza una prueba de dos colas, ya que la tendencia en el nivel
Igual que en el captulo 3, es importante observar que no se ha probado que los datos de hormona podra ser ascendente o descendente.) La hiptesis nula, de que no existe
proceden de tal poblacin; slo se ha probado que tal hiptesis no se puede rechazar. ninguna tendencia en los resultados, no se puede rechazar en esta forma al nivel de
Qu.eda claro a partir de este ejemplo que la prueba de signos conllevar al uso frecuente significacin del 5%.
'le la d trib .. bi . I
,. IS n ucion unonua con p = q = 2. Esta aproximacin es tan comn en la estadstica
',lO parall1~trica que la mayora de las tablas estadsticas incluyen los datos necesarios, lo El lector crtico puede encontrar este resultado bastante insatisfactorio. Si se observan
cual permite que tales clculos se realicen instantneamente (vase la tabla A.7). Adems, los datos, es difcil resistirse a la conclusin de que, a pesar de los resultados de la prueba
de signos, hay de hecho una tendencia descendente en los resultados. Por ejemplo, la que se puedan dividir o convertir en slo dos categoras. Supongamos, por ejemplo, que
media de los tres primeros resultados es 6.00, la de los cuatro siguientes es 5.78, y la de se dispone de los tiempos de funcionamiento de doce lmparas que se han ido colocando
los tres ltimos es 5.30. Esta aparente discrepancia en parte es una consecuencia de la sucesivamente en un espectrmetro como fuentes de luz y que son 450, 420, 500, 405, 390,
filosofia del contraste de hiptesis: no podernos rechazar la hiptesis de que no existe 370, 380, 395, 370', 370, 420, Y 430 horas. El tiempo de vida mediano, es en este caso el
tendencia en los resultados, pero esto no significa que tal tendencia deba necesariamente promedio de los tiempos de funcionamiento de las lmparas sexta y sptima cuando los
estar ausente. Sin embargo, el ejemplo indica tambin que por la extrema sencillez de la datos estn dispuestos en orden creciente, es de 400 horas. Si a todas aquellas lmparas
prueba de los signos se pierde cierta potencia estadstica. La prueba no utiliza toda con tiempos de funcionamiento menores, que el mediano se les asigna un signo -, y a todas
la informacin ofrecida por los datos, por eso no es sorprendente encontrar que tambin aquella con tiempos de vida superiores se les asigna un signo +, entonces resulta la siguiente
proporciona menos informacin discriminante. En secciones posteriores se analizarn frecuencia + + + + - - - - - - + +. sta es la misma secuencia que la del ejemplo de
mtodos no para mtricos que utilizan las magnitudes de los resultados individuales as regresin anterior, y se demuestra de la misma manera que es significativamente no
como sus signos.
aleatoria. En este caso, las variaciones significativas que se producen en los tiempos de
funcionamiento se podran explicar porque las lmparas proceden de diferentes fabricantes
o de diferentes lotes.
6.4 LA PRUEBA DE RACHAS DE WALD-WOLFOWITZ
Tambin es importante resaltar que puede incomodamos mucho el tratar con nme-
ros inusualmente grandes de rachas cortas, as como con nmeros inusualmente peque-
En algunos casos puede interesarnos no slo si las observaciones generan signos positivos os de rachas largas. As pues, si se dan 6 signos + y 6 signos - en el orden + - + - + - +
o negativos, sino tambin si stos aparecen en una secuencia aleatoria. En la seccin 5.11, - + - + -, podramos sospechar que existe una secuencia no aleatoria. La tabla A.8 muestra
por ejemplo, se demostr que s una linea recta es un buen ajuste a una serie de puntos de que, con N = M = 6, un total de 11 12 rachas indica que la hiptesis nula de un orden
calibr.icion , los residuos positivos o negativos ocurrirn ms o menos al azar. Por el aleatorio se debera rechazar y sospechar una cierta periodicidad en los datos.
contrario, a] intentar ajustar una linea recta a un conjunto de puntos que realmente se sitan
en una linea curva resultaran secuencias no aleatorias de signos positivos o negativos;
podra s~~r, por ejemplo, una secuencia de signos +, seguida de una de signos _, y luego 6.5 PRUEBAS BASADAS EN EL RECORRIDO DE LOS RESULTADOS
otr,: de SI.2nos +. Dichas secuencias se conocen tcnicamente como rachas -el significado
utilizado aqu es el mismo que cuando alguien se refiere a "una racha de mala suerte", o En los captulos anteriores la desviacin estndar se ha utilizado como la medida de
cuando un deportista experimenta "una racha de malos resultados". En el caso del ajuste
dispersin o "variabilidad" ms comn de un conjunto de resultados. En estadistica no
de curvas, queda claro que una secuencia no aleatoria de signos + y - conducir a un nmero paramtrica se utiliza frecuentemente el recorrido intercuartlico (vase la Seco 6.1) como
ms pequeo de rachas que una aleatoria. El mtodo de Wald-Wolfowitz prueba si el
una medida de dispersin. Adems varias pruebas muy tiles se basan en el recorrido
numero de rachas es suficientemente pequeo para que se rechace la hiptesis nula de una completo wde la muestra, es decir, la diferencia entre el valor ms grande y el ms pequeo.
distribucin aleatoria de los signos. El nmero de rachas en los datos experimentales se Es evidente que w ser ms fcil de calcular que el recorrido intercuartlico, y de hecho los
c,ompara con los nmeros de la tabla A.S, que se presentan al nivel de significacin del 5%. clculos de la mayora de las pruebas descritas en esta seccin se pueden realizar mental-
f~n esta tabla s~ entra uti,l.izando los valores apropiados de N, el nmero de signos +, y M, mente. No obstante, debe recalcarse que aunque estas pruebas son rpidas, no son no
e, numero de signos -. SI el nmero experimental de rachas es ms pequeo que el valor paramtricas: por ejemplo los clculos utilizan la media aritmtica de la muestra y no la
:;:lmlado, entonces se puede rechazar la hiptesis nula.
mediana.
En lugar de las dos aplicaciones elementales de la prueba se pueden utilizar pruebas
Ejelll~lo. Para ajustar una recta a un conjunto de 12 puntos de calibracin se proponen simples de recorridos. En la seccin 3.2 se describi el uso de las prueba t para comparar
ecuaciones de re~resin lineal. Los signos de los residuos resultantes ordenados por una media experimental con un valor conocido o estndar. En lugar de esta prueba el
valores de x crecientes son: + + + + - -- - - - - + +. Comente si sera mejor intentar estadistico Ti se puede calcular a partir de la ecuacin
ajustar una curva a los puntos.
Aqu es evidente que N = M = 6, Y que el nmero de rachas es 3. La tabla A.8
Ti = Ix - VI/w (6.2)
muestra que, al nivel ele significacin del 5%, el nmero de rachas debe ser <4 si se
rechaza la hiptesis nula. As, en este caso, podemos rechazar la hiptesis nula y donde x es la media y Vel valor estndar.
concluir que la secuencia de signos + y - no es aleatoria. Por lo tanto resulta poco
satisfactorio intentar ajustar una linea recta a los puntos experimentales, y en su luaar Ejemplo. En una mtodo de determinacin de mercurio por espectrornetra de absorcin
se propone IlIld grificd de regresin curvihnea. b
atmica de vapor fro se obtuvieron los siguientes valores para un material estndar
que contena el 38.9% de mercurio:
Existen otros dos plintos de inters en relacin con la prueba de Wald- Wolfowtz. El
l\r"".,." es que merece la pella observar que se puede utilizar con cualesquiera resultados
38.9,37.4 37.1 %
(Hou, P K., Lau, O. W. y Wong, M. c., Aualyst, 1983, 108, 64.) Ya se utiliz el recorrido en otra prueba descrita en el captulo 3 (vase la seccin 3.6),
la prueba Q para resultados anmalos. Entonces se demostr que el valor experimental de
Existe alguna evidencia de error sistemtico? Observe que este ejemplo es el mismo Q [dado por (valor sospechoso) - (valor ms prximojl jrecorrido] se puede comparar con
que el de la seccin 3.2.
un conjunto de valores tabulados (tabla AA) para establecer si una medicin sospechosa
Es evidente que la media, x, en este caso es 37.8 %, y el recorrido, w, es 1.8 %. El podra ser candidata al rechazo. Se puede demostar que una forma ms simple, pero
valor de Ti es, por tanto, [ecuacin (6.2)] 137.8 - 38.91/1.8 = 0.611. Este valor se aproximada de esta prueba, prescinde de tablas. Un resultado anmalo se puede rechazar
compara con el de la tabla A.9, para n ~ 3 Y P ~ 0.05. El valor tabulado es 1.304: ya al nivel de significacin P ~ 0.05 si Q > -/(2jn) , y al nivel P ~ 0.01 si Q > -/(3/11) , c1onc1e
que el valor experimental es ms pequeo no podemos rechazar la hiptesis nula, o n es el nmero de mediciones incluyendo aquella que es aparentemente anmala.
sea, que los datos experimentales podran venir de una poblacin con un valor medio Esta prueba sirve para recordar que los mtodos de recorridos presentan la gran
de 38.9% de mercurio. Este resultado -que al nivel de significacin del 5% manifiesta desventaja de verse muy afectados por uno o ms resultados anmalos. En contraposicin,
ausencia de error sistemtico- es el mismo que el obtenido en la seccin 3.2 mediante los mtodos verdaderamente no paramtricos son por lo general inmunes a tales resulta-
la prueba t, aunque los clculos en este caso se realizan obviamente con mayor facili- c1os. Las pruebas de recorrido poseen otra desventaja: tienen menos potencia estadstica
dad. Hay que agregar que la prueba Ti puede utilizarse tambin para estimar lmites que los mtodos correspondientes decritos en el captulo 3. Debido a que las pruebas de
de confianza; en este caso los limites de confianza estarn dados por x (1.304 x 1.8) recorrido no utilizan todos los datos disponibles, habr casos en los que una prueba F, por
~ 37.8 2.]% (un recorrido que, como se esperaba, incluye el 38.9%). ejemplo, indique que la hiptesis nula apropiada pueda ser rechazada, pero su alternativa
ms simple, el sustituto de la prueba F, indique que la hiptesis nula debera ser aceptada.
Una prueba muy similar puede utilizarse en vez de la prueba t en la comparacin de La popularidad de las pruebas de recorrido indica que la simplicidad en los clculos es una
dos valores medios. Si se compara Ull conjunto de datos de media X y recorrido w con un compensacin ms que suficiente a todos estos problemas.
segundo conjunto de datos con el mismo valor de n y de media X2 y recorrido W2
respccti vamente, el estadstico T d se calcula a partir de la expresin:
6.6 LA PRUEBA DE RANGOS Y SIGNOS DE WILCOXON
(6.3)
La seccin 6.3 describa el uso de la prueba de signos. Su importancia reside en los
Como es habitual, si el valor experimental de T es menor que el valor tabulado (vase la supuestos mnimos que se hacen sobre los datos experimentales. No se supone que la
tabla 1\.10), entonces se acepta la hiptesis nula de igualdad entre las dos medias muestra- poblacin de la cual se toma la muestra sea normal, ni incluso que sea simtrica -la nica
les. Un ejemplo de este tipo de clculo se propone al final del captulo. Otra prueba con el informacin a priori necesaria es el valor de la mediana. Una cierta desventaja de la
iI1lSJ]]() propsito y que se ha hecho popular es la prueba de recorridos de Lord. En este prueba de signos es que no utiliza toda la informacin disponible. Slo es necesario saber
caso el estadstico de la prueba, L, est dado por:
si una medicin individual es ms grande o ms pequea que la mediana- la magnitud de
esta desviacin no se utiliza en absoluto.
(604) En muchos casos un analista tendr suficientes razones para creer que sus mediciones
se distribuyen simtricamente pero no desea suponer que siguen distribucin nonna!. Este
es. decir utiliza la suma de recorridos en lugar del recorrido promedio. Estas pruebas son supuesto de datos simtricos, y la consecuencia de que la media y mediana de la poblacin
tiles cuando se desea comparar muestras pequeas (11 puede ser tan pequeo como 2), sean iguales, permite desarrollar pruebas de significacin ms potentes. Wilcoxon contri-
pero (como la prueba t descrita en la seccin 3.3) suponen que la poblacin de partida es buy con importantes avances a este respecto, y su prueba de rangos y signos tiene varias
ormal, y que la dispersin es razonablemente similar en las dos muestras. De nuevo su aplicaciones. Su mecanismo se ilustra mucho mejor con un ejemplo.
ven radica en la sencillez de los clculos. La tabla A.lO proporciona un conjunto de
lor,:s tabulados para L: el rechazo de la hiptesis nula se produce cuando surgen valores Ejemplo. Se encontr que los niveles de plomo en sangre (en pg/rnl) de siete nios eran
.penmentales superiores a los valores tabulados.
104, 79, 98, 150,87, 136 Y 101. Podran proceder estos datos de una poblacin que
Incl uso se puede utilizar otras pruebas simples de recorrido en lugar de la prueba F se supone simtrica, con mediana (media) de 95 pg/ml?
u.rndo se compara la dispersin de dos conjuntos de resultados. En lugar de comparar Los datos comparados con el valor de referencia (95) toman los valores
vananzas. el nuevo estadstico, Fi, compara recorridos; esto es, Fr ~ WfW2 o w-lw; el
Cociente que sea mayor que l. El valor experimental Fr se compara, como es habitual, con 9, -16,3,55,-8,41,6
ios valores tabulados (vase la tabla A.II). Se rechaza la hiptesis nula de que las dos
nuestras proceden de poblaciones de varianzas iguales, si el valor experimental es mayor En primer lugar y prescindiendo del signo se ordenan estos valores de menor a mayor,
'I:L' el valor tabulado. Como en la prueba F convencional se dipone de versiones de una y
resultando:
colas de este "sustituto de la prueba F', la tabla A.II se debe utilizar con cuidado. En
os ejercicios al final del captulo se propone UI1 ejemplo c1eluso de este mtodo. ' 3,6,8,9,16,41,55
A continuacin se incorporan sus signos (en la prctica estos dos pasos se haran de mtrico)]) se distribuiran simtricamente en torno a cero. Es facil obtener las diferen-
una vez): cias sealadas:

3,6,-8,9, -16,41,55 -0.4. -0.7,0.6,0.2, -0.7, -0.2, -0.4, -0.3

Los nmeros entonces se jerarquizan; en este proceso mantienen sus signos pero se Colocando estos valores en orden numrico sin tener en cuenta el signo, tenemos:
les asignan nmeros que indican su orden (o rango), as:
-0.2,0.2, -0.3, -0.4, -0.4, 0.6, -0.7, -0.7
1,2, -3,4, -5,6,7
Queda claro que la asignacin de rangos a estos resultados presenta una dificultad, la
Los rangos positivos suman 20 y los negativos 8. La menor de estas dos cifras (8) se de las posiciones empatadas. Hay dos resultados con el valor numrico 0.2, dos con un
toma como el estadstico de la prueba. El teorema binorninal dar la probabilidad de valor numrico 0.4, y dos con un valor numrico de 0.7, cmo se calculan las
que aparezca este nmero. Si los datos proceden de una poblacin con una mediana posiciones? Este problema, en la prctica el nico que uno se encuentra en los mtodos
de 95, se ~speraria .que las ~umas de los rangos positivos y negativos fuesen aproxima- dejerarquizacin, se resuelve asignando posiciones promedio a los valores empatados,
darnente Iguales; SI la mediana de la poblacin fuese muy diferente de 95, la suma de con signos adecuados: por lo tanto, los rangos resultantes para estos datos son:
los rangos positivos y negativos seria diferente. La probabilidad de que aparezca una
suma concreta en la prctica est dada por una serie de tablas (vase la tabla A.12). En -1.5,1.5, -3, -4.5, -4.5, -7.5, -7.5
esta prueba. se rechaza la hiptesis nula si el valor tabulado es menor o igual que el
valor experimental, es decir, la situacin opuesta de la observada en la mayora de las En estos casos, merece la pena verificar si se ha hecho correctamente la ordenacin
pruebas de sig.ni:icacin. En este ejemplo, el examen de la tabla A.12 muestra que, para calculando la suma de todos los valores, sin tener en cuenta el signo. La suma para los
n = 7, el estadstico de la prueba debe ser menor o igual que 2 para que la hiptesis nula nmeros anteriores es 36, la misma que la suma de los ocho primeros nmeros
-que los datos proceden de una poblacin con una mediana (media) de 95- se puede naturales, y por tanto la ordenacin es correcta. La suma de los valores positivos es 7.5,
rechazar a un nivel de significacin de P = 0.05. En este ejemplo, la hiptesis nula se y la de los valores negativos es 28.5. El estadstico de la prueba es entonces 7.5. Al
debe aceptar claramente. Como de costumbre, se utiliza una prueba de dos colas mirar la tabla A.12 se observa que, para 11 = 8, el estadstico de la prueba tiene que ser
aunque quizs haya ocasiones en los que una prueba de una cola sea ms adecuada. ' menor o igual que 3 para que se pueda rechazar la hiptesis nula al nivel de significacin
P ~ 0.05. En este caso, la hiptesis nula tiene que ser aceptada -no hay evidencia de
Una ventaja importante de la prueba de rangos y signos es que tambin se puede utilizar la mediana (media) de la diferencia sea distinta de cero, y por tanto no hay ninguna
para ~atos por parejas, ya que se pueden transformar en el tipo de datos dados en el ejemplo evidencia sobre de una diferencia sistemtica entre los dos mtoclos analticos.
antenor. De esta forma se puede utilizar el mtodo de rangos y signos corno una alternativa
no paramtrica a la prueba t por parejas (vase la Seco 3.4). De estos ejemplos se desprende que la prueba de rangos y signos es un mtodo simple
y valioso. Su limitacin principal radica en que no se puede aplicar a conjuntos de datos
Ejemplo. La siguiente tabla proporciona el porcentaje de concentracin de zinc deter- muy pequeos: para una prueba de dos colas al nivel de significacin P = 0.05, n tiene que
minado por dos mtodos diferentes, para cada una de las ocho muestras de alimentos. ser al menos 6.

Muestra Titulacin con AEDT Espectrometria atmica


1 7.2 7.6 6.7 LA PRUEBA DE SUMA DE RANGOS DE WILCOXON y MTODOS
2 6.1 6.8
3 RELACIONADOS
5.2 4.6
4 5.9 5.7
5 9.0 9.7 La prueba de rangos y signos que se describe en la seccin anterior es vlida para el
6 8.5 8.7 estudio de conjuntos individuales de mediciones y para conjuntos de datos por parejas
7 6.6 7.0 que se puedan reducir con facilidad a conjuntos individuales. Sin embargo, en muchos
8 4.4 4.7 casos es necesario comparar dos muestras independientes que no se pueda reducir a
un conjunto nico de datos. Dichas muestras pueden contener diferentes nmeros de
Hay alguna diferencia sistemtica entre los resultados de los dos mtodos?
mediciones. Para abordar estos problemas se han propuesto varias pruebas no paramtricas.
. La a!)roximacin a este tipo de problemas es muy simple. Si no hay diferencia
La ms sencilla de comprender (aunque quizs no sea la ms sencilla de realizar) es la
SlstematIca entre los dos mtodos, entonces se esperara que las diferencias entre los
prueba elesuma de rangos de Wilcoxon. La ejecucin de esta prueba se entiende mejor con
resultados para cada muestra, es decir, ([resultado volumtrico) - (resultado espectro-
un ejemplo.
Ejemplo. Se analiz una muestra de material fotogrfico de desecho mediante espec- esencial ya que la prueba es tambin vlida cuando n y n2 son distintos. En dichos casos
trometra de absorcin atmica para conocer el nivel de plata, proporcionando para cin- no es razonable esperar que las sumas de los dos conjuntos de posiciones sean iguales,
co determinaciones sucesivas los siguientes valores: 9.8, 10.2, 10.7,9.5 Y 10.5 /lg/ml. aunque se hayan mezclado ms o menos al azar en la ordenacin global, y las ecuaciones
Despus de recibir un tratamiento qumico se volvieron a analizar por el mismo (6.5) y (6.6) tengan en cuenta este efecto. Debido a este clculo adicional se han establecido
procedimiento. Los resultados obtenidos para las cinco determinaciones sucesivas dos pruebas altemativas, y probablemente ms simples, para comparar dos conjuntos de
fueron los siguientes: 7.7, 9.7, 8.0, 9.9 Y 9.0 /lg/ml. Hay alguna evidencia de que el datos que tienen diferente nmero de elementos.
tratamiento produjo una reduccin significativa en los niveles de plata? La primera, la prueba U de Mann-Whitney, es un mtodo ms fcil e igualmente
El primer paso es ordenar todos los datos (es decir, de ambos conjuntos de vlido para calcular el menor valor de Tdefinido antes.
mediciones). Para distinguir los resultados obtenidos despus del tratamiento, stos
aparecen subrayados: Ejemplo. Aplique la prueba U de Mann-Whitney a los datos del ejemplo anterior.
En este procedimiento hay que encontrar el nmero de resultados en una muestra
7.7, 8.0, 9.0, 9.5, 9.7,9.8, 9.9,10.2,10.5,10.7 que supera cacla uno de los valores en la otra muestra. En este ejemplo tenemos la
impresin de que la concentracin de plata de la solucin tratada debera ser, en todo
Las posiciones -de nuevo subrayadas las que corresponden a las mediciones de la
caso, menor que la solucin no tratada. De esta forma esperamos encontrar que el
muestra tratada- son:
nmero de casos en los que una muestra tratada tiene un valor ms alto que una muestra
1,~,J,4,~,6,1,8,9, 10 no tratada debera ser pequeo. A continuacin se hace una lista con cada uno de los
valores de la muestra no tratacla, y se anota el nmero de casos en que los valores para
Queda claro que, incluso si aparecen posiciones empatadas y se tratan de la misma la muestra tratada son mayores.
forma en la seccin anterior, la suma de todas las posiciones tiene que ser n(n + 1)/2,
en este caso 55. Valores ms grandes Nmero de valores
Muestra no tratada en la muestra tratada ms grandes
,Si las mediciones de los dos conjuntos de resultados fueran indistinguibles, espe- 9.8 9.9 1
rariarnos que tanto las posiciones subrayadas como las otras estuvieran mezcladas ms 10.2 O
o m.el~os al azar en la lista. Esto es, la suma de las posiciones subrayadas y la de las otras 10.7 O
posiciones debera ser similar (si el nmero de mediciones fuese el mismo en los dos 9.5 9.7,9.9 2
conjuntos de resultados). En el presente caso la suma de las posiciones subrayadas 10.5 O
(muestras tratadas) es 37. Estas sumas de posiciones se convierten ahora en los La suma total de la tercera columna es 3, el mismo valor de Tobtenido en la prueba de
estadsticos T Y T 2 utilizando las ecuaciones:
suma de rangos. Se puede demostrar que los dos mtodos siempre producen el mismo
T= S, - n(n + 1)/2 resultado, con lo cual la tabla A.13 se utiliza tanto para la prueba U de Mann-Whitney
(6.5) como para la de suma de rangos. Es obvio que el mtodo de la prueba U es una forma
T 2= S2 - n2(n2 + 1)/2 mucho ms sencilla de llegar al valor de T En realidad, cuando los nmeros de
(6.6)
mediciones son pequeos, el clculo se puecle hacer mentalmente, lo cual es una gran
d?nde S es la suma de las posiciones subrayadas y S2 es la otra suma (18 y 37 en este ventaja. Si se presentan empates (valores idnticos) en la prueba U, a cada uno se asigna
ejemplo) y n, y 112 son los correspondientes nmeros de observaciones. En este caso
un valor de 0.5 en el clculo de T
ni ~ 112 = 5, con lo cual n,(n, + 1)/2 = 15, y T y T 2 son 3 y 22 respectivamente. El menor
de estos dos valores (3) se compara con el valor apropiado de la tabla A.l3. Es Otro mtodo conveniente que tiene algunas caractersticas interesantes en la prueba
especialmente importante observar que en este ejemplo podemos aplicar de forma rpida de Tukey. Parece apropiado que se ilustre su uso con el mismo ejemplo.
ortodoxa una prueba de 1lI1Q cola porque el mtodo de tratamiento est diseado
especficamente para reducir el nivel de plata del residuo fotogrfico; 'esto se podr o Ejemplo. Aplique la prueba rpida de Tukey a los datos del ejemplo anterior.
I . .
no iacer con xito, pero no hay ninguna posibilidad realista de que crezca realmente Se puede considerar que la prueba est formada por dos pasos, aun cuando slo se
el nivel de plata! La tabla muestra que, para P = 0.05 Y ni = 112 = 5 el menor valor de disponga de pocos resultados; esos dos pasos se agrupan sin lugar a duda en un solo
Tn~ ti:ne.que exceder de 4 si se va a rechazar la hiptesis nula. As, es posible rechazar clculo mental rpido. En el primero, se cuenta el nmero de resultados del segundo
la hlpotesls nula -que las dos muestras proceden de la misma poblacin- y concluir conjunto de datos que son inferiores a rodas los valores del primer conjunto. Si no
que el tratamiento qumico se ha mostrado efectivo en el momento de reducir el nivel existe ningn valor con esa condicin la prueba se da por terminada, y se acepta la
de plata en el residuo fotogrfico. hiptesis nula de medianas iguales. En el ejemplo que se est analizando, hay tres de
esos valores, las lecturas 7.7, 8.0 Y 9.0, son inferiores al menor valor del primer
El funcionamiento.de la prueba de suma de rangos se complica debido al clculo de conjunto (9.5). En el segundo paso, se cuentan todos los valores del primer conjunto
los valores de T a parr de las sumas de posiciones. Sin embargo, este paso adicional es de datos que son ms grandes que todos los valores en el segundo conjunto. De nuevo,
si no existen esos valores la prueba finaliza y se acepta la hiptesis nula. Aqu hay
La suma de las posiciones correspondientes a los valores subrayados (muestras que
tambin tres valores, 10.2, 10.5 Y 10.7, que superan el mayor valor del segundo
contienen plata tratada) es de 26, y la de las posicicones para las muestras .I~O tra~ada'; e,
conjunto de datos (9.7). (Esta aproximacin se puede contrastar con la de la prueba U
de 29. Estas sumas se convierten entonces en los estadsticos de la prueba 1 1 Y I 2 como
de Mann-Whitney, que identifica los valores grandes en la muestra que se espera tenga
en las ecuaciones (6.5) y (6.6). El menor de estos valores, 11, el utilizado en la prueba, es
mucho mayor que el valor crtico de 2 (para una prueba de dos colas, a un P = 0.05) \v~se
la mediana ms pequea. Globalmente, por tanto, hay seis valores que no estn dentro
del intervalo donde se solapan las dos muestras. Este total (a menudo designado por T,
la tabla A.13). La hiptesis nula, en este caso que la dispersin de los resultados es similar
pero que no se debe confundir con el estadstico Ten la prueba de suma de rangos) es
para los dos conjuntos de datos, debe ser aceptada. Si se anali~a un poco esta prueba St~
el estadstico de la prueba. El aspecto ms interesante y destacado de la prueba rpida
ver que su validez queda reducida cuando los valores promedios para los dos c~nJuntos
de Tukey es que normalmente no se necesitan tablas estadsticas para interpretar este
de datos son sustancialmente diferentes. En el caso extremo en que todas las mediciones de
resultado. Si suponemos que el nmero de lecturas de cada muestra no excede de 20
, la muestra sean inferiores a todas las mediciones en la otra, los valores de TI Y T 2 sern
Y que los dos tamaos muestrales no difieren mucho (condiciones que probablemente
siempre tan parecidos como sea posible, cualquiera que sea la .dispersin de las dos
seran vlidas en muchos experimentos analiticos realizados en laboratorios), los
muestras. Si se teme que este efecto sea apreciable, se pueden estrmar las medias de las
valores de referencia de Tpara un nivel de significacin concreto sern independientes
dos muestras, y aadir la diferencia entre las medias a cada una de las mediciones del
del tamao muestral, Para una prueba de una cola se puede rechazar la hiptesis nula
conjunto inferior. Esto eliminar cualquier efecto debido a media~ dif~;entes, mientras que
si T?: 6 (para P = 0.05), ?: 7 (P = 0.025) ?:, 10 (P = 0.005) Y ?: 14 (P = 0.0005). (Para se mantendr la dispersin de la muestra. Un ejemplo de aplicacin a esta prueba se
una prueba de dos colas los valores crticos de T a unos niveles de significacin P =
proporciona al final del captulo.
0.05, 0.025, ~.005 y 0.0005 son 7, 8, 11 Y 15, respectivamente). En el ejemplo que
e~ta.n~s ~na)zando, por tanto, el valor de T es suficientemente grande para ser
significativo a un P = 0.05 en una prueba de una cola. Podernos por lo tanto rechazar
6.8 PRUEBAS NO PARAMTRICAS SOBRE MS DE DOS MUESTRAS
la hiptesis nula y concluir que el tratamiento reduce significativamente el contenido
de plata en el material fotogrfico de desecho, lo que concuerda con la prueba U de
Mann-Whitney. Enla seccin anterior vimos pruebas que comparan dos muestras estadsticas entre s. Sin
embargo, los mtodos no para mtricos no estn limitados a dos conjuntos de datos: .hay
varios mtodos disponibles que comparan tres o ms muestras. Antes de dar una l~lca
Si se producen empates en la prueba rpida de Tukey (es decir si uno de estos valores
general sobre dos de estas pruebas, es importante mencionar 11II pelig;o que se deb~ ~vltar
en la muestra hipotticamente ms grande es igual al mayor valor de la otra muestra, o si
en todas las comparaciones de muchas muestras. Al examinar tres conjuntos de mediciones
uno de los valores en la muestra "ms pequea" es igual al menor de la muestra "ms
(por ejemplo), para comprobar si sus medianas son o no similares, existe la tentaciJ~ de
grande") entonces cada empate se cuenta como 0.5 en el clculo del valor de T.
comparar nicamente las dos muestras que tengan las medianas mayor y menor. E~ta
A?ems de su ~plicaci~n. habitual para comparar medianas, la prueba de suma de rangos aproximacin simplista puede conducir a resultados engaosos. Cuando se toman va.nas
de :"'tlcoxon ha SIdo modificada por Siegel y Tukey para comparar la dispersin de dos
muestras de la misma poblacin, hay casos en que las medianas menor y mayor, considc-
conjuntos de resultados, y as ofrecer una alternativa verdaderamente no paramtrica a la
radas en forma aislada, resultan ser significativamente diferentes. Esto se debe a que, a
prueba F (vase la Seco 3.5). En esta versin de la prueba de suma de rangos, se juntan los
medida que crece el nmero de muestras, la diferencia entre las medianas I~lenor y mayor
datos y se .disponen por orden creciente del valor numrico, como antes, subrayando uno
de los conjuntos de resultados para diferenciarlo del otro. Luego se ordenan de una forma
tender a crecer. La aproximacin correcta es realizar una prueba que con.sldere todas, :as
muestras juntas: si se demuestra que no todas podran proceder de la misma poblacin,
difere~Jt~: a la medici.l.l.m~s peq~lea se le asigna la posicin 1, a la ms grande se asigna entonces se pueden realizar pruebas separadas para intentar identificar dnde s: p~o~ucen
~a pOsl.clon 2, la medlc~on lI1medlatamente anterior a 'la ms grande lleva la posicin 3, la las diferencias significativas. Aqu describimos, en trminos generales, los prinCIpIOS de
lIlmedlatamente posterior a la ms pequea lleva la posicin 4, la medicin posterior a las
dos pruebas no paramtricas para tres o ms conjuntos de datos; el lector que desee mas
dos ms pequeas lleva la posicin 5 y as sucesivamente. (Si el numero total de mediciones
informacin puede consultar los libros mencionados en la bibliografa. .
e~ impar se ignora la r~edida central.) Esta "ordenacin altema por pares" produce una La prueba de Kruskal-Wallis se puede considerar como una extensin del procedi-
situacin en la que se asignan posiciones bajas a los resultados bajos y altos, y los resultados
miento de suma de rangos de Wilcoxon para comparar las medianas de tres o ms muestras
~entrales reciben posiciones altas. Si un conjunto de datos tiene una dispersin significa- entre las que no se pueda considerar ningn tipo de emparejamiento. (Una generalizac.~n
tIvamente mayor que el otro, la SUma de sus posiciones debera ser mucho menor mientras
del anlisis de plata descrito en la seccin anterior, con tres muestras de materia I fotogra f ICO
que si la dispersin es similar en los dos conjuntos de resultados, las sumas de sus
de desecho, una sin tratamiento y las otras dos tratadas por mtodos diferentes, proporcio-
Posl~iOl?e~ tambin sern similares. La aplicacin de este mtodo en el ejemplo utilizado nara un ejemplo donde sera til la prueba.) Los resultados de las tres (o mas) .muestras se
al pnncipio de esta seccin proporciona las posiciones siguientes:
juntan y se disponen por orden de menor a mayor. Se dct:~r~nina el total ele poslclones para
Datos: los datos de las diferentes muestras: se promedia las posiciones con el mismo valor COIllO
8.0, 9.0, 9.5, 9.7, 9.8, 9.9, 10.2, 10.5, 10) en el mtodo de Wilcoxon, aunque hay un procedimiento de correccin especial si se
Posiciones: 4 5 8 9 10 7 6 3 2 encuentran numerosos valores iguales. Es fcil apreciar que, si cada muestra tiene el mismo
. 1 s tres mtodos valores para los niveles de pesticida que difieren
nmero de mediciones (sta no es una condicin de la prueba), y si las muestras tienen P roporcronan o . . .
medianas similares, entonces sera similar la suma total de posiciones en cada muestra, de significativamente? " .". " .. . , .
Este problema se resuelve simplemente sustituyendo los resultados de la tabla pOI
manera que la suma de sus cuadrados sera mnima. De este modo, si tenemos tres muestras
sus rangos. Para cada muestra se asigna la posicin I al mtodo que da el resultado
-cada una con cinco medidas- las posiciones irn de la 1 a la 15 y la suma de todas ellas
mavor tal como se indica a continuacin:
ser 120. Supongamos que las tres medianas son muy similares, y que la suma de , '
las posiciones para cada muestra son por tanto iguales a 40. La suma de los cuadrados Muestra Mtodo
de estos totaJes ser 40 2 + 40 2 + 40 2 = 4800. Si las medianas son significativamente A B e
diferentes, entonces los totales de los rangos sern tambin diferentes unos de otros 1 1 3 2
2 1.5 1.5 3
-digamos 20, 40 Y60. La suma de los cuadrados de dichos totales ser siempre ms grande
3 I 3 2
que 4800 (20 2 + 40 2 + 60 2 ~ 5600). 4 2 I 3
Se puede determinar la probabilidad de obtener cualquier suma de cuadrados utilizando
Es necesario el uso de un valor promedio en el caso de posiciones empatadas en la
el estadstico chi cuadrada (vase el Cap. 3). Si uno se refiere a las muestras por A, B, e,
muestra 2 (vase la Seco 6.6). La suma de las posiciones para los tres mtodos, A, B,
etc. (k muestras en total), con un nmero de medidas ns, n, nc, etc, y la suma de las
C, son 5.5,8.5 y 10, respectivamente. Estas sumas totalizaran nki]: + 1)/2, donde k es
posiciones por RA , Rn, Re, etc., entonces el valor de X2 est dado por:
el nmero de mtodos (aqu tres) y n el nmero de muestras (aqu cuatro). ~e elevan al
cuadrado las sumas de los rangos, lo que da 30.25, 72.25 Y 100, respectivamente, y
X2 = -12
-
(R~ R~ RZ' ... ) -3(N+l)
-+-+-+ (6.7)
estos cuadrados se suman para dar el estadstico R, que en este caso es 202.5. El valor
N2 + N nA nB nc experimental de X2 se calcula entonces a partir de:

donde N ~ /lA + nn + /le etc. Este valor X2 se compara con los valores usuales cuando el 12R _ 3n(k + 1) (6.8)
nmero total de mediciones es > ca. 15, no obstante se utilizan tablas especiales para n- nk(k + 1)
meros ele mediciones ms pequeos. El nmero de grados de libertad es k - 1. Los valores
experimentales de X2 que superan los valores tabulados permiten rechazar la hiptesis nula que resulta en este caso 2.625. Al nivel de significacin P ~ 0.05 y con k = 3, l~s valores
(que las medianas de las muestras no son significativamente diferentes). Como ya se ha ..
cnticos d e X2 son 6 .O, 65
. , 64 ( n = 3 , 4 , 5 , 6, 7 Y 8, respectIvamente.
. , 7 .O,7. 1 Y6 .2 para ~

observado, en esta ltima situacin se pueden realizar otras pruebas sobre pares individua- (Muchos conjuntos de tablas estadsticas proporcionan ms ~atos, y cuando k > 1, se
les de muestras; de nuevo, el lector que desee mayor informacin puede consultar la puede utilizar las tablas usuales ele X2 con k - 1 grados de l~bertad.) En este caso, e,l
bibliografa. valor experimental ele i es mucho menor que el valo~ ~ntlco,. y ~~ ele.be aceptar la
Ya hemos visto (Secs. 3.4 y 6.3) que cuando se comparan resultados por parejas, se hiptesis nula: los tres mtodos dan resultados ~ue no difIeren. slgl~I:lca:Iv:ment.e.. "_
pueden utilizar pruebas estadsticas especiales. Estas pruebas se basan en el siguiente Es importante mencionar que la prueba de Fnedman podna ut.I1lzaro-e alternativa
principio: cuando dos mtodos experimentales que no difieren significativamente se apli- mente en forma inversa: suponiendo que los tres mtodos analiticos dan r.esulta~os
can a las mismas muestras qumicas, las diferencias entre los pares de resultados empare- indistinguibles, se podra utilizar el mismo procedimiento para contrasta~ clIferenc.las
jados deberan estar cerca de cero. Esto puede extenderse a tres o ms conjuntos de entre los cnatro extractos de plantas. En este caso k y I! son 4 y 3 respectIvan~ente, el
resultados emparejados utilizando una prueba no pararntrica ideada en 1937 por el famoso lector puede verificar con cuidado que R es 270 y que el valor resultante de,~ es 9.0.
economista americano, Milton Friedman. En qumica analtica, la principal aplicacin de la Este es mayor que el valor crtico para P ~ 0.05, 11 = 3: ' : 4.' qne es 7.4: ASI, ene~t~
prueba de Friedman es la comparacin de tres (o ms) mtodos experimentales aplicados segunda aplicacin de la prueba se puede recha~ar la hiptesis nula, y.afIrn:ar que ras
a las mismas muestras qumicas. La prueba utiliza de nuevo el estadstico X2 , en este caso cuatro muestras difieren en sus niveles de pesticida. Se encuentran .chspombles otras
para calcular las diferencias que aparecen entre los valores de la suma total de posiciones, pruebas que permiten comparaciones entre parcs de muestras seleccionados.
por distintos mtodos. El siguiente ejemplo aclara la simplificacin de la aproximacin:
Evidentemente es mucho ms simple realizar la prueba ele Friedman en la prcti:a .que
Ejemplo. Se determinaron los niveles de un pesticida en cuatro extractos de plantas por el mtodo ANOVA (vanse las Secs. 3.8, 3.10), aunque no tiene la capacidad de este ltimo
(A) cromatografia lquida de alta resolucin, (E) cromatografa de gas-lquido, y (C)
de estudiar los efectos de interaccin (vase el Cap. 7).
radioinmunoensayo. Se obtuvieron los siguientes resultados (todos en ng/ml):

Muestra Mtodo
A B e 6.9 CORRELACIN ORDINAL
I 4.7 5.8 5.7
2 7.7 7.7 8.5 Los mtodos de jerarquizacin se pueden aplicar tambin a los problemas de.cor:Tlaci~I~.
3 9.0 9.9 9.5 El mtodo elc coeficiente de correlacin ordinal de Spearmau, qllC se decribir en esta
4 2.3 2.0 2.9
seccin, es la aplicacin ms antigua de los mtodos de d ., , .
d or enacion en estadstics q d t una fuerte evidencia de que niveles de S02 ms altos producen vinos menos aceptables
e 1904. C~mo otros mtodos de ordenacin, es especialmente ventajosa cuando ue a a
los dos conjuntos de observaciones en estudio pued ' 1 ' . uno de al paladar!
d d . '. e expresarse so o en trminos de un
o~ en e posicion en lugar de expresarse en unidades cuantitativas A ' '.
ejemplo, ~e investig~ la posible correlacin entre las concentraciones' de s~ :~;I ~lgUlente
Otro mtodo de correlacin ordinal, debido a Kendall, se introdujo ern 1938; ste pre-
tende tener algunas ventajas tericas sobre el mtodo de Sparman, pero es ms complicado
en un conjunto de V1l10S de mesa y la calidad de su sabor. La calidad d OXI o e azu.fre
no se expresa con facilidad en trminos cuantitativos pero par ells~bor de un villa de calcular (especialmente cuando aparecen posiciones empatadas) y no se emplea con
vinos es realmente sencillo ordenarlos segn su refe . ~ un pane e catadores de tanta frecuencia.
que s~ ordenan con facilidad pero que no se cuanffic:~e~~~~;~:Pil~: de otros atri~u.t?s
de animales experimentales la calidad del es . d di ,luyen la condicin
cia del personal dellaborato;io Se debera tam~~~1O e Id c ado all.aboratorio, y la eficien-
d d . len recor ar que SIuno o los do . t 6.10 MTODOS DE REGRESIN NO PARAMTRICOS
e atas que se estudian fueran cuantitativos entonce (en ~ conjun os
critos en el captulo 5) no es necesario qu'e se dists'b contraste con los metodos des-
estadstic~s no paramtricos, el coeficiente de correla:ilr~~;~I~~rmalmente.
Como ot:~s Al analizar detalladamente los mtodos de regresin lineales en el captulo anterior, se hizo
de determinar e interpretar. Esto se muest l si . de Spearman, p, es facil hincapi en la hiptesis de distribucin normal para los errores en la direccin del eje y, y
ra en e siguiente ejemplo. qued clara la complejidad de alguno de los mtodos de clculo; sta se supera en gran
Ejemplo. Un panel de expertos ord ' parte al utilizar calculadoras o computadores, y existen tambin algunos mtodos de
diferentes; al mejor se le asi na la e~~ ,segun s~s preferenca, siete vinos de mesa aproximacin rpidos para ajustar lneas rectas a datos experimentales (vase la biblio-
contenido de dixid d g f 1:
posicion al siguiente la 2, y as sucesivamente. El grafa). Se mantiene, por lo tanto, un cierto inters en las aproximaciones no para mtricas
o e azu re de cada Villa (en part illc al problema de ajustar una lnea recta a un conjunto de puntos: de los mtodos disponibles,
mediante anlisis por in .' . . ,es por rm on) se determina
resultados siguientes par:~:~~~;i~n fl.ui co~ d~~ecclOn colori~trica. Utilice los
o
quizs el ms simple es el mtodo incompleto de Theil, denominado de esta forma para
vino y el contenido de dixido de azufre, iay re acton entre la calidad percibida en el distinguirlo de otro procedimiento ms complejo desarrollado por el mismo autor (el
mtodo "completo").
Vino El mtodo de Theil supone que un conjunto de puntos (XI, YI), (X2, Y2), etc., va a ser
Rango segn el sabor A BCD E F G ajustado por una recta de la forma y = bx + a. El primer paso en los clculos consiste en
Contenido de S02 1 2 3 4 5 6 7
disponer los puntos en orden de X creciente. Si el nmero de puntos, x, es impar, el punto
0.9 2.8 1.7 2.9 3.5 3.3 4.7
medio, es decir, el valor mediano de X se borra: el clculo siempre exige un nmero par de
El primer paso en los '1 I . puntos. Para cualquier par de puntos (x Yi), (Xi> Yi) donde X) > Xi, la pendiente, bij, de la lnea
ca cu os es convertir las concentraciones de SO d I
a bso Iutas a valores d ( . . . 2 e va ores que une los puntos se puede calcular a partir de:
describi en las secci:~:~gaOnt:~i~::~~en posiciones empatadas se promedian como se
bij ~ (Yi - Yi) / (Xi - X,) (6.10)
Vino
A B C D
Rango segn el sabor E F G
1 2 3 4 5
Se calculan las pendientes bij para el par de puntos (Xl, YI) Y el inmediatamente posterior
Contenido de S02 6 7
1 3 2 4 al valor mediano de la x, para (X2, Y2) y el segundo punto despus del valor mediano de la
6 5 7
x, y as sucesivamente hasta que se calcule la pendiente para la lnea que une el punto
Entonces, se calculan las diferenci d I
-1 1 O -1 l O El f" las, " entre as dos ordenaciones. Claramente son O inmediatamente anterior a la mediana de X con el ltimo punto. De esta forma, si los datos
, " ". cae retente de correlacin , p , esta' dad o en tonces por: ' originales contenan 11 puntos, se estimaran 5 pendientes (el punto mediano se ha
omitido); 8 puntos originales proporcionaran 4 estimaciones de la pendiente, y as
sucesivamente. Estas estimaciones de la pendiente, a su vez se disponen en orden ascen-
p
dente y su valor mediano, calculado como se describi en la seccin 6.2, es la pendien-
(6.9)
te estimada de la lnea recta. Con este valor de b, los valores a, de la ordenada en el origen
En este ejemplo, es 1 - (24/336) es decir O929 ' se estiman para cada punto con la ayuda de la ecuacin y ~ bx + a. De nuevo, las
el coeficiente de correlacin mom~nto- d' t' . La teo.na demuestra que, como estimaciones de a se ordenan de forma ascendente y el valor mediano se elige como la
11 = 7 tiene qu . pro uc o, puede vanar entre -1 y + 1. Cuando mejor estimacin de la ordenada en el origen de la recta. El mtodo se aclara mediante el
, e superar a 0.786 SI se va a rechaz I hi .
de correlacin al nivel de SI' ifi " p ar a ipotesis nula de ausencia siguiente ejemplo.
gm icacion = O05 (v I bl
mas concluir que hay una correl ' " '1 ease a ta a A.14). Aqu, pode-
. acin entre e cont id d SO d .
calIdad percibida. Teniendo en cuenta la 1'< em o ~ 2 e los VlI10S y su Ejemplo. Se han obtenido los resultados siguientes en un experimento de calibracin
arma en que se definen las posiciohes, hay para la determinacin absorciomtrica de un complejo metlico tipo quelato:
Concentracin, .Jg/ml:
Absorbancia: o 10 20 30 40 50 60 70 A
0.04 0.23 0.39 0.59 0.84 0.86 1.24 1.42

Utilice el m.todo d~ Theil para estimar la pendiente y la ordenada en el origen d 1 1.4


recta que mejor se ajuste a esos puntos. e a
~n este caso el clculo se simplifica al tener un nmero par de observaciones
que os valores de x (es decir, las concentraciones) aparecen a interval ,y por 1.2
estn ya ordenadas. Por tanto se calculan las estimaciones de la pendient o~ relgulares y
pares de puntos: e e os cuatro 1,0

bIS ~ (0.84-0.04)/40 ~ 0.0200 O


b26 ~ (0.86-0.23)/40 ~ 0.0158 0.8
b 37 ~ (1.24-0.39)/40 ~ 0.0212
b4 S = 0.42-0.59)/40 ~ 0.208
0.6
Ahora se ordenan estas estimaci dI'
O0208 00212 L . " aClol.les e a pendiente, resultando 0.0158. 0.0200
. ,. . a estimacin mediana de la pendo t ' 0.4
entre O 0200 Y O 0208 deci len e es, por lo tanto, el promedio
. " es ecir, 0.0204. Se utiliza este valor rl b .
ordenada en el origen a' los ocho val . di . a or e para estimar la
, , ores al lI1 ividuales son:
0,2
al 0.04 - (0.0204 x O) = +0.040
=
a2 ~ 0.23 - (0.0204 x 10) ~ +0.026
a; = 0.39 - (0.0204 x 20) ~ -0.018 70 80
O 10 20 30 40 50 60
a4 = 0.59 - (0.0204 x 30) ~ -0.022
e
a5 ~ 0.84 - (0.0204 x 40) ~ +0.024
a ~ 0.86 - (0.0204 x 50) = -0.160 Figura 6.1 Grfica de la recta de calibracin, calculada por el mtodo de Theil ( - - ) y por el
ai = 1.24 - (0.0204 x 60) ~ +0.016 mtodo de mnimos cuadrados del capitulo 5 (- - -).
as = 1.42 - (0.0204 x 70) ~ +0.008

Ordenando estas estimaciones de 1 d d . que tambin existen mtodos no paramtricos disponibles para ajustar curvas, si bien stos
-o .O18, -O.008 , +0.O16,+.O 024,+0.026
a or ena a en el ongen, tenemos -0.160
+0 040 L . ., . ' ,
-0.022 escapan a los objetivos de este libro.
tanto +0 004 D t d . , . , a estnnaclOn med13na es por lo
, . . e es e mo o concluirno 1 . ,
0.0204x + O 004 E f '1 s que a mejor lnea recta est dada por y =
. . s aCI mostrar que la recta de "n . . d
los mtodos del captulo 5, es y ~ 0.0195x + 001 111l1t1l.0S cua radas", calculada por 6.11 LA PRUEBA DE BONDAD DEL AJUSTE DE KOLMOGOROV
rectas son similares cuando se re :. 9. La figura 6.1 muestra que ambas
Theil tiene tres ventajas distintas: ~~e:~~:~Ill~~~:I~:~~:I;~e. Sin embar?o, el m~todo. ~e En el captulo 3 se estudi el problema estadistico frecuente de la "bondad del ajuste". ste
de y; no supone que los errores en la direccin de x o d ~ e:~re~lestan en la direccin surge cuando se necesita probar la procedencia de una muestra de observaciones de una
y no se ve efectado por la presencia de resultados a . e}' se Istn,)u'yan normalmente, distribucin concreta, como puede ser una distribucin normal. La prueba de chi cuadrada
claramente ilustrado por el punto (50 O 86) d nOI~alos. Est~ ultimo aspecto queda es muy adecuada para este propsito cuando los datos se presentan como frecuencias,
de ser un resultado anmal 'l' e este ejemplo; tiene toda la apariencia aunque la prueba no se utiliza normalmente para menos de 50 observaciones, y es difcil
o, pero su va or no afecta en ab l t 1 '1
ya que ni b26 ni a afectan directamente las est .' so l~ o, e ca culo de Theil, usarla con datos continuos. En esta seccin se describe el mtodo de Kolmogorov, que es
ordenada en el origen, respectivamente En eIII:a~lOnes medl~I~as de la pendiente y muy apropiado para probar la bondad del ajuste con datos continuos y aislados. Este mtodo
embargo, este resultado anmalo tiene t .t alculo de rmrumos cuadrados, sin se puede extender a la comparacin de dos muestras, aunque no se describir con detalle.
resultados calculados' la lnea d ..an o peso como los otros; esto se refleja en los Estos mtodos modificados fueron descubiertos en primer lugar por Smimov, y al conjunto
anmalo que la lnea ~o paramt;ic:l.lI~~n~~c~u~~~dos p,asa ms cer,ca. del resultado de estas pruebas se les conoce, a menudo, como el mtodo de Kolmogorov-Smirnov.
ven muy afectados por los resultad '1 q os metodos estadlstIcos que no se El principio de la aproximacin de Kolmogorov es muy simple. Compara la curva de
os anorna os son metodos" b tos" ,
en ste y otros casos est clara. ro us os : su Importancia frecuencias acumuladas de los datos que se desea contrastar con la curva de frecuencias
acumuladas de la distribucin propuesta como hiptesis. El concepto de curva de frecuen-
A diferencia de la mayora de los mtodos ' . , cias acumuladas, y su aplicacin con relacin al papel de probabilidad normal, se analiz
clculos tedosos y sera de til id 1 no parametncos, el metodo de Theil conlleva en el captulo 3. Cuando se han trazado las curvas experimental e hipottica, el estadstico
, " gran u 1 I ac un programa de computador. Tenga en cuenta
de la prueba se obtiene encontrando la mxima diferencia vertical entre ambas, y cornpa-
randa este valor, de la forma habitual, con el conjunto de valores tabulados. Si los datos
experimentales se apartan sustancialmente de la distribucin esperada, se esperar que las
dos curvas se encuentren separadas en parte del diagrama de frecuencias acumuladas; sin
FA
embargo, si los datos estn en gran consonancia con la distribucin esperada, las dos curvas
nunca se separarn mucho una de otra. En la prctica, el mtodo de Kolmogorov tiene dos
0.8
aplicaciones frecuentes -prueba de aleatoriedad, y prueba de normalidad de una distribu-
cin-; el funcionamiento del procedimiento se ilustrar con ejemplos simples.

Ejemplo. Se analizaron las lecturas de bureta obtenidas por un laboratorio durante un


periodo dilatado. En 50 lecturas se ha encontrado que los ltimos digitos registrados 0.6
son los que aparecen en la siguiente tabla:

Dgito: o 1 2 3 4 5 6 7 8 9
Frecueucia : 1 6 4 5 3 11 2 8 3 7 0.4

Son estas lecturas congruentes con un uso aleatorio de los dgitos 0-97 (Note que los
datos de este ejemplo son idnticos a los del ejercicio 5 al final del captulo 3.)
En este ejemplo la distribucin hipottica es inmediata: se presupone que todos los
0.2
dgitos del O al 9 tienen la misma probabilidad de aparecer, y no son posibles otros
resultados. La curva hipottica de frecuencias acumuladas es, por lo tanto, una fun-
cin regular escalonada como se muestra en la figura 6.2. Las frecuencias acumula-
das en la prctica son claramente: 0.02,0.14,0.22,0.32, 0.38, 0.60, 0.64, 0.80, 0.86, 9
l.OO en x ~. O, 1, 2, ... ,9, respectivamente. Las dos curvas muestran una diferencia
o
mxima de 0.12 en x = 4. (En ejemplos simples de este tipo es innecesario representar Digito
en la prctica las frecuencias acumuladas; la diferencia mxima se puede obtener
, ara robar la aleatoriedad de los dgitos 0-9. La
examinando los datos.) La tabla A.15, que es adecuada para una prueba de dos colas Figura 6.2 El empleo del metodo de ~~Imo,gforovd Pla f~cuencia acumulada terica (A) Yla repre-
(el caso usual), muestra que al nivel de significacin P = 0.05 para 11 = 50 el valor crtico . .. t I presentaclOn gra tea e x
diferenCia maxima en re . ~ re . t 1(B) se muestra con las flechas (<---').
es 0.188, de manera que no se puede rechazar la hiptesis nula de que los dgitos se sentaclOn expenme n a ,
distribuyan aleatoriamente.
, vara probar si una distribucin es normal,
ro
El lector observar que este resultado es el mismo que el obtenido utilizando el mtodo Cuando se utiliza el metodo de Kolmogo PI d tos originales que podran tomar
h s transformar os a ' d
chi cuadrada (vase el Cap. 3, ej. 5). Una inspeccin minuciosa de las dos pruebas muestra lo primero que hay que acer e .' , tndar en la variable normal estan ar, z.
loui lar para la media y la desvlaclon es ,
que, en el clculo de chi cuadrada, los valores experimental y tabulado son casi los mismos, cua qUler va ., .
es decir, los dgitos de titulacin no se desvan significativamente de una distribucin Esto se hace utilizando la ecuaClOn.
(6.11)
aleatoria. En la prueba de Kolrnogorov, sin embargo, los resultados sugieren que los datos
se desvan ostensiblemente de la aleatoriedad. Esta reflexin surge del hecho de que los Z = (x - p)/ (J
valores de la tabla A.15 estn basados en la hiptesis de que la distribucin probada es . .' . nificado habitual. Se suele considerar esta transformacin
con! inua. Cuando los datos son discretos, los resultados de la prueba son conservadores, en la que cada termmo tiene su sig . ifi d tndar La teoria demuestra que Z,
" d d t [orma tipi tc a o cstunuur- .. 'd d
decir, tienden a dar muy pocos resultados significativos. No obstante hay algunas como la converSlO n e a os e~ 1 t su funcin de distribuclOn esta a a
stnbuye norma men e, y . . d d
ventajas en la prueba de Kolmogorov. En los ejemplos del tipo que se acaba de analizar, calculado en esta f arma, se d I . . 'n (6 11) se puede utilizar e os
bl t distlcas La ecuacio .
es mas sencillo de utilizar, y es ms fiable cuando 11 es pequeo. (El ejemplo anterior utiliza en muchas colecciones de ta as es a . d . de un conJ'unto de datos de una
. b r la proce encia
precisamente el conjunto de datos ms pequeos que generalmente se puede estudiar por formas. A veces es necesano pro a . d . .. estndar dadas. En tal caso, se
distribucin normal COllcreta,
de media y esvlaclOn
. t 1 mediante la ecuacin (6.11) y se reo. Iza
r
el mtodo chi cuadrada: 50 observaciones y una frecuencia esperada de 5 para cada
nrnero.) El mtodo de Kolmogorov tambin proporciona lmites de confianza no param- transforman directamente los datos,expenmen. a es 'necesario contrastar simplemente la
C n mas frecuencia, sera ti
ricos para la funcin de distribucin acumulada verdadera, utilizando los datos de la tabla la prueba de Kolmog orov. o ..', al En este caso primero se es lI11a
laui r dlstnbuclon norm . . .,
A. 15. Este tema se trata con mayor profundidad en pruebas detalladas sobre mtodos no procedencia de los datos d ecua qute -rodos si les del captulo 2; a cont1l1uaClOn
la media y la desviacin estndar, por los meto os simp
pmamtricos (vase la bibliografa).
se transforman por la ecuacin (6.11); Y por ltimo se aplica el mtodo Kolrno
dos tipos de pruebas se analizan en el ejemplo siguiente. gorov. Estos 6.12 CONCLUSIONES

Ejemplo. Se realizaron ocho titulaciones, con los resultados 25 13 2502 25 11 Las pruebas de ejecucin rpida y no para mtricas, descritas en este captulo son slo una
25.03, 24.97, 25.14 Y 25.09 m!. Dichos resultados dn , . , . ,25.07, pequea parte de todos los mtodos de este tipo que hay disponibles. Los ejemplos
poblacin normal con media 25 00 mI y d . '. , po nan proceder de (a) una
.. esvracion estandar O 05 1 (b) d expuestos manifiestan claramente tanto su potencia como sus limitaciones. En muchos
otra poblacin normal? . . 111 , Y e cualquier
casos su rapidez y conveniencia aventajan, en cierta medida, a los mtodos convencionales,
y las pruebas no paramtricas no conllevan la hiptesis de una distribucin nonna!. Se
(a) En este caso, el primer paso es transformar los valo ..
la relacin z ~ (x - 25 00)/0 05 obte id d I " res x en valores z, utilizando ajustan perfectamente al examen preliminar de un pequeo nmero de mediciones, y a
, . 111 a e a ecuacion (6 11) L 1 clculos hechos con rapidez -a menudo sin la nececidad de tablas- mientras el analista
transformados en 2.6 04 2 2 1 4 O 6 06 2 ' . os oc 10 resultados son
, . , . , . , . , - . , .8 Y 1 8 Esto' I est en el banco de pruebas o en la fbrica. Se puede utilizar tambin cuando se estudian
representan grficamente como una funcin de d t ib '., s va ores Z se ordenan y
d.ecir, 1/8) en cada paso. (Observe que ste el n .UClOn ~on un salto de 0.125 (es tres o ms muestras (Sec. 6.8). La potencia (es decir, la probabilidad de que una hiptesis
. " no es e mIsmo calculo qu 1'1" . nula falsa sea rechazada: vase la Seco 3.13) de un mtodo no paramtrico puede ser menor
SeCClOn 3.12.) La comparacin con la f " hi ,. e se u I IZO en la
uncion npotetlca par . d' (v . que la de la correspondiente prueba paramtrica, pero la diferencia se da slo en raras
que la diferencia mxima es O 545 el1111l 1 li a Z 111 tea vase la Flg. 6.3)
. va or Z Igeramente' feri 1 ocaciones. Por ejemplo, se han hecho muchas comparaciones de las potencias en condi-
este valor se utiliza la tabla A 16' la t' bl A 15 III enor a .4. Para probar
. , a a . no es adecuada d ' ciones diferentes (es decir, distribuciones poblacionales y tamaos muestrales diferentes)
se hayan transformado en la forma est d S . espues que los datos
an aro egun la tabla A 16 de la prueba de rangos de Wilcoxon y de la prueba t. La primera opera muy bien en casi
el valor crtico es O 288 de 111 d . , para 11 = 8 Y P = 0.05
. " o o que se puede re 1 1 hi . ' todas las circunstancias y slo cs marginalmcnte menos potente que la prueba t, incluso
tItulaciones probablemente no pr d d ~ lazar a llpotesls nula -las
oce en e una poblaCIn I 1 . cuando los datos proceden de una poblacin normalmente distribuida. Muchos programas
Y desviacin estndar 0.05 ml, iorrna con media 25.00 mi
para computadores personales incluyen ahora varias pruebas no paramtricas. Dichos
(b) En este caso, se estiman la media I d ' '. , programas permiten evaluar un conjunto concreto de datos con rapidez por dos o ms
(2.1) Y (2.2)] por 25.07 y 0059 . 1 Y a .esvlaclOn estndar [utilizando las Ecs. mtodos, y parece seguro que aumenta cl inters en estos mtodos en lugar de reducirse,
. m respectlvament I ilt
dos cifras significativas correctas L' 1 e,. y e u timo resultado tiene ya que resultan muy tiles.
25.07)/0.059, es decir por I 02 ~o;~ ~a 60;e~ de z estan ahora dados por Z ~ (x -
ma de frecuencias aCI;mlllada's p'a . . t' . '1 ,-0.68, -1.69, 1.19, 0.34. El diagra-
. , ara es os va ores dif dI'
sumo por O. 125 (en varios puntos) Est. dif . I rere e a curva hIpottica a lo BIBLIOGRAFA
crtico de 0.288. De esta <orlll'lIJOd' a I erencia es mucho ms pequea que el valor
l' e emos aceptar la hi itesi 1
ceden de una poblacin normal con una medo '25 On~o esis nu ~ d~,que los datos pro- Conover, W. J., Practica/ Non-paramctric Statiscs, Nueva York,Wiley, 1971. Probablemente el mejor
. la . 7) una desviacin estndar 0.059. texto general de mtodos no paramtricos.

l.r-.-r-----r---,r-~~-_ Daniel, W. W., Applied Nonparatuctric Stntistics, Boston, Houghton Miftlin, 1978. Es un texto muy
general que abarca un amplio espectro de mtodos no paramtricos con bastante profundidad;
FA contiene muchos ejemplos.

Langley, R., Practica/ Stotistics, Londres, Pan Books, 1968. Es un texto bastante asequible, con
especial nfasis en las pruebas no paramtricas.

0.5 Sprent, P., Quick Statistics, Londres, Penguin Books, 1981. Es una introduccin excelente a los
mtodos no paramtricos: claro, explicaciones con pocas matemticas, y muchos ejemplos y
ejercicios.

EJERCICIOS

1. Se realiz una titulacin 4 veces, con los siguientes resultados: 9.84, 9.91, 9.89, 10.20 ml,
Calcule y comente la mediana y la media de estos resultados.
2 3 4
F' l 2. El nivel de azufre en lotes de combustible de un avin, segn manifiesta el fabricante, est
.Igura 6.3 El empleo del mtodo de Kolmo orov distribuido simtricamente con un valor mediano del 0.1 %. Se ha encontrado que lotes sucesivos
eras mximas entre la curva de frecu . g I para probar la distribucin normal. Las diferen- tienen concentraciones de azufre de 0.09, 0.12, 0.1 0,0.11,0.08,0.17,0.12,0.14 Y0.11 %. Utilice
. enctas acumu adas terica y las dos distrib .
reflejan con las flechas ( <---. n UClones probadas se la prueba de signos, la prueba de rangos y signos, y una prueba de recorridos para probar la
afirmacin del fabricante.
3. La concentracin (g/lOO mi) de inmunoglobulina G en suero sa . .
gu
por llllnunoeJ[usin radial (i.d.r) y por electroinmunodifu .. l(l de 110 d~na~ltes se mide
tados. sion e.1. dln)eo
, con os SIgUIentes resul-

Donantes: 1 2 3 4 5 6 7 8 9 10
Resul. i.r.d. 1.3 1.5 0.7 0.9 1.0 1.1 0.8 1.8 0.4
Resul. e.i.d. I.I 1.6 1.3
0.5 0.8 0.8 1.0 0.7 1.4 0.4 0.9
Son significativamente diferentes los resultados de los dos mtodos?

4. En el des~rrollo de un nuevo mtodo para la detemlinacin de ni I


se analizo 5 veces una nica muestra de sang l I ive es de alcohol en la sangre,
' 00 1 I re, con os resu tados 64 5 66 O 63 9 65 1 6
mg / l m . E mtodo de anlisis estndar a licado l . " " " ' . y 4.0
resultados 66.2, 65.8, 66.3 Y65.6 mg/IOO mi:
Jilice r::
a mIsma. n.mestra, proporcIOna los
rridos de una serie de resultados para contra t . ( p) I ebdas esta?lslIcas basadas en los reco-
Ii . .. . e s ar SI a
mee lOS slgnlflcalIvamente diferentes )' (b) . dif
,
os os metodos p
. if
. l
roporclOnan va ores
SI I reren sigm tcatrvarnente en la precisin.
Diseo experimental, optimizacin
5. Se encc:ntr que diez barras de grafito utilizadas sucesiva '
absorcin atmica electrotrmico duraron 24 26 30 21 17 mente en un espe.ctrofotometro de
y reconocimiento de pautas
Pruebe la aleatoriedad de los tiempos d f ' . ' '. ' ,23,22,25 Y25 unidades de tiempo.
e unClonamlento de estas barras.
6. Los niveles de alcohol en sangre encontrados para cinco voluntan ,
de cerveza cada uno, fueron de 104, 79, 88 120 90 tarios, despus de beber tres jarras
bebieron tres jarras de cerveza rubia e d ' 1
Y mg/ 00 mI. Otro conjunto de voluntarios
eran de 68, 86, 71, 79, 91 Y66 mg/ 1~oal~::lOU~i~i~:t;~ontr que los nivelesde alcohol en sangre
rpida de Tukey o la prueba de Manr WI't . prueba de suma de ltItervalos, la prueba 7.1 INTRODUCCIN
i.: e ,1- 11 ney para ltIveslIgar si iert lb
rubia se produce un nivel de alcohol en 1, . f . es crer o que a eber cerbeza
ti d a sangre 111 enor que al beber la m id
IpO e cerveza. Utilice el mtodo de Sie el-Tuke . . . a mlsm~ canti ad de otro En el captulo 3 se introdujo la idea de un factor. Un factor es cualquier aspecto de las
conjuntos de resultados difieren Sl'g ificati y para verifica- SIlas dispersiones en estos dos
mica ivamente. condiciones experimentales que influye en el resultado obtenido en un experimento.
7. Un laboratorio universitario de quimica posee siete es e c ' .. , La seccin 3.9 mostr el ejemplo de la dependencia existente entre una seal de fluores-
(A-G). Las encuestas sobre la opinin d I dY trofot~lI1etros de absorcioj atomica cencia y las condiciones en las cuales se almacen una solucin. En este experimento el
acadm!co de plantilIa demuestran que el o~d~~ ;:tur~;e~~es .de ltlvestigaci.n y del personal factor de inters eran las condiciones de almacenamiento; en este caso se le asign
a estos II1strumentos es B G A D e F E P neta de los estudiantes con relacin
el nombre de factor controlado ya que el experimentador podia alterarlo a su voluntad. En
D, B, E, A, e, F. Se encu~t(~an'co;"el~con~d;~~a~l del ?ersondallacadmico de plantilla es G,
acadmico? opmiones e os estudiantes y del personal otro ejemplo del captulo siguiente (Sec. 4.3), en el que se probaba la pureza de la sal de
diferentes partes de un barril, el factor de inters, es decir, la parte del barril de la que se
8. Utilice el mtodo de Thiel para c I l 1 l' tomaba la sal, se elega al azar; por esta razn se denomina factor incontrolado. Estos dos
capitulo 5. a cu ar a mea de regresin para los datos del ejercicio 1 del
factores son cualitativos ya que sus posibles "valores" no se pueden ordenar numrica-
9. Tomando los datos de inmunodifusin radial del e' '. , mente. Un factor para el cual los valores posibles se pueden ordenar numricamente se
para probar la hiptesis de que los niv I . d . JerClCIO 3, emplear el
es
metodo Kolmogorov denomina cuantitativo, por ejemplo, la temperatura. Se entiende por niveles diferentes de
nonnalmente con una media de 10 g/IOeO 1 e mmunog.lobuhna G del suero se distribuyen un factor los valores diferentes que dicho factor toma.
. . m y una desv .. t' d d
ajustar mejor cualquier otra distribucio'Il110 '1 '1 d acion es an ar e 0.2 g/lOO ml. Se En los captulos 3 y 4 se presentaron estos experimentos como una introduccin a
rrna a os atos?
10. lo . 1 1 ' los clculos que aparecen en el anlisis de la varianza (ANOVA). No se hizo mencin
" s lllV: es ~ e niquel en tres muestras de aceite crudo s d . .
absorclOn atmica, con los siguientes resultados: e eterminaron por espectrometna de alguna de las condiciones experimentales que podran haber introducido otros factores
que afectasen los resultados. En el experimento de fluorescencia dichos posibles facto-
Muestra res incluyen: la temperatura ambiente, el fluormetro utilizado para cada medicin, la
Medias (Ni, ppm)
1 14.2 16.8 15.9 19, l 15.5 16 persona que realiza las mediciones y el da de realizacin del experimento. Cualquiera
2 14.5 20.0 17.7 18.0 .0 de estos factores podra haber influido en los resultados para dar el comportamiento
3 18.3 15.4 16. 1
20.1 16.9 17.7 17.9 19.3 observado e invalidar la conclusin extrada sobre el efecto de las condiciones de almace-
Utilice el mtodo de Kruskal-Wallis para decidir si los . . namiento. Queda claro que si se quiere que las conclusiones extradas de un experimento
dlerell slgnlflcativamente. mveles de mquel en los tres aceites
sean correctas, hay que identificar los diferentes factores que influyen en el resultado y, si
es posible, controlarlos. El trmino diseo experimental se utiliza habitualmente para
describir las etapas de (1) identificacin de aquellos factores que pueden influir en el
resultado de un experimento, (2) diseo del experimento de modo que se minimicen los
efectos de los factores incontrolados y (3) utilizacin del anlisis est d ti
Ios e fectos ele los diferentes
. '
factores implicados.
a IS reo para separar Con este diseno, las mediciones que utilizan el tratamiento A se llevan a cabo en los
priemros das, mientras que aquellas que utilizan el tratamiento B se realizan en los ltimos
dos das. Si se tuviese la impresin de que existe diferencia entre los tratamientos A y B
7.2 ALEATORIZACIN no sera posible decir si esta diferencia era autntica o si fue provocada por el efecto de
utilizar los dos tratamientos en pares de das diferentes. Un mejor diseo es aquel en el que
Una de las hipt~s.is del ANOVAes que la variacin incontrolada es aleatoria. No obstante
cada tratamiento se utiliza una vez cada da, y el orden de los tratamientos se aleatoriza
en aquellas tnediciones tomadas durante un periodo , Ia vanacion
' . . en un facror i ' cada da. Por ejemplo:
.. actor II1controlad
como la presion, la temperatura, el deterioro del aparato etc pued duci ,o
., l I d ,., e pro uClr una tendenCIa Dia 1 A C B
t n os resu ta os. Como consecuencia los errores debid 1 ...,
. ' os a a variacron II1controlada no Da 2 A B C
son aleatorios durante mucho tiempo ya que los errare ' . ,
E" . .'. s suceSIVOS estan correlacionados, Da 3 C B A
sto puede conducir a un error SistemtICO en los resultados Af t d
hl .. . or una amente este Da 4 C A B
pro , ema se supera utilizando la tcnica de aleatoriz . . S
" , . . , ., . . acron. upongamos que deseamos
e, emparar ti efecto de un umco factor con tres niveles diferei t E ' Un grupo que contenga una medicin para cada tratamiento recibe el nombre de bloque
. te t' . los ni . . 1 es. n un expenmento de
tS e upo os niveles ejferentes se llaman a menudo tratamientos Est t' . . (de nuevo un trmino de origen agrcola que significa una zona de un campo) y el diseo
'., ., Id' l ' . e ernnno tiene su
origen en e esarro lo que hace Fisher del ANOVA I li , se llama un diseno de bloques aleatorizados. En este caso, el conjunto de las mediciones
. a ana Izar expenmentos pr . d l
agricultura. En estos casos, los diferentes tratamientos odran ser o ' OpIOS ,e a de cada da constituye un bloque.
cin de fertilizantes distintos. Notemos los tres tr t ' P t dif ' P r ejemplo, la aplica- Otra ventaja de un experimento por bloques es que es ms sensible que otro sin bloques,
. a armen os I erentes A B C '.
que, se realicen cuatro mediciones repetidas en cada uno de 1 t t . ' , y exijamos como un mtodo de probar si tratamientos diferentes producen resultados significativa-
t . l' , ' . os ra almentos. En lugar de
ornar as cuatro tnedicioncs para el tratamiento A id d i ' mente diferentes. El ANOVA -en este caso de dos factores ya que cada medicin se
luego de las otras cuatro para C podemos llevar' :ecgalbJI ads ,e as d~r~s cuatro para B, y
. 1, , ' . ' o oce me tetones en un ord clasifica de acuerdo con dos factores, tratamiento y dia- permite la separacin de las tres
dt~tO~1O que se decide mediante uan tabla de nmeros aleatorios. Para elI . ' en fuentes de variacin: variacin entre bloques, variacin entre tratamientos y variacin
ti ,1 tamiento un numero para cada repeticin: o se asigna a cada
aleatoria debida al error experimental. Para decir si los tratamientos producen resultados
significativamente diferentes, se compara la estimacin de la varianza entre tratamientos
A B C con la varianza estimada de los errores aleatorios. La sensibilidad del experimento depende
01020304 05060708 09101112
del tamao de la variacin aleatoria: cuando ms pequea sea la variacin aleatoria,
(O~'serve que cada numero tiene la misma cantidad de d . ,,' ms pequea ser tambin la diferencia que se pueda detectar entre los tratamientos. En
tabla de nmeros aleatorios (vase la tabla A 6) gltos')b~esl:ues entramos en
una un experimento sin bloques, la variacin aleatoria sera ms grande, ya que incluira una
'. j" , . en un punto ar rtrario y leemos 1
elt ( igttos, descontando los pares de la forma 00 13 99 . l os pares contribucin debida a la variacin da a da y, en consecuencia, se reducira la sensibilidad
S ' - , y se repite e proceso doce v
. upongamos que como resultado de lo ant . l .. eces. del experimento.
I ~ oc 08 07 ' . error aparece a sucesron 02, 10 04 03 11 al
('-:ml~n A' C' ~C)~o~e~to~c~ s~ r~alizaran las mediciones en los nivel~s dfe'r~nte's el;
::~~:"I'l~~)~~~~:saeios'en'~II;iV~1 .; f~c~~r~:\~J~:~~;~~~~:~o;~~J~:I~:~:~~~~:~e~~~~~~:~1i~~ 7.4 ANOVA DE DOS FACTORES

En un ANOVA de dos factores, cada medicin, XI), se clasifica con dos factores, como se
muestra en la tabla 7.1. Hay N mediciones divididas entre e niveles de tratamiento y r
73 EXPERIMENTOS CON BLOQUES
bloques (por tanto N ~ cr), Tambin aparecen los totales por columna y por fila y el gran
total, T, necesarios en los clculos. La deduccin de las frmulas empleadas no se dar con
;1: illconw'nicnte dt' la ale:1torizacincom lleta -s nu .
,1(\I:CS natlwlies en el III t, .r. l . . 1 , e que no aprovecha las pOSIbles sulxlivi .. detalle como se hizo para el ANOVA de un factor en la seccin 3.C), El principio del mtodo
. " a cria cxpenmcntal SIi!Jong ,', I es el mismo, y al fina 1 del captulo se proporcionan referencias para los que estn
llndr a cabo l: 1" -dici " , a, por t;jl:mp 0, que no se pudiesen
'JJ'l'lH'r' ,:lSetXt mee clon.es del ejeillplt,) anterior en el mismo da y se tllvienn que interesados en los aspectos matemticos de! tema. Las frmulas para el clculo de la
l en cuatro e 1;15 consccutrv Ut'I' , e ~
, os. I rzanr o el nJlsmo orden de antes rcsi1tana: variacin de las tres fuentes diferentes, o sea, entre tratamientos, entre bloques y error
experimental, se dan en la tabla 7,2.
Dla l A C A
Da 2 A C A
Da :1 Ejemplo. En un experimento para comparar el porcentaje de eficiencia en la extraccin
C B B
Da 4 B de iones metlicos en solucin acuosa por agentes quclantes, se obtuvieron los siguien-
C B
tes resultados:
probar si la variacin da a da es significativamente mas grande que la variacin debida
Tabla 7.1 Forma general de la tabla del ANOVA dee (dos
os rae
f tores
al error aleatorio de la medicin y, si es as, estimar su varianza,
Como en un ANOVA de un factor, los clculos se pueden simplificar restando a
cada medicin un nmero arbitrario, En la siguiente tabla se muestran mediciones una
vez que se les ha restado 80 a cada uno de ellas,

Tratamientos
D Totales por filas. T, T'
Bloques A B C
O 3 1 6 3'6 }
Dia 1 4 ~-1 5 25 62 = "[,T,'
3 O
Da 2 -1 2 1 1 I
2 O
Dia 3 3
- 5 3 4 O ~ Gran total, T
Totales por columna, TI 6 9 16
TI' 36
----- ----_/
25

"[,1' = 86
j I

Agente quelante Tenemos: r=3,c=4.N=12,l:1'~=62,):r-J=~6.r=O.':l:x~=54


l } 1 j

Das A B C D
1 84 80 83 79 En la siguiente tabla se muestra el clculo de los cU<ldr<ldos medios para cada fuente
2 79 77 80 79 de variacin
3 83 78 80 78 Cuadrado
Suma de Grados de
Fuente de libertad medio
cuadrados
~:::e~l::; II~r::;r::~~I~~s:r:~~i~~l:~~~ei~:sI:lget:~ico (coln concentracin especificada)
varracton
3 28.6667/3 ~ 9.5556
Entre tratamientos 86/3 - 0 2/12 ~ 286667
aleatoria. e 1 es que antes, tomados de una manera 2 15,5/2 ~ 7,75
Entre bloques 62/4 - 02/12 = 15,5
6 9.8333/6 = 1.6389
Residual por diferencias ~ 9.8333
En este experimento el uso d dif
~ d~ae~~~~e:jagen~~s ~u~lantes 54 - 0 2/12 = 54,0 11
ya que el investigador los elige' .es un factor controlado, Total
incontrolado ya que introduce ~arl'a ic etcucllodn e expenmento supone un factor
e on mcon ro a a causada a 1 1 . (Ya que p<lra obtener 1<1 suma de cuadrados residu<ll hay que calcular una diferenci<l, se
en la temperatura del laboratorio resi . ' . a vez; por os cambios
tracin de la disol " del i ' P ., n, etc., y por ligeras diferencias en la concen- deben tomar tantas cifras decimales como sean posibles p<lra evitar errores en esta
ucion e Ion metlico es d . 1d
captulos 3 y 4 se expf , 1 ' . ~clr, e la es un factor aleatorio. En los cantidad.)
~ignificativo par~
ICO a manera de utilizar el ANOVA Para el lector puede ser formativo el verificar que las sumas de cuadrados separan
debido a un factor controlado o . probar un efecto
los efectos de bloque y trat<1tniento. Esto puede hacerse, dig<lmos, incrementando
Incontrolado En e te exoeri para estimar la vananza de un factor
ANOVA d .d f s e experimento -en . . que hay a 1a vez dosos ti
tipos de factores- el todos los valores de un bloque en una cantidad fija y volviendo <1 c<llcubr las sumas de
. e os actores se puede utilizar de dos maneras' (i) . cuadrados Se deber<l llegar <1 que 1<1 suma de los cuadrados total y entre bloques se ha
. ifrcativamente
diferentes agentes quelantes tienen eficienci as srgru . ' . I diferentes,
.para probar
y (ii)SIpara
los
modific<ldo, mientras que la suma de cuadrados residual y entre tratamientos no

ha variado.
Si no hay ninguna diferencia entre las eficiencias o los dias, entonces las tres sumas
Tabla 7.2 Frmulas para ANO VA de dos factores
de cU<ldrados medios proporcionar<ln una estim<lcin de u;,
o sea, la v<lri<lnz<l de la
variacin aleatoria debida <11 error experiment<ll (vase 1<1 Seco 3.9). L<I prueba F se
Fuente de variacin Suma de cuadrados Grados de libertad
utiliza para ver si las estimaciones de 1<1 varianza difieren signific<ltiv<lmente. Compa-
e rando el cuadrado medio entre tratmnientos con el cuadrado medio residual resulta:
Entre tratamientos JI1')lr - TliN e - 1

, F,,6 ~ 9.5556/ 1.6389 ~ 5.83


Entre bloques ,f l
'/c ~~ TliN r - 1
De la tabla A.2 podemos extraer el valor crtico de F que es 4.76 (P = 0.05) y al ser
Residual por diferencia por diferencia
super<ldo por el valor <Interior nos est indicando que hay una diferenci<l signific<ltiv<I
Total x 2 - TliN N - entre tratamientos, es decir, entre la eficiencia de los diferentes agentes quelantes, al
i 1 IJ
. 'le :-\ x 3 hay mas de un diseno posible y se deberia
nivel del 5%. Comparando el cuadrado medio entre bloques (es decir, entre das) con SI el cuadrado es mayor que 11110 l - - " . .,.. _ _ c'

. 1 l "tos diseos 1 a desventaja obvia de un diseno de CUcldrdClo I.It1l10


elegir a azar U110 e e es . ' . ~< , " .' 1'
el residual resulta: '.' . 1 es que debe exisir el mismo nmero de bloques y t-atamentos Es posible conste l rar
sllnp e .. . . . ..
F 2 ,6 = 7.75/1.6389 = 4.76 diseos ms com pi icados que el nm ncn esta restnccion.

Como el valor crtico de Fes 5.143 (P = 0.05) Y no es superado por el valor anterior,
se concluye que no hay diferencias significativas entre das. No obstante, el cuadrado 7.6 DISEOS ANIDADOS Y DE CLASIFICACIN CRUZADA
medio entre bloques es considerablemente mayor que el cuadrado medio residual, y si
el experimento se hubiera realizado sin bloques, estos dos efectos se combinaran en El diseo del experimento considerado en la seccin 7 ..4 s~ clcnolllina c1asifi.cacil;n
la estimacin del error experimental, y el experimento probablemente no habra sido l' lebido a que se torna una medicin para cada combll1aclon posibl> de los distintos
cruzar a (, e entra el diseno
capaz de detectar si tratamientos diferentes proporcionaban resultados significati va- niveles ele los factores. En contraposicin al diseno anterior se encue :.' ," e

mente diferentes. Si la diferencia entre dias hubiera sido significativa, indicara que . . l' figura 7 1 en el que una muestra de una soluclon est"lcl"r
expenmental que aparece en a , e . , . . ' d' [e , te
otros factores tales como la temperatura, preparacin de la disolucin, etc., tendran , e la uno ele los tres laboratorios Y en carla laboratono dos tecnicos 1 eren es
se enva a cae e " 1, ver que
efectos. Se puede demostrar que el cuadrado medio entre bloques proporciona una nalizan la muestra. Se dice que este diseo es anidado o Jcrarqulco Y se puee e L .
estimacin de aS + ca~, donde a~ es la varianza de la variacin aleatoria de da a da. a tiliz: todas las combinaciones posibles de las condiciones expenmentales, por
no se u I Izan (El ANOVA simple se
Ya que el cuadrado medio residual da una estimacin de aS,
se puede deducir una . 1
eJemp o, ca a
e . c

d tcnico slo realiza mediciones en su Llboratono.


." ..
'

, 'bl' t
.
. '1 cuenta
estimacin de a~. puede considerar tambin corno un eJsei.o.'l1l1dado.) lamblen e~ p~~1 . e. amar 1 I
diseos mixtos (es decir, en parte de clasificacin cruzada, en parte amdddos),
Este ejemplo il ustra claramente las ventajas de considerar el diseo de un experimento
antes de realizarlo. Entre un experimento con bloques y uno sin bloques, con el mismo
nmero de mediciones en cada uno, el primero en ms sensible y proporciona ms
7.7 INTERACCIN
informacin.
El anlisis expuesto supone que los efectos, si existen, son aditivos. Este aspecto se La hi otesis bsica en el anlisis realizado en la seccin 7.4 era qu.e los e~ectos eh:,los,dOS
analiza posteriormente en la seccin 7.7. I ,. El' '1"" I 1 este trmino se explica llleJor mediante IUI
factores fuesen aditIVOS. sIgm lCd( o e e . _ . 1-
, . . . .: .: . 1" leila en la que cada factor tiene e os
ejemplo numcrtco. La snuacion mas sunp e es aql . 1 l l
. . los ,1' Y a, Y el factor BIas 11IVe es )1 y 'h
niveles: por ejemplo, el factor A tiene os nrve LS al ." I() 1') , l'"
7.5 CUADRADOS LATINOS Supongamos que las com binaci b l)' a 2b I trencn corno resultados
mactoncs al 1, al le
,-) ~

corno se muestra en la tabla 7.3. . . . . , .. . ' .',


Un factor incontrolado que no se consider en el anlisis de la seccin anterior era el . . 1 l - valores es decir si no exisncse mnguna vanacion aleatoria,
SI estos fuesen vere ae eros " ' . , .i,
momento del da en que se realizaban las mediciones. Una variacin sistemtica durante I factor B elel nivel b, al nivel be, mantenIendo A e.n al, su la
entonces el e f ecto
' e1e carn 1llar e < - . , ' 1l
el dia debido al deterioro de la solucin, o un cambio en una determinada direccin de la 5. Si los efectos fuesen aditivos, entonces el efecto de camb;r B del nivel b, al nive 'h
temperatura del laboratorio, podra producir una tendencia en los resultados. Es posible uti-
lizar un diseo experimental que permita la separacin de este factor si tiene el mismo m-
mero de bloques y tratamientos. Por ejemplo, del siguiente diseo de bloques aleatorizados

Solucin estandar
Da 1 A C B
Da 2 C A B

\
Da 3 C B A
;:ll '31 que las mediciones que utilizan el tratamiento C se concentran al principio del da y
Ji]'; que US3n el B lo hacen al final del da, se podra seguir el diseo siguiente:

3 Laboratorios
Da 1 A B C 2
Da 2 C A B
Da 3 B C A

Este diseno, en el que cada tratamiento aparece una vez en cada fila y una vez cada columna,
A B
/\
e D E F Tcnicos
''C be el nombre de cuadrado latino; permite separar la variacin entre tratamientos, entre
entre el momento del da y el error experimental aleatorio. Figura 7.1 Diseno anidado o jerrqllico.
Tabla 7.3
izquierda; si los efectos interaccionasen, las rectas no serian paralelas, como cu el diagrama
NiveldeA de la derecha. Si los factores tienen varios niveles, Una gnifica de este tipo es til en la
interpretacin de cualquier interaccin.
Desafortunadamente la situacin experimental se confunde por la presencia de errores
10 12 aleatorios, El lector puede comprobar que para la tabla 7.3, un ANOVA de dos factores da
Nivel de B
cero para la suma de cuadrados residual si el valor faltantc se considera como 17, pero si
15 ?
uno de los valores se modifica, esto ya no es asi. Con este diseo del experimento no
podemos valorar hasta que punto una suma de cuadrados residual que no es cero es causada
por el error aleatorio, en lugar eleserlo por la interaccin entre los dos efectos. Para estimar
con A en a2 tambin debera ser 5, de manera que el valor final en la tabla debera ser 17.
Observe que entonces el efecto de cambiar A del nivel a al nivel 2 . d el error aleatorio se debe repetir las mediciones en cada celda de la tabla. Es importante la
di del ni I a2 es ,In epen- forma exacta de esta repeticin. Supongamos, por ejemplo, que una determinacin consiste
ienternente el nivel de B. En general si los resultados
bl 7 4 ' ' son como se muestran en la en disolver un peso dado de una especie en IUI volumen especificado de agua y posterior-
ta a . y son ajenos al error aleatorio, entonces Y2 - YI es igual a)' y SI' 1 f t
4 - 3 os e ec os son mente en titularlo frente a una disolucin cstaudar. Las mediciones repetidas deben incluir
tanto la etapa de pesar COIIlO la de titular: si slo se repitiese la etapa de titular, el error
aleatorio producido al pesar no estara incluido en la estimacin del error experimental.
Tabla 7.4
Adems, si el mismo lote ele disolucin estndar y el mismo conjunto de material de vidrio
Nivel deA no se utilizan para todas las determinaciones en el experimento, entonces l/O se debe utilizar
el mismo Jote de disolucin estndar y el mismo conjunto de material de vidrio para las
mediciones repetidas. Las mediciones que se repiten de manera que est.in sujetas a todas
YI Y2 las fuentes de error aleatorio en el experimento se llaman rplicas. En el ejemplo siguiente
Nivel deB
se aclara cl mctodo por el cual se puede separar el error aleatorio y la suma de cuadrados
de la interaccin.

Ejemplo. En un experimento para investigar la validez de una solucin como estndar


aditivos. Si no es as, se dice que hay interaccin entre A y B ya que en una combina '.
concreta entre A y B d i ' ' CIOn de absorbancia, se midi el valor de la absortividad molar, E, de soluciones de
. . a u~ va or mas grande que el esperado. La fi ura 7.2 aclara
grficamente el efecto de la Interaccin. En las dos grficas cada resulta; tres concentraciones diferentes a cuatro longitudes de onda diferentes. Se realizaron
respecto al nivel d B . o se representa dos mediciones repetidas por cada combinacin de concentracin y longitud de onda;
f di . e , y se unen los puntos que tienen el mismo nivel de A. Si los efectos
y se aleatoriz el orden en que se hicieron las mediciones. Los resultados se muestran
uesen a ItlVOS, entonces las rectas seran paralelas como en el diagrama de la parte
en la tabla 7.5: para simplificar los clculos se han multiplicado por 100 los valores
medidos.

(i)
( i i) Tabla 7.5

o 240 270 300 350


'O
~ 0.02 94,96 106, 108 48,51 78,81
:::l
/iveldeA.a U)
al
Nivel de A = al
a: 0.06 93,93 106, 105 47,48 78, 78
Nivel de A = a2 0.10 93,94 106,107 49,50 78, 79

/ N i v e l de A' a,
El primer paso en los clculos es encontrar los totales de celda. Esto se hace en
~---'------L- _ la tabla 7.CJ, que tambin incluye otras cantidades necesarias en los clculos. Como
b2 antes, T, denota el total de la fila r-sima, el T el total de la columna j-sima y T el
Nivel de B gran total.
Nivel de B
Se calculan las sumas de cuadrados entre filas, entre columnas y del total. Cada
Figura 7.2 (i) Efectos que son aditivos; (ii) efectos que interaccionan. clculo requiere el trmino r-/I/rc (donde 1/ es el numero de mediciones repetidas en
Tabla 7.6
de la i-sima fila y j-sima columna, es decir, la suma de las mediciones replicadas en
Concentracin (gil) A(nm) 240 270 300 350 L. 1f. la i-sima fila y la j-sima columna.
0.02 190 214 99 159 662 438244
0.06 186
Suma de cuadrados residual = I.X~k - I.yt/n
211 95 156 648 419904
0.10 187 213 99 157 656 430336 = 172138 - 344244/2
Tj.563 638 293 472 T= 1966 1288484 I.n
1] 316969
= =16
407044 85849 222784
I.n ~ 10322646 con (n - l)rc = 12 grados de libertad.
J
La suma de cuadrados de la interaccin y sus grados de libertad se pueden obtener
ahora por diferencia. A continuacin se resumen los resultados de estos clculos.
cada celda, en este caso 2, r = nmero de filas y e = nmero de columnas). Aeste trmino
Fuente de variacin Suma de cuadrados Grados de libertad Cuadrado medio
se le denomina a veces trmino de correccin, C. Tenemos:
Entre filas 12.34 2 6.17
Entre columnas 11059.506 3 3686.502
e = T'[nrc = 19662/(234) = 161048.16 Interaccin 1.994 6 0.3323
Residual 16 12 1.3333
Se calculan ahora las sumas de cuadrados:
Total 11089.84 23

Suma de cuadrados entre filas = rn/nc - e Para probar si cada una de las fuentes de variacin es significativa se compara el cuadrado
medio de dicha fuente con el cuadrado medio residual.
= 1288484/(2 x 4) - 161048.16 (i) Interaccin. sta es obviamente no significativa ya que el cuadrado medio de la
= 12.34 interaccin es menor que el cuadrado medio residual.
(ii) Entre columnas (es decir, entre longitudes de onda). sta es significativa ya que
con r - 1 = 2 grados de libertad tenemos:

Suma de cuadrados entre columnas = I.Tj/nc - C) F 312 = 3686.502/1.3333 = 2765


)

= 1032646/(23) -161048.16 El valor crtico de F3. 12 es 3.49 (P = 0.05). En este caso se esperaba un resultado significativo
ya que la absorbancia depende de la longitud de onda.
=11059.506
(iii) Entre filas (es decir, entre concentraciones). Tenemos:
con e - 1 = 3 grados de libertad.
h12 = 6.17/1.3333 = 4.63
Suma de cuadrados total = I.Xlk - e El valor crtico de F 2 12 es 3.885 (P = 0.05), indicando que la variacin entre filas es
demasiado grande para que se tenga en cuenta como variacin aleatoria: la solucin no es
donde Xijk es la k-sima rplica en la i-sima fila y j-sima columna, es decir, I.xlk
adecuada como un estndar de absorbancia. La figura 7.3 muestra la representacin de
es la suma de los cuadrados de las mediciones individuales que aparecen en la tabla la absortividad molar frente a la longitud de onda, y en ella los valores con la misma
7.5.
concentracin estn unidos por lneas rectas. Esto aclara los resultados del anlisis anterior
de la siguiente forma:
Suma de cuadrados total = 172138 - 161048.16
(i) las lneas son paralelas, lo que indica ausencia de interaccin;
= 11089.84 (ii) las lineas no son muy horizontales, 10 que indica que la absortividad molar vara
con nrc - 1 = 23 grados de libertad. con la concentracin;
(iii) las lineas se encuentran a diferentes alturas en la grfica, lo que indica que la
L~ variacin .debida al error aleatorio (nonnalmente llamada variacin residual) absortividad molar depende de la longitud de onda.
se estuna a partir de la variacin dentro de las celdas es decir la variacin entre
rplicas. La suma de cuadrados residual = hlk - I.yt/n donde Tij es ~l total para la celda
Las frmulas en los clculos anteriores se resumen en la tabla 7.7.
decir, si algunos laboratorios daban resultados inesperadamente altos o bajos para algunas
muestras. Esto se hace comparando la suma de cuadrados residual y de interaccin. Si /lO
hay ninguna interaccin, entonces se podra probar si los laboratorios obtuvieron resultados
significativamente diferentes, es decir, si existe diferencia sistemtica entre los laborato-
rios. Si existiese, entonces se podra estimar la varianza entre elIos. Sin embargo, si hay
alguna interaccin significativa, la prueba sobre diferencias significativas entre laborato-
rios tiene poca relevancia.
Para que un ANOVA de dos factores sea vlido se deben satisfacer las siguientes
condiciones (vase la Seco 3.9):
(i) el error aleatorio es el mismo para todas las combinaciones de niveles de los factores;
(ii) los errores aleatorios se distribuyen aproximadamente normales.

7.8 EL DISEO FACTORIAL FRENTE AL DE UN FACTOR CADA VEZ

0.02 0.06 0.10 Un experimento como el del ejemplo anterior, en el que la variable de respuesta (es decir,
la absortividad molar) se mide para todas las combinaciones posibles de los niveles
elegidos de los factores, recibe el nombre de diseo factorial completo. El lector ha podido
concentracin, gil observar que este tipo de diseo de experimento es la anttesis de la aproximacin clsica
Figura 7.3 Relaciones en el ANOVA de dos factores del ejemplo de la seccin 7.7. en donde la respuesta se investiga para cada factor, mientras que el resto de los factores se
mantiene a un nivel constante. Hay dos razones de peso para utilizar un diseo factorial en
lugar de uno clsico, en experimentos que prueben si la respuesta depende del nivel del
En est~ ~xperimento los dos factores, es decir, la longitud de onda y la concentracin
factor:
de la.sol.uclOn, son factores controlados. En qumica analtica una aplicacin importante de
(i) el experimento factorial detecta y estima cualquier interaccin que el experimento
las te~Il1cas ANOV~ e~ in~estigar dos o ms factores controlados y sus interacciones en
de un factor cada vez no puede hacer;
experimentos de opnmtzacn. Esto se trata en la seccin 7.9. (ii) si los efectos de los factores son aditivos, entonces el diseo factorial necesita menos
mediciones que la aproximacin clsica para proporcionar la misma precisin. Esto se
Como se coment en la seccin 4.8, otra aplicacin importante de las tcnicas ANOVA
puede ver volviendo nuevamente al experimento de absortividad molar. All, las 24
se e~~l!entran en. las investigac.i~nes de colaboracin entre laboratorios, en cuanto a
mediciones se utilizaban para estimar el efecto de variar la longitud de onda y las mismas
prec~~lOn y exactltl~d. U~a ver~lOn .ms elaborada de los experimentos descritos en la
24 para estimar el efecto de variar la concentracin.
seccion 4.8 supondr~a enviar van~s tipos diferentes de muestras a una serie de laboratorios
En un experimento de un factor cada vez, en primer lugar se habra fijado fa concen-
y que c.a~a uno realIzase una sene de anlisis replicados sobre cada muestra. Un anlisis
tracin y, para obtener la misma precisin para el efecto de variar la longitud de onda,
;n~tematl.co de los resultado~ proporcionara las siguientes sumas de cuadrados: entre
habran sido necesarias 6 mediciones para cada longitud de onda, es decir, 24 en total.
~ ora tonos: entre mu~stras, mteraccin muestra-laboratorio, y residual. El objetivo de
Despus se habra fijado la longitud de onda y se realizaran otras 24 mediciones para
dicho expenmento sena probar primero si hay interaccin entre laboratorio y muestra, es
concentraciones diferentes, formando en total 48. En general, para k factores, una apro-
ximacin clsica supone k veces tantas mediciones como un factorial con la misma
precisin.
Tabla 7.7 Fnnulas para ANOVA de dos factores con interaccin
Fuente de variacin Suma de cuadrados Grados de libertad
Entre filas 7.9 DISEO FACTORIAL Y OPTIMIZACIN
ITiJnc
, - e r - 1
Entre columnas Puesto que con frecuencia las tcnicas analticas estn interesadas en la deteccin de trazas
IT'jnc - e e- 1
J
de anal ita, suele ser importante que los niveles de los factores de los que depende la
Inl'raccin
por diferencia por diferencia respuesta se elijan con vistas a maximizar la respuesta. El proceso de bsqueda de estos
Residuos niveles de factor ptimos se conoce como optimizacin.
Ix~, - ITtln rc(n - 1) En el primer paso se determinan los factores y las interacciones que afectan de manera
Total
Ix~, - e rcn importante a la respuesta. Esto se puede hacer utilizando un experimento factorial en el
que cada factor tenga dos niveles, conocidos habitualmente por "alto" y "bajo". En el caso (a) Efecto de los factores individuales. . . .
bi 1 . eles de P se puede hallar de la diferencia media en
de una variable cuantitativa los trminos "alto" y "bajo" tiene el significado usual. La El efecto de carn lar os I11V . fii
respuesta cuando P cambia el nivel alto al bajo y los nivele~ de ~ ~ T s~ mtntlel~el: I!o:i
eleccin exacta de los niveles se determina principalmente por la experiencia y el conoci-
Hay cuatro pares de respuestas ~u~ proporcionan una esumacion de e ecto e I11V
miento del experimentador y las restricciones fsicas del sistema, por ejemplo, si el agua
se utiliza como disolvente, slo se puede trabajar con temperaturas en el intervalo O-100C. P, como se muestra en la tabla siguiente.
Algunos problemas relacionados con la eleccin de los niveles se analizan ms adelante. Nivel de P
Para una variable cualitativa, "alto" y "bajo" se refiere a un par de condiciones diferentes, + Diferencia
Nivel de C Nivel de T
por ejemplo, la presencia o ausencia de un catalizador, el uso de agitacin mecnica o 9.9 4.7 5.2
magntica, muestras de forma granular o el polvo, etc. Como ya se han considerado 5.3 2.7 2.6
+ 8.0
experimentos con dos factores con cierto detalle, nos centraremos en uno con tres factores + 15.0 7.0
6.0 3.2 2.8
A, B Y C. Esto significa que hay 2 x 2 x 2 = 8 combinaciones posibles de niveles de + +
Total = 18.6
factores, como se muestran en la tabla siguiente. Un signo ms indica que el factor est en
el nivel alto y uno menos que est en el nivel bajo. La primera columna muestra una
Efecto promedio de alterar el nivel de P ~ 18.6/4 ~ 4.65
notacin utilizada a menudo para describir las combinaciones, donde la presencia de la
correspondiente letra en minscula indica que el factor est en el nivel alto, y su ausencia,
De manera similar se puede obtener el efecto promedio de alterar los niveles de T y C.
que el factor est en el nivel bajo. El nmero 1 se utiliza para indicar que todos los factores
Se deja como ejercicio para el lector demostrar que ellos son:
estn en el nivel bajo.

efecto promedio de alterar el nivel de C ~ - 4.85


Combinacin A B C Respuesta
YI
a +
efecto promedio de alterar el nivel de T = 2.15
Y2
b + Y3
e + Y4 (b) Interaccin entre dos factores. . '. 11
be + + id l i s dos factores P Y T. Si no hubiera mteraCClOn entre e os,
Y5 Consi eremos a lora o . . d
ae + + Y6 entonces el cambio de respuesta entre los dos niveles de P debera ser m. epen-
ab + + Y7 diente del nivel T. Las primeras dos cifras en la ltima colum':a de la tabla an~en~~d~n
abe + + + Y8 el cambio en respuesta cuando P cambia del nivel alto al bajo con T e'~ el nive aJo.
li (e 2 + .., 6)/2 = 39 1 as dos ltimas cifras en la misma columna
Su promec la es .J.~. . . ~ . ' dio es
El mtodo por el cual se estiman los efectos de los factores y sus interacciones se ilustra proporcionan el efecto de cambiar P cuando T esta en el n~vel ~lto. Su prom e
mediante el ejemplo siguiente. (8.0 + 2.8)/2 = 5.4. Si no hubiera interaccin ni error aleat.ono (vease la Sec?7) es.tas
estimaciones del efecto del cambio del nivel P deb~ran ser I~uales. ~I. c~nvel11o segUido
Ejemplo. En un experimento de cromatografa lquida de alta resolucin, se investig es tomar la mitad de su diferencia como una medida de la mteraCClOn.
la dependencia del parmetro de retencin, k', sobre tres factores. Los factores fueron
pH (factor P), la concentracin de un contra in (factor T) y la concentracin de un efecto de interaccin PT ~ (5.4 - 3.9)/2 = 0.75.
disolvente orgnico en la fase mvil (factor C). Se utilizaron dos niveles para cada
factor y se realizaron dos mediciones, una rplica de la otra, para cada combinacin. Es im ortante darse cuenta de que esta cantidad estima el grado ~n que los e~ectos de
Las mediciones se aleatorizaron. La tabla que se expone a continuacin da el valor P y T ~o son aditivos. Igualmente, se podra habe~ calculad? consl~er~ndo que tanto el
medio para cada par de rplicas. cambio en respuesta para los dos niveles de T es mdependlente del nivel de P.
Las otras interacciones se calculan de manera similar. De nuevo el lector puede
Combinacin de niveles de factor k'
1 4.7
verificar que:
p 9.9
t 7.0
efecto de interaccin CP ~ - 1.95
e 2.7 efecto de interaccin CT = - 1.55
pt 15.0
pe 5.3 (e) Interaccin entre tres factores. .1 ..
te 3.2 La interaccin PT calculada anteriormente. se p~l~de divi~ir en d~~ part~s c~'~r~ ;~~;
pte 6.0 . Id C Con C en el nivel bajo, la eslirnaclon de la mteraccion sena ( . .
a 1I11ve e"
= lA Y con C en el nivel alto sera (2.8 - 2.6)/2 = 0.1. Si no hubiera interaccin medio del error (residual). ste se calcula de las mediciones individuales realizadas
entre los tres factores ni error aleatorio, estas estimaciones de la interaccin PT debe- por el mtodo descrito en el ejemplo de absortividad molar en la seccin 7.7. En el
ran ser iguales. La interaccin de los tres factores se estima por la mitad de su diferencia experimento que estamos analizando, se ha obtenido 0.012 para el cuadrado medio
[= (0.1-1.4)/2 ~ - 0.65]; Y mide hasta que punto el efecto de la interaccin PT y el residual con 8 grados de libertad. El contraste de significacin, empezando con la
efecto de C no son aditivos: igualmente se podra calcular considerando la diferencia interaccin de orden ms grande, proporciona para la interaccin PTC:
entre las estimaciones de la interaccin PC para los niveles bajo y alto de T, o la
diferencia entre las estimaciones de la interaccin TC para los niveles bajo y alto de P. F 18 = 1.69/0.0 12 ~ 141
Estos resultados se resumen en la tabla siguiente.
que es obviamente significativa. Si existe interaccin entre los tres factores, no tiene
Efecto
Un nicofactor (efecto principal) caso probar que los factores tomados por pares o individualmente sean significativos,
P 4.65 ya que en cualquier proceso de optimizacin se tendrn que considerar todos los
T 2.15 factores. Slo se debera probar la significacin de un nico factor si no hubiera
C -4.85 interaccin con otros factores.
Interaccin de dos factores
TP 0.75 Un problema que aparece en un experimento factorial completo como ste es que el
CT -1.55
CP nmero de experimentos requerido crece rpidamente con el nmero de factores: para k
-1.95
Interaccin de tres factores factores a 2 niveles con 2 rplicas para cada combinacin de valores, son necesarios 2,,1
PTC -0.65 experimentos, por ejemplo, para 5 factores, 64 experimentos. Cuando hay ms de tres
factores es posible una simplificacin suponiendo que las interacciones de orden 3 y
Los clculos se han presentado con cierto detalle para mostrar con ms claridad los superiores sean despreciables. Las sumas de cuadrados correspondientes a estas interac-
principios. Un algoritmo debido a Yates (vanse la referencias) simplifica el clculo. ciones se pueden combinar para proporcionar una estimacin de la suma de cuadrados
Para probar qu efectos, si existen, son significativos, se puede utilizar el ANOVA residual y que no sean necesarias ms rplicas. La lgica para esta aproximacin es qU'
(suponiendo que existe homogeneidad de varianza). Se puede demostrar que en un los efectos de orden ms grande son normalmente mucho ms pequeos que los efectos
experimento de dos niveles, como ste, las sumas de cuadrados necesarias se pueden principales y los efectos de interaccin entre dos factores. Si las interacciones de orden
calcular de los efectos estimados utilizando
superior se pueden suponer insignificantes, una fraccin adecuada de todas las posibles
combinaciones de los niveles del factor es suficiente para proporcionar una estimacin de
Suma de cuadrados = N x (efecto estimado)2/4 los efectos principal y de interaccin de dos factores. Corno se mencion en la seccin 4.7,
dicho diseo experimental se llama diseo factorial fraccional o incompleto.
donde N es el nmero total de mediciones incluyendo las rplicas. En este caso N es 16, Al utilizar un diseo factorial para determinar qu factores tienen un efecto significa-
ya que se hicieron dos mediciones, una rplica de la otra, por cada combinacin de los tivo sobre la respuesta se observa que, para factores que son variables continuas, el efecto
niveles del factor. Las sumas de cuadrados calculadas se proporcionan a continuacin depende de los niveles alto y bajo utilizados; si stos estn excesivamente cerca uno del
otro, se puede obtener que el efecto del factor correspondiente sea no significativo, a pesar
Factor (es) Suma de cuadrados de que sobre el intervalo posible completo de los niveles del factor, el efecto de ese factor
P 86.49
110 sea despreciable. Por otra parte, si los niveles se alejan bastante pueden caer a ambos
T 18.49
C 94.09 lados de un mximo, y aun as dar lugar a una diferencia en la respuesta que no sea
PT 2.25 significati va.
TC 9.61
PC 15.21
PTC 1.69 7.10 INCAPACIDAD DEL MTODO DE UN FACTOR CADA VEZ PARA
LOGRAR EL PTIMO
Se puede demostrar que cada suma de cuadrados tiene un grado de libertad, y puesto que
el cuadrado medio est dado por:
En la seccin 7.8 se demostr la superioridad de un diseo factorial sobre un experimento
de un factor cada vez en el momento de estimar si un factor ejerca un efecto significativo.
cuadrado medio = suma de cuadrados /nmero de grados de libertad El mtodo de un factor cada vez es tambin poco adecuado para lograr condiciones ptimas
si la respuesta depende de dos o ms factores que interaccionan (vase la Seco 1.6). Esto
cada cuadrado medio es simplemente la correspondiente suma de cuadrados. Para se puede comprobar grficamente cuando la respuesta depende de dos factores que son
contrastar si un efecto es significativo, se compara el cuadrado medio con el cuadrado variables continuas. En este caso, la relacin entre la respuesta y los niveles de los dos
.r
;
al
::1
Q.
...o
-
CII
al
oc (J y
~ o
~
"tl
~
>
Z Y1

Figura 7.4 Una superficie de respuesta para dos factores.

Nivel del factor X


factores se puede representar por una superficie tridimensional como se muestra en la
figura 7.4. Esta superficie se Ilama superficie de respuesta. Se comprende mejor su utili- Figura 7.S Diagrama de las curvas de nivel para una superficie de respuesta con dos factores.
dad considerando un diagrama de curvas de nivel (vase la Fig. 7.5), en el que la respuesta
sobre cada curva de nivel es constante. La forma de las curvas de nivel es, desde luego,
desconocida por el investigador, quien desea determinar los niveles ptimos, X o y Yo para
los factores X y Y, respectivamente. Adoptando el enfoque de un factor cada vez con el nivel
inicial de X fijo en xi, por ejemplo, y variando el nivel de y, resultara una respuesta mxima
en el punto A, cuando el nivel de Y fuese YI. A continuacin, manteniendo el nivel de Yen
YI, y variando el nivel de X resultara un mximo en B. Obviamente, ste no es el mximo
real y la posicin alcanzada depende del nivel inicial elegido para XI. El proceso se podra
repetir variando los niveles de X y Y altemativamente, pero ste es un mtodo no eficiente
de aproximacin a (x o, Yo). Adems, en algunos casos no conducira al mximo real, como (i) (ii)
se pone de manifiesto en la figura 7.6 donde, aunque C no es el mximo real, el valor de
respuesta disminuye hacia cada lado de las direcciones X y Y. Con el mtodo de un factor
cada vez, al llegar a este punto se concluira, por tanto, que representaba la respuesta
mxima. Razonamientos similares se aplican en la' optimizacin de ms de dos factores,
aunque no se pueda visualizar fcilmente la superficie de respuesta en estos casos. Por esta
razn, el anlisis de los mtodos de optimizacin se centrar en gran parte en el caso de
dos factores, aunque los mtodos se puedan generalizar a cualquier nmero de factores.

7.11 MTODO DE LA MXIMA PENDIENTE O DEL GRADIENTE

El proceso de optimizacin se puede visualizar como un hombre en una colina con niebla
espesa y que pretende Ilegar a la cima. En estas circunstancias una aproximacin obvia es
caminar en la direccin en que la colina tenga mayor pendiente. sta es la base del mtodo
del gradiente. La figura 7.7 muestra dos mapas posibles de curvas de nivel. Un simple Diagrama de curvas de nivel: un caso en el que el mtodo de un factor cada vez no
Figura 7.6
razonamiento demuestra que la direccin de mxima pendiente en cualquier punto r;e sirve para localizar el mximo.
(i)
(ii)

>-
Cll
'tl
-a; 2 ,,7f
>
Z )I;-----~""
tan e = 4/5

l
4 3

Figura 7.7 Diagramas de las curvas de nivel: la flecha en cada diagrama indica el camino de la
mxima pendiente. En (i) se dirige aproximadamente al mximo pero en (ii) no. Nivel de X

Figura 7.8 Un diseo factorial 2 x 2 para determinar la mxima pendiente, que est indicada por
encuentra en ngulo recto a las curvas de nivel en dicho punto, como se indica con las la lnea de trazo discontinuo.
flechas. Cuando las curvas de nivel son crculos, las flechas apuntarn a la cima, pero
cuando sean elipses puede no cumplirse lo anterior. La forma de las curvas de nivel depende
Los efectos de X y de Y indican que en la figura 7.8 se buscara la mxima respuesta a la
de las escalas elegidas para los ejes: se obtienen los mejores resultados con este mtodo si
derecha y por encima de la regin original. Ya que la variacin en la direccin de X
se toma una escala de los ejes de manera que un cambio de una unidad en cualquier
es mayor que en la direccin de Y, el incrementro a dar en la direccin de la X tendra que
direccin d un cambio aproximadamente igual en la respuesta. El primer paso es realizar
ser mayor. Para ser ms exactos, los incrementos en las direcciones de X y Y tendran
un experimento factorial con cada factor a dos niveles. Los niveles se eligen de tal manera
que estar en razn de 5 a 4 respectivamente, es decir, en la direccin indicada por la lnea
que el diseo forme un cuadrado como el que se muestra en la figura 7.8. Suponga, por
de trazo discontinuo de la figura 7.9.
ejemplo, que el experimento es una reaccin (catalizada por enzimas) en la que la tasa de
El paso siguiente en la optimizacin es realizar otros experimentos en la direccin
reaccin, en este caso es la respuesta, se quiere maximizar respecto del pH (factor X) y la
indicada por la lnea discontinua en la figura 7.9, digamos que en los puntos cuya
temperatura (factor Y). La tabla siguiente proporciona los resultados (tasa de reaccin
medida en unidades arbitrarias) del experimento factorial inicial. numeracin es 5, 6 y 7. Esto indicara que el punto 6 es una posicin aproximada para el
mximo en esta direccin. Entonces se lleva a cabo otro experimento factorial en la regin
pH (X) del punto 6 para determinar la nueva direccin de la mxima pendiente.
~ Este mtodo proporciona una forma satisfactoria de progresar en direccin al mximo,
68 7.0 con tal que sobre la regin del diseo factorial, las curvas de nivel sean aproximadamente
20 30 35 rectas. Esto es equivalente a que la superficie de respuesta sea plana, lo que se puede
Temperatura ('C)
25 34 39 describir matemticamente por una combinacin lineal de trminos en x y y. Al estar ms
cerca de la cumbre son tambin necesarios trminos en xy, x 2y y2. El trmino xy representa
Los efectos de los dos factores se pueden separar segn se describi en la seccin 7.9. la interaccin entre X y Y y se puede estimar utilizando la replicacin como se describi
Escribiendo de nuevo la tabla anterior, con la notacin de esa seccin, resulta: en la seccin 7.9. Los trminos cuadrados, que representan la curvatura de la superficie,
se pueden estimar comparando la respuesta en el centro del diseo factorial con el promedio
Combinacinde niveles Tasa de reaccin
1
de las respuestas en las esquinas. Cuando los efectos de curvatura e interaccin se hacen
30
x ms apreciables en comparacin con el error experimental (que se estima mediante
35
y 34 replicacin) se emplea un diseo factorial ms elaborado que permite determinar la forma
xy 39 de la superficie curva y, por lo tanto, la posicin aproximada del mximo. .
Es evidente que el diseo factorial y el mtodo del gradiente sern muy comphcados
Efecto promedio del cambio en el nivel de X = [(35 - 30) + (39 - 34)]/2 = 5 cuando existan varios factores implicados. La siguiente seccin describe un mtodo de
Efecto promedio del cambio en el nivel de Y = [(34 - 30) + (39 - 35)]/2 = 4
optimizacin que es conceptualmente mucho ms simple.
ro

-"-
::J
ro
"-
di
a.
E
~

6.6 6.8 7.0 7.2 7.4 7.6 7.8 8.0


pH
Figura 7.9 Diapama de curvas de nivel: la direccin inicial de la mxima pendiente es la corres-
Nivel de X
pendiente a la linea de trazo discontinuo. En los puntos 5, 6 Y7 se realizan nuevos experimentos.

Figura 7.10 Optimizacin por el mtodo simplex.


7.12 OPTIMIZACIN POR EL l\ITOnO SIMPLEX
rapidez hacia el mximo; cerca de! mximo se contrae para permitir que el mximo se
La optimizacin simplex se aplica cuando todos los factores son variables continuas. (Se
pueda hallar con exactitud y evitar la situacin mostrada en la figura 7.10.
a~I:Ierte al lector que la eleccin del nombre es poco afortunada ya que el mtodo es
La posicin del nuevo vrtice de un simplex se puede encontrar por clculo en lugar
diferente del mtodo simplex que se utiliza en programacin lineal.) Un simplex es una
de dibujar -esto es esencial cuando hay ms de dos factores. Los clculos se establecen
figura geomtrica que tie~e n + I vrtices cuando se trata de optimizar una respuesta
con ms facilidad como se muestra en la tabla 7.8. En este ejemplo hay 5 factores y, por
respecto a n factores. Por ejemplo, para dos factores, el simplex ser un tringulo. El mtodo
tanto, el simplex tiene 6 vrtices. La respuesta para el vrtice 4 es la ms pequea y en
de optimizacin se ilustra mediante la figura 7.10. El simplex inicial est definido por los
consecuencia se tiene que sustituir este vrtice. Las coordenadas del centro de gravedad
puntos con numeracin 1, 2 Y 3. En el primer experimento se mide la respuesta en cada
de los vrtices que se conservan se calculan de la siguiente forma: (i) sumando las
una de las combinaciones de los niveles del factor dadas por los vrtices del simplex. En
coordenadas de los vrtices que se conservan y (ii) dividiendo por el nmero de factores,
este caso, la peor respuesta se encontrara en el punto 3 y sera lgico concluir que se
/l. El desplazamiento del nuevo punto desde el centro del gravedad est dado por (vi)
~btendr~ una respuesta mejor en el punto simtrico del 3 respecto a la lnea que une 1 y
~ (ii) _ (iii), Y las coordenadas del nuevo vrtice, vrtice 7, por (v) ~ (ii) + (iv). Si se vara
"-, es decir, en 4, Con los puntos 1,2 Y 4 se forma un nuevo simplex y se mide la respuesta
el simplex en tamao, entonces los valores en la fila (iv) se multiplican por un factor de
para la combinacin de los niveles del factor dada por 4. Si ahora se comparan las respuestas
alcan.zadas en los puntos 1, 2 Y4 se observar que 1 da la peor respuesta. El procedimiento escala adecuado.
Una cuestin obvia al utilizar e! mtodo del simplex es la eleccin del simplex
antenor, b~s~do en la reflexin sobre una recta, se repite de nuevo, con lo cual el simplex
inicial. Si ste se considera como una figura regular en 1/ dimensiones, entonces las
resulta definido por los puntos 2, 4 Y 5. La figura 7.10 muestra la continuacin de este
posiciones de los vrtices para generar tal figura dependern de las escalas usadas en los
proceso. Se puede ver que no es posible progresar ms all del paso dado, ya que los puntos
ejes. Como en el mtodo de la mxima pendiente o del gradiente, estas escalas se deberan
6 y 8 dan peor respuesta que 5 y 7.
elegir de manera que el cambio de unidad en cada factor d aproximadamente el mismo
. . Par~ mejora~ l.a ejecucin del mtodo simplex se han propuesto (y se siguen proponien-
cambio en la respuesta. Si hay insuficiente informacin para lograr esto, la diferencia entre
do) vanas modificaciones, El avance hacia el mximo se puede acelerar utilizando un
los valores mayor y menor factibles de cada factor se puede representar por la misma
sirnplex que puede variar en tamao segn como se compare la respuesta en el nuevo vrtice
distancia. La eleccin del tamao del simplex inicial se analiza en un artculo ele Yarbro y
en un simplex con los otros vrtices. Inicialmente, el simplex es grande para avanzar con
~
Tabla 7.8 Optimizacin por el mtodo simplex

Factores

A B e D E Respuesta
Vrtice 1 1.0 3.0 2.0 6.0 5.0 7
Vrtice :2 6.0 4.3 9.5 6.9 6.0 8
Vrtice 3 2.5 11.5 9.5 6.9 6.0 10 >-
Cll
'O

@
Vrtice 4 (rechazado) 2.5 4.3 3.5 6.9 6.0 6
Qj
Vrtice 5 2.5 4.3 9.5 9.7 6.0 11 >
2.5 4.3 9.5 6.9 9.6 9
Z
Vrtice 6
(i) Suma (vrtice 4 excluido) 14.50 27.40 40.00 36.40 32.60
(ii) Suma /11 (vrtice 4 excluido)
(iii) Vrtice rechazado (es decir, 4)
(iv) Desplazamientos = (ii) - (iii)
(v) Vrtice 7 = (ii) + (iv)
2.90
2.50
0.40
3.30
5.48
4.30
1.18
6.66
8.00
3.50
4.50
12.50
7.28
6.90
0.38
7.66
6.52
6.00
0.52
7.04
@
Derning (vase la bibliografa), que demuestran que el tamao del simplex inicial no es
tan crtico si se puede expandir o contraer segn se procede con el mtodo. Yarbro y
Deming citan un algoritmo que se puede utilizar para calcular las posiciones iniciales de
los vrtices; un vrtice normalmente se coloca en los niveles de los factores aceptados Nivel de X
actualmente.
Figura 7.11 Diagrama de lneas mostrando dos mximos localizados.
Se puede ver que, al contrario de un diseo factorial, el nmero de experimentos
exigidos en el mtodo simplex no crece rpidamente con el nmero de factores. Por esta
razn todos los factores que se piense que pueden tener relacin con la respuesta deberan
ser incluidos en la optimizacin, Ya que al hacerlo as no se incrementar el nmero de 7.13 RECONOCIMIENTO DE PAUTAS
experimentos necesarior para definir el ptimo.
Una vez que se ha encontrado un ptimo, el efecto sobre la respuesta cuando se vara El avance en la automatizacin ha hecho posible la recoleccin rpida de grandes cantida-
un factor mientras los otros se mantienen a sus niveles ptimos, se puede analizar cada vez des de datos, y el desarrollo de los microcomputadores ha hecho posible procesar e~t~s
para cada factor. Este procedimiento se puede utilizar para verificar la optimizacin. datos con mayor perfeccionamiento. El trmino quimiometra se ~Ia acua~~ para.d~scn~~r
Tambin indica la importancia de las desviaciones del nivel ptimo para cada factor; cuanto los mtodos estadsticos y matemticos diseados para extraer informacin qumnca til
ms acusado es el pico de respuesta en la regin del ptimo, ms crtica es la variacin en a partir de los datos qumicos. La optimizacin es un campo cubierto por el paraguas de la
el nivel del factor. quimiometra; otro es el campo del reconocimiento de pautas, que ahora pasamos a des-
La optimizacin por simplex se ha utilizado con xito en muchas reas de qumica cribir. .
analtica, por ejemplo, espectrometna de absorcin atmica, cromatografa de gases, Una consecuencia de la automatizacin es que se pueden determinar muchos parame-
mtodos de anlisis calorimtricos, espectrometra de plasma y analizadores centrifugas tros simultneamente para la misma muestra, por ejemplo, en qumica clnica, cromato-
en qumica clnica. Cuando un instrumento se conecta con microcomputador, se pueden grafa y anlisis de emisin atmica. En qumica analtica se utili~an dichos c~atos en las
utilizar los resultados de la optimizacin del simplex para iniciar mejoras en la variables pruebas de significacin, por ejemplo, determinar si un derramamlent~ de aceite procede
instrumentales. de una fuente concreta, utilizando las intensidades y/o las frecuencias de los muchos
Para superficies de respuesta con ms de un pico, como la expuesta en la figura 7.11., mximos obtenidos en el espectro de fluorescencia o infrarrojo de dichas muestras. Otro
los dos tipos de optimizacin descritos pueden encontrar un ptimo local tal como A en uso es la clasificacin, por ejemplo, dividir las fases estacionarias utilizadas en c~omato
lugar del ptimo verdadero B. Una forma de verificar este punto es empezar en una regin grafa gas-lquido dentro de grupos con propiedades similare~, ~ltiliza~ldo las propiedades
diferente y ver si se obtienen las mismas condiciones de ptimo. Los mtodos de optimi- de retencin de una variedad de solutos con propiedades qumucas diferentes. En ambos
zacin proporcionan informacin slo sobre algunas partes de la superficie de respuesta, casos los mtodos ele reconocimiento de pautas utilizan los elatos disponibles simultl~ea
ya que su objeto es maximizar la respuesta con el mnimo esfuerzo. Si se requiere un cuadro mente en lugar de secuencialmente. El conjunto de meelidas que se utiliza para caractenzar
completo de la superficie de respuesta, son necesarios experimentos ms elaborados que la muestra se denomina pauta. Cuando slo se mielen dos parmetros para cada muestra, la
cubran todo el intervalo de las variables. pauta se puede representar grficamente por un punto, como se muestra en la figura 7.12,
constituyen ms a la variacin entre los vectores de pautas. Las variables restantes, que
llevan poca informacin extra, se pueden rechazar. De hecho, si se utilizan demasiadas
variables, puede resultar una separacin en clases aleatoria y sin sentido qumico, o el
>- "ruido" de los parmetros superfluos puede oscurecer la existencia de clases.
o ( xi' Yi)
=
E
Yi
GI
-------------- Esencialmente hay dos procedimientos diferentes para el reconocimiento de pautas,
dependiendo si se utiliza para pruebas de significacin o clasificacin. En el primer caso
'Cll
~
se conocen las clases en que puede caer una muestra, y el objetivo es clasificar una muestra
Cll
a, de clase desconocida por su pauta. En el caso del ejemplo de derramamiento de aceite, una
r. muestra puede proceder de una de entre varias fuentes diferentes: cada fuente forma
_L
una clase y el propsito del reconocimiento de pautas es identificar la clase y, por lo tanto,
la fuente de la muestra. En el segundo caso se trata de ver si las pautas obtenidas caen en
grupos naturales; aqu no se espera ningn conocimiento a priori de las clases. Estas dos
aproximaciones diferentes al reconocimiento de pautas se denominan, a veces, aprendi-
zaje supervisado y no supervisado, respectivamente. Utilizan mtodos diferentes y ahora
pasamos a describirlas.
XL

Parmetro X 7.14 MTODOS DE APRENDIZAJE SUPERVISADOS

Figura 7,12 Una pauta representada en el espaciode pautas; Xi y Yi son los valoresde los par- La situacin ms simple es aquella en la que una muestra puede pertenecer a una de dos
metrosX y Y; Ti es el vectorde pautas. clases: se conoce como clasificacin binaria. Para el caso'de dos parmetros se encuentra
reflejada en la figura 7.14. Para encontrar un criterio o clasificador para separar las dos
clases, se utiliza un conjunto de datos de pautas para muestras en las que se conoce la clase
donde las coordenadas del punto son los valores tomados por los dos parmetros. El
de la que son miembros. Este conjunto de datos se divide (utilizando nmeros aleatorios)
punto se puede definir tambin por un vector, dibujado desde el origen y conocido como
en dos partes llamadas el conjunto de orientacin y el conjunto de prediccin. El
un vector de datos o de pautas; el sistema coordenado se conoce como espacio de pautas.
conjunto de orientacin se utiliza para encontrar la posicin de un plano, el plano de
La base de todos los mtodos de reconocimiento de pautas es que los vectores de pautas
decisin, que separa las dos clases. Una manera simple de hacerlo es utilizar el plano de
para muestras similares se sitan con mucha proximidad en el espacio de pautas, formando
simetra entre los centros de gravedad de las dos clases. Esto significa que se asigna
conglomerados. En dos dimensiones este conglomerado se puede detectar con facilidad
un vector de pautas desconocido a la clase que tenga su centro de gravedad ms prximo
por el ojo humano. Sin embargo, cuando se miden ms de dos parmetros, ya no es posible
al vector. La distancia d entre dos puntos en un espacio 11 dimensional con coordenadas (x
la representacin grfica: si se miden 11 parmetros, cada muestra se representar por un
X2, ... , XII) Y (YI, Y2, ... , YII) se calcula habitualmente como la distancia eucldea, dada por la
punto en un espacio 11 dimensional y se necesitan mtodos matemticos para detectar
expresin:
conglomerados. Uno de dichos mtodos, conocido como anlisis de componentes prin-
cipales, permite proyectar los vectores de pautas sobre un plano, de tal forma que se pierda n
tan poca informacin como sea posible. La figura 7.13 ilustra el principio del mtodo en d2 (X,- yy
,~l
la situacin en que hay slo dos parmetros. El diagrama muestra dos grupos bien definidos
de vectores de pautas y dos lneas posibles sobre las que se podran proyectar los puntos,
Este mtodo es satisfactorio si las clases forman conglomerados compactos pero, si no es
reducindose de este modo el nmero de dimensiones de 2 a l. La proyeccin sobre la lnea
as, se puede obtener una separacin ms efectiva utilizando mtodos ms perfecci~n~dos.
A mantendra tanta diferencia como fuese posible entre los dos grupos, mientras la
Uno de estos es el mtodo de la mquina de aprendizaje. Se trata de un procedimiento
proyeccin sobre la lnea B oscurecera la diferencia. En este caso, se debera hacer
iterativo que utiliza retroalimentacin (jeed-back) negativa. Tomando en primer lugar
una proyeccin sobre la lnea A. Las lneas A y B representan combinaciones lineales de
como plano de decisin el plano de simetra entre los dos centros de gravedad, se prueban
las variables originales. De manera similar, el anlisis de componentes principales permite
una a una las pautas del conjunto de orientacin. Si se obtiene una clasificacin incorrecta
hacer una proyeccin de n a 2 dimensiones, de tal forma que se conserva tanto corno sea
se ajusta el plano de decisin para rectificar esto. El mtodo de la mquina de aprendizaje se
posible la diferencia entre los vectores de pautas. De nuevo, los ejes del plano sobre los
denomina as debido a que "aprende" de los errores en la clasificacin del reajuste
que se realiza la proyeccin representan combinaciones lineales de las variables originales.
requerido en la posicin del plano de decisin. Si suponernos que se puede separar dos
En muchos casos, slo algunas de las variables originales figuran significativamente en
clases por un plano, este procedimiento conduce, eventualmente, a la posicin de dicho
estas combinaciones lineales, y de este modo se pueden identificar las variables que
plano. Si las clases no son separables por un plano, entonces es preferible el mtodo de
Plano de decisin

.
A //
/ O

.
~
/
Clase 2 O Clase 1
>-
< /
.,III
j'
e"
//
/
/

-
E
...
o
Ql
O O
O O

...

/ 'ClI
(D O
.... /
/ ClI
o..


o / O O
/ O
/
o //
/ O
O
,
';;j ,

/ O
/
/
/
/ o
o

(i) /
-,
, -, Parmetro X
Variable 2
"-, -,
Figura 7.14 Dos clases separadas por un plano de decisin.
"
mnimos cuadrados. Este mtodo minimiza una suma de cuadrados que estima los errores
en la clasificacin. Determinar la posicin del plano de decisin se puede tambin tratar

.
A como un problema de optimizacin, resoluble por el mtodo de simplex: el plano de
, decisin se puede definir por un vector ortogonal a l y las componentes de este vector son
~
.,~
j'
e"
(D
/. /
los factores que se variarn de nivel. La respuesta que se maximiza es la proporcin de
pautas del conjunto de orientacin que se encuentran clasificadas correctamente.
Cuando la posicin del plano de decisin se ha fijado, la efectividad del plano de
.... /
/ decisin para separar las dos clases se puede probar utilizando el resto del conjunto
/ de datos, es decir, el conjunto de prediccin: cada muestra se clasifica por su pauta, y el
, /
porcentaje clasificado correctamente proporciona una estimacin objetiva de la eficiencia

(ii)
",
" B

/
,,
,
0/
0)3 del clasificador.
En la prctica, antes de aplicar el procedimiento de reconocimiento de pautas, se
deberan escalar las variables (que pueden venir medidas en valores numricos diferentes),
de modo que no dominen las variables con los valores ms grandes. Se puede hacer tambin
un intento preliminar para ponderar las variables para optimizar la clasificacin. Despus
de contrastar el clasificador, se pueden revisar de nuevo estos factores de ponderacin.
Variable 2 Cuando hay ms de dos clases que se van a separar, se pueele utilizar una serie ele
clasificaelores binarios. Un mtodo alternativo, que es conceptualmente muy simple, es el
mtodo del K entorno ms prximo (KNN, Kincarest neighbour; en ingls). Este mtoelo
tambin tiene la ventaja ele que se pueele utilizar cuando no se pueelen separar las clases
por un plano, como se ilustra en la figura 7.15. En la forma ms simple eleseparacin, cada
Figura 7.13 muestra se clasifica en la misma clase que el entorno ms prximo. Alternativamente se
Proyec~in de ?untos desde dos dimensiones a una dimensin; (i) muestra de pun-
tos originales; (11) muestra sus proyecciones sobre dos ejes diferentes, puede tomar los K entornos ms prximos (donde K es un entero pequeo) y decidir por
( i) (ii)
4
0

> o 0 5

-....o
OJ
.....E
oo
a s s 2
~

~
1
O O
a.
O O

O
oC cis.. 1
(iii) (iv)
O
4

~5
O O

3 5

1
Parmetro X

Figura 7.15 Dos clases que no se puede separar por un plano, Figura 7.16 Etapas en el conglomerado de pautas: O representa un punto original, representa
el nico punto que se sustituyea un par de puntos.

un esquel~a de v~tacin los miembros de la clase. Se toma normalmente un valor impar puntos que estn ms prximos y los sustituye por un nuevo punto en la mitad de ambos.
para K a fin de evitar empates. En una versin ms compleja se puede dar diferentes pesos Este procedimiento se repite y si se contina indefinidamente agrupar todos los puntos
a los entornos, dependiendo de su distancia relativa. Con este mtodo no es necesario hacer juntos como se muestra, por pasos, en la figura 7.16. En estos diagramas se unen por una
ninguna divisin del conjunto de datos en conjuntos de prediccin y orientacin; se pueden lnea los pares de puntos que han sido emparejados juntos y se sustituyen por un nico
utilizar todos los datos para estimar la eficiencia del mtodo. punto. As, en cada etapa, se unen los grupos de puntos que estn clasificados juntos. Las
Las aproximaciones al reconocimiento de pautas descritas hasta ahora han considerado etapas sucesivas del agrupamiento se puede mostrar en un dendrograma como el de la
slo la distancia entre puntos y no su orientacin relativa en el espacio. Dichos mtodos figura 7.17. El eje vertical muestra la semejanza, sij, entre los dos puntos i y i. se calcula
son no paramtricos, es decir, ningn modelo se propone para la distribucin en el espacio segn la expresin siguiente:
~e pa:ltas de l.as muestras de~tro d~ una clase. Por el contrario, el programa de computador
SIMCA (debido a Wold), disponible comercialmente, utiliza el conjunto de datos para Sij = J -d;ldmx
formar un I.nodelo matemtico de cada clase. Entonces es posible calcular para cada clase
la probabIlIdad de que una muestra desconocida pertenezca a esa clase. donde dij es la diferencia entre los puntos i y j y d mx es la distancia mxima entre cualquier
Al~unos de los campos en que se han aplicado los mtodos de reconocimiento de pautas par de puntos. Obviamente, la semejanza toma valores de O (para puntos coincidentes) a l
supervIsadas, son: pruebas de diagnstico en qumica analtica ciencia forense la identi- (para los dos puntos ms alejados). La etapa en la que se detiene el agrupamiento, y que
ficacin de fuentes de polucin, qumica de alimentos y la ~rediccin de la 'estructura determina el nmero de grupos en la clasificacin final, se debera decidir por un criterio
molecular a partir de los espectros. qumico. Una aproximacin opuesta trata todas las pautas inicialmente como un grupo, y
despus las subdivide.
Como se mencion anteriormente, los mtodos de aprendizaje no supervisado han sido
7.15 MTODOS DE APRENDIZAJE NO SUPERVISADOS utilizados para clasificar la gran cantidad de fases que se presentan en cromatografa
gas-lquido. Se puede entonces seleccionar un pequeo conjunto referido de fases con
El lector re~~rdar que stos son los mtodos que se utilizan para decir si un conjunto de caractersticas diferentes tomando una fase de cada clase. Otra aplicacin es la clasificacin
pautas se divide naturalmente en grupos. Existe un gran nmero de mtodos de bsqueda de los antibiticos por su accin frente a los diferentes tipos de bacterias, para clasificar la
de conglomerados en el espacio de pautas. Una aproximacin agrupa, juntos, el par de relacin entre actividad biolgica y estructura molecular.
Massart , D. L., Dijkstra, A, y Kaufman, L., Evalnatiou and Optmurntioa of Laboratory Methods
and Analytical Proccdures. Arnstcrdam, Elscvicr, 1978. Una valiosa fuente de informacin de los
temas de este capitulo. Incluye muchos ejemplos extra idos de la bibliografa y proporciona un gran
S, nmero de referencias adicionales.
I J
Varmuza, K., Palien Recognition in Chemistry. Berlm, Springer- Verlag, 1980. Proporciona un
1 2 tratamiento detallado de los mtodos y aplicaciones del reconocimiento de pautas.
3 4 5
1.01- Yarbro, L. A., Y Deming, S. N., Anal. Chim. Acta, 1974, 73, 391. Discute la eleccin del simplex
inicial.
Betteridge, D., Wade, A. P. Y Howard, A. O., Talanla, 1985,32,709,723. Buena fuente de referencias
de los mtodos sirnplex, compara varias aproximaciones.

EJERCICIOS

0.5 l. En un experimento de colaboracin entre laboratorios de la determinacin de arsnico en carbn,


se enviaron muestras de carbn de tres regiones diferentes a tres laboratorios. Cada laboratorio
realiz un anlisis por duplicado de cada muestra con los resultados que se muestran a
continuacin (medidos en flg/g).

Laboratorio
Muestra I 2 3
A 5.1,5.1 5.3,5.4 5.3,5.1
B 5.8,5.4 5.4,5.9 5.2,5.5
C 6.5,6.1 6.6,6.7 6.5,6.4
Figura 7.17 Un dendrograma para los puntos de la figura 7.16.
Compruebe que no existe interaccin significativa laboratorio-muestra y pruebe las diferencias
significativas entre laboratorios.

Queda claro que el reconocimiento de pautas se puede utilizar para establecer relacio- 2. Si la respuesta en el vrtice 7 en el ejemplo de la optimizacin simplex (pg. 170) es 12, qu
nes ql~e de otra. forma podran quedar ocultas en una masa de datos. Es un mtodo que se vrtice se rechazar al formar un nuevo sirnplex y cules son las coordenadas del nuevo vrtice?
ha aplicado recientemente en qumica analtica: su potencial como un medio de anlisis de
3. Se prepararon cuatro soluciones estndar, cada una conteniendo un 16% de cloruro calculado
datos no se ha evaluaelo por completo. Existen varios paquetes disponibles de programas por pesada. Para analizar cada disolucin estndar se emplearon tres mtodos de titulacin, cada
elecomputador aparte elel SIMCA. Uno ele ellos es ARTHUR (desarrollado por Kowalski) uno con una forma diferente de determinar el punto final. El orden de los experimentos fue
que contiene programas para muchos mtodos, incluidos los descritos aqu. aleatorio, Los resultados del cloruro (%w/w) se muestran a continuacin:

Mtodo
Solucin A B C
BIBLIOGRAFA 1 16.03 16.13 16.09
2 16.05 16.13 16.15
Box, O. E. P, Hunter, W. O., y Hunter, 1. S., Statisticsfor Experimentalists Nueva York Wiley 1978 3 16.02 15.94 16.12
amiento d eta IIa d o de los diseos factorial completo y fraccional
Prop ~rcIOna un t.ra tarni " ,
y del mtodo de. 4 16.12 15.97 16.10
la maxuna pendiente,
Pruebe si existen diferencias significativas entre (a) la concentracin de cloruro en las diferentes
soluciones y (b) los resultados obtenidos por los diferentes mtodos.
Cooper, B. E., Statistics for Experimentalisis, Oxord, Pergarnon Press 1975. Proporcion d t II
adIcIOnales de ANOVA. ' a e a es
4. Para conocer el contenido en nitrovina, se analizaron cuatro muestras diferentes de alimentos
;ox: D. R, Planning of EXJcrilllc11ls, Nueva York, Wiley, 1958. Un tratamiento no matemtico hervidos por dos mtodos diferentes, cada uno por duplicado. Los resultados se muestran en la
cstinado al trabajador experimental. Proporciona detalles adicionales de los cuadrados Latinos. tabla siguiente (concentracin en mg/kg). Pruebe si los resultados obtenidos por los mtodos
difieren significativamente.
Davis, J. c., Statistics and .Data Analysis in Gcology, Nueva York, Wiley, 1973. Informa con
sufiCiente claridad del ana liSIS de componentes principales. Alimentos Mtodo HPLC Mtodo Espectrofotomtrico
1 9.3, 10.0 9.0, 10.2
Kowalski, B. R (Ed.), Chemometrics: Theory and Application Washington American Chemic I 2 9.3, 12.3 9.0, 11.8
Soclety, 1977, Contiene articulos sobre SIMCA y ARTHUR' , a
3 12.8,12.7 12.9,12.0
Kryger, L., Talanta, 1981,28,871. Un compendio de las aplicaciones de los mtodos del recono- 4 11.9,11.8 11.6,12.1
cunienro de pau tas
as aa laa oui . 1uyendo muchas referencias de trabajos originales.
quuruca, lile (Adaptado de Gliddon, M 1., Cordon, C. y Parnham, O. M., Analyst, 1983, 108, 116.)
5. La temperatura efectiva del vapor de estao, calculada de la razn de absorbancias de dos lneas
espec~rales, fue comparada con respecto a la temperatura real bajo diferentes condiciones
expenmentales en un tubo de cuarzo calentado. Los resultados se muestran en la tabla siguiente
(valores en C). Calcule el efecto principal y de interaccin.

Temperatura efectiva

Tiempo de purga (s)


Gas de purga Ar
~
~
--
Gas de purga Ar + 1% O2

20 60 20 60
Temperatura real (C) 900 843 826 852 855
{ 1000 908 873 908 908
(Adaptado de Welz, B. y Melcher, M., Analyst, 1983,108,213.)

6. De las soluciones guardadas en matraces de polipropileno el mercurio se pierde por ca bi ..


Soluciones a los ejercicios
con el estao ad bid S idi . l b b m macion
. sor I o. e.nu lO a a sor ancia de una solucin acuosa estndar de mercurio,
que se habla guardado en dichos matraces, en dos niveles de los factores siguientes.

Factor Bajo Alto


A- agitacin de! matraz Ausente Presente
C- limpieza del matraz Una vez Dos veces CAPTULO 1
1'- tiempo de 'pennanencia 1 hora 18 horas

Se obtuvieron losresultados siguientes: calcule el efecto principal y de interaccin.


1. El laboratorio A ha conseguido un resultado medio de 41.9 gil, (muy cercano al valor
correcto) y una pequea variabilidad en los resultados -todos los valores caen entre
Combinacin de los niveles de factores Absorbancia 41.1 y 42.5 gil. Estos resultados son exactos y precisos: los errores sistemticos y
1 0.009 aleatorios son pequeos. El laboratorio B ha conseguido el mismo valor medio, pero
a 0.084 la variabilidad de los resultados es mucho mayor (intervalo 39.8-43.9 gil), de manera
e 0.097 que, aunque no existen aparentemente errores sistemticos (es decir, el resultado
0.076 medio es exacto), existen grandes errores aleatorios (es decir, los datos son muy
ac 0.082
la imprecisos). Consideraciones similares muestran que el laboratorio C ha obtenido
0.049
te 0.080 resultados precisos pero inexactos (media 43.2 gil), Yque los resultados del laboratorio
ate 0.051 D son imprecisos e inexactos. El laboratorio E ha obtenido una serie de resultados que
(Adaptado de Kuldvere, A., Analyst, 1982, 107, 179.) parecen precisos y exactos, con la excepcin del valor final. En la prctica, se podra
probar que ste es un valor anmalo (vese el Cap. 3): si las pruebas demostrasen que
7. Se invetsti~ el porcentaje de recuperacin de plomo aadido a muestras en presencia de
concen raCIOnes "bai .. "It .. d ,. d
at .
.
. aJ~s . Y a a~ e a,cl o ntrico y lantano por espectrometria de absorcin
se pudiera rechazar, con un razonable nivel de confianza, los resultados restantes seran
C Iml~as tl~ctrote~lc~, a contI.nuaclO~ .se proporcionan las medias de anlisis duplicados. muy similares a los del laboratorio A.
/ IC~ e e e ecto pn~clpal y de m~eracclOn. Si el cuadrado medio residual es 4 (con 4 grados
e 1 erta d ), pruebe SI e! efecto de mteraccin es significativo. 2. La segunda serie de seis resultados obtenida por el laboratorio A tiene el mismo
resultado medio que la primera serie, confirmando que este laboratorio obtiene
Concentracin de lantano (gj 100 mi) resultados con errores sistemticos no significativos. En la segunda serie la variabili-
dad es ms grande (intervalo 40.8-43.3 gil), ilustrando la diferencia entre la precisin
Concentracin de cido nitrico (%v/v) o 0.10 dentro de los das o dentro del lote (repetitividad) y la precisin entre das o entre lotes
0.1 64 90
1.0 77 96 (reproducibilidad).

(Adaptado de Bertenshaw, M. P., Gelsthorpe, D. y Wheatstone, K. c.,Analyst, 1982,107, 163.) 3. Las poblaciones de anticuerpos monoclonales son homogneas, de aqu que el nmero
de posiciones de enlace por molcula deba ser un nmero entero -obviamente dos
en este caso. Los resultados son, en este caso, precisos, pero muestran clara evidencia
de un error sistemtico que produce valores bajos.

4. (i) La concentracin de lactato en sangre humana vara ampliamente de un paciente


sano a otro (ca. 5-20 mg/l00 ml), y tambin vara con menor extensin dentro del
2. Media = 5.163. Desviacin estndar = 0.027. Nmero de grados de libertad = 6; (i)
mismo sujeto de una vez a otra. Si se estudia el "gradodel ltimo tipo de variacin, la
exactitud no ser muy importante pero sern necesarias mediciones precisas -los 5.16 3 0.025; (ii) 5.163 0.038.
errores experimentales deben ser despreciables comparados con las variaciones del
3. Nmero de grados de libertad = 9; los lmites de confianza al 95 % son 20.9 2 0.3 4 gil.
individuo. Si slo se realiza una medicin, para verificar si un sujeto cae o no cae
4. Nmero de grados de libertad = 49; los lmites de confianza al 95 % ~on 10.1 2 O._ls
dentro del "intervalo normal" de lactato en sangre, se requerir menos precisin,
aunque un gran error sistemtico podra conducir a un diagnstico equivocado.
ng/ml. Para reducir la longitud del intervalo de confianza se reqUIere un ta~ano
(ii) El contenido de uranio en minerales se estudia con vistas a una extraccin del
de muestra ms grande y es seguro suponer que t estar cercano a 1.96. El tamano de
el~mento econmicamente viable; por lo tanto no ser necesaria una alta precisin,
la muestra se calcula de 0.1 = 1.96 x O.64/rn, dando n = 157.
jSIl1 embargo, errores sistemticos sustanciales (positivos o negativos) podran condu-
5. Media = 10.45%. Desviacin estndar = 0.105%. Nmero de grado~ de libertad = 5.
cir a decisiones econmicamente desastrosas!
(ii) En este anlisis la velocidad es claramente esencial, y ni la exactitud ni la
Los lmites de confianza a195% son 10.4 5 0.1 1 Los lmites de confianza al 99% son
precisin son inicialmente de gran importancia. A medida que el paciente envenenado
10.4 O.h% . (i) No; (ii) no. Esto sugiere que el mtodo da un error sistemtico.
se re.cupera, el nivel en plasma de la droga puede ser repetidamente controlado para 5

confirmar que est decreciendo: ya que se estudia una tendencia, la precisin es ms s


6. La media y la desviacin estndar son 1.74 y 1.28 gil, respectivamente. Los logaritm 0
importante que la exactitud. 2
decimales de los valores dados son 0.260, 0.521,0.029,0.104, -0.310,0.579, -0.8 4,
(iv) Aqu, de nuevo, el objetivo principal es detectar cambios en el resultado del
0.297. La media de estos valores es 0.082 y su desviacin estndar es 0.462. ~~ero
anlisis; corno estos cambios pueden ser muy pequeos, ser necesaria buena precisin
de grados de libertad = 7. El intervalo de confianza a195% para lo~ valo~es logantmlcos
para detectar cualquier tendencia, mientras que la exactitud ser de menor importancia.
es 0.082 0.386, es decir, de -0.304 a 0.468. Tomando antllogantmos da como
intervalo de confianza de la media 0.50 a 2.94. Observe que este intervalo no es del
5. (i) En este experimento, la fuente ms probable de error es que la muestra tomada no
sea representativa del conjunto mineral, y de este modo se puede dar un valor errneo todo simtrico alrededor de la media.
del c?~tenido de Fe a granel (el muestreo se analiz en el captulo 4). Puede surgir
7. Media = 0.2943. Desviacin estndar = 0.00468. Nmero de grados de libertad = 9.
tambin un error sistemtico si la reduccin de Fe(I1I) a Fe(I1) es incompleta, o si existe
un gran error de indicador. Otros errores sistemticos, aparte del error de muestreo, se Los lmites de confianza al 99% son 0.294 3 0.004 8.
pueden detectar con la ayuda de una muestra de mineral estndar -tales muestras
8. Media = 10.19. Desviacin estndar = 0.19. Nmero de grados de libertad.= 4. Los
estl~ disponibles come~c.ialmente y tienen un valor certificado de Fe. Otro problema,
lmites de confianza al 95% son 10.1 9 0.2 3 , es decir, 9.96 - 10.42. Ya que el ntervalc
no siempre resuelto utilizando la muestra estndar, es la posibilidad de que otros
de confianza incluye 10.00 no existe evidencia de error sistemtico.
elementos en estados de oxidacin bajos sern titulados por el sulfato crico, dando
un resultado falso de hierro por exceso. Los errores aleatorios en anlisis volumtrico
9. Desviacin estndar = 0.14 mg. La pesada del reactivo requerido es 0.5 (4.9) g danddo
se estudian en las secciones preliminares de este captulo.
una DER = 0.028 (0.0029)%. DER para el volumen de disolvente = 0.02%. DER e
. (ii) Aparte de los errores sistemticos vistos en (i), una formacin y/o extraccin
la molaridad de la solucin = 0.034 (0.020) %. Los valores para el reactivo con
incompleta del quelato plantearn, en este caso, los mayores problemas. De nuevo,
tales errores se detectarn con la ayuda de una muestra mineral de contenido de Fe peso-frmula 392 se dan entre parntesis.
conocido. El anlisis calorimtrico utilizar probablemente una serie de patrones de 10. Solubilidad = I( 1.3 x 10 10) = 1.14 x lO-sM. DER del producto de solubilidad
s = 7.7%,
Fey un procedimiento grfico para calcular el resultado y los errores aleatorios: dichos dando DER de la solubilidad = 3.85% y desviacin estndar = 0.04 4 x 10- M.
metodos se analizan posteriormente en el captulo 5.
(iii) Los. error~~ aleato.rios en anlisis gravimtrico deberan ser muy pequeos y
lo~ ~rr?res slstel~atlcos, directamente asociados con el proceso de pesada pueden
mll111TI1ZarSe mediante una tcnica cuidadosa (vese la Seco 104). Las fuentes de errores CAPTULO 3
mas p~o~abl.~s en esta determinacin son qumicas, por ejemplo el problema de 1. Los puntos caen aproximadamente en una lnea recta, indicando que los datos se han
cop~eclpltaclOn de otros iones, y se discuten ampliamente en libros de texto de anlisis extrado de una distribucin normal.
clsico.
2. Q = 0.13/0.23 = 0.565. Valor crtico = 0.570. El resultado no es significativo al nivel
de confianza P = 0.05; no existe evidencia que 2.07 sea un valor anomalo.
CAPTUL02
3. Tomate: media = 772.6, desviacin estndar = 13.6 j.1g/g. Pepino: media = 7087'~'
desviacin estndar = 10.4 j.1g/g. (i) Se requiere un prueba de dos colas. F6.6 = 1. .
l. Media = 0.077 j.1g/g. Desviacin estndar = 0.007 j.1g/g. DER = 9%.
cin conjunta de la varianza que es igual a 0.1685; ( ~ 0.54. Valor crtico ~ 2.78 (P ~
Valor crtico ~ 5.82 (P ~ 0.05). Las varianzas no difieren significativamente. (ii) Ya que
0.05, dos colas). Los resultados medios no difieren significativamente.
las varianzas no difieren significativamente, se calcula una estimacin conjunta de la
desviacin estndar y es 12.1 .;g/g; ( ~ 1.28. Para una prueba de dos colas, el valor
10. En este ejemplo una prueba (por parejas es adecuada cuando se aplican ambos mtod.os
crtico ~ 2.18 (P ~ 0.05), de manera que las medias no difieren significativamente.
a cada muestra: pruebe que las diferencias entre pares elimina el efecto de cualqUIer
variacin entre las muestras. Las diferencias son 0.051, 0.030, -0.030 mg/ml. Estas
4. Fuente de variacin Suma de cuadrados Grados de libertad Cuadrados medios
diferencias tienen una media = 0.017 mg/ml, desviacin estndar = 0.042 mg/ml. Hay
Entre muestras 6365.7116 3 2121.9 2 grados de libertad y t = 0.7. Valor crtico = 4.3 (P = 0.05, dos colas). Los resultados
Dentro de muestras 162.0284 20 8.1
no difieren significativamente.
6527.74 23
11. Hombres: media = 40.0 gIl, desviacin estndar = 2.78 gIl. Mujeres: media = 43.2 5 gIl,
Para probar si el porcentaje de agua recogida a diferentes profundidades difiere
desviacin estndar = 3.06 gIl. En primer lugar debemos probar si las varianzas difie-
significativamente, se compara la variacin entre muestras con la variacin dentro de
ren significativamente: F 7 ,7 = 1.21. El valor crtico es 4.995 (P = 0.05, dos colas), de
muestras: Fl,20 = 262. Valor critico ~ 3.098 (P = 0.05, prueba de una cola). El valor es
manera que las varianzas no difieren significativamente. La estimacin conjunta de la
significativo, indicando que hay diferencia entre las medias muestra les. Las medias
desviacin estndar es 2.92; ( = 2.2. Valor crtico = 2.14 (P = 0.05, dos colas). Las
muestra les son 34.1, 45.4, 72.2, 70.4. La mnima diferencia significativa = 3.43,
calculada t.omando (20 ~ 2.09 (P = 0.05, prueba de dos colas). Todos los pares medias difieren significativamente.
de profundidades, excepto el par ms profundo, difieren significativamente unos de
12. Una prueba t por parejas es adecuada. La media y la desviacin estndar de las
otros.
diferencias son 1.18 y 0.84 respectivamente; ( = 3.4. Valor crtico = 2.57 (P = 0.05,
dos colas). Los resultados difieren significativamente.
5. Use.la prueba chi-cuadr~~a con cada frecuencia esperada ~ 5. X2 = 16.8. Hay 9 grados
de libertad y el valor cnnco es 16.92 (P = 0.05.). No existe evidencia suficiente en la
preferencia de algunos dgitos.
CAPTULO 4
6. l ~ 1.54, 1.60, 1.18, 1.60..Hay 7 grados de libertad y el valor crtico es 2.36 (P = 0.05,
prueba de dos colas). Ninguna de las medias difiere significativamente del valor 1. Esquema 1: cT ~ (4/2) + (lO/S) = 4
certificado. Esquema 2: cT = (4/23) + (10/3) = 4
Si S = costo de muestreo y A = costo del anlisis, entonces:
7. Las medias son 55.875 y 50.25 mg/kg y las desviaciones estndar son 0.8345 y costo del esquema 1: costo del esquema 2 = (SS + 2A) : (3S + 6A).
8.828 mg/kg. Esta razn es mayor que 1 si S:A es mayor que 2: 1.
.(~) ~7.7 = 112. Valor crtico = 3.79 (P ~ 0.05, prueba de una cola). Variabilidad
significativamente ms grande para tiempos de ebullicin ms largos. 2. Los clculos del ANOVA se resumen a continuacin:
. (b) Una estimacin conjunta de la varianza no es adecuada cuando las varianzas
difieren significativamente; t 1.8. El nmero de grados de libertad calculado de la g.1. cuadrado medio
Fuente de variacin Suma de cuadrados
>

e~ua.cin (3.5) es 7. Valor crtico ~ 2.36 (P = 0.05, dos colas). La m~dias no difieren Entre das 332.92 3 111
sigm ficati varnente, 8 3.25
Dentro de das 26.00
358.92 11
Total
8. (a) Frecuencias esperadas ~ 15.25 Y45.75, suponiendo que el nmero de roturas est
en proporcin al nmero de trabajadores en cada grupo, mientras que las frecuencias F ,s = 34, Valor crtico = 4.066 (P = 0.05) demostrando que las concentraciones medias
difieren significativamente. Estimacin de la varianza muestral ~ (111 - 3.25)/3 = 35.9.
3
reales S~I~ 24 y 37; 1 grado de libertad l ~ 5.95 (Se aplica la correccin de Yates).
Valor cntico = 3.84 (P = 0.05). El primer trabajador difiere significativamente de los
otros tres. 3. Los clculos del ANOVA se resumen a continuacin:
(b) Para .Ios ltimo~ tres trabajadores las frecuencias esperadas = 12.33, 12.33,
12.33 (~s decir, 37/3);.X" = 2.81; 2 grados de libertad. Valor critico ~ 5.99 (P = 0.05). g.1. cuadrado medio
Fuente de variacin Suma de cuadrados
Los ltimos tres trabajadores no difieren significativamente unos de otros. 3 0.0008306
Entre muestras 0.0024916667
8 0.000175
Dentro de muestras 0.0014
9. En primer lugar debemos probar si las varianzas difieren significativamente: F ~ 11
122 -no srgrn
. 'f'icanvo
. 2,2 Total 0.0038916667
(P ~ 0.05, dos colas). Entonces se puede calcular una estima-
F 3 , 8 = 4.746. El valor crtico (P ~ 0.05) es 4.066, demostrando que el cuadrado m d'
e~t~e muestras es demasiado grande para ser explicado por variacin en las e 10 De las columnas D y T de la tabla, es fcil calcular que la estimacin de u~ = 0.793, Y
diciones, me- que la estimacin de a2 = 11.027. El valor experimental de F 14 14 es 11.027/0.793 =
El cuadrado medio dentro de muestras 0000175 . '. 13.095: ste es mucho mayor que el valor tabulado (ca. 2.48, obtenido de la tabla A.2
.
Ia varianza di' . 2 ' . , proporcIona una estimacin de
e as mediciones, uo. por interpolacin), mostrando que los errores sistemticos son de hecho significativos.
Esti.macin de la v~rianza muestral, u~ = 0.0008306 - 0.000175)/3 = 0.000219 Se pueden estimar de la ecuacin (4.3), siendo el resultado de u~ = 5.117.
Var~anza de la medl~ para el esquema 1 = 0.000175/4 + 0.000219/6 = 0.00008025
Varianza de la media para el esquema 2 ~ [0.000175/ (2 x 3)] + 0000219/3 .
0.0001022. . = CAPTULO 5
1. La aplicacin de la ecuacin (5.2) a los datos proporciona un coeficiente de correlacin
4. Se realiza una estimacin de a2 de cada muestra, dando: 2.607 0.847 3017 3633 producto-momento, r, de -0.8569. Este valor sugiere una correlacin negativa consi-
~.927. El promedio de estos valores es 3.077. Entonces'la estl'm' '., 'd' , derable entre el nivel de mercurio y la distancia al polargrafo. Su significacin puede
'13.077 = 1.753. acion e u =
ser probada utilizando la ecuacin (5.3), que proporciona un valor de t de 3.33. La
Las lneas de alerta se encuentran en 50 2 1 75 rrr comparacin de este valor con el valor tabulado de t a un nivel de confianza del 95%
. 3/v4 , es decir, en 48.25 y 51. 75
Las lneas de accin se encuentran en 50 3 1 7 rr; y n - 2 (= 4) grados de libertad (t = 2.78) muestra que la relacin es de hecho
. 53/v 4 ,es decir, en 47.37 y 52.63.
significativa a este nivel de confianza. Sin embargo, hay dos advertencias, (1) este
5. Clculos ~imples muestran que las c.oncentraciones medias de Cd en las muestras A mtodo prueba slo una correlacin lineal, mientras que en el laboratorio podramos
B, determmadas por los 15 laboratorios son 701 Y775 . Y esperar que el nivel de mercurio decrecera con el incremento de la distancia al
, . . ppm respectIvamente Cuando
se representa en una carta de dos muestras el punto (7 75 701) dib . ' . polargrafo de forma inversamente proporcional al cuadrado de la misma; (2) COrre-
d '1 1]' I . . ,. , y se I ujan a traves
e e al mea. iorizontal y vertical, los cuatro cuadrantes generados contienen (leyen lacin no es lo mismo que causa. Los clculos muestran que existe una relacin entre la
do en e sentido de las aguja d I loi
s e re OJ a partir. del cuadrante + +) 6 1 7 1 - distancia al polargrafo y la concentracin de mercurio -no prueban que el polar-
~.~te res~ltado es tpico de un ejercicio de colaboracin de este 'tipo, ~ ;ugi~re ~~:t~:~ grafo sea la fuente de la contaminacin de mercurio. La contaminacin podra surgir,
si~~en.~~as grandes entre los 15 laboratorios son debidas fundamentalmente a errores por ejemplo del fregadero o de otra pieza del equipo prxima al polargrafo.
na ICOS. Hay que hacer constar que slo cuatro laboratorios (7 9 12 Y 13)
resulltabdos qu~ estn bastante cercanos a las medias de ambas mu~st~as mien~r:l;eqr:~ 2. En este caso la ecuacin (5.2) muestra que r = 0.99982. Esto es sintomtico de una co-
I os a oratorios 3 y 10 pos
. een para am bas muestras grandes ses ' .. rrelacin lineal, aunque inspeccionando los datos se muestra claramente que una curva
negatIvos, respectivamente. Las distancias en perpendicular desde 10;op:~OSltlVOS .y es en ms adecuada en este caso, Cada valor de y (absorbancia) es ms grande que su
mentales a la lnea de 45 ue a (77 os expen- predecesor, pero con un incremento que decrece lentamente cuando x aumenta. La
lab tori . . q p sa por . 5, 7.01) mide los errores aleatorios de los
ora onos partlClpan.tes, y queda claro que los laboratorios 4 y 14 pueden t curvatura tambin puede demostrarse estudiando los residuos (vese el ejercicio 9).
grandes errores aleatorios en sus resultados. ener En este caso, los errores causados al tratar los datos como en una grfica de calibrcin
Para calcular los componentes de la variacin, se expone la tabla siguiente: lineal seran muy pequeos.

Laboratorio 3. Aplicando las ecuaciones (5.4) y (5.5) resultan unos valores de b = 0.0252, Y a = 0.0021
A B
1 D T respectivamente. Otros resultados importantes incluyen: x = 15; Y = 0.380; Ir; =
8.8 10.0
2
3.8
-1.2 18.8 2275; Y ~(Xi - X)2 = 700. Los residuos individuales (yi - Yi ) de y encontrados son
3 4.7 -0.9 8.5
10.1 12.1 -2.0 +0.0009, -0.0009, -0.0028, +0.0104, -0.0074, -0.0062, +0.0060. Estos residuos
4 22.2
8.0 11.0 -3.0
5 19.0 suman cero (como era de esperar), y la suma de sus cuadrados es 0.000247. Aplicando
5.0 4.7 0.3
6 9.7 la ecuacin (5.6) se obtiene que Sy/x = 0.00703. Entonces la ecuacin (5.7) da Sb =
5.2 6.4 -1.2
7 11.6 0.000266, Y el uso de t (5 grados de libertad; nivel de confianza del 95%) = 2.57
6.7 8.4 -2.0
8 15.4
9.3 9.6 -0.3 proporciona un lmite de confianza para b de 0.0252 0.0007. Similarmente, la
9 18.9
6.9 7.5 -0.6 ecuacin (5.8) proporciona un valor de So = 0.00479, con lmites de confianza para a
10 14.4
3.2 2.8
11 0.4 6.0 de 0.0021 0.0123.
9.7 10.4 -0.7
12 20.1
7.2 8.3 -1.1
13 15.5 4. (a) Es fcil demostrar, usando los valores de a y b calculados en el ejercicio 3, que un
6.5 6.8 -0.3
14 13.3 valor de y de 0.456 corresponde a un valor de x de 18.04 ng/ml, y que (yo _ y)2
9.7 7.2
15 2.5 16.9
5.0 6.0 ~ 0.00578. La aplicacin de la ecuacin (5.9) proporciona entonces un valor de SxO =
-1.0 11.0
0.300, Y los correspondientes lmites de confianza estn dados por 18.04 (2.57 x
0.300) = 18.04 0.77 ng/ml.
(b) En est~ caso, es claramente necesario ver si el valor de absorbancia 0347
es un valor anomalo. ~l valor de Q c~lculado de la ecuacin (3.8) es (0.347 _ 5.87 Y 44.1 ng/m1 respectivamente. Note que estos valores, y los de la pendiente y
0.314)/(0.347 - 0.308) - 0.846. Para un mvel de confianza del 95% el val b . ordenada en el origen, son todos similares a los calculados en la regresin no
es mayor que el valor de Q tabulado de O829 de man 1 ' l a r o tenido ponderada, a pesar de la considerable dispersin de los puntos experimentales. La
rechazarse. De lo~ tres resultados que que'dan 'se obtiel~:au~~ea~s:r~~~c~~3~:~:~e:e diferencia esencial entre el uso de los mtodos de regresin ponderada y no ponderada
0.311, correspondiente a una concentracin de 1228 gJ 1 E e slo es patente cuando la ecuacin (5.16) se utiliza para estimar la desviacin estndar
.d . n m. n este caso el valo d
Sx esta. ado por la ecuacin (5.10) [m =3; (Yo _ y)2 = 0.00476] siendo O ' ~ e de las concentraciones estimadas. Para estimar esta ecuacin, es necesario, en primer
de confianza son, por tanto 1228 + (2 57 x O 195) 1228 .195, los Imites lugar, estimar los valores Wo para los dos valores Yo bajo estudio. La inspeccin de los
, . -. . = . 0.50 ng/ml.
datos sugiere que pesos de 1.8 y 0.18 respectivamente son apropiados para los valores
5. Con los resultados del anterior ejercicio 3 este cl 1 . de yo de 15 y 90. El uso de estos pesos da valores de Sxw de 0.906 y 2.716 respectiva-
deteccin se define como la concentracin c~ o es muy s~nclllo. El lmite de mente. La multiplicacin por el valor de t de 2.78 proporciona lmites de confianza
seal de absorbancia de fondo en tres veces l~~e pr? ~~e una senal que supera a la para las dos concentraciones de 5.9 2.5 y 44.0 7.6 ngJml respectivamente.
viene dada por a (O 0021) Y I d ' " .esv 13ClOn estndar, la seal de fondo
. a esviacion estndar por s (O 00703) L -
absorbancia en el lmite de deteccin es 0.00211 + (3 x O 0~73)' _ . a sen~l ?e 8. Aqu, el mtodo "nuevo" es claramente el ESI, representado, por 10 tanto, en el eje y:
de deteccin, calculado de la pendiente y ord dI: - 0.0232, Y el lfrnite la tcnica gravimtrica es la referencia o procedimiento estndar y se representa en el
es 0.84 ng/ml, ena a en e ongen de la recta de regresin, eje x. La recta de regresin calculada de esta manera tiene una pendiente de 0.963, y
una ordenada en el origen de 4.48, siendo el coeficiente de correlacin de 0.970. Este
6. Los clculos de regresin lineal usuales dan a = 0.2569 Y b = 0005349 L . ltimo valor es sumamente significativo [t = 11.29 - Ec. (5.3)], pero los lmites de
estos dos valores da la concentracin d I ' . a razon de confianza de la pendiente y la ordenada en el origen deben calcularse tambin. Los
x = 35, Y = 0.4441 Cx _ -)2 = 4200 e a muestr,a problema (48.0 ngJml). Tambin clculos usuales [Ecs. (5.6)-(5.8)] y un valor tabulado de t = 2.31 (8 grados de libertad;
0003 ,/ x , Y (y - y)2 = 0.00001364 As' _
. 693, Y SxE dado por la ecuacin (5.12) es O 917 ..' I p.ues Sy/x - a un nivel de confianza del 95%) muestran que los lmites de confianza para la
la concentracin son 48.03 (2.45 x O 9179) = 4'8 9. Los hmites de confIanza para pendiente y la ordenada en el origen son respectivamente 0.96 0.200 y 4.5 20.1.
. .0 2.2 ngJml.
Ya que estos intervalos de confianza al 95% incluyen claramente a 1 y O respectiva-
7. Los datos disponibles permiten un clculo de re .. . mente, debemos concluir que esta recta de regresin indica una buena concordancia
de y, y desviaciones estndar: gresion ponderado, SIendo los valores entre los dos mtodos analticos. No obstante, hay una sensacin residual de intran-
quilidad sobre los datos. Los clculos muestran que 7 de los residuos y son negativos
x: o 10 20 30 40 50
(incluyendo 6 en una secuencia simple) y slo 3 son positivos. Se sugiere tambin que
y: 4.0 21.2 la concordancia entre los dos mtodos es muy grande para la mayora de las muestras,
44.6 61.8 78.0 105.2
pero muy pobre para una pocas; esto podra ser causado por problemas de especiacin.
s: 0.7 1 0.8 4 0.8 9 1.64 2.2 4 3.0 Un buen analista podra concluir que se necesitan ms datos (en el trabajo citado se
3
suministran ms datos).
El primer paso es calcular la recta de re resin n .
ordenada en el origen 1 982 y 2 924 g. o ponderada SIendo la pendiente y la
. '. respechvamente Las ca t . 9. Si se representan grficamente estos datos (recuerde que debera hacerse siempre),
dientes a intensidades de fluor . d . ncen racIOnes correspon- existen ciertos indicios de que la calibracin sea lineal hasta 0.7 - 0.8 unidades de
escencra e 15 y 90 id d
43.9 ng/ml respectivamente. De la manera habitu 1(U~I a els ~on .d~ ~ste modo 6.09 y absorbancia, y curva posteriormente. Clculos de regresin lineal no ponderada
Ya 1 1 " a vease e eJerclclclO 3) s - 2 991
que se ca cu a facilmenr- que (Xi _ X)2 es 1750 _ ' y/x - . utilizando los seis puntos proporcionan un coeficiente de correlacin de 0.9936, y los
las dos concentraciones son en los dos casos 1.
de 2.78, los lmites de confianza al 95
76J ~es ~;;)7], ~s valores de Sx para
c. . . sando un valor de t
residuos y (en orden creciente de x) de -0.07, -0.02, +0.02, +0.06, +0.07 y -0.07
y 43 9 + 4 9 gJ 1 . % para estos valores estn dados por 6 1 + 4 9 (redondeando a dos cifras decimales). La tendencia en estos valores es obvia y
. - . n m respectIvamente. . - . confirma que se trata de una curva. La suma de los cuadrados de los residuos es
Para calcular la recta de regresin onderad ' . 0.0191. La confirmacin de que el ltimo punto debera ser omitido del intervalo
calcular la ponderacin de cada punt t.P d la, es necesario, en pnmer lugar,
o u IIIzan o a ecuacin (5 13) A f d . lneal, se obtiene repitiendo el clculo de regresin slo con los cinco puntos. El
mentar los valores de x estas p d . . . m e mcre-
0122 _ . /, on eraciones son 2.227, 1.591, 1.418 0.417 0224 coeficiente de correlacin entonces aumenta a 0.9972 y los residuos y son -0.04, O,
. ,notese que la suma de estos nmeros es 5 999 . '. ,. y +0.02, +0.04 y -0.02 respectivamente (suma de cuadrados 0.0040). Los residuos y
errores. Esta es una importante ve T .. . . ' es decir 6, SI redondeamos
n icacion por realizar Utilizar d t d para el sexto punto con respecto a esta segunda lnea recta es comparativamente muy
nes y las ecuaciones (5.14) y (5 15) 1 di . loes as pon eracio- grande: -0.22.
. a
d e regresin ponderada son 1 964 3 4 8 3 'pen lente y la ordenada en el . d 1
ongen e a recta Este proceso puede repetirse para el quinto punto, es decir, se calcula la lnea recta
t . . y. respectlvamente De e t t 1
racione, correspondientes a las intensid d d fl .. ,s a rec a, as concen- ajustada slo con los cuatro primeros puntos. De nuevo se mejora, en este caso, el
a es e uorescenc de 15 y 90 unidades son
coeficiente de correlacin (a 0.9980), se reducen los valores de los residuos y (-0.02,
+0.01, +0.01 y -0.01), Y existe un gran residuo para el quinto unto' .
(-0.14). Puede concluirse, por lo tanto ue el uinto p ~aJo estudIO (b) En la prueba de rangos y signos, se desprecia de nuevo el valor cero. Los datos
del intervalo lineal del mtodo. Prueb;s~imila;es aplfc~~~~~~~~:~~C~~I~~~ :~;'bin restantes comparados con la mediana proporcionan las siguientes diferencias ordena-
al c~mpararIos, que probablemente deberan formar parte del int 1 li rcan, das: -0.01,0.01,0.01, -0.02, 0.02, 0.02, 0.04, 0.07. Las posiciones con sus signos,
analista podra usar mtodos de regresin lineal en el intervalo de a~;:r~a~~I~aol, you6n teniendo en cuenta los empates, son por tanto -2, 2, 2, -5, 5, 5, 7, 8. El total de
con confianza. a - . posiciones negativas (-) es 7 pero, a P = 0.05, el valor crtico para n = 8 es solamente
de 3. Por lo tanto, se mantiene de nuevo la hiptesis nula.
10. Este ejemplo tambin recalca la importancia del trazado de una e r ' .. (c) Para utilizar una prueba de rangos, calculamos la media (x), que es 0.1156 y
en \'~z. de realizar un simple clculo de regresin lineal. El ltimo ~va de cahbraciOn el recorrido (w), 0.09. Entonces TI est dado por Ix - f1/w = 0.173. El valor critico en
coeficiente de correlacin de O 9952 la i .. lculo produce un este caso es 0.255, de modo que por tercera vez se mantiene la hiptesis nula. En
. ,aunque a IIlspecclOn de I ifi
~ebnV~rl~:~t;r~~i:~:ec~:v;; ~: ~e~r~s~: l:n:a: ~u~s~~~ que los residu:sg;~i~~ae~~;~~~ contra de las apariencias observadas a simple vista no se puede decir, quizs, que la
muestra de combustible no cumpla la especificacin.
residuos es 9.50. Es claramente m" b bl ' a suma de los cuadrados de los
aleatorio. Cuando la curva y = 4x _ ;sl I~pro. a e que el orden de los signos sea 3. Este problema se puede resolver tambin utilizando la prueba de signos, y el de rangos
delos residuos es' + __ + + O + . XI se ajusta a los datos, el orden de los signos
. - - -+,yasumadeloscuadradosess'l 129 E' y signos. Si se restan los valores e.i.d. de los valores i.d.r., los signos de las diferencias
entonces, evidencia de que los puntos se a iustan me' o o. . x~ste, son: + - + + + + + + O +. En efecto, 9 resultados, con 8 signos + y un signo -. La
recta. Para los valores de y 5 16 Y 27 I l J jor ~or la curva que por la lnea probabilidad de que haya 8 signos + en 9 resultados es solamente de 0.04, por tanto al
4 83 Y 8 51 .d d ' .' a mea recta predice concentraciones de 1 15
. . U1l1 a es respectivamente mientras ue 1 . . , nivel de significacin P = 0.05 se puede rechazar la hiptesis nula: los resultados son
de 1.29 451 Y 8 60 id d .' q a curva predice concentraciones significativamente diferentes. En la prueba de rangos y signos, el valor asociado a las
,.,.. UI1l a es respectivamente. A la luz de los anlisis d i ' .
los valores ultimas son ciertament . fi bl e os residuos, posiciones negativas es slo de 2.5. Este nmero es muy inferior al valor crtico de 5,
e mas la es No debe pas l'
que otras curvas podran ajustar los punt '. arse por ato, sin embargo, por tanto se rechaza otra vez la hiptesis nula, y se confirma la diferencia significativa
sugiere aqu: el anlisis con computad os expenmentales aun mejor que la que se entre los dos conjuntos de resultados. Observe, no obstante, que los resultados de la
or muestra que" 1 ' " .
y ~ 0.86 -t 3.97x _ 0.098x2. e mejor ajuste cuadrtico es prueba de rangos y signos deberan interpretarse con precaucin si hay muchas
El ejemplo tambin muestra que en los casos d . posiciones empatadas, como ocurre en este ejercicio y en el anterior.
de puntos de calibracin y dond '1 ond~ existe un razonable nmero
. ' e os errores alea tonos no son d
tratamiento de la curva como u . d muy gran es, el 4. El nuevo mtodo proporciona una media de 64.7 mg/lOO ml y un intervalo de
. na sene e segmentos rectos t
aproXimado atractivo Si se dibujan di . cor os, es un mtodo 2.1 mg/l00 mI: las cifras correspondientes para el mtodo estndar son 65.86 y
los puntos del calibrado las con t le~ segmentos lineales, es decir, se utilizan todos 0.9 mg/l00 ml. De estas cifras, se ve claramente que T des 0.773, mayor que el valor
, cen raciones calculadas por int laci li
seales de 5, 16 Y 27 unidades son 1 36 450 8 . erp~ aClon ineal para crtico de 0.61, de manera que las medias difieren significativamente. La razn de
si slo se dibujan cinco segment . 'd" y ..65 uIlldades respectivamente. Incluso posiciones F R es 2.33, comparada con el valor crtico de 3.2, de manera que las
1 . os, es ecir, solo se usan los puntos X = O 2 4
as concentracIOnes predichas son 1.32 437 851 id . '" etc., precisiones de los mtodos no son significativamente diferentes. (La prueba F da el
de clculo y los derivados de 1 " . y. uru ades. En vista de la facilidad mismo resultado.)
evidentes. a curva ajustada, los atractivos de este mtodo son

5. Si los valores se disponen en orden ascendente, se obtiene que la mediana es 23.5. Los
valores individuales, para el uso de las barras de grafito, tienen por lo tanto los signos
CAPTULO 6 + + + - - - - - + +. De este modo existen tres rachas. Pero para N = M = 5 el valor
crtico es 3, con lo cual se podria decir que la sucesin dada se ha obtenido al azar.
1. La media es 9.96 ml, y la mediana (el promedio de 1 ..
segunda y tercera posiciones) es 9 90 I L b as medICIOnes que OCupan la 6. Este problema se resuelve fcilmente mediante la prueba U. Si se espera que los valores
se puede rechazar a P = 005 S fi' m. ha prue a Q muestra que el valor 10.20 no de "cerveza estndar" sean mayores que los valores de "cerveza rubia", debera de ser
. . I uera rec azada la medi b"
mediana a 9 89 ml: la di '. ' a cam lana a 9.88 mi y la pequeo el nmero de valores de cerveza rubia que son mayores que los de cerveza
. ,me lana es msenslble a la presencia de valores anmalos.
estndar. Es realmente 4.5, contando 0.5 para el empate que aparece. El valor crtico
2. (a) Se usa la prueba de los signos: comparados con l a ' . en una prueba de una cola es 5, con lo cual podemos rechazar la hiptesis nula al nivel
valores experimentales los signos _ + O mediana proporCionan, en los de P = 0.05 Yafirmar que una cerveza rubia en particular produce niveles de alcohol
,, ' + - + + + + En efe t d
:-; lecturas, 6 con signo +. La probabilidad de 6 si . e o, e este modo tenemos en sangre inferiores a los de una cerveza estndar en concreto! Sin embargo, el
mayor que 0.05. Por lo tanto se mantien 1 hi . I~nos en 8 lecturas es 0.29, mucho resultado en la prueba de ejecucin rpida de Tukey, T= 5.5, no llega a alcanzar el valor
e
de una poblacin simtrica con t 'd a IP?tesls nula de procedencia de los datos crtico de 6 (una cola, P = 0.05). Por tanto, se deben tratar los resultados con
con eru o mediano de azufre de 0.10%.
precaucin. Se necesitan ms datos. La prueba de Siegel-Tukey para la variabilidad
proporciona un estadstico de la prueba de 10, muy por encima del valor crtico de 2. :: _ _13- (1521 + ~756.25 + 6320.25) - 3 (18 + 1)
Por tanto, la hiptesis nula de variabilidades similares se debe aceptar. X - 342 + 18 6 6 6

7. Las posiciones se muestran a continuacin: = 4 . 97 . .


d lib t d
2 d 5 99 (P ~ 0.05 2 grados e I er a
or que el cnuco para X e . , h
Este va lor es men l h'ptesis nula y concluir que no ay
Instrumento A B C D E F G P tanto debemos mantener a l ' . d
-tab la A .5) . o r , . de ni 1 las tres muestras de aceite cm o.
Ordenacin del estudiante 3 1 5 4 7 6 2 diferencia significativa entre los mveles e mque en
Ordenacin del
personal acadmico 5 3 6 2 4 7
d: -2 -2 -1 2 3 -1 CAPTULO 7
rP: 4 4 1 4 9 1 . I d ANOVA de dos factores con replicacin.
1. Un eJemp o e
As pues, es 1 - (6 x 24)/0 x 48) = 0.571. ste se encuentra por debajo de valor crtico g.l. Cuadrado medio
Suma de cuadrados
0.786 (P = 0.05 y II = 7), con lo cual no parece que los estudiantes y el personal Fuente de variacin 2.3
5.06778 2
acadmico estn de acuerdo -la correlacin no es significativa. Entre filas 2 0.0939
0.18778
Entre columnas 4 0.0256
0.10222
8. Si los valores x son las distancias, y los valores y los niveles de mercurio, entonces el Interaccin 9 0.0406
0.36500
mtodo de Theil da a = 2.575, Y b = 0.125. Estos valores estn sorprendentemente Residual 17
5.72278
prximos a los niveles (para mtricos) de "mnimos cuadrados" de 2.573 y -0.122. Total
.' ue el cuadrado medio de la interaccin, por eso
9. Para probar x = 1.0 Y a = 0.2, escribimos z = (x - 1.0)/0.2, Yobtenemos 1.5,2.5, -1.5, El cuadrado medio resldu~l.es~ayor q 1 b t 1'0 Para probar si hay diferencia
. . . ficativa muestra- a ora or .
-0.5, O, 0.5, -1.0, 4.0, -3.0 Y 1.5. Si dibujamos dichos valores frente a la funcin de no existe interacclOn signmceu 1 drado medio entre columnas con
distribucin normal estndar, resulta que dan lugar a un trazo que casi es simtrico, significativa entre los laboratonos se compara ecua
pero mucho ms ancho que la curva estndar, indicando que la media supuesta no se el cuadrado medio residual, dando:
aleja demasiado de la verdadera, pero la desviacin estndar estimada es demasiado
F2 9 = 0.0939/0.0406 ~ 2.31
pequea. La mxima diferencia es +0.335 en Z = 1.5. Este valor es mucho ms alto que
el crtico de 0.262, lo que confirma que se debe rechazar la hiptesis nula, y que los .. (P = O 05) s 42556 con lo cual el valor calculado no es
valores no se ajustan a esta distribucin normal concreta. Para probar otra distribucin El valor critico de F2,9 e. ,
normal, calculamos las estimaciones de la media y la desviacin estndar que son significativo.
respectivamente 1.08 y 0.41. Esto proporciona los valores z de 0.54, 1.02, -0.93, -0.44,
El vrtice 1 debera ser rechazado al formar el nuevo simplex.
-0.20,0.05, -0.68, 1.76, -1.66 Y0.54. La mxima diferencia, en este caso, es slo de 2.
ca. 0.11 en z = 0.54, por tanto se acepta la hiptesis nula; los datos se ajustan muy bien Respuesta
Factores
a esta distribucin normal. D E
A B C
9.5 6.9 6.0 8
6.0 4.3
10, Este problema se resuelve sustituyendo las concentraciones de nquel reales con Vrtice 2 6.0 10
2.5 11.5 9.5 6.9
valores de posicin, con los resultados siguientes: Vrtice 3 6.0 11
2.5 4.3 9.5 9.7
Vrtice 5 9.5 6.9 9.6 9
2.5 4.3
Muestra Valores de posicin Vrtice 6 7.7 7.0 12
3.3 6.7 12.5
1 1 8 5 15 4 6 Vrtice 7 38.1 34.6
16.8 31.1 50.5
2 2 17 10.5 13 3 7 Suma 7.6 6.9
3.4 6.2 10.1
3 14 18 9 10.5 12 16 Surna/ 2.0 6.0 5.0
1.0 3.0
Vrtice rechazado (es decir, 1) 1.9
2.4 3.2 8.1 1.6
Observe que se da un empate y, por tanto, se tratar de la manera habitual. Las sumas Desplazamiento 9.2 8.8
5.8 9.4 18.1
de los tres conjuntos de posiciones son: R, = 39, R2~" 52,5, R3 = 79.5. Estos tres nmeros Vrtice 8
suman 171, igual a N(N + 1)/2, donde N =18, es el nmero total de mediciones. El (Todos los valores de la tabla anterior se expresan con una cifra decimal.)
valor del estadstico chi-cuadrada, est dado por:
Una factor Efecto
3. Un ejemplo de ANOVA de dos factores sin replicacin. Primero se resta 16 de cada 6.
-0.0215
valor. A
C 0.0005
T -0.0265
Fuente de variacin Suma de cuadrados g.l. Cuadrado medio
Entre filas 0.011092 3 0.00370
Entre columnas 0.012014 2 0.00601 Dos factores
AC -0.0005
Residual 0.028186 6 0.00470
CT 0.0025
Total 0.051292 11
AT -0.0065
(a) El cuadrado medio entre soluciones (es decir, filas) es ms peqneo que el
cuadrado medio residual, de manera que no es significativo. Tres factores
ACT -0.0005
(b) Comparando los cuadrados medios entre mtodos (es decir, columnas) y
residuales proporciona F Z6 ~ 1.28, que no es significativo (P = 0.(5).
7. Utilizando la siguiente notacin:
4. Un ejemplo de ANOVA de dos factores con replicacin. concentracin de cido ntrico (O.IM - bajo, 1.0 M - alto)
N
L concentracin de lantano (OM- bajo, O.IM - alto)
Fuente ele variacin Suma de cuadrados g.l. Cuadrado medio
Entre filas 20.8768749 3 6.959 los efectos calculados son:
Entre columnas 0.14062595 1 0.141
Interaccin 0.11187458 3 0.037 Efecto Suma de cuadrados g.l
Un factor
Residual 9.92499971 8 1.241 9.5 180.5 1
N
Total 31.0543752 15 22.5 1012.5 1
L
No existe interaccin significativa o diferencia entre los mtodos ya que en ambos
Interaccin
casos el correspondiente cuadrado medio es menor que el cuadrado medio residual. 25.5
NL 3.5

5. Utilizando la siguiente notacin:


Para probar si es significativa la ~nteraccin ~e
compara el cU:d;:d~/4m~~~12~~
. .. n el cuadrado medio de los resIduos, dando Fl.4 . . t
la mteraccion ca . . Sn
G .~ gas de purga (Ar-e-bajo, Ar + Oz-alto) .. F 7 709 (P = O 05) de manera que no extste 111 eraccio
El valor critico de 1.4 es . .,
Te tiempo de purga (20 segundos-bajo, 60 segundos-alto)
significativa.
Q ~ temperatura de la clda de slice (900C-bajo, 1000C-alto)

los efectos calculados son:

Un factor Efecto
G 18.25
T -12.25
Q 55.25

Dos factores
GT 13.75
TQ -5.25
CQ -0.75

Tres factores
GTQ 3.75
~...o()Vl_
"""......
- ; - O J r t'~
cr-G~~tr.
l
L
>
.

(t ~ ~. ;; '3 '"O
:3 ;;; :::: ,;::; ~ (e~
~ Vl := ~ tz: ~
(j~~::::~ .....
g:lo.:;
(") 001 ':"i") (D r/)
~
....

@~ w ;;; ~ n
o~g8z (e
:::: (') (ti ~

~ ;;. 2.. ~ ~
=- t>l O
n
d
~
o:::: ~
!::..t>l
-'O
g cf'' = :3
~ (1)
~
(e
O S' ; :..
""1 CiJ Q.) ~ c:
rJ::

S
(1)
::t :=:~
(1) 'O
O
t>l
- -t>l n ::::
t>l (1) (e
~~5' g'
g~=~
~
..,
o 'O (1) (1)
_.::::
O, (1)'
~ ~
;;; ~

=o.no.
o. o -. (1)
(e
(1)==~, '"O
;;-g8~
'S183~
~;:g~
cT ; ~ o
=
"'1
(e
_
~ ~ ::1. :1. .....,;
~ o ~ ~ ~
&ri=;~""
o. o . '"
-. ~ cT = -
(/) """"t (D " .....
:::.~(1) ~ ir:
~ ;;; ~
CJ - (/)
s
-
~
....
0.5"0.0'
(1) (1) ... ~
1""'\
_

8 tn ;;; ? ... ~
t>l~::::l' ~
fr'~~ B; ....
'O(1)~'O
t>l ~ _ ...
n
"'.,
"
t>l ' ' O
(1) n : :(1)
: -r ...
e: ... t>l cT \1..

= e; fr' B;

(1) Pruebas sobre promedios

Nombre de la prueba Utilizado para probar si: Referencia Comentarios


o estadstico de la prueba en pgina
(a) una media muestra! difiere de un valor estndar 53 Supone que las poblaciones son normales
(b) las medias de dos muestras difieren 55
(e) las muestras por parejas difieren 58
Prueba de signos (a) una mediana muestra! difiere de un valor estndar 138 No paramtrico
(b) las muestras por parejas difieren 139
TI (a) una media muestral difiere de un valor estndar 142 Supone que la poblacin es nonnal; ms rpido
que la prueba t
t; (a) las medias de dos muestras difieren 143 Supone que las poblaciones son normales;
ms rpido que la prueba t
L (Prueba de recorridos de Lord) (a) las medias de dos muestras difieren 143 Supone que las poblaciones son normales;
ms rpido que la prueba t
Prueba de rangos y signos (a) una mediana muestral difiere de un valor estndar 144 No paramtrica, pero supone que la poblacin
de Wilcoxon (b) la muestras por parejas difieren 145 es simtrica; requiere 11 5 para pruebas de
una cola y /1 6 para dos colas

Prueba de suma de rangos (a) las medianas de dos muestras difieren 146 No paramtrica; tamaos de muestra mnimos:
de Wilcoxon prueba de una cola /11 ~ /12 ~ 3; prueba de dos colas,
/I[ ~ 3,112 = 5

Prueba U de Mann-Whitney (a) las medianas de dos muestras difieren 148 Versin ms simple de la prueba de suma de
rangos de Wilcoxon
Prueba rpida de Tukey (a) las medianas de dos muestras difieren 148 Alternativa muy simple a las pruebas de suma de
rangos y U -no necesita tablas estadsticas
Prueba de Kruskal- Wal1is (a) las medianas de tres o ms muestras difieren 150 No paramtrica; utiliza el mtodo X2 en forma modi-
ficada
Prueba de Friedman (a) las muestras emparejadas difieren 151 No paramtrica; mtodo X2 en forma modificada
---------------~
'"
o
C
<O

5s
o
U
Apndice 2 Tablas estadsticas
Se presentan para la conveniencia del lector las siguientes tablas, y para su uso en este libro
en pruebas estadsticas simples, ejemplos y ejercicios. Estn presentadas en un formato
compatible con las necesidades de qumicos analticos: el nivel de significacin P = 0.05
ha sido utilizado en muchos casos, Yse ha supuesto que el nmero de mediciones disponible
es suficientemente pequeo. Excepto donde no se establezca lo contrario, estas tablas
abreviadas han sido obtenidas, con autorizacin de Elelllelltary Statistics Tables de Henry
R. Neave, publicadas por George Allen & Unwin Ud. (Tablas A.I-A.3, A.5-A.7 Y A.12-
A.16). Se remite a estas fuentes a los lectores que requieran nmeros de mediciones no
recogidos en las tablas.
TablaA.l La distribucin t
90% 95% 98% 99%
Valor de t para un intervalo de confianza de 0.02 0.01
0.10 0.05
Valor critico de \tl para valores de P de
Nmero de grados de libertad
6.31 12.71 31.82 63.66
I 6.96 9.92
2.92 4.30
2 4.54 5.84
2.35 3.18
3 3.75 4.60
2.13 2.78
4 3.36 4.03
2.02 2.57
5 3.14 3.71
1.94 2.45
6 3.00 3.50
1.89 2.36
7 2.90 3.36
1.86 2.31
8 2.82 3.25
1.83 2.26
9 2.76 3.17
1.81 2.23
10 2.68 3.05
1.78 2.18
12 2.62 2.98
1.76 2.14
14 2.58 2.92
1.75 2.12
16 2.55 2.88
1.73 2.10
18 2.53 2.85
1.72 2.09
20 2.46 2.75
1.70 2.04
30 2.40 2.68
1.68 2.01
50 2.33 2.58
1.64 1.96

Los valores criticas de Irl son adecuados para una prueba de dos colas. Para una prueba de una cola el valor se
toma de la columna para dos veces el valor de P deseado, por ejemplo, para una prueba de una cola, P 0.005,~
5 grados de libertad, el valor critico se lee de la columna P ~ 0.10 Yes igual a 2.02.
Tahla A.2 Valores crticos de F para una prueba de una cola (P ~ 0.05) TablaA.4 Valores crticos de Q (P ~ 005)
Tamao de muestra Valor crtico
t/
I 1 2 4 5 6 7 8 9 10 1 15 20
4 0.831
U --_._-~~--------

1
5 0.717
I 161 4 1995215.7 2246 230.2 2340 2368 2389 2405 2419 2439 245.9 24E.0 0.621
1851 1900 19.16 19.25 19.30 19.33 19.35 19.37 1938 19.40 1941 1943 J945 6
2 0.570
3 10.13 9.552 9.277 9117 9013 8941 8.887 8845 8.812 8.786 8.745 8.703 8660 7
4 7.709 6.944 6591 6388 6256 6 163 6.094 6.041 5999 5.964 5.912 5858 5.803 8 0.524
5 6.608 5786 5409 5. 92 5050 4.950 4.876 4818 4.772 4735 4.67R 4619 4.558 9 0.492
10 0.464
6 5987 5143 4.757 4.534 4387 4.284 4207 4.147 4.099 4.060 4000 3938 3874
7 5591 4737 4.347 4120 3.972 3866 3.787 3.726 3.677 3637 35"75 3.511 3445 Toma d os d e K"lIlg, E . P.], Am
. . Statist. Assoc ., 195848531
" , cOllautorizacindeAmericallStatistical
8 5.318 4459 4066 3.838 3.687 3.581 3.500 3438 3.388 3347 3284 3.218 3150 Assocjation.
9 5.117 4256 3863 3.633 3.482 3374 3.293 3.230 3.179 3.137 3073 3.006 2.936
10 4.965 4103 3708 3.478 3.326 3.217 3.135 3.072 3.020 2978 2.913 2845 2.774 Tabla A.S Valores criticas de i (P = 0.05)

Nmero de grados de libertad Valor crtico


II 4844 3982 3587 3357 3.204 3095 3012 2.948 2.896 2854 2788 2.719 2.646
1 3.84
12 4.747 3885 3490 3.259 3106 2.996 2.913 2.849 2.796 2.753 2.687 2.617 2.544
3 4.667 3806 3411 3.179 3.025 2.714 2 5.99
2915 2.832 2.767 2.671 2.604 2533 2459
J4 4600 3.739 3344 3112 2958 2.848 2.764 2.699 2.646 2.602 2534 2463 2.388 3 7.81
15 4543 3.682 328 7 3.056 2.901 2.790 2.707 2641 2.588 2.544 2475 2.403 2"128 4 9.49
_._._--~--.-

5 11.07
16 4.494 3634 3239 3007 2852 2.74] 2.657 2.591 2.5 38 2494 2425 2.352 2.276 6 12.59
17 4451 3.592 3.197 2.965 2810 2699 3.614 2.548 2.494 2.450 2381 2.308 2.230 14.07
7
J8 4.414 3555 3160 2.928 7.77 3 2.661 2<>77 2.510 2.456 2412 2342 2.26C 2.191 15.51
19 4381 3.522 :1127 2.895 2740 2628 2.544 8
2.477 2423 2378 2.008 2.234 2.155
<1351 9 16.92
20 3493 3098 2.866 2711 2599 2.514 2.447 2.393 2348 2.27R 2/03 2124
10 18.31
L',- nmero de grados de libertad del numerados y lJ, ~ nmero de grados de libertad del denominador.
TablaA.6 Nmeros aleatorios
.~-----_._-

63259 99886 20644 41853 41915 02944


02484 88139 31788 35873
Tabla A.3 Valores crticos de F para una prueba de dos colas (P = 0.05) 95093 07362 74354 13071 77901 63058
R3680 56131 12238 68291
u,
79781 09184 83909 77232 57571 25413 82680
i 2 3 4 S 6 7 8 9 10 12 15 20 3733ti 63266 18632
61880 40119 88098 75956 85250 05015 99184
I' ~ --------------- (\4Oh O 46030 23751
647.8 7 Y95 864.2 899.6 921.8 ~() 84 i 42478 71784 65864 84904 48901 17115
937.1 948.2 9567 9633 968.6 976.7 984.9 993 J b20 i ) O1S l' 79352
2 3851 3900 3917 39.25 39.30 39.33 3936 3937 3939 3940 39.41 3943 39.45
3 J744 1604 1544 15.10 1488 1473 14.62 14.54 1447 1442 14.34 1425 1417 73259 21086 51932 32304 45021 61697 73953
964 \ 7 63336 8i1491
4 1222 1065 9979 9605 9.364 9.197 9074 8980 8905 8.844 8751 8.657 8.560 33717 20284 55606 33308 51007 68272
42291 29755 24119 62125
5 1001 8434 7.764 7.388 7.146 6978 6.853 6.757 6.681 6.619 6525 6428 6.329 30596 67769 59343 53193 19203
31378 ',57 4 0094] 53042 99174
-------~~~---------~-

69341 40475 55998 87510 55523 15549 32402


6 8.813 7260 6599 6.227 5988 5820 5695 2"/098 38959 +9721
5600 5523 5.461 5.366 5.269 5168 35332 52387 29194 21591
7 8.073 6542 5.890 5.523 61',527 "73898 669J2 7()300 52782 29356
5285 5.119 4.995 4899 4.823 4.761 4.666 4568 4.467 .-----------
8 7.571 60595416 5053 4.817 4.652 4.529 4.433 4.357 4.295 4.200 4101 3.999
9 7209 91293 80576 67485 88715 45293 59454 76218
5715 5078 4.718 4484 4320 4.197 4102 4.026 3.964 3868 3769 3667 61621 52967 40644
10 6937 5456 4826 4468 4.236 40261 35555 76229 00486 64236 74782
4.072 3.950 3.855 3.779 3.717 3.621 3522 3419 18798 99633 32948 49802
13788 04806 31140 75253 79692 47618 20024
31)864 66460 87303
11 6.724 52% '<630 4.275 4.044 3881 3.759 3664 3.588 3526 3.4 30 3330 3226 04097 98009 58042 67833 23539 37668 16324
1034() 28822 5891
12 6554 5096 4.47~ 4121 389] 3728 3.607 3.512 3436 3.374 3277 3 J77 3.073 99450 18240 70002 75386 26035 21459
20582 49576 91822 ()3807
13 6414 4965 4347 3.996 3.767 3.604 3483 3388 3.312 3.250 3.153 3053 2948
14 6298 4857 4.242 3.892 3663 3501 3.380 3285 2.209 3147 3050 2.949 2844 84186
54810 ()4766 58954 76201 78456 98467 34166
15 6200 4765 4153 3804 3.576 3415 12023 82328
3293 3199 3.123 3060 2.963 2862 2.756 21643 90674 98858 26060
--_._-------, 48255 20815 51322 04936 33413 43128
10899 89780 57080 82799 70178 40399
16 6. J 15 4687 4077 3729 3502 3341 3.21 Q 3125 3049 2.986 2.889 2788 2681 92956 09401 58892 59686
17 6042 4.6194011 49036 24993 69827 67637 09472 63356
3665 3438 3277 3156 3061 2.985 2.922 2.825 2723 )616 8'7300 04 729 57966 95672
18 5.978 4560 3954 3608 3382 3221 3100 3005 2929 OC)25 h 81645 48500 73237 95420 98974 36036 21781
2.866 2.769 2.667 2.559 6J10l 21192
19 5.922 4508 3903 -- ------ --_._----_.~-
3559 3333 3 172 3051 2956 n80 2.817 2.720 2617 2.509 ._--- - - -~-

20 5871 4461 3.859 3515 3.289 3 128 3007 2913 2.837 2.774 2676 2.573 2464 80102 48211 61149 7124() 19993 79708
2201'14 031 )7 96937 86176
_ _ _ o ___ ._

88132 07083 50818 09104 92449 27860 90196


2S0IJO 443Dl 40028
/};
nmero elegrados de libertad e1el numerador y ~ nmero de grados de libertad del denominador. 91566 64917 18709 79884 44742 18010 11599
1),
41662 2f)Q"lO 32856
00857 21068 94121 39197 27752 67308
91398 16841 51399 82654
42334 06695 26306 16832 63140 13762 15598
46560 00597 84561
Tabla A.7 La prueba de signos Tabla A.9 La prueba TI

La tabla utiliza la distribucin binominal con P = 0.5 para proporcionar las probabilidades de r xitos Valores criticas para pruebas de una y dos colas a P ~ 0.05
o menos para II ~ 4 - 15. Estos valores corresponden a una prueba de signos de una cola y se deben Prueba de dos colas
1/ Prueba de una cola
duplicar para una prueba de dos colas.
2 3.175 6.353
r=O 2 3 4 5 6 7 3 0.885 /.304
4 0.529 0.717
n
S 0.388 0.507
4 0.063 0.313 0.688 0.312 0.399
6
5 0.031 0.188 0.500 0.263 0.333
0.344 0.656 7
6 0.016 0.109 0.230 0.288
8
7 0.008 0.063 0.227 0.500 0.205 0.255
9
8 0.004 0.035 0.144 0.363 0.637 0.]86 0.230
0.02. 0.090 0.254 0500 10
9 0.002
10 0.001 0.011 0.055 0.172 0.377 0.623
11 0001 0.006 0.033 0.113 0.274 0.500
12 0.000 0.003 0.019 0.073 0.194 0.387 0.613
13 0.000 0.002 0.011 0.046 0.133 0.290 0.500
Tabla A.IO La prueba T el Y la prueba de recorridos de Lord
14 0.000 0.001 0.006 0.029 0090 0.212 0.395 0.605
15 0.000 0.000 0.004 0.018 0.059 0.151 0.304 0.500 Valores crticos de T el Y La P'~ 0.05

ni = 1/2 t: L
Tabla A.S La prueba de rachas de Wald-Wolfowitz 1.71
2 3.43
3 1.27 0.64
N M AP = 0.05, el nmero de rachas
4 0.81 0.41
es significativo si es:
S 0.61 0.31
menor que mayor que 0.50 0.25
6
2 12-20 3 NA 0.43 0.21
7
3 6-14 3 NA 8 0.37 0.19
3 15-20 4 NA 9 0.33 0.17
10 0.30 0.15
4 5-6 3 8
4 7 3 NA Las tablas A.9 y A.IO estn tomadas de Lord, E., Biometrika, 1947,34,66, con autorizacin ele Biometrika
4 8-15 4 NA
Trustees.
4 16-20 5 NA
5 5 3 9
S 6 4 9
S 7-8 4 10 Tabla A.U La prueba sustituta de la prueba F (FR)
5 9-12 4 NA
S 13-18 5 NA Valores criticas de FR para pruebas de una y dos colas a P = 0.05
6 6 4 10 Nmero de
6 7-8 4 11 mediciones en
6 9-12 5 12 numerador y
6 13-18 6 NA denominador Prueba de una cola Prueba de dos colas
7 7 4 12 2 12.7 25.5
7 8 5 12 3 4.4 6.3
7 9 5 13 4 3.1 4.0
7 10-12 6 13 5 2.6 3.2
8 8 S 13 6 2.3 2.8
8 9 6 13 7 2.1 2.5
8 10-11 6 14 8 2.0 2.3
8 12-15 7 15 9 1.9 2.2
10 1.9 2.1
Adaptada ele Swed, F. S. y Eisenhar, c., Ann. Math. Statist. 1943, 14, 66, con autorizacin del Institute of
Mathematical Statistics. La prueba no puede aplicarse a datos con N, M menores que los nmeros dados, O a casos Adaptada de Link, R. F.,AI/n.Matl: Suuist.; 1950,21, 122con autorizacindel Isntitute of Mathematical Statistics.
marcados con NA.
Tabla A.12 La prueba de rangos y signos de Wilcoxon
Tabla 14 El coeficiente de correlacin ordinal de Spearrnan
Valores crticos para el estadstico a P = 0.05
Valores crticos de a P = 0.05
n Prueba de una cola Prueba de dos colas
n Prueba de una cola Prueba de dos colas
5 O NA
6 5 0.900 1.000
2 O
7 6 0.829 0.886
3 2
8 7 0.714 0.786
5 3
9 8 0.643 0.738
8 5
10 9 0.600 0.700
10 8
11 10 0.564 0.649
13 10
12 11 0.536 0.618
17 13
13 12 0.504 0.587
21 17
14 13 0.483 0.560
25 21
15 14 0.464 0.538
30 25
15 0.446 0.521
La hiptesis nula puede rechazarse cuando el estadstico de la prueba sea :<:; que el valor tabulado. NA indica que 16 0.429 0.503
la prueba no puede ser plicada. 0.414 0.488
17
8 0.401 0.472
19 0.391 0.460
20 0.380 0.447

TablaA.13 Tabla A.15 La prueba de bondad del ajuste de Kolmogorov


La prueba de suma de rangos de Wilcoxon; la prueba U de Mann-Withney
Los valores crticos para la prueba de una y dos colas a P = 0.05. Los val?res adecua~os se comparan
Valores crticos de U o el menor entre TI y T2 a P = 0.05
con la diferencia mxima entre las curvas de frecuencia acumulada expenmental y teonca, tal y como
/ll se describe en el texto.
/l2 Prueba de una caa Prueba de dos colas
3 3 O Prueba de una cola Prueba de dos colas
3
NA ti
4 O NA
3 1 0.950 0.975
5 1 O
3 2 0.776 0.842
6 2 1
4 3 0.636 0.708
4 1 O
4 4 0.565 0.624
5 2 1
4 5 0.509 0.563
6 3 2
4 6 0.468 0.519
7 4 3
5 7 0.436 0.483
5 4 2
5 8 0.410 0.454
6 5 3
5 9 0.388 0.430
7 6 5
6 10 0.369 0.409
6 7 5
6 11 0.352 0.392
7 8 6
7 12 0.338 0.375
7 11 8 13 0.326 0.361
La hiptesis nula puede rechaz~rse cuando U o el valor de Tms pequeo sea :<:; que el valor tabulado. NA indica 14 0.314 0.349
que la prueba no puede ser aplicada. 15 0.304 0.338
16 0.295 0.327
17 0.286 0.318
8 0.278 0.309
19 0.271 0.301
20 0.265 0.294
Tabla A.16 La prueba de Kolmogorov para probar la normalidad
Los valores crticos para pruebas de una y dos colas a P = 0.05. Los valores adecuados se com
dif . .. l paran
con la 1.lerencla maxima entre as curvas de frecuencia acumulada experimental y terica, tal y como
se describe en el texto.

n Prueba de una cola Prueba de dos colas


3 0.367 0.376
4 0.345 0.375
5 0.319 0.343
6 0.297 0.323
7 0.280 0.304
8 0.265 0.288
9 0.252 0.274
10 0.241 0.262
11 0.231 0.251 ,
12
13
0.222
0.215
0.242 Indice de materias
0.234
14 0.208 0.226
15 0.201 0.219
16 0.195 0.213
17 0.190 0.207
8 0.185 0.202
19 0.181 0.197 absorbancia, 12,32, 35 anlisis de tamaos de partculas, 2
20 0.176 0.192 ajuste de curvas, 115, 118, 119, 126, 141 anlisis enzimtico, 14, 15, 165, 166
albmina en suero, determinacin de, 1, 13, 25 anlisis gravimtrico, 87
aleatoriedad, prueba para la, 142, 143 anlisis potenciomtrico, 35, 36
aleatorizacin, 148, 149, 160 anlisis volumtrico, 7-10, 33, 35, 87, 122
American Society for Testing and Materials analizadores centrfugos 170-171
(ASTM), 7,17 aprendizaje no supervisado, mtodos de recono-
anlisis automtico, 88, 90, 169, 170 cimiento de pautas, 172-173, 176-180
anlisis clinicos, 188 aprendizaje supervisado, mtodos de recono-
anlisis cualitativo, 1 cimiento de pautas, 172, 175, 176
anlisis cuantitativo, 1-3 ARTHUR, mtodo de reconocimiento de pautas,
anlisis de componentes principales, 172, 174, 179
179 astigmatismo, 11
anlisis de la varianza (ANOVA), 52-56, 67-70,
75,76,84,137,147-149,179 barras de error, 111
aritmtica de clculos, 56, 57 blanco, 10,89,90, 101-102, 108
cuadrado medio residual en, 150-152, 157 bloque(s), 148, 149, 152
cuadrados medios en, 53-56, 150-152, 157, bondad del ajuste, 141-145, 198,205
162, 163 British Standards Institution (BS!), 7, 17
de un factor, 52-56, 75, 150, 153 bureta, 7-9
diferencias significativas en, 55-56 bsqueda de variable alternativa, 164
de dos factores, 149-158, 162
mnima diferencia significativa en, 82, 83
calculadoras, 15,21,92,96,99,139
para comparar varias medias, 52-56
capacidad de procesos, 79, 80, 84
suma de cuadrados en, 55, 56,150,151,
157, 158, 162, 163 centro de gravedad ponderado, 111-114
variacin dentro de muestras en, 53-56, 69, centro de gravedad, de puntos en grficas de
70, 76, 79 calibracin, 90, 95, 100, 106, 111-113
variacin entre bloques en, 149, 151 cifras significativas, 23, 31, 92, 98, 151
variacin entre muestras en, 53-56, 69, 70, clasificacin binaria, 172-173
75, 76, 78 clasificador, 172-173
variacin entre tratamientos en, 149, 153 censura de valores en ensayos de colaboracin,
variacin total en, 55, 56 76
coeficiente de correlacin momento-producto, determinacin de la concentracin por mtodos funciones generales en la propagacin del error,
errores por el indicador, 9, 10
60,90-95, 106-107, 109, 115, 116, 198 de calibracin, 96, 98-101,105,112,113 errores relativos, 22, 34-37 35
coeficiente de correlacin ordinal de Spearman, diagrama de Shewhart, 78-82 errores sistemticos, 3-13,23,28, 32,33,37, 38,
138, 139, 198,205 diagramas de control, 78-84 gradiente, mtodo de optimizacin del, 164, 166,
40,41,46,47, 72, 73, 76, 77, 88, 106-109,
coeficiente de correlacin, 60, 90-95, 107, 109, diagramas DSA (de sumas acumuladas), 80-83 119, 127, 130, 148, 159 167, 179
115, 116 diseo de bloques aleatorizado, 149, 152 grados de libertad, 29, 41, 44, 46, 53-56, 58, 70,
errores, vase errores sistemticos, aleatorios y
coeficiente de variacin (CV), 21, 36, 110 diseo de experimentos, 10, 12, 14, 15,46, 52, accidentales en pruebas de significacin, 61- 75,94,96,97,99,101,136,150,151,156-
(vase tambin desviacin estndar relativa) 147-159 63 158,162,199,200
colorimetra, 170-171 diseo factorial completo, 159 escalado de datos previo al reconocimiento de grfica de dos muestras, 72, 73
combinaciones lineales, de errores aleatorios, 33 diseo factorial incompleto, 74, 163 pautas, 209 grfica de Youden, 72, 73
de errores sistemticos, 36-37 diseos de clasificacin cruzada y anidados, 153 espacio de pautas, 171-172
comparacin, de un resultado experimental con diseos experimentales uno cada vez y optimiza- espectrometra de absorcin atmica, 11, 13,87, hiptesis alternativa, 61-62
otro estndar, 2, 3, 40, 41, 197 cin, 159, 163-165 103,104,114,127,170-171 hiptesis nula, 40-49, 53-55, 57, 58, 62, 94,
de datos por parejas, 45, 46, 197 diseos factoriales fraccionales, 74, 163, 179 espectrometra de emisin, 87, 103, 149 124-128,130-132,133-137,139,143,145
de las desviaciones estndar de dos conjuntos diseos factoriales, 159-163, 165, 167, 168, 170 espectrometra de fluorescencia, 34,52-56, 114, histograma, 23
de datos 3,47-49, 197 diseos jerarquizados, 153 118, 147, 172 hojas de clculo, 16
de las medias de dos conjuntos de datos, 3, distancia eucldea, 175 espectrometra de luminiscencia, 87
17,42-45,197 distribucin binominal, 123, 124 incremento de muestra, 68, 69
espectrometra de masas, 87
de las medias de varios conjuntos de datos, distribucin de errores, 22-25 espectrometra de plasma, 13,87,103-104,170- inrnunoensayos, 114, 117
52-56, 197 distribucin Gaussiana, vase distribucin nor- 171 instrumentos inteligentes, 11,88
computadores centrales, 16 mal, espectroscopia de derivadas, 88 inteligencia artificial, 16
concentraciones de anticuerpos en suero, 25, 27 distribucin lag-normal, 16,27,30,31, 122 esquema de votacin, en reconocimiento de pau- interacciones entre factores, 15, 137, 153-163,
conglomerados, 172, 173, 177 distribucin muestral de la media, 25, 28,46,54, tas, 175-176 167, 168
conjunto de orientacin, 173, 177 61,62,122 estadstico FR, 128, 129,203 intervalo de confianza de la media, 28, 29, 32,
conjunto de prediccin, 173, 175, 177 distribucin normal, 23-26, 29, 31, 50, 57-60, estadstico t, 29, 30, 32, 41-46, 94, 95, 97, 99, 33
control de calidad, 67 102, 103, 115, 122-125, 128, 129, 138, 142- 101,105,108,116,197,199
correccin de Yates, en la prueba chi-cuadrada, 145, 159 estadstico T d, 127, 128, 197,203 Kowalski, B. R., 179
58 estadstico TI, 127, 128, 197,203
correlacin ordinal, 138, 139, 198,205 ecuacin de Nerst, 35, 36 estimacin conjunta de la desviacin estndar, laboratorio de arbitraje, 73-75, 78
correlacin, 15,87 ecuaciones polinmicas, en ajuste de curvas, 118 42,44 lmpara de ctodo hueco, 114
cromatografa gas-lquido, 87, 119, 171, 172, efecto matriz, 102-103 exactitud, 4-6, 50, 82, 116, 159 lmite de cuantificacin, 101-102
178 efectos atmosfricos en la pesada, 8, 9 expresiones multiplicativas, en la propagacin lmite de decisin, 101-102
cromatografa lquida de alta resolucin, 87, 160 efectos de filtro-interno, en fluorimetra, 114 del error aleatorio, 34 lmite de deteccin, 3, 89, 96, 100-102
cromo en suero, determinacin de, 11-13 efectos de la temperatura en anlisis volumtri- en la propagacin del error sistemtico, 36-37 lmite de determinacin, 101-102
cuadrados latinos, 152, 153, 169 co,36,37 lmites de confianza de la media, 15, 28-32, 68,
cuartil inferior, 123 electrodos selectivos de ones, 114 factor controlado, 69, 79, 147, 150, 158 78, 123, 128
cuartil superior, 123 empates en reconocimiento de pautas, 175-176 factor incontrolado, 69, 75, 79, 147 en grficas de calibracin lineal, 89, 97-100,
cuartiles, 123 enmascaramiento, en pruebas de valores anma- factores aditivos, en diseo experimental, 153, 105,106,108-110,112,113,119
los, 55-56 154, 159 no paramtricos, 143
curva de frecuencias acumuladas, 58-60, 142-
145 ensayos de colaboracin, 13, 71-78 factores cualitativos, 147 lneas de accin, en diagramas de control, 78-81
curvas de nivel, 164-168, 171 ensayos de competencia obligatoria, 118, 119 factores cuantitativos, 147 lneas de aviso, en diagramas de control, 92-95
equilibrio electrnico, 36-37 factores de efecto aleatorio, 52, 69, 75, 150 longitud media de racha, 94, 96
error de ltima gota, 10 factores de efecto fijo, 52, 69, 147, 150
chi cuadrada, prueba, 57, 58,136,137,141,143,
198,201 error estndar de la media (eem), 27, 31, 62 factores que afectan a los resultados experimen- materiales de vidrio volumtricos, 7-12
errores accidentales o crasos, 3, 23, 77 tales, 15,52,73,147,149,153,154,159-164, materiales estndar de referencia, 12, 87
errores aleatorios, 3-10, 14,33,40,52, 78, 84 168, 169 para anlisis volumtrico, 8
daltonismo, 11
en clculos de regresin, 88, 96-107, 109 Fisher, R. A., 148 matraz aforado, 7, 8
datos perdidos, en ensayos de colaboracin, 77 110, 115
dendrograma, 178 forma tipificada, 143 media, 15,20-32,40-46,49-53,57,67, 78, 84,
en ensayos de colaboracin, 72, 73, 76, 77 frecuencia acumulada, 58, 60 122-124,127,131,144
desviacin estndar relativa (DER) 22 34-36 errores de tipo 1, en pruebas de significacin,
109-110,112 ", frecuencia esperada en la prueba chi-cuadrada, media aritmtica, vase media,
61-63,78 57,58 media del proceso, 79, 80, 82
desviacin estndar, 20-38, 41-51, 74,123,124, errores de tipo 2, en pruebas de significacin,
127,144 frecuencia observada en la prueba chi-cuadrada, mediana, 122-124, 126, 129, 130, 133, 135, 136,
61-63 57,58 139,197
de la pendiente y ordenada en el origen de errores de vaciado, 9 frecuencia, en la prueba chi-cuadrada, 57 medicin en probeta, tolerancia de, 8
grficas de calibracin lineales 96-98 104 errores determinados, 4
105,108,111,112,113 ' , , Friedman, M., 136 mtodo de adiciones estndar, 89, 102-103, 106
errores indeterminados, 4 funciones a trozos (spline), 118 mtodo de calibracin, 12, 88-119
mtodo de la mquina de aprendizaje, 175 optimizacin, 14, 17,88,147,158-172 Prueba F, 32,47-49,63,70,76-78,128,129,134, splines (funciones a trozos) cbicos, 118
mtodo de mnimos cuadrados, 16,95, 118, 140 ordenacin alterna por pares, 134, 135 151,152,163,200 sucesiones, de signos + y -, 115
mtodo de Theil para rectas de regresin, 139- ordenada en el origen, de la grfica de calibra- prueba Q para valores anmalos, 50, 51, 78, 201 superficies de respuesta en optimizacin, 164,
141 cin lineal, 89, 96, 98, 99,102-103,107-110, prueba t por parejas, 45, 46, 124, 130 165, 167
mtodo del K entorno ms prximo (KNN), 175- 110-111,112,139-141 prueba rpida de Tukey, 133, 134, 197 supuestos utilizados en calibracin lineal,
176 prueba t, 32,41-46,49,58,63,67,94, 116, 124, clculos, 90, 110, 111
mtodos de distribucin libre, vase mtodos no pendiente de la grfica de calibracin lineal, 89, 128,197,203
paramtricos 96,98,99,102-103,107-110,111,112,125, prueba U de Marm-Whitney, 133, 134, 197,204 tabla de frecuencias, 22
mtodos de interpolacin en regresin no lineal, 139-141 pruebas de significacin, 32, 40-66, 78 tabla de nmeros aleatorios, 68, 74, 148,201
119 periodicidad, efectos en el muestreo, 96 errores en el uso de, 61-63 tendencia, prueba de significacin para, 125
mtodos de Kolmogorov-Smirnov, 60,141-145, de signos + y -, 127 problemas en el uso secuencial, 63 teorema binominal, 124, 130
198,205 pesada, 7, 8 papel de probabilidad normal, 58, 59, 61, 142 teorema del lmite central, 28, 122
mtodos de la transformada de Fourier, 88 efectos atmosfricos en la, 8, 9 titulaciones complexomtricas, 101?
mtodos de ordenacin, 129-141 Q de Dixon, 50, 51, 78, 201 tolerancias, de materiales de vidrio y pesas, 7, 8
por diferencia, 7, 9, 37
mtodos de regresin no ponderados, 100, 102, recipiente de, 7 quimiometra, 15, 170 transformaciones de grficas de calibracin cur-
105,110-113,116,118 pipeta, 7-9 vas en lineales, 113, 116-118
mtodos de regresin ponderada, 110-114, 117, plano de decisin, 173 rachas de signos + y -,115,126,127,198,202 transmitancia, 34-35
118 reconocimiento de pautas, 17, 147, 170-179 tratamientos, 148, 149, 153
plantilla en V, 82-84
mtodos de regresin, supuestos utilizados en, poblacin de mediciones, 23, 67 recorrido intercuartlico, 123, 127
90,110,111 recorrido, 79,80,84,127-129,198 uso secuencial de las pruebas de significacin,
ponderaciones, de puntos de regresin pondera-
lineal, 15, 16,46,51,87-119,125,126 recta de regresin de x sobre y, 95 63
da, 111, 112, 113, 117, 118
no lineal, 15, 17,88,93,113,119 recta de regresin de y sobre x, 95, 110
posiciones empatadas, 131, 133-136, 139 valor objetivo, en diagramas de control, 79-82,
no paramtrica, 139-141 recta de regresin, 101-102
potencia de una prueba estadstica, 62, 63, 125, 84
para comparar mtodos analticos, 106-110 redondeo de resultados, 31, 32, 98, 115
129, 145 valor verdadero, 23, 25, 26, 28, 29, 40, 41
mtodos electroqumicos de anlisis, 87, 103, regresin curvilnea, vase regresin no lineal,
precisin dentro de rachas, 4, 5 valores anmalos, 2, 3,49-51,67,78,116,123,
114 regresin no lineal, 15, 17
precisin, 4-6, 26, 50, 57, 82, 159 128, 129, 140
mtodos modificados en la optimizacin sim- repetitividad, 4-6
plex, 169 prejuicios en la experimentacin, 11 rplicas, en diseo de experimentos, 155 valores crticos en pruebas estadsticas, 41, 42,
mtodos no paramtricos, 50, 96, 122-127, 129- presentacin de resultados, 31, 32 reproducibilidad, 4-8 45-51,55,58,70,76,77,137,143,151,152,
144,177,197,198 problemas de especiacin, 108 residuos (de) y, en grficas de calibracin, 95-97, 157,160,199-206
mtodos radioqumicos de anlisis, 87 procesadores de texto, 43 115, 116, 126 valores de codificacin previos a los clculos, 21
mtodos robustos, 141 propagacin de errores aleatorios, 14,22,33-36 residuos, en clculos de regresin, vase resi- variable normal estndar, 143-145
mtodos trmicos de anlisis, 87 propagacin de errores sistemticos, 37 duos y superficies de respuesta en optimiza- variacin entre laboratorios, 71, 72, 76, 77
microcomputadores, 11, 15, 17,88,92,99, 108, prueba bilateral, vase prueba de dos colas cin, 164, 165, 167 varianza en la medicin, 68-70
111,113,118,123,139,141,170-171 prueba chi-cuadrada, 85, 86, 136, 137, 141-143, varianza muestral, 68-71
microprocesadores, vase microcomputadores 198,201S semejanza en el reconocimiento de pautas, 211 varianza, 22, 26, 33, 43, 47-49, 53, 54, 56, 63,
minicomputadores, 16 determinacin de, sensibilidad, 103-104 69,70,111,128,149,151,162,198
mnima diferencia significativa, en ANVA, 54- prueba de dos colas, 46, 47, 49, 63, 94,124,125, seal de fondo, vase blanco, vector de pautas, 171, 172-173
55 128,130,131,134,135,143,197,199-200 sesgo, vase error sistemtico,
monocromadores, errores sistemticos debidos prueba de entereza, 73 SIMCA, mtodo de reconocimiento de pautas, Wold, S., 176-177
a, 11-13 prueba de Friedman, 136, 137, 197 176,178
muestra aleatoria, 68 prueba de Kruskal-Wallis, 135, 136, 197 sistemas expertos, 16 Yates, 58, 159
muestra bruta, 68 prueba de rachas de Wald-Wolfowitz, 126, 127, spline, vase funciones a trozos Youden, W. J., 72, 73
muestra de mediciones, 23 198,202
muestreo a granel, 68 prueba de rangos y signos de Wilcoxon, 129,
muestreo, 65, 81-84, 88 131,135,204
prueba de rangos y signos, 129-131, 135
naranja de metilo, error de indicador debido a, 10 prueba de recorridos de Lord, 128, 197
National Bureau of Standards (NBS), 13, 17, 18 prueba de Siegel-Tukey, 134, 135, 198
National Physical Laboratory (NPL), 13 prueba de signos, 123-126, 129, 197,202
niveles de factores experimentales 73 74 148 prueba de suma de rangos de Wilcoxon, 131-134,
153, 154, 159-161, 165-169, 169, 170 ' , 145, 197,204
niveles de significacin 40 41 prueba de suma de rangos, 131-134, 145
nudos en funciones a tr~zo~ (spline), 133 prueba de una cola, 46-49, 55, 59, 63, 128, 130,
132, 134, 197, 199,209-206
optimizacin simplex, 17, 168-170,208,212 prueba F sustituto, 128, 129,203

Вам также может понравиться