Вы находитесь на странице: 1из 83

1

ESTADISTICA EN QUIMICA ANALITICA


RESULTADOS CUANTITATIVOS ⇒ Deben ser válidos
(estimación de errores)
•Precisos
•Exactos
ADQUISICION
DE DATOS

DURANTE

DISEÑO MANIPULACION
ANALISIS
EXPERIMENTAL DE DATOS
ANTES DESPUES

2
CALIDAD CONFIABILIDAD

RESULTADO CONFIABLE

RESULTADO VALIDO

VALIDEZ: GRADO AL CUAL UNA


MEDICION (REALIZADA
MEDIANTE UN INSTRUMENTO
Y/O PROCEDIMIENTO
ANALITICO ESPECIFICOS)
PRODUCE EL RESULTADO
ESPERADO
3
CLASES DE ERRORES

Errores crasos
* Muy graves, abandonar el experimento

Errores aleatorios o indeterminados


* Producen una dispersión de los resultados
individuales a ambos lados de un valor medio

Errores sistemáticos o determinados


* Concordancia o proximidad al valor real, todos los
resultados son erróneos en el mismo sentido
(SESGO)
4
Resultado
correcto

d
9.7 10.0 10.3

5
6
ERRORES ALEATORIOS
 Se relacionan con la precisión
 NUNCA se pueden eliminar

Reproducibilidad: Concordancia de los valores cuando


las mediciones individuales se realizan
en condiciones no repetitivas
 Ocasiones diferentes
 Soluciones diferentes
 Variabilidad ambiental
 Material de vidrio diferente

Repetibilidad: Concordancia de los valores cuando las


mediciones individuales se realizan en
condiciones repetitivas 7
ERRORES SISTEMÁTICOS
 Se pueden eliminar con controles adecuados de la
técnica y el equipo

EXISTE ERROR SISTEMÁTICO?



Se debe de conocer el valor
verdadero

POCO PROBABLE

Fácil de cometer
errores sistemáticos
8
CAUSAS DE ERRORES SISTEMÁTICOS
1. Contaminación por el material usado y reactivos
utilizados

2. Lavado incompleto en análisis gravimétrico

3. Error del indicador en análisis volumétrico

4. Descalibración de equipos instrumentales (pH-metros,


termómetros, cronómetros, monocromadores
descalibrados, ect.)

9
ERRORES SISTEMÁTICOS

Los errores sistemáticos se pueden eliminar o minimizar


usando materiales de referencia y métodos estándar

Se puede evidenciar un error sistemático


analizando el analito por dos métodos no
relacionados

SOLO ERRORES ALEATORIOS


10
ESTADÍSTICA

Herramienta utilizada para discriminar entre las partes


sistemática (determinada) y al azar (indeterminada) de
una señal

error = ∆ + δ
Total Sistemática Al azar

Objetivo de una
medición
11
POBLACION Y MUESTRA

 POBLACIÓN
 Colección completa de objetos que comparten
una o más características

 Número infinito de resultados que, se puede


obtener con una infinita cantidad de muestra y en
una infinita cantidad de tiempo

 MUESTRA
Un subconjunto de una población

12
Leyes de la estadística

sólo para poblaciones

Leyes de la estadística para


muestras

La muestra debe ser representativa


de la población

13
MEDIA

 POBLACIÓN:
n

∑x i

µ = lim i =1

n→∞ n

 MUESTRA:
n

∑ xi
x = i =1
n
14
DESVIACIÓN ESTÁNDAR

 POBLACIÓN:
n

∑ (x i − µ)
2

σ = lim i =1

n→∞ n

 MUESTRA:
n

∑(x − x) i
2

σn-1
s= i =1 en calculadora
n −1
15
DESVIACIÓN ESTANDAR RELATIVA (RSD)
[COEFICIENTE DE VARIACIÓN (CV)]

s
RSD =
x
s
%RSD = ⋅100
x

VARIANZA S2
16
GRADOS DE LIBERTAD
 Número de valores no restringidos

Ejemplo:
• ESCOJA UN TOTAL DE 5 VALORES AL AZAR:
3 5 17 2 10
5 GRADOS DE LIBERTAD

• ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8:


3 5 17 2 13
4 GRADOS DE LIBERTAD

Para obtener un promedio de 8 después de


escojer los primeros 4 valores, el 13 y
solamente el 13 puede ser el 5o valor 17
GRADOS DE LIBERTAD
• ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8 Y
UNA DESVIACION ESTANDAR DE 6:
3 5 17 3.725 11.275
3 GRADOS DE LIBERTAD

Para obtener un promedio de 8 y una desviación estándar de


6, solamente los numeros 3.725 y 11.275 pueden ser el 4oy
el 5o valores, despues de escojer los primeros 3 numeros

EN GENERAL:

GL= n - m
Parámetros
Grados de Número de estadísticos
libertad datos calculados 18
DESVIACIÓN ESTÁNDAR PONDERADA O COMBINADA
Si se tienen varios subconjuntos de datos, se puede
obtener una mejor estimación de la desviación estándar
de la población mediante la combinación de datos que
usando sólo los datos de un subconjunto.

Se debe suponer que:


 Todas las mediciones presentan la misma fuente de error
aleatorio

 Todas las muestras deben de tener composición semejante

 Todas las muestras se deben de analizar de la misma forma

 Todas las muestras se extraen aleatoriamente de la misma


población (valor común de σ)
19
DESVIACIÓN ESTÁNDAR PONDERADA O COMBINADA
Los subconjuntos de datos pueden ser, por ejemplo:
 valores de diversos laboratorios
 datos obtenidos en varios días
 Instrumentos diferentes

s1, s2, s3, sk ⇒ desviaciones estándar de los subconjuntos

gl1, gl2, gl3, glk ⇒ grados de libertad de los subconjuntos

20
DESVIACIÓN ESTÁNDAR PONDERADA O COMBINADA
EJEMPLO:

La determinación de metil mercurio en peces en un área de


la bahía de Buenaventura proporcionó los siguientes datos
(a cada muestra se le hicieron tres preparaciones y todas
provienen de la misma población):

Muestra Metil mercurio


(mg/Kg)
1 1.32 1.23 1.24
2 2.19 1.97 2.07
3 1.80 1.83 1.79

Obtener el valor de scombinada (desviación estándar ponderada)


21
Medida de la dispersión
Desviación
de una serie de medidas
estándar
respecto a un valor medio

Tablas de Indica la forma de la


frecuencias e distribución alrededor
histogramas de un valor medio

1. La media de la muestra es una


Muestra de estimación de µ
gran tamaño
2. La desviación estándar de la
muestra es una estimación de σ
22
DISTRIBUCIÓN DE MEDIDAS REPETIDAS
En un laboratorio de control de calidad se
obtuvieron en los últimos 70 análisis datos del nivel
de tensoactivo en un Shampoo (%). Construya un
histograma.
10 17 9 17 18 20 16
7 17 19 13 15 14 13
12 13 15 14 13 10 14
11 15 14 11 15 15 16
9 18 15 12 14 13 14
13 14 16 15 16 15 15
14 15 15 16 13 12 16
10 16 14 13 16 14 15
6 15 13 16 15 16 16
12 14 16 15 16 13 15
23
TABLA DE FRECUENCIAS HISTOGRAMA

% Ten. Frecuencia La distribución de las mediciones


6 1
es cercanamente simétrica con
7 1
9 2
respecto a la media
10 3
11 2 16

12 4 14

13 10 12

14 11

Frecuencia
10

15 16 8

16 13 6

17 3 4

18 2 2

19 1 0

10
11

12
13

14

15
16

17
18

19

20
6

8
9
20 1
% Tensoactivo

Al aumentar el número de datos la


simetría se hace más aparente 24
LA DISTRIBUCION NORMAL
(GAUSSIANA)

Distribuciones normales con la


y = exp[ − ( x − µ ) 2σ 2 ] σ 2π
2
misma media pero diferentes
valores de la desviación estándar
25
PROPIEDADES DE LA DISTRIBUCIÓN NORMAL

Distribución normal
estandarizada
µ)/σ
Z=(Xi-µ σ
26
Áreas bajo la curva de Gauss
para varios valores de ± z

27
Áreas bajo la curva de Gauss
para varios valores de ± z

28
Áreas bajo la curva de Gauss
para varios valores de ± z

29
Áreas bajo la curva de Gauss
para varios valores de ± z

30
Áreas bajo la curva de Gauss
para varios valores de ± z

31
F(z), función de distribución acumulativa normal estándar

32
EJEMPLO
Si las medidas repetidas de una valoración se
distribuyen de forma normal con media de 10.15 mL y
desviación estándar de 0.02 mL, encontrar la proporción
de medidas que caen entre 10.12 y 10.20 mL.

*Para 10.12 z= (10.12 – 10.15)/0.02= -1.5


F(-1.5)= 0.0668

*Para 10.20 z= (10.20 – 10.15)/0.02= 2.5


F(2.5)= 0.9938

Proporción de medidas 0.9938 – 0.0668 = 0.927


33
EJERCICIOS
1- El valor medio del peso de una marca de jabón
durante el año pasado fue de 0,297 kg, su
desviación estándar fue 0,024 kg. Calcule el
porcentaje de datos que está comprendido
debajo del límite de especificación de 0,274 kg.

2- Con los datos anteriores, calcule el porcentaje


de datos comprendidos arriba de 0,347 kg.

3- Se desea que el 12.1 % del voltaje de línea esté por


debajo de los 115 V, ¿cómo habrá que ajustar el
voltaje medio? La dispersión es de σ=1.20 V.
34
DISTRIBUCIONES LOG-NORMAL
Distribución diferente a la normal al representar la
frecuencia frente a la concentración (u otra característica),
pero su frecuencia representada frente al logaritmo de la
concentración (u otra característica) proporciona una curva
de distribución normal.

Ejemplo: Concentración del anticuerpo inmunoglobulina M


en suero de individuos machos
35
DISTRIBUCIÓN MUESTRAL DE LA MEDIA

 La media de una serie de medidas proporciona una


estimación del valor verdadero, µ, (en ausencia de
errores sistemáticos ).
 Aun sin errores sistemáticos, las medidas individuales
varían por errores aleatorios y es poco probable que su
media corresponda en forma exacta al valor verdadero.
 Es más útil proporcionar un intervalo de valores donde
sea probable que se encuentre el valor verdadero.

El intervalo depende de:


1. Precisión de las medidas individuales (σ)
2. Número de medidas de la muestra
36
DISTRIBUCIÓN MUESTRAL DE LA MEDIA
0.51 0.51 0.51 0.50 0.51 0.49 0.52 0.53 0.50 0.47
0.51 0.52 0.56 0.48 0.49 0.50 0.52 0.49 0.49 0.50
0.49 0.48 0.46 0.49 0.49 0.48 0.49 0.49 0.51 0.47
0.51 0.51 0.51 0.48 0.50 0.47 0.50 0.51 0.49 0.48
0.51 0.50 0.50 0.53 0.52 0.52 0.50 0.50 0.51 0.51

0.506 0.504 0.502 0.496 0.502 0.492 0.506 0.504 0.500 0.486

Medias de cinco valores con


menor dispersión respecto a
todos los 50 datos originales

Su desviación estándar es el error


estándar de la media e.e.m.

e.e.m.= σ/√
√n 37
TEOREMA DEL LIMITE CENTRAL
Aún si la población original no es normalmente
distribuida, la distribución de las medias tiende a ser
más normalmente distribuida a medida que n aumenta

CONFIABILIDAD DE UN RESULTADO ANALÍTICO:

Resultado analítico = x ± Intervalo de confianza

INTERVALO DE CONFIANZA:
Rango dentro del cual se puede asumir razonablemente
que se encuentra el valor real a determinada probabilidad.

LÍMITES DE CONFIAZA:
Son los valores extremos de ese rango 38
DISTRIBUCIÓN
MUESTRAL DE
LA MEDIA

µ-1.96 * eem µ µ+1.96 * eem

Intervalo donde se encuentra el 95%


de las medias muestrales

39
 En la práctica se dispone habitualmente de una muestr
muestra,
de media conocida, y se busca un intervalo para µ, el valor
verdadero

Si la muestra es
grande, σ se
puede sustituir
por s

40
LIMITES DE CONFIANZA
Rango dentro del cual se puede asumir razonablemente
que se encuentra el valor real a determinada probabilidad.

 Para muestras grandes:


1.64 (90%)

z= 1.96 (95%)

2.58 (99%)
* Si se conoce σ se sustituye por s
 Para muestras pequeñas:
GL: grados de libertad

t= f(GL, P) P: probabilidad de que µ


este dentro del rango
establecido
41
Ejercicio:
Se determinó la concentración de plomo en la sangre
de 50 niños de una escuela cerca de una carretera con
mucho tráfico. La media fue de 10.1 ng/mL y la
desviación estándar fue de 0.6 ng/mL.

a. Calcular el intervalo de confianza de la


concentración media de plomo en todos los niños
de la escuela a un nivel de confianza del 95 %.
b. ¿Cuál debería ser el tamaño de la muestra para
reducir el rango de confianza a 0.2 ng/mL (es decir,
±0.1 ng/mL)?

42
Ejercicio:
El nivel de alcohol en tres muestras de sangre (%) es:
0.084 0.089 0.079
Calcular el intervalo de confianza al 95 % de nivel de
confianza para la media:

a. Cuando los tres resultados son la única indicación de la


precisión del método
b. Cuando con base en la experiencia propia de cientos
de muestras se sabe que s=0.005 % y es buena
estimación de las desviación estándar de la población,
s→σ

43
Los límites de confianza se pueden utilizar
como una prueba para detectar errores
sistemáticos

Ejemplo:
Se utilizó una solución de 0.1 M de ácido para valorar 10
mL de una solución de NaOH de 0.1 M dando los
siguientes volúmenes de ácido:
9.88 10.18 10.23 10.39 10.25 mL
Calcular los límites de confianza de la media al 95 % y
utilícelos para decir si existe alguna evidencia de error
sistemático.

44
Límites de confianza de la media geométrica
de una distribución log-normal
Ejemplo:
El diámetro de las gotas en un aerosol presenta un
comportamiento log-normal. Los diámetros de 10 gotas
de un líquido presentan los siguientes valores en
micrómetros:
3.43 2.56 1.34 1.13 3.56
2.01 2.23 2.78 1.12 1.65
Calcular el intervalo de confianza de la media
geométrica al 95% suponiendo que los diámetros de las
gotas se distribuyen log-normal.
45
PROPAGACION DEL ERROR ALEATORIO

 Los errores aleatorios se compensan entre sí

 Cada paso de un procedimiento puede tener una


incertidumbre en su medida (error aleatorio)

 Al combinar las diferentes mediciones (sumas, restas,


multiplicaciones, etc.) para calcular una cantidad final, el
error aleatorio se propaga y genera una desviación
estándar final

x=a+b Si, (a ± 1) y (b ± 1) el error


aleatorio de x NO es ± 2

46
PROPAGACIÓN DEL ERROR ALEATORIO

Suma o resta:
p, q y r son variables
experimentales

sp,sq y sr sus
desviaciones estándar

Ejemplo:
Calcular el peso promedio y su desviación estándar de
los siguientes valores: 1.56, 1.68, 2.36 g, cada uno de
los pesos con una desviación estándar de ± 0.03.
47
PROPAGACIÓN DEL ERROR ALEATORIO
Multiplicación o división:

Desviación
estándar relativa

Ejemplo:
La carga eléctrica se calcula a partir de la expresión Q=I.t,
donde I es la corriente en amperios y t el tiempo en
segundos. Calcular la desviación estándar relativa de la
carga si las desviación estándar relativa de la corriente es
0.030 y la del tiempo es 0.015 48
PROPAGACIÓN DEL ERROR ALEATORIO

Elevar a una potencia:

Desviación estándar
relativa
Ejemplo:
El producto de solubilidad del sulfato de bario es 1.3 x 10-10,
con una desviación estándar de 0.1 x 10-10. Calcular la
desviación estándar de la solubilidad calculada del sulfato
de bario en agua.
49
PROPAGACIÓN DEL ERROR ALEATORIO

Logaritmo:

Desviación
estándar
relativa

Ejemplo:
La ecuación de Nernst describe la relación entre el
potencial y la concentración del analito i expresada como
su actividad ai : E = Eº - (0.0592/n).log ai
Para n = 1, ¿cuál es el error en E para una ai = 0.53 con
una incertidumbre de ± 0.05 ? 50
PROPAGACIÓN DE ERRORES SISTEMÁTICOS
 El error sistemático tiene lugar en un sentido definido
y conocido.

Suma o resta:
 Los errores sistemáticos pueden ser tanto positivos
como negativos y estos signos se deben de incluir
en el calculo de ∆x

∆x = ∆p + ∆q + ∆r +…….

Multiplicación o división:

∆x/x = (∆
∆p/p) + (∆
∆q/q) + (∆
∆r/r) +….
51
PROPAGACIÓN DE ERRORES SISTEMÁTICOS

Elevar a una potencia:


Sin valor
absoluto

Logaritmo:

Sin valor
absoluto
Ejemplo:
Calcular el error sistemático resultante en la molaridad
cuando se pesa 4.1212 g de NaOH (balanza con error
sistemático de -0.0030 g) y se disuelve con agua hasta un
volumen de 100 mL (error sistemático del matraz: +1.5 mL)
52
PRUEBAS O CONTRASTES DE SIGNIFICACIÓN
 Un procedimiento sistemático que nos permite decidir
si un conjunto de mediciones repetidas muestra
evidencia de error sistemático
 Prueba si son significativas las diferencias entre dos
resultados (cantidad medida o resultado y la cantidad
conocida o real), o se pueden justificar sólo por
variaciones aleatorias
 El proposito de una prueba de significación es sacar
una conclusión acerca de una población utilizando
datos provenientes de una muestra
 Se comprueba la veracidad de una hipótesis (hipótesis
nula), la cual plantea que un método NO se encuentra
sujeto a errores sistemáticos
53
PRUEBAS O CONTRASTES DE SIGNIFICACIÓN
 La estadística calcula la probabilidad o posibilidad de
que la diferencia observada entre la media muestral,
x ,y el valor verdadero, µ, se debe solamente a un
error aleatorio.

A menor Menor probabilidad


probabilidad que que la hipótesis nula
 µ)
(x- sea verdadera
ocurra por azar

54
PRUEBAS O CONTRASTES DE SIGNIFICACIÓN
Ejemplo:
Ejemplo
En un método para determinar plomo en sangre por absorción
atómica se obtuvierón los siguientes valores para una
muestra estándar que contiene 38.9 ppb de plomo:
38.9 37.4 37.1
¿existe alguna evidencia de error sistemático?

x = 37 .80 s = 0.964
la pregunta es si la diferencia entre el resultado y el valor real
es estadísticamente significativa, o si se debe a meras
variaciones fortuitas (al azar)

55
56
SOLUCIÓN DEL EJEMPLO:
PASO 1
Se plantea la hipótesis nula, Ho, de que no hay error
sistemático. Uno no sabe si esta declaración es
cierta o es falsa, pero será asumida cierta hasta
que se pruebe que es falsa

PASO 2
Prueba estadística que condensa la información de
la muestra en un simple número.

x−µ n 37.8−38.9 3
t calc = tcalc = =1.98
s 0.964
57
PASO 3
Comparación con valores críticos tabulados
tcrit = 4.3 (P = 95%, f = 2)
Si tcalc excede el valor crítico, la hipótesis nula se
rechaza

Los valores críticos pueden intepretarse como


valores que son improbables* que sean
excedidos por la prueba estadística (tcalc) si la
hipótesis nula es cierta

* A UN 95% DE CONFIANZA, LA PROBABILIDAD ES


MENOR DE 5% (ES DECIR, MENOS QUE 1 EN 20) 58
tcalc < tcrit

1.98 < 4.3


PASO 4
Decisión: se retiene la hipótesis nula
No hay evidencia de error sistemático

No significa que no hay error sistemático, sino


que no se ha podido probar su existencia

NOTA IMPORTANTISIMA
LA DECISION DE RETENER LA HIPOTESIS NULA
NO SIGNIFICA QUE SE HA DEMOSTRADO QUE
ES CIERTA; SIMPLEMENTE NO SE PUDO
DEMOSTRAR QUE SEA FALSA
59
LA HIPOTESIS NULA SE USA
EN LAS CORTES CRIMINALES

EL ACUSADO SE ASUME “NO CULPABLE” HASTA QUE


SE DEMUESTRE QUE ES CULPABLE

VEREDICTO “NO CULPABLE” EN CORTE CRIMINAL

LA EVIDENCIA (PRUEBAS DE SIGNIFICACION) INDICA


QUE LA HIPOTESIS NULA DEBE CONSERVARSE

CONCLUSION:
 NO SE HA DEMOSTRADO QUE EL ACUSADO ES INOCENTE...
 LO QUE SE HA DEMOSTRADO ES QUE EL ACUSADO ES NO
CULPABLE 60
COMPARACIÓN DE LAS MEDIAS DE
DOS MUESTRAS
Es una forma en la cual los resultados de un muevo
método analítico pueden comprobarse por
comparación de los resultados obtenidos utilizando un
segundo método (de referencia)

*Se debe conocer ⇒ Método 1 Método 2


_ _
x1 x2
s1 s2
n1 n2

61
COMPARACIÓN DE LAS MEDIAS DE
DOS MUESTRAS
CASO I
Si s1 y s2 NO son significativamente diferentes:
Hipótesis nula: Los dos métodos producen el mismo resultado

fs +f s
Prueba estadística 2 2

=
x −x s =
2 1 1 2 2

f +f
1 2
t calc
1 1
s + 1 2

n n1 2
f1 grados de libertad método 1
f2 grados de libertad método 2
Estimación conjunta de tcalc tiene (n1+n2-2) grados de libertad
la desviación estándar
62
COMPARACIÓN DE LAS MEDIAS DE
DOS MUESTRAS
Ejemplo:
Se compararon dos métodos para la determinación de
boro en material vegetal

Método espectrofotométrico (1) Método fluorimétrico (2)


X = 28.0
1 X = 26.25
2

S1= 0.3 S2= 0.23


n1= 10 n2= 10

¿Estos dos métodos dan resultados cuyas medidas difieren


significativamente a un nivel de confianza del 95 %?
63
COMPARACIÓN DE LAS MEDIAS DE
DOS MUESTRAS
Ejemplo:
Se compararon dos métodos para la determinación de
cromo en muestras de hierba de centeno:
Método (1) Método (2)
X = 1.48mg/Kg X = 2.33mg/Kg
S1= 0.28 S2= 0.31
n1= 5 n2= 5
 ¿Estos dos métodos dan resultados cuyas medidas difieren
significativamente a un nivel de confianza del 95 %?
 Si la hipótesis nula fuera verdadera ¿la probabilidad de que la
diferencia de las medias se deba al azar será menor de 1 en 100?
64
COMPARACIÓN DE LAS MEDIAS DE
DOS MUESTRAS

CASO II
Si s1 y s2 son significativamente diferentes:
Hipótesis nula: Los dos métodos producen el mismo
resultado
Grados de libertad
Prueba estadística 2
s
2
s 
2

x −x  +  1 2

t =
calc
1
2
2
2 f =  n n 1
2 −22
2
s s s  2
s  2

+ 1 2
  1
  2

n n n  +n 
1 2
1 2
n +1 n +1
1 2

Se redondea al entero más cercano 65


COMPARACIÓN DE LAS MEDIAS DE
DOS MUESTRAS
Ejemplo:
La siguiente tabla proporciona la concentración de tiol en sangre
de dos grupos de voluntarios, el primer grupo es “normal” y el
segundo sufre de artritis reumatoide:

Concentracion de tiol (mM)


Normal Reumatoide
1.84 2.81 ¿Son los resultados de estas dos
1.92 4.06 muestras significativamente
1.94 3.62 diferentes a una P=0.005?
1.92 3.27
1.85 3.27
1.91 3.76
2.07
66
¿Qué prueba t utilizar?

SI CASO I
σ1 = σ2?
x1 − x 2
NO t calc =
CASO II 1 1
s +
n1 n2
x1 − x 2
t calc =
2 2 f s 2
+ f s 2
s1
+
s 2
s2 = 1 1 2 2
n1 n2 f1 + f 2
2
 s 12 s 22 

f =

 1n
+
n

2 
−2
f = f1 + f2
2 2
 s1 
2
 s2  2
   
 n1  +  n 2 
n1 + 1 n2 + 1 67
LA PRUEBA t POR PAREJAS
Circunstancias en las cuales es necesario o deseable
hacer una comparacion de medias por parejas

 Circunstancias en las cuales es necesario o deseable


hacer una comparación de medias por parejas
 Muestras de origenes diferentes y posiblemente con
concentraciones diferentes
 Muestras que se reciben en un período de tiempo largo (se
hace necesario eliminar efectos de condiciones
ambientales variables como temperatura, presión, etc.)

Se asume que cualquier error (sistemático o al


azar) es independiente de la concentración
68
LA PRUEBA t POR PAREJAS
Ejemplo:
La siguiente tabla proporciona la concentración de plomo
(mg/ml) por dos métodos diferentes para 4 muestras:
Muestra Método 1 Método 2
1 71 76
2 61 68
3 50 48
4 60 57

• Los dos métodos proporcionan valores para las


concentraciones medias de plomo que difieran
significativamente?
69
LA PRUEBA t POR PAREJAS
Solución al ejemplo:
 Se observa la diferencia entre cada par de resultados dados
por los dos métodos
 Hipótesis nula: No existen diferencias significativas
en las concentraciones dadas por los
dos métodos
Se debe de probar si la media de las diferencias
difiere significativamente de cero

Muestras Diferencias
X d = −1.75 s d = 4.99
1 -5
Medias de Desviación
2 -7 estándar de las
las
3 2 diferencias diferencias
4 3 70
LA PRUEBA t POR PAREJAS
Solución al ejemplo:
µd ⇒ Valor real de las diferencias
µd=0
Prueba estadística
XXXX

μμμμ dddd

XXXX ssss
dddd

dddd
tttt calc

nnnn

nnnn
− Tiene (n-1)
ssss dddd
= = grados de

dddd
libertad
1.4
tttt calc

4444
0.70

− tcalc < tcrit


= =
7.599

Se acepta la
tcrit=3.18 (P=0.05, f=3) hipótesis nula
71
LA PRUEBA t POR PAREJAS
Ejemplo:
Se analiza la concentración de paracetamol (% p/p) en
pastillas por dos métodos diferentes. Se analizaron
diez patillas de diez lotes diferentes para ver si diferían
los resultados obtenidos por los dos métodos.
Lote Método UV Método IR
1 84.63 83.15
2 84.38 83.72
3 84.08 83.84  Mediante una prueba t por
4 84.41 84.20 parejas contrastar si los dos
5 83.82 83.92 métodos producen resultados
6 38.55 84.16
significativamente diferentes
7 83.92 84.02
8 83.69 83.60
9 84.06 84.13
10 84.03 84.24
72
LAS PRUEBAS DE UNA Y DOS COLAS

DOS COLAS (bilateral) UNA COLA (unilateral)

Diferencia de dos medias Se tiene una idea


en cualquier dirección, no preconcebida sobre el
se tiene en cuenta el signo de la diferencia

XXXX
μμμμ
( )
signo de la diferencia
XXXX
μμμμ
,,,,


( )+
oooo

− −
Se conoce su signo
No se tiene una
idea preconcebida
del signo de la
diferencia
73
LAS PRUEBAS DE UNA Y DOS COLAS

DOS COLAS (bilateral) UNA COLA (unilateral)

Incremento

_ µ + µ +
A un n dado y
una determinada
Decremento
probabilidad, se
determina tcrit

_ µ
95% ⇒ P=0.05 74
UNA COLA (unilateral)

La probabilidad es la mitad de
la probabilidad en una bilateral

0.05 x 2 = 0.10
El tcrit se determina en la columna P = 0.10

Ejemplo:
Se sospecha que una valoración acido-base tiene un error de
indicador significativo y tiende a dar resultados con un error
sistemático positivo (sesgo positivo). Para comprobarlo, se utiliza
una disolución de ácido exactamente 0.1 M para valorar 25.00 mL
de otra disolución de una base, exactamente 0.1 M con los
siguientes resultados (mL):
25.06 25.18 24.87 25.51 25.34 25.41
• Probar la existencia de sesgo positivo en estos resultados 75
EL CONTRASTE F PARA LA COMPARACIÓN DE
DESVIACIONES ESTÁNDAR
 Las pruebas anteriores (t) comparan medias y detectan
errores sistemáticos
 La prueba F compara desviaciones estándar, o sea los
errores aleatorios de dos conjuntos de datos
USOS:
1. Probar si el método A es más preciso que el método B
(prueba de una cola). Se tiene una idea predeterminada
que un método es MÁS preciso que el otro.
2. Probar si los métodos A y B difieren en su precisión
(prueba de dos colas). No se tiene idea preconcebida de
cual es más preciso.
antes de una prueba t 76
EL CONTRASTE F PARA LA COMPARACIÓN DE
DESVIACIONES ESTÁNDAR

 El contraste F considera la razón de las dos varianzas


muestrales:

s 2

F =
cal
1
F siempre debe ser ≥ 1
s 2

 Se asume que las poblaciones de donde se toman


las muestras son normales

H0 : Las desviaciones estándar de las poblaciones


no difieren significativamente (la relación de
varianzas es próxima a la unidad)
77
EL CONTRASTE F PARA LA COMPARACIÓN DE
DESVIACIONES ESTÁNDAR
Ejemplo: Se compararon dos métodos para la determinación
de cromo en muestras de hierba de centeno:
Método (1) Método (2)  ¿Las varianzas de
X = 1.48mg/Kg X = 2.33mg/Kg ambos métodos son
S1= 0.28 S2= 0.31 significativamente
n1= 5 n2= 5 iguales?

Ejemplo: Se compara un método propuesto para la


determinación de la demanda de oxígeno (ppm) en aguas
con un método estándar.
Método estándar (1): media: 72 s1=3.31 n=8
Método propuesto (2): media: 72 s2=1.51 n=8

¿Es más preciso el método propuesto que el método estándar? 78


79
CONTRASTE DE DIXON PARA DATOS ANNOMALOS
(Contraste Q)
 Es una prueba con la cual se contrastan estadísticamente
datos anómalos para determinar si se rechazan o no (para
muestras pequeñas, de 3 a 7 datos).

Ho: Todas las medidas provienen de la misma población

(resultado sospechoso - resultado más próximo)


Qcalc=
rango de resultados

 Si Qcalc > Qcrit , el resultado sospechoso puede descartarse


Valores críticos de Q (P=0.05), contraste de dos colas
Tamaño de muestra Valor crítico
4 0.831
5 0.717
6 0.621
80
7 0.570
CONTRASTE DE DIXON PARA DATOS ANNOMALOS
(Contraste Q)
Ejemplo:
1. Se obtuvieron los siguientes valores para la concentración
de nitrito (ppm) en una muestra de agua de río:
0.403 0.410 0.401 0.380
¿Debería rechazarse la última medida sospechosa?

2. A los datos anteriores se adicionaron otras tres nuevas


medidas,
0.403 0.410 0.401 0.380 0.400 0.413 0.411

¿Se debería aún mantener el valor 0.380?


81
CONTRASTE DE GRUBBS (Contraste G)

 También usado para datos anómalos

Ho: Todas las medidas provienen de la misma población

valor sospechoso - x
Gcalc=
s

Ejemplo:
Aplicar el contraste de Grubbs
a los datos del último ejemplo

82
Ejercicios
Datos Datos
A B
1. Realizar los contrastes Q y G para el valor
1.84 2.81
2.07 de los datos A y el valor 2.81 de los
1.92 4.06
1.94 3.62
datos B, ¿son datos anómalos?
1.92 3.27 2. Demostrar si las varianzas de los dos grupos
1.85 3.27
de datos difieren significativamente.
1.91 3.76
2.07

3. Los siguientes datos proporcionan la recuperación de bromuro


adicionado a muestras con contenido vegetal, medido mediante un
método de cromatografía gas-líquido. La cantidad de bromuro potásico
añadido a cada vegetal fue la misma.
Tomate 777 790 759 790 770 758 764 µg/g
Pepino 782 773 778 765 789 797 782 µg/g
a) Pruebe si la recuperación en los vegetales tiene varianzas que difieran
significativamente.
b) Pruebe si las tasas de recuperación media difieren significativamente.
83

Вам также может понравиться