Вы находитесь на странице: 1из 171

CURSO TALLER DE

GEOESTADÍSTICA APLICADO AL
YACIMIENTO DE ANTAMINA

Por:
Alfredo Marín Suárez Ph.D.

Diciembre del 2013 – Mayo del 2014


CONTENIDO
 ANÁLISIS EXPLORATORIO DE DATOS
I. ESTADÍSTICA, CLUSTER Y DECLUSTER, ERRORES DE MUESTREO SEGÚN
NUQUIST SHANNON Y PIERRE GY

II. HISTOGRAMA
III. TEOREMA CENTRAL DE LÍMITE

- Construcción de histogramas experimentales de las variables


regionalizadas.
- Análisis e interpretación de histogramas experimentales.
- Detección de diversas poblaciones o poblaciones erráticas.
- Modelado de los histogramas experimentales de las variables
regionalizadas estudiadas.
- Análisis del grado de log normalidad de la distribución de la ley de cobre.
IV. DISTRIBUCIÓN T DE STUDENT
V. DISTRIBUCIÓN CHI CUADRADO

2
CONTENIDO
VI. DIAGRAMA DE DISPERSIÓN Y RECTA DE REGRESIÓN
VII. TEORÍA DE CORRELACIÓN DE MUESTRAS
- Nubes de correlación, uso de P-P Plot y Q-Q Plot.
VIII.MOVIMIENTOS MEDIOS O MEDIA MÓVIL
IX. QA – QC Y MUESTREO

3
I. ESTADÍSTICA, CLUSTER Y
DECLUSTER, ERRORES DE
MUESTREO SEGÚN NYQUIST-
SHANNON Y PIERRE GY

4
El estudio de las leyes formales de lo aleatorio es
la Probabilidad

5
EEstadística es la ciencia,
pura y aplicada.

6
El Objetivo de la Estadística
Descriptiva
Conocer la información que se tiene para
poder identificar e interpretar aspectos
relevantes de una muestra.
Utilizar esta información para obtener
resultados, planear o hacer inferencia acerca de
la población bajo estudio.

7
Etapas de un estudio estadístico
Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el
llamado método científico cuyas etapas son:

1) Planteamiento del problema: consiste en definir el objetivo de la


investigación y precisar el universo o población.

2) Recopilación de la información: consiste en recolectar los datos


necesarios relacionados al problema de investigación.

3) Análisis descriptivo: consiste en resumir los datos disponibles para


extraer la información relevante en el estudio.

4) Inferencia estadística: consiste en suponer un modelo para toda la


población partiendo de los datos analizados y obtener conclusiones
generales.

5) Diagnóstico: consiste en verificar la validez de los supuestos del modelo


que nos han permitido interpretar los datos y llegar a conclusiones sobre
la población. 8
Los datos son la materia prima del estadístico.
Usa los números para interpretar la realidad. Todos
los problemas estadísticos involucran la recoleccíón, la
descripción y el análisis de los datos, o pensar cómo
recolectar, describir y hacer el análisis de los datos.

8
3 2 3
9 1
3 5
0 05 3
7
4 89
8

9
Población

MUESTRA
Muestra

Transformación Análisis
Sumarización Estimación
Ilustración Hipótesis
10
¿Tengo un 98% de probabilidad
de hacer algo que tenga sentido
con estos números?

8
3 2 3
9 1
3 5
0 0 5 3
4 89 7
8

11
El conjunto de datos que describen un
fenómeno (nuestro objetivo) constituyen lo
que se llama Población

Una Muestra es un subconjunto de la


población, sobre la cual vamos a realizar las
medidas de una o más características de
interés.

12
Una característica importante de una
muestra es que sea Representativa
de la población de interés. Cualquiera

que sea nuestro objetivo:


describir a la población, analizar o
pronosticar el comportamiento de la
población, la muestra, al ser
representativa, será Confiable

13
- Cada unidad tiene la misma
oportunidad de ser elegida

- La selección de una unidad


Muestreo
no tiene influencia sobre la Aleatorio
elección de otra unidad

14
Muestreo Estratificado

- Divide a la población en
grupos homogéneos Muestreo por
Conglomerado
- Se extrae una muestra
aleatoria simple de cada
grupo o estrato - Divide a la población en
grupos
-Se extrae una muestra
aleatoria simple de los grupos

15
Muestreo Sistemático

- Se elige aleatoriamente a
una unidad
- A partir de ésta se selecciona
cada k-ésima muestra que se
encuentra después de la
elegida

Muestreo
Oportunista
-Se muestrean los n primeros
elementos que se presentan
16
Métodos Numéricos
(Válidos sólo para datos cuantitativos)

Si pudiéramos escoger entre dos números que nos ayuden a


construir una imagen mental burda de la distribución de un
conjunto de datos ¿Cuáles escogeríamos?

- Un número que esté localizado cerca


del centro de la distribución

- Un número que mida la 9


9
3 39 1
9 19 3 3 2 1 5
dispersión de la distribución 0 0
9 0 3 13 591
9 10
0 3
2
3251 5
5
3 5 1 5
30 0 5 3 0 8 53 25 5
304 3 3 7 5 0 7 3
3 8 3 0 97 5 5 3 30 4 383
4 8 9 3 8 8 437 5 373 8 5 7 0 3

8
4 8 79 8 4 38
4 8 8 9 9 8

8
200
8

9 97 8 3
8
4 68
68 9 3 20

8
6 3 2
6 6
6 6 3 2
6

17
Teorema del Error Fundamental del
Muestreo de Nyquist - Shannon
Consiste en que se produce una pérdida de
información, en el proceso de
cuantificación, que se traduce a una
distorsión como error o “Ruido de
cuantificación”.

18
Tipos de Errores de Muestreo según
Nyquist - Shannon y Pierre Gy

19
Medidas de Tendencia Central
Son números que se localizan cerca del centro o cerca de
donde se encuentran los datos con mayor frecuencia:
media, mediana, moda

Medidas de Dispersión
Son números que indican qué tan separados están los
datos entre si: rango, desviación estándar,
rango intercuartil 20
Estadística Descriptiva

Medidas de centralización
• La media aritmética:

• La moda:
El valor que aparece
con mayor frecuencia
• La mediana:

El valor central cuando los datos se


ordenan de menor a mayor. El 50 %
de los valores son inferiores y el 50 %
superiores

21
22
23
Distribución bi-variada
cuando se dispone de observaciones de dos
variables en los mismos puntos, u

• Gráficos de dispersión

•Para distribuciones muy sesgadas


se puede necesitar dos gráficos
para representar con más detalle
los puntos cerca del origen.

•Otra solución: usar una escala


logarítmica

24
Distribución

25
Cluster y Decluster
Si dividimos el área de muestreo en regiones
rectangulares que llamaremos celdas. Entonces
cada muestra recibe un peso inversamente
proporcional al número de muestras que caen
dentro de la misma celda, así tal como se
muestra en el gráfico siguiente:

26
27
Aplicando
el Método
de los
Polígonos

28
II. HISTOGRAMA

29
Histogramas Experimentales

30
Estadística descriptiva
Representar la variación

¿Qué aprendemos del • Estimación de la función de densidad


histograma? • Tipo de distribución (Normal, log-normal, ...)
• Distribución uni-modal, multi-modal
• Aparición de valores extremos y outliers
• Variabilidad del fenómeno

Histograma Histograma
bi-modal acumulativo

31
DISTRIBUCIÓN LOGNORMAL

Sea 𝑥1 𝑥2 𝑥3 … 𝑥𝑛

1 𝐿𝑛𝑥−𝛼 2
1 −
2 𝛽 2
𝑓 𝑥 = 𝑒
2𝜋 𝑥 𝛽

𝛼 = 𝜇𝑦 𝛽 = 𝜎𝑦
𝜇𝑦 : Media de los logaritmos
𝜎𝑦 : Desviación estándar de los logaritmos
32
Gráfica de la distribución
Lognormal

33
Otros ejemplos de
distribución lognormal

34
Relacionados por:

𝛽2
∝+
𝜇𝑥 = 𝑒 2

2 2𝛼+𝛽 2 𝛽 2
𝜎𝑥 = 𝑒 (𝑒 − 1)

35
LEY DE LA DISTRIBUCIÓN NORMAL O
GAUSSIANA
Tomando logaritmos
𝐿𝑛𝑥1 , 𝐿𝑛𝑥2 , 𝐿𝑛𝑥3 , … , 𝐿𝑛𝑥𝑛 = *𝑦1 , 𝑦2 , 𝑦3 , … 𝑦𝑛 +

𝜇𝑦 𝛼
𝜎𝑦 = 𝛽

36
𝑦−𝜇 2
1 𝑦
1 −
2 𝜎𝑦
𝑓(𝑦) = 𝑒
2𝜋 𝜎𝑦

37
Gráfica de la distribución
Normal

𝑁 𝜇𝑌 𝜎𝑌

38
39
TABLA DE LA DISTRIBUCIÓN NORMAL

40
ANOMALÍA

= +

41
SECCIÓN

A B

42
PP-PLOT SIN ANOMALÍA

Teóórico

Observado
43
SECCIÓN

44
PP-PLOT CON ANOMALÍA

45
99.99 Probabilidad Acumulada del Zn con anomalía

99.9
99.8
99
98
95
Cumulative Probability

90
80
70
60
50
40
30
20
10
5
2
1
.2
.1

.01
.010 .10 1.0 10. 100.

Zn %

46
III. TEOREMA CENTRAL DE LÍMITE

47
El Ruso Alexander Lyapunov (1900) demostró el
teorema central de límite al estudiar la
naturaleza de la distribución de Gauss.

48
49
Considerando la función:
2
1 𝑦−𝜇𝑦
1 −
2 𝜎𝑦2
𝑓 𝑦 = 𝑒
2𝜋𝜎𝑦
Donde:

𝑦 : es un valor de la variable aleatoria


𝜇𝑦 : Media aritmética
𝜎𝑦 : Desviación estándar
𝑓(𝑦) : Función de la ley de distribución de Gauss
50
Dado valores random en el intervalo ]0,1[

𝑟1 + 𝑟2 + 𝑟3 + ⋯ + 𝑟𝑛

Aplicamos el operador Esperanza.

𝐸 𝑟1 + 𝑟2 + 𝑟3 + ⋯ + 𝑟𝑛

𝐸𝑟1 + 𝐸𝑟2 + 𝐸𝑟3 + ⋯ + 𝐸𝑟𝑛

51
𝑛

𝐸 𝑟𝑖 = ∅ + ∅ + ∅ + ⋯ + ∅ = 𝑛∅
𝑖=1

52
Analíticamente

1
𝑓 𝑥 =
𝑏−𝑎

53
𝑏 𝑏
1
𝜇1 = 𝑓 𝑥 . 𝑥 𝑑𝑥 = 𝑥 𝑑𝑥
𝑎 𝑏−𝑎 𝑎

2 𝑏
1 𝑥 1 𝑏2 𝑎2
𝜇1 = = −
𝑏−𝑎 2 𝑎
𝑏−𝑎 2 2

54
𝑎 = 0 ,𝑏 = 1

1 2 2
𝑏+𝑎 1
𝜇1 = 𝑏 −𝑎 = =
2(𝑏 − 𝑎) 2 2

1
𝜇1 =
2

55
𝜎 2 = 𝜇2 − 𝜇1 2

𝑏
𝜇2 = 𝑓 𝑥 𝑥 2 𝑑𝑥
𝑎

𝑏 3 𝑏
1 2
1 𝑥 1 𝑏3 𝑎3
𝜇2 = 𝑥 𝑑𝑥 = = −
𝑏−𝑎 𝑎 𝑏−𝑎 3 𝑎
𝑏−𝑎 3 3

56
Sabiendo que:

1 b 3 − a3 1 2
= a + ab + b2
3 b−a 3

𝑎2 + 𝑎𝑏 + 𝑏 2 𝑎+𝑏 2 𝑏−𝑎 2
𝜎 2 = 𝜇2 − 𝜇1 2 = − =
3 4 12

𝑎 = 0 ,𝑏 = 1
2
1
𝜎 =
12 57
Entonces:

1 1
2
𝜇1 = y 𝜎 = ∀ 𝑟 ∈ > 0,1 < 𝑅𝑎𝑛𝑑𝑜𝑚
2 12

𝐸 𝑟𝑖 = 𝑛∅ y 𝑉𝑎𝑟 (𝑟1 + 𝑟2 + 𝑟3 + ⋯ + 𝑟𝑛 )
𝑖=1

58
𝑉𝑎𝑟 (𝑟1 ) + 𝑉𝑎𝑟(𝑟2 ) + 𝑉𝑎𝑟(𝑟3 ) + ⋯ + 𝑉𝑎𝑟(𝑟𝑛 )

𝜎 2 + 𝜎 2 + 𝜎 2 + ⋯ + 𝜎 2 = 𝑛𝜎 2

𝑛 𝑏
𝑖=1 𝑟𝑖
− 𝑛∅ 1
𝑃 1
−2𝑧 2
𝑎< <𝑏 → 𝑒 𝑑𝑧
𝑛→∞ 𝜎 𝑛 2𝜋 𝑎

59
Proceso de Aplicación

𝑛
𝑦 − 𝜇𝑦 𝑖=1 𝑟𝑖− 𝑛∅
=
𝜎𝑦 𝜎 𝑛

𝑛
𝑖=1 𝑟𝑖 − 𝑛∅
𝑦 = 𝜎𝑦 + 𝜇𝑦
𝜎 𝑛

Con lo que podemos simular variables de la


realidad
60
61
RESUMEN

DATOS ANÁLISIS ESTADÍSTICO

Leyes del Molibdeno en ppm


165 220 232 248 266 290
182 221 236 250 270 298
199 225 238 251 272 301
209 228 240 256 277 320
210 230 245 262 283 338
MEDIA 248.7
DESVIACION STANDARD 38.96
A continuación se muestran las Leyes del molibdeno

Leyes del Molibdeno en ppm


165 220 232 248 266 290

182 221 236 250 270 298

199 225 238 251 272 301

209 228 240 256 277 320

210 230 245 262 283 338

MEDIA 248.7

DESVIACION STANDARD 38.96

63
El comportamiento estadístico de estos datos será
presentado en una tabla de frecuencias y sus
respectivas gráficas.

64
Frecuencia relativa del Molibdeno

65
Frecuencia relativa acumulada
66
IV. DISTRIBUCIÓN T DE STUDENT
Sea el estadístico

𝑋−𝜇 𝑋−𝜇
𝑡 = 𝑁−1 =
𝑠 𝑠
𝑁

67
La distribución muestral de t viene dada por :

𝑌0
𝑌 = (𝜈+1)
𝑡2 2
1+
𝜈
Donde:
𝑌0 es una constante que depende de N
𝜈 = (N-1) se llama número de grados de libertad

68
69
70
Para grandes valores de 𝜈 o N (N > 30), la
distribución se aproxima estrechamente a la curva
normal tipificada

1 1
− 𝑡2
𝑌 = 𝑒 2
2𝜋

71
Intervalos de confianza de t - Student

Se pueden definir intervalos de confianza del 95%, 99%


u otros distintos mediante la tabla de la distribución de
t.
De esta forma se puede determinar dentro de unos
determinados límites de confianza la media de la
población µ.

72
Ejemplo: Intervalos de confianza

Por ejemplo, si − 𝒕𝟎.𝟗𝟕𝟓 y 𝒕𝟎.𝟗𝟕𝟓 son los


valores de t para los que el 2.5 % del área se
encuentra en cada “cola” de la distribución t,
entonces un intervalo de confianza del 95% para
t será

𝑿−𝝁
−𝒕𝟎.𝟗𝟕𝟓 < 𝑵 − 𝟏 < 𝒕𝟎.𝟗𝟕𝟓
𝒔

73
Despejar 𝜇
𝑋−𝜇
−𝑡0.975 < 𝑁 − 1 < 𝑡0.975
𝑆

1 𝑡0.975 𝑋−𝜇 𝑡0.975


× − < <
𝑁−1 𝑁−1 𝑆 𝑁−1

𝑆 𝑆
× 𝑆 − 𝑡0.975 < 𝑋 − 𝜇 < 𝑡0.975
𝑁−1 𝑁−1

74
𝑆 𝑆
+ −𝑋 − 𝑋 − 𝑡0.975 < −𝜇 < 𝑡0.975 −𝑋
𝑁−1 𝑁−1

𝑆 𝑆
× −1 𝑋 + 𝑡0.975 > 𝜇 > 𝑋 − 𝑡0.975
𝑁−1 𝑁−1

𝑆 𝑆
𝑋 − 𝑡0.975 < 𝜇 < 𝑋 + 𝑡0.975
𝑁−1 𝑁−1

75
De lo que se deduce que 𝜇 se encuentra en el
intervalo
𝑠 𝑠
𝑋 − 𝑡0.975 < 𝜇 < 𝑋 + 𝑡0.975
𝑁−1 𝑁−1
Con el 95% de confianza (es decir, probabilidad
de 0.95).

76
Intervalos de confianza de t - Student

En general, pueden representarse los límites de


confianza para medias poblacionales por

𝑠
𝑋 ± 𝑡𝑐
𝑁−1

Donde los valores ± 𝑡𝑐 , llamados valores críticos o


coeficientes de confianza, dependen del nivel de
confianza deseado y del tamaño de la muestra.
77
Ejercicio
Una muestra de (N = 10 ) medidas de leyes de
Zn en un laboratorio dio una media ( 𝑿 = 𝟒. 𝟑𝟖 %)
y una desviación típica ( 𝒔 = 𝟎. 𝟎𝟔 %) . Hallar los
límites de confianza para la ley verdadera del
95%.

78
Solución
Los límites de confianza del 95% son dados por
𝒔
𝑿 ± 𝒕𝒄
𝑵−𝟏

𝑡𝑐 : 𝑉𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜 𝑜 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎


Aplicando al ejemplo
𝝂 = 𝑵 − 𝟏 = 𝟏𝟎 − 𝟏 = 𝟗
Y con 𝒕𝟎.𝟗𝟕𝟓 𝒕𝒆𝒏𝒆𝒎𝒐𝒔 𝒖𝒏 𝒗𝒂𝒍𝒐𝒓 𝒄𝒓í𝒕𝒊𝒄𝒐 𝒕𝒄 𝟐. 𝟐𝟔

Entonces, utilizando 𝑿 = 𝟒. 𝟑𝟖 𝒚 𝒔 = 𝟎. 𝟎𝟔
79
Los límites de confianza del 95% pedidos son
𝟎. 𝟎𝟔
𝟒. 𝟑𝟖 ± 𝟐. 𝟐𝟔
𝟏𝟎 − 𝟏

= 𝟒. 𝟑𝟖 ± 𝟎. 𝟎𝟒𝟓𝟐%
Así pues, se puede estar en la confianza del 95% de
que el valor verdadero se encuentra entre

𝟒. 𝟑𝟖 − 𝟎. 𝟎𝟒𝟓 = 𝟒. 𝟑𝟑𝟓 % y
𝟒. 𝟑𝟖 + 𝟎. 𝟎𝟒𝟓 = 𝟒. 𝟒𝟐𝟓 %

80
81
V. DISTRIBUCIÓN CHI - CUADRADO
Sea el estadístico

𝑁𝑠 2 𝑋1 − 𝑋 2 + 𝑋2 − 𝑋 2 + ⋯ + 𝑋𝑁 − 𝑋 2
𝜒2 = 2 =
𝜎 𝜎2

82
La distribución llamada distribución chi – cuadrado
viene dado por:

1 2
𝜈−2 −2𝜒
𝑌= 𝑌0 𝜒 𝑒

Donde:
𝑌0 es una constante que depende de 𝜈
𝜈 = (N-1) se llama número de grados de libertad

83
84
Gráfica de la distribución Chi-Cuadrado

85
LA PRUEBA CHI-CUADRADO
Una medida de la discrepancia existente entre las
frecuencias observadas y esperadas es suministrada
𝝌𝟐
por el estadístico (léase chi-cuadrado), dado por

𝒌 𝟐
𝟐 𝟐 𝟐 𝒐𝒋 − 𝒆𝒋
𝒐𝟏 − 𝒆𝟏 𝒐𝟐 − 𝒆𝟐 𝒐𝒌 − 𝒆𝒌
𝝌𝟐 = + + ⋯+ =
𝒆𝟏 𝒆𝟐 𝒆𝒌 𝒆𝒋
𝒋=𝟏

Donde si el total de frecuencias es N,

𝒐𝒋 = 𝒆𝒋 = 𝑵
86
Ejercicio 1

La tabla siguiente muestra las frecuencias observadas y


esperadas al lanzar un dado 120 veces. Ensayar la
hipótesis de que el dado esté bien hecho al nivel de
significación del 0.05.

Cara 1 2 3 4 5 6
Frecuencia 25 17 15 23 24 16
Observada
Frecuencia 20 20 20 20 20 20
Esperada
87
Solución
𝟐 𝟐 𝟐 𝟐 𝟐 𝟐
𝟐
𝒐𝟏 − 𝒆𝟏 𝒐𝟐 − 𝒆𝟐 𝒐𝟑 − 𝒆𝟑 𝒐𝟒 − 𝒆𝟒 𝒐𝟓 − 𝒆𝟓 𝒐𝟔 − 𝒆𝟔
𝝌 = + + + + +
𝒆𝟏 𝒆𝟐 𝒆𝟑 𝒆𝟒 𝒆𝟓 𝒆𝟔

25 − 20 2 17 − 20 2 15 − 20 2 23 − 20 2 24 − 20 2 16 − 20 2
+ + + + +
20 20 20 20 20 20

= 𝟓. 𝟎𝟎
Por otra parte el número de categorías o clases
(caras 1, 2, 3, 4, 5, 6) es k = 6,
𝝂 = 𝒌 − 𝟏 = 𝟔 − 𝟏 = 𝟓 𝒈𝒓𝒂𝒅𝒐𝒔 𝒅𝒆 𝒍𝒊𝒃𝒆𝒓𝒕𝒂𝒅
88
El valor crítico 𝝌𝟐𝟎.𝟗𝟓 para 5 grados de libertad es
11.1. Entonces, puesto que 5.00 < 11.1 no se puede
rechazar la hipótesis de que el dado está bien hecho.

89
90
VI. DIAGRAMA DE DISPERSIÓN Y
RECTA DE REGRESIÓN

91
Sea la ecuación de la recta de mínimos cuadrados

𝑌 = 𝑎0 + 𝑎1 𝑋
Los valores de Y en esta recta correspondientes a

𝑋 = 𝑋1 , 𝑋2 , … , 𝑋𝑁
Son

𝑎0 + 𝑎1 𝑋1 , 𝑎0 + 𝑎1 𝑋2 , . . . , 𝑎0 + 𝑎1 𝑋𝑁

92
Mientras que los valores reales son

𝑌1 , 𝑌2 , … , 𝑌𝑁
respectivamente.

Entonces, la recta de mínimos cuadrados es tal que:

𝑺 = 𝒂𝟎 + 𝒂𝟏 𝑿𝟏 − 𝒀𝟏 𝟐 + 𝒂𝟎 + 𝒂𝟏 𝑿𝟐 − 𝒀𝟐 𝟐 + ⋯ + 𝒂𝟎 + 𝒂𝟏 𝑿𝑵 − 𝒀𝑵 𝟐

es mínimo.

93
Pero S es mínimo cuando las derivadas parciales de S con
respecto a 𝑎0 𝑦 𝑎1 son cero.

Entonces
𝝏𝑺
= 𝟐 𝒂𝟎 + 𝒂𝟏 𝑿𝟏 − 𝒀𝟏 + 𝒂𝟎 + 𝒂𝟏 𝑿𝟐 − 𝒀𝟐 + ⋯ + 𝒂𝟎 + 𝒂𝟏 𝑿𝑵 − 𝒀𝑵 =𝟎
𝝏𝒂𝟎

𝝏𝑺
= 𝟐 𝒂𝟎 + 𝒂𝟏 𝑿𝟏 − 𝒀𝟏 𝑿𝟏 + 𝒂𝟎 + 𝒂𝟏 𝑿𝟐 − 𝒀𝟐 𝑿𝟐 + ⋯ + 𝒂𝟎 + 𝒂𝟏 𝑿𝑵 − 𝒀𝑵 𝑿𝑵 = 𝟎
𝝏𝒂𝟏

94
Y de aquí se obtienen las ecuaciones normales:

𝑁𝑎0 + 𝑎1 ΣX − ΣY = 0

𝑎0 Σ𝑋 + 𝑎1 Σ𝑋 2 − ΣXY = 0

95
Que dan:

Σ𝑌 Σ𝑋 2 − Σ𝑋 Σ𝑋𝑌
𝑎0 =
𝑁Σ𝑋 2 − Σ𝑋 2

𝑁Σ𝑋𝑌 − Σ𝑋 Σ𝑌
𝑎1 =
𝑁Σ𝑋 2 − Σ𝑋 2

𝑌 = 𝑎0 + 𝑎1 𝑋
96
Ejercicio

La tabla 1 muestra los respectivos valores X e Y de una


muestra de 12 leyes de Molibdeno (ppm) de dos
laboratorios A y B.

a) Construir un diagrama de dispersión.


b) Hallar la recta de regresión de mínimos cuadrados
de Y sobre X.

97
Tabla 1
Ley de Mo (ppm) -
65 63 67 64 68 62 70 66 68 67 69 71
Laboratorio A

Ley de Mo (ppm) -
68 66 68 65 69 66 68 65 71 67 68 70
Laboratorio B

98
a) El diagrama de dispersión se obtiene representando
los puntos (X,Y) sobre un sistema de coordenadas
rectangulares, como se muestra en la figura siguiente.

99
Y Dispersión Lab A - Lab B
72
71
70
69
Ley Mo (ppm) - Lab B

68
67
66
65
64
63
62
61 X
61 62 63 64 65 66 67 68 69 70 71 72
Ley Mo (ppm) - Lab A
100
b) La recta de regresión Y sobre X está dada por

𝑌 = 𝑎0 + 𝑎1 𝑋
donde 𝑎0 𝑦 𝑎1 se obtienen resolviendo el sistema
de ecuaciones normales

ΣY = 𝑎0 𝑁 + 𝑎1 ΣX

ΣXY = 𝑎0 Σ𝑋 + 𝑎1 Σ𝑋 2
101
Las sumas se muestran en la siguiente tabla
Tabla 2
Nº X Y X2 XY
1 65 68 4225 4420
2 63 66 3969 4158
3 67 68 4489 4556
4 64 65 4096 4160
5 68 69 4624 4692
6 62 66 3844 4092
7 70 68 4900 4760
8 66 65 4356 4290
9 68 71 4624 4828
10 67 67 4489 4489
11 69 68 4761 4692
12 71 70 5041 4970
∑X = 800 ∑Y = 811 ∑X2 = 53418 ∑XY = 54107

102
Y así las ecuaciones normales quedan

12𝑎0 + 800𝑎1 = 811

800𝑎0 + 53418𝑎1 = 54107

103
De donde se obtiene 𝑎0 = 35.82 y 𝑎1 = 0.476 ,
de modo que
𝑌 = 35.82 + 0.476𝑋

La representación de esta ecuación aparece en la


siguiente figura

104
Y Dispersión_Leyes_Mo_(ppm)
72

71

70
Y = 35.82 + 0.476 X
69

68
Ley Mo (ppm) - Lab B

67
Dispersión_Leyes_Mo_(ppm)

66

65 Lineal (Dispersión_Leyes_Mo_(ppm))

64

63

62

61
61 62 63 64 65 66 67 68 69 70 71 72
X
Ley Mo (ppm) - Lab A

105
VII. TEORÍA DE CORRELACIÓN DE
MUESTRAS

106
CORRELACIÓN
Si la recta de regresión Y sobre X está dada por

𝒀 = 𝒂𝟎 + 𝒂𝟏 𝑿
El error típico de la estima 𝑺𝒀.𝑿 está dado por:

𝐘 − 𝐘𝐞𝐬𝐭 𝟐
𝐒𝐘.𝐗 =
𝐍

107
En la tabla siguiente se presentan los valores reales de Y y los
valores Y estimados denotados por 𝒀𝒆𝒔𝒕 , obtenidos de la recta
de regresión.

𝒀 = 𝟑𝟓. 𝟖𝟐 + 𝟎. 𝟒𝟕𝟔𝑿
X 65 63 67 64 68 62 70 66 68 67 69 71

Y 68 66 68 65 69 66 68 65 71 67 68 70

Yest 66,76 65,81 67,71 66,28 68,19 65,33 69,14 67,24 68,19 67,71 68,66 69,62

Y - Yest 1,24 0,19 0,29 - 1,28 0,81 0,67 - 1,14 - 2,24 2,81 - 0,71 - 0,66 0,38

Se pide calcular el error típico de la estima 𝑺


𝒀.𝑿

108
Solución:
𝟐
𝒀 − 𝒀𝒆𝒔𝒕
𝑺𝟐𝒀.𝑿 =
𝑵

𝟏. 𝟐𝟒 𝟐 + 𝟎. 𝟏𝟗 𝟐 + ⋯ + 𝟎. 𝟑𝟖 𝟐
𝑺𝟐𝒀.𝑿 = = 𝟏. 𝟔𝟒𝟐
𝟏𝟐

𝑺𝒀.𝑿 = 𝟏. 𝟔𝟒𝟐 = 𝟏. 𝟐𝟖
109
La recta de regresión

𝒀 = 𝟑𝟓. 𝟖𝟐 + 𝟎. 𝟒𝟕𝟔𝑿
Aparece con trazo continuo en la siguiente figura,
Figura A.

Las dos rectas paralelas, a una distancia de ella, de


𝑺𝒀.𝑿 = 𝟏. 𝟐𝟖 aparecen en la figura A con líneas
de trazos.

Entonces el porcentaje de puntos de los datos que


caen entre estas dos rectas paralelas definidas
por las líneas de trazos, será (9/12) = 75%
110
Figura A. Recta de regresión

𝐒𝐘.𝐗

𝐒𝐘.𝐗

111
VIII. MOVIMIENTOS MEDIOS
 Dado un conjunto de números

𝑌1, 𝑌2, 𝑌3, …

Se define un movimiento medio de orden N al que


viene dado por la sucesión de medias aritméticas,

𝑌1 + 𝑌2 +⋯+𝑌𝑁 𝑌2 + 𝑌3 +⋯+𝑌𝑁+1 𝑌3 + 𝑌4 +⋯+𝑌𝑁+2


, ,
𝑁 𝑁 𝑁
Las sumas de los numeradores anteriores se llaman
movimientos totales de orden N.
112
Ejemplo 1: dados los números 2,6,1,5,3,7,2 un
movimiento medio de orden 3 está dado por la
sucesión

2+6+1 6+1+5 1+5+3 5+3+7 3+7+2


, , , , es decir,
3 3 3 3 3

3, 4, 3, 5, 4

Se acostumbra a situar cada número del


movimiento medio en su posición relativa
apropiada con respecto a los datos originales.
113
En este ejemplo se escribiría

Datos originales 2, 6, 1, 5, 3, 7, 2

Movimiento medio de orden 3 3, 4, 3, 5, 4

cada número del movimiento medio es la media de


los 3 números inmediatos por encima de él.

114
Si los datos son dados anual o mensualmente, se
llama movimientos medio de orden N a un
movimiento medio de N años o un movimiento
medio de N meses, respectivamente. Así, se habla
de movimientos medios de 5 años, movimientos
medios de 12 meses, etc. Naturalmente que
cualquier otra unidad de tiempo puede igualmente
utilizarse.

115
Los movimientos medios tienen la propiedad de
tender a reducir la cantidad de variación presente
en un conjunto de datos. En el caso de series de
tiempo, esta propiedad se utiliza a menudo para
eliminar las fluctuaciones no deseadas y el proceso
se llama suavización de series de tiempo.

Si en las fórmulas anteriores se emplean las medias


aritméticas ponderadas, siendo lo pesos dados con
antelación, la sucesión resultante se llama
movimiento medio ponderado de orden N.

116
117
IX. QA – QC Y MUESTREO

118
Objetivo del QA-QC
• Prevenir el ingreso de grandes errores en la base de datos
utilizada para la estimación de recursos.
• Garantizar que la precisión de la información pueda ser
confirmada dentro de los límites razonables.

“Se puede demostrar que los resultados de las evaluaciones son


altamente confiables” 119
Estimación de Recursos
Principal fuente de información:
Muestras obtenidas de sondajes y laboreos mineros.

120
Los programas de QA–QC detallados son diseñados
para monitorear el muestreo rutinario y el
desempeño del laboratorio en un esfuerzo por
controlar (minimizar) el posible error total en la
secuencia muestreo – cuarteo – análisis.

121
El programa de QAQC integran un programa de
inserción rutinaria de materiales de control de
calidad. Estos incluyen:

• Estándar. (Material de Referencia Estándar, SRM)


• Muestra blanca.
• Muestra duplicada.
• Validación cruzada (Duplicado ,Laboratorio
Externo)

122
Protocolos de Muestreo
Muestra DDH “N°0012”
3-4 kg
Preparación
en terreno

3-4 kg Chancador
(-3 mm)

Laboratorio
Divisor Rotatorio
de
preparación
de muestras Rechazo grueso de 1 de c/20
reingreso posterior
(muestrera) Muestra Muestra DDH N°0012
1 kg
(1 kg)
R1 al circuito como
3 kg Aprox. Duplicado Grueso

Pulverizador
(-150#)

Rechazo pulpa de 1 de c/20


reingreso posterior
Muestra Muestra DDH N°0012 al circuito como
250 g
(250 g) R2 750 g Aprox. Duplicado Pulpa

Laboratorio
Químico Muestra
R3
Quimico (1 g Cu
50 g Au) 123
Esquema de preparación
Lote de Muestras DDH
Preparación
Muestra Gemela
en terreno (1/4 core) 1 c/20
Muestra Blanco
Grueso 1 c/20
(1.5-2) kg . (3-4) kg .

Chancador
(-3 mm)

Laboratorio
Divisor Rotatorio
de
preparación
de muestras
Rechazo Duplicado Grueso , de
(muestrera) 1 kg R1 grueso rechazo de lotes anteriores
1 c/20 (1) kg .
Pulverizador
(-150#)

Rechazo Duplicado Pulpa , de


rechazo de lotes anteriores
pulpa
250 g R2 1 c/20 (100 g) .

Laboratorio Estándar 1 c/20 (100 g) .


Químico
R3
Quimico ANALISIS Blanco Pulpa1 c/20
(100 g) . 124
Al implantar o evaluar los resultados de un programa de QA-QC en la
actividad geológica, es importante conocer tres conceptos básicos, que se
describen a continuación:
Precisión
Mide la reproducibilidad de la medición
(dispersión) entorno a su valor medio (no
necesariamente el valor verdadero).

Exactitud
Se define como la proximidad de los
resultados a un valor verdadero o aceptado.

En términos estadísticos estos conceptos


corresponden respectivamente a la media
, la cual debe ser insesgada (exactitud) y a
la varianza del error, la cual debe ser
pequeña (precisión)

125
Contaminación

Al preparar o analizar algunas muestras, particularmente las muy mineralizadas,


es posible que cierta porción de una muestra o de una solución quede retenida
accidentalmente en el equipo y contamine las muestras siguientes. La
contaminación se estudia a través de los blancos, que son de hecho muestras
estériles, en las cuales los elementos a evaluar se encuentran presentes en
cantidades inferiores o muy cercanas a los correspondientes límites de
detección.

126
127
ESTANDAR (Material de Referencia Estándar,
SRM)
Son muestras preparados bajo condiciones especiales por
laboratorios comerciales certificados. Se establece el mejor valor
(MV) del estándar para cada elemento en particular, tanto el MV
como el Intervalo de Confianza (IC) que caracterizan al estándar,
deben ser establecidos a través de múltiples análisis en una serie
de laboratorios de elevada reputación técnica.
Estas muestras son usadas para estimar la EXACTITUD del
análisis. Estos estándares deben ser insertados alternativamente
en los lotes.

128
RESULTADOS DEL LABORATORIO
INSERCIÓN DE STANDARD “A”

INSERCIÓN DE STANDARD “B”

INSERCIÓN DE STANDARD “C”

INSERCIÓN DE STANDARD “A”

INSERCIÓN DE STANDARD “B”


129
Ejemplos de Certificados

130
Análisis Materiales de Referencia- Proyecto “AA”
Estándar STZN-01

Mejor Valor (BV) = Promedio ( Promedio Lab 1, Lab 2, Lab 3, Lab 4)

(BV)= (2.015+2.048+2.118+2.128) /4=2.077


Desviación Estándar (SD) =( Promedio Lab 1, Lab 2, Lab 3, Lab 4)

(SD)= Raiz [((2.015-2.077)2+(2.048-2.077)2+(2.118-2.077)2+(2.128-2.077)2) /3]

(SD)=0.055 131
Intervalo de Confianza (CI)= BV =2.0777
SD =0.055
n =n° de laboratorio : 4

t = Ver mediante la tabla de distribución t, para un intervalo de


confianza del 95%
t0.975 = para intervalo de confianza del 95%

Entonces de la tabla , t 0.975 con v (grados de libertad)=n-1


4-1=3 grados de libertad

t 0.975 = 3.18

Entonces:
CI = 3.18X0.055/ 4
CI = 0.087

Coeficiente de Variación (CV)= SD x100%


BV
CV = (0.055/2.077)x100%
CV = 2.6% 132
Análisis Materiales de Referencia- Proyecto “AA”
Estándar STZN-02

Mejor Valor (BV) = Promedio ( Promedio Lab 1, Lab 2, Lab 3, Lab 4)

(BV)= (5.847+5.786+5.698+5.784) /4= 5.779

Desviación Estándar (SD) =( Promedio Lab 1, Lab 2, Lab 3, Lab 4)

(SD)= Raiz [((5.847-5.778)2+(5.786-5.778)2+(5.698-5.778)2+(5.784-5.778)2) /3]

(SD)=0.061 133
Intervalo de Confianza (CI)= BV =5.779
SD =0.061
n =n° de laboratorio : 4

t = Ver mediante la tabla de distribución t, para un intervalo de confianza del 95%


t0.975 = para intervalo de confianza del 95%

Entonces de la tabla , t 0.975 con v (grados de libertad)=n-1


4-1=3 grados de libertad

t 0.975 = 3.18

Entonces:
CI = 3.18X0.061/ 4
CI = 0.097

Coeficiente de Variación (CV)= SD x100%


BV
CV = (0.061/5.779)x100%
CV = 1.1% 134
Análisis Materiales de Referencia- Proyecto “AA”
Estándar STZN-03

Mejor Valor (BV) = Promedio ( Promedio Lab 1, Lab 2, Lab 3, Lab 4)


(BV)= (29.486+ 27.448+27.309+27.515) /4= 27.940

Desviación Estándar (SD) =( Promedio Lab 1, Lab 2, Lab 3, Lab 4)

(SD)= Raiz [((29.486-27.940)2+(27.448-27.940)2+(27.309-27.940)2+(27.515-27.940)2) /3]

(SD)=1.035 135
Intervalo de Confianza (CI)= BV =27.940
SD =1.035
n =n° de laboratorio : 4

t = Ver mediante la tabla de distribución t, para un intervalo de confianza del 95%


t0.975 = para intervalo de confianza del 95%

Entonces de la tabla , t 0.975 con v (grados de libertad)=n-1


4-1=3 grados de libertad

t 0.975 = 3.18

Entonces:
CI = 3.18x1.035/ 4
CI = 1.646

Coeficiente de Variación (CV)= SD x100%


BV
CV = (1.035/27.940)x100%
CV = 3.7% 136
ANALISIS DEL ESTÁNDAR

137
Cómo se Evalúa la Exactitud
Exactitud - magnitud cualitativa

Ejemplo de uso: baja exactitud, alta exactitud, exactitud


aceptable

Sesgo - magnitud cuantitativa


Para materiales de referencia: Sesgo (%) = (PR / MV) – 1

Donde: PR representa el promedio de los valores obtenidos


en el análisis del material de referencia,
y MV el mejor valor del material de referencia

Criterio de Aceptación

El sesgo resultante del análisis, es:

Bueno, si |Sesgo| < 5%


Cuestionable, si |Sesgo| entre 5% y 10%
Inaceptable, si |Sesgo| > 10%
138
GRÁFICO TÍPICO DE CONTROL PARA ESTÁNDARES

X= Mejor Valor (BV) del certificado del Estándar.


(SD)=Desviación Estándar del proceso de certificación.
139
140
Análisis STZN-01 –usando
“Desviación Estándar -SD” de certificado

141
Análisis STZN-01 –usando parámetros de
certificado
“Intervalo de Confianza -CI”

Se puede decir que la


información es sesgada
negativamente 142
Análisis STZN-01 –Usando Parámetros de
Datos

143
MUESTRA BLANCA
Material en blanco, consistente en material desprovisto del (los)
elemento(s) o producto de interés económico, o desprovisto de
un contaminante que afecta el costo de un proceso o decisión y
pueden ser:
Blancos Gruesos: Son muestras gruesas de material “sin
valores”, estas deberán indicar si la contaminación se produce
durante la preparación.
Blancos pulpa: Que son muestras de material pulverizado “sin
valores”; estas muestras deberán indicar si alguna
contaminación ha ocurrido durante el análisis.
“Las muestras en blanco deben ser colocadas después de muestras con leyes altas”

Se considera que se ha producido un nivel significativo de contaminación de un


elemento cuando los blancos arrojan valores que exceden varias veces el límite
de detección para dicho elemento.
144
Gráfico de control para blancos

145
Gráfico de control para Blancos Vs Muestra
Precedente

146
Safe Limit

“Los valores de los blancos no deben exceder en


más de tres o cinco veces los límites de detección
del elemento”

147
148
149
Observaciones Blancos Vs Muestra
Precedente
• Los valores de los blancos no deben
estar directamente influenciados por
las leyes de las muestras precedentes.

• Los valores de los blancos no deben


exceder en más de tres o cinco veces
(blancos finos o gruesos,
respectivamente) los límites de
detección del elemento.

• La tasa de contaminación no debe


superar el 2% del total de muestras e
blanco.

150
MUESTRA DUPLICADA
Una muestra duplicada tiene la misma ubicación
espacial que la muestra original. Los duplicados sólo
pueden obtenerse por cuarteo de muestras
representativas de minerales partidos.

151
Muestras gemelas : Estas muestras se envían para evaluar la
homogeneidad de la mineralización y la varianza del muestreo. En un
programa de perforación, la muestra de la mitad original del testigo será
dividida nuevamente en dos y un cuarto representará la muestra original y
el otro cuarto representara la muestra gemela.

Los duplicados gruesos (o duplicados de preparación): son divisiones de


algunas muestras tomadas inmediatamente luego de la primera división y
separación; estas muestras deben registrar la varianza del submuestreo.

Los duplicados de pulpas (o duplicados de la misma pulpa, duplicados de la


pulpa interna): que constituyen una segunda división de muestras finalmente
preparadas, analizadas rutinariamente por el laboratorio principal, reenviadas al
mismo laboratorio bajo un número de muestra diferente; estas muestras
deberán ser indicadores de la reproducibilidad o precisión de análisis.

152
Cómo se Evalúa la PRECISIÓN
El parámetro más comúnmente utilizado para evaluar la precisión en la
exploración geológica es el Error Relativo (ARD, por Absolute Relative
Difference, o AVRD, por Absolute Value of the Relative Difference)

Error Relativo - magnitud cuantitativa:


2*|Vo-Vd|
ER= -------------------
(Vo+Vd)
Valor absoluto de la diferencia entre el valor original y el valor
duplicado, dividido por el promedio entre ambos valores

¿Qué Nivel de Precisión es Aceptable?


La proporción de pares fallidos no debe exceder el 10% del número total de pares,
evaluados para límites de error relativo según el tipo de duplicados, como sigue:

Muestras Gemelas: 30% ER


Duplicados de Preparación: 20% ER
Duplicados de Pulpa: 10% ER
153
Gráfico de control para Duplicados

Gráfico de Dispersión X-Y


154
155
Duplicados de Pulpa: 10% ER

156
157
158
159
160
Cuando la ley disminuye y se acerca al límite de detección,
la precisión empeora exponencialmente.

2*|Vo-Vd|
Límite Práctico de Detección
ER= -------------------
Ley ER ~ 100% (Vo+Vd)

161
Límite Práctico de Detección

Error Relativo -:
2*|Vo-Vd|
ER= -------------------
(Vo+Vd)
Valor absoluto de la diferencia entre el valor original
(Vo) y el valor duplicado (Vd), dividido por el
promedio entre ambos valores
162
163
Precisión: Esquema de Principio (y = mx)

El gráfico Max- Min (diseñado


por Scott Long), se basa en que
el procedimiento de evaluación
de la precisión no tiene en
cuenta el sentido de las
desviaciones, sino su magnitud.

164
Gráfico de control-Método de la hipérbola
Proyecto Quintana: Au in Field Duplicates
Evaluación (Low Grade Samples)
3.5
1.0

3.0 0.9

0.8
2.5 (All Samples) 0.7 FD
Max Au (g/t)

Max Au (g/t)
0.6 45º Line
2.0 FD
45º Line
0.5 Number of
Failure
1.5 Line 14
0.4
Number of Failures
14 0.3 12 8.1
1.0
Failures
12 8.1 0.2
0.5
0.1

0.0
0.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5
Min Au (g/t) Min Au (g/t)

Gráfico de trabajo 4. 165


166
Hiperbola (H)

𝑯= 𝒎𝟐 × 𝒎𝒊𝒏 𝟐 + 𝒃𝟐

2 𝑉𝑜 − 𝑉𝑑 2 𝑜−𝑑
𝐸𝑅 = 𝐸𝑅 =
𝑉𝑜 + 𝑉𝑑 𝑜+𝑑

Cálculo de m
2 𝑦−𝑥
Valor de ER
𝐸𝑅 = Muestras gemelas ER = 30%
𝑦+𝑥
Duplicados Gruesos ER = 20%
2𝑦 − 2𝑥
0.3 = Duplicados Pulpa ER = 10%
𝑦+𝑥

𝑦 = 1.35𝑥

Cálculo de b
𝑏 = 𝑓 × 𝐿𝐷𝑃
167
168
Valor del parámetro b
Muestras Gemelas / b = [10 –> 20] x LDP
Duplicados de Campo LDP: Límite de detección práctica

Duplicados b = [5 –> 10] x LDP


Gruesos

Duplicados b = [3 –> 5] x LDP


de Pulpa

Valor mayor para Au, Pt, (Mo)


Valor menor para Cu, Zn, Pb, Fe, Co, As, y otros
169
VALIDACIÓN CRUZADA
Muestras de verificación (o duplicados de pulpas
externas), que son divisiones secundarias de muestras
finalmente preparadas, analizadas rutinariamente por
el laboratorio principal, reenviadas a un laboratorio
secundario, con un número diferente de muestra;
estas muestras deben utilizarse para estimar la
exactitud del análisis, junto con los estándares.

170
Gráfico de Dispersión X-Y

171

Вам также может понравиться