Академический Документы
Профессиональный Документы
Культура Документы
TALLER
ANALISIS MULTIVARIABLES
Y APLICACIONES
Dr. Filiberto Mata Pérez
Consultor Intercade
INDICE
Diap.
1. Introducción................................................................................................. 3
2. Estadísticas de las Variables....................................................................... 5
3. Regresión Lineal aplicaciones y análisis en Minería ................................... 24
4. Regresión Múltiple aplicaciones y análisis en Minería................................... 49
5 Matriz de Correlaciones................................................................................ 65
6. Clúster Análisis ……………………………….. ………..……........................ 74
7. Correlación entre las variables Mineralógicas ……................................... 84
8. Relación Tonelaje-Ley .............................................................................. 93
9 Correlación entre otras Variables …….…………………………………… 100
10 . Variables Mineralógicas vs Consumo de Acido……………..… 120
11. Variables Mineralógicas vs Recuperación ...................................... 146
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
2
3
1. INTRODUCCION
ANALISIS MULTIVARIADO
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
3
5
2. ESTADISTICAS
DE LAS VARIABLES
ESTADISTICA
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
4
7
ESTADISTICA
POBLACION
En estadística se denomina población a todas las personas
u objetos que componen un gran grupo.
Con frecuencia en la práctica estamos interesados en
extraer conclusiones válidas con respecto a un grupo grande
de personas u objetos. Sin embargo es difícil o casi
imposible analizar a toda la amplitud de este gran grupo.
MUESTRA
Una muestra es una pequeña parte de la población o el
universo o un subconjunto de observaciones de la misma.
Su importancia radica en que sirve para estudiar a toda una
población o universo.
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
5
9
Muestra Población
xxx
xx x
xxx xx
xxx xx x
xxx xxx
xxx xxx
xxx
xx
10
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
6
11
12
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
7
13
14
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
8
15
16
23 18 22 17 17 21 21 20
28 19 26 23 21 26
28 25 23 27 17
23 21 25 23 18 29 27 25
24 25
25 20 22 17 23 25 23 21
25 23 23 25 21 24 24 29
25 30 25
28 18 26
28 23 23 22 19 25 21 24
27
26 20 23 27 21 28 21 21
25 19
29 30 27 29 25 27 28 31
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
9
17
18
35 34
30
25
20
20
14 16
15 11
10 13
5
0 4
1 2
3
4 5
6
7
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
10
19
1.20
1.00
0.80
0.60
0.40
0.20
0.00
1 2 3 4 5 6 7
20
n
* fi
2
2 i
Varianza = = n
fi
n
2
i
2
fi
Desviación estándar = = n
fi
n
i
3
fi
3er. Momento = m 3 = n
fi
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
11
21
n
* fi
4
i
m4 = n
fi
3
n
* fi
2 2
3 i
n
fi
m3
Coeficiente de Sesgo = 3
m4
Coeficiente de Curtósis = 4
22
CLASES
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
12
23
CLASES
m3= 15.99
m4= 323.38
Varianza= 11.16
desviación stándar 3.34
Coef.Sesgo= 0.000779337
Coef.Curtósis= 2.596560665
24
3. REGRESION LINEAL
APLICACIONES Y ANALISIS
EN MINERIA
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
13
25
PROBABILIDAD
26
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
14
27
28
y= 0 + 1 *x+
E(y) = 0 + 1 *x+
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
15
29
y = b0 + b 1 x
n
i =1x i yi ( in=1 x i n
i =1 y i ( n
b1 = 2
n
n 2 i =x i
i =1 x n
b0 = y - b1 x
30
Xi Yi XiYi Xi^2
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
16
31
b1 = (SumaXiYi-(SumaXi*SumaYi)/n)/(SumaXi^2-(suma Xi)^2/n)= 5
b1 = Ymed-b1Xmed
32
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
17
33
200 y = 5x + 60
R2 = 0.9027
150
100
50
0
0 5 10 15 20 25 30
34
Estadísticas descriptivas: X, Y
Media del
Conteo Error
Variable total N N* CumN Porcentaje CumPct Media estándar Desv.Est.
X 10 10 0 10 100 100 14.00 2.51 7.94
Y 10 10 0 10 100 100 130.0 13.2 41.8
Suma de
Variable Varianza Suma cuadrados Mínimo Q1 Mediana Q3 Máximo
X 63.11 140.00 2528.00 2.00 7.50 14.00 20.50 26.00
Y 1747.8 1300.0 184730.0 58.0 100.8 127.5 160.0 202.0
N para
Variable Rango IQR Modo moda Sesgo Kurtosis MSSD
X 24.00 13.00 8, 20 2 -0.00 -1.33 4.89
Y 144.0 59.3 * 0 -0.01 -0.03 419.6
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
18
35
200 S 13.8293
R-cuad. 90.3%
R-cuad.(ajustado) 89.1%
150
Y
100
50
0 5 10 15 20 25
X
36
95
90
80
Porcentaje
70
60
50
40
30
20
10
1
-30 -20 -10 0 10 20 30
Residuo
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
19
37
38
SSE
2
S = MSE = n-2
SEE
S = MSE = n-2
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
20
39
Prueba t
El objetivo de la prueba t es el poder establecer si la
relación entre X, Y es significativa para esto se
utilizaran los datos de la muestra para probar la
siguiente Hipótesis:
H0 : β 1 = 0
Ha : β1 ≠ 0
40
200 S 13.8293
R-cuad. 90.3%
R-cuad.(ajustado) 89.1%
150
Y
100
50
0 5 10 15 20 25
X
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
21
41
b1 =
2
n
i=1 X
2 ( n
i=1 X i (
Distribución normal
42
s= 191.25 = 13.829
13.829
b2 = = 0.5803
(140) 2
2528
10
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
22
43
Por lo anterior:
Prueba t:
H0: β1 = 0
Hα : β1 ≠ 0
Estadístico de prueba:
b1 5
t= = 0.5803
= 8.62
b1
Regla de Rechazo:
Rechazar H 0 si t < - t 2 o si t > - t 2
por lo tanto con 99% de probabilidad es decir
α= 0.01 con una distribución de n - 2 = 8 de acuerdo de la
Distribución t de Student t005 = 3.355
44
Y = 60.0 + 5.00 X
Coef.
Predictor Coef de EE T P
Constante 60.000 9.226 6.50 0.000
X 5.0000 0.5803 8.62 0.000
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
23
45
La ecuación de regresión es
Y = 60.00 + 5.000 X
Análisis de varianza
Fuente GL SC MC F P
Regresión 1 14200 14200.0 74.25 0.000
Error 8 1530 191.2
Total 9 15730
46
2
1 (x p - x (
s yp = s
n
+ n 2
n 2 i=1 x i
i=1 X i n
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
24
47
200 S 13.8293
R-cuad. 90.3%
R-cuad.(ajustado) 89.1%
150
Y
100
50
0 5 10 15 20 25
X
48
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
25
49
4. REGRESION LINEAL
MULTIPLE APLICACIONES
Y ANALISIS EN MINERIA
50
y = β0 + β1 x1 + β2 x2 + β3 x3 + ….. βp xp + Є
E(y) = β0 + β1 x1 + β2 x2 + β3 x3 + …….. + βp xp +
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
26
51
(yi - yi) 2
1
Si sabemos que:
52
n k 2
yi - 0 - j xi j
i=1
n k
L
0 1 k
= -2 yi - 0 - j xi j = 0
i=1 j =1
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
27
53
n n n n
n 0 + 1 x i1 + 2 x i2 k x ik yi
i=1 i=1 i=1 i=1
n n n n n
0 x i1 1 x2 i1 2 x i1 x i2 k x i1 x ik x i1 yi
i=1 i=1 i=1 i=1 i=1
n n n n n
0 x ik 1 x ik x i1 2 x ik x i2 k x2 ik x ik yi
i=1 i=1 i=1 i=1 i=1
54
n n n n
n + n
i=1 X i1 + i=1 X i2 + ........ + i=1 X ik = i=1 yi 0 i=1 yi
...
...
...
...
...
...
...
n n n n n X i1 y i
i=1 X i1 + 2
i=1 X i1 + i=1 X i1 X i1 + ........ + i=1
X ik X ik = i=1 X i1 yi 1 n
i=1
...
...
...
...
...
...
...
...
n n n n n
i=1 X ik + i=1 X ik X i1 + i=1 X ik X i1 + ........ + 2
i=1 X ik = i=1 X ik yi k
n
i=1 X ik yi
n
SEE = (y i - b 0 - b1 x1i - b2 x2i ) = 0
i=1
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
28
55
SEE
-2 (y i - b 0 - b1 x1i - b2 x2i ) = 0
b0
SEE
-2x 1 i (y i - b 0 - b1 x1i - b 2 x2i ) = 0
b1
SEE
-2x 2 i (y i - b 0 - b1 x1i - b 2 x2i )
b2
56
yi + b0 + b1 x1i b 2 x 2i = 0
yi = b0 + b1 x1i b2 x2i
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
29
57
58
y x(1) x(2)
9.3 100 4
4.8 50 3
8.9 100 4
6.5 100 2
4.2 50 2
6.2 80 2
7.4 75 3
6 65 4
7.6 90 3
6.1 90 2
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
30
59
La ecuación de regresión es
(y) = - 0.869 + 0.0611 (x1)+ 0.923(x2)
Análisis de varianza
Fuente GL SC MC F P
Regresión 2 21.601 10.800 32.88 0.000
Error residual 7 2.299 0.328
Falta de ajuste 6 2.219 0.370 4.62 0.342
Error puro 1 0.080 0.080
Total 9 23.900
Dr. Filiberto Mata Pérez - Consultor Intercade
60
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
31
61
62
10 - 1
Así que : R 2 = 1-(1-0.904) = 088
10 - 2 - 1
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
32
63
SSE
MSE =
n-p-1
64
MSR
F= se rechaza si H0 si F > Fα con p grados de
MSE
libertad en el numerador y n-p-1 en el denominador por
lo que: 10.8
F= = 32.88
0.328
Estos datos se pueden observar en la tabla de varianza
de Minitab
Análisis de varianza
Fuente GL SC MC F P
Regresión 2 21.601 10.800 32.88 0.000
Error residual 7 2.299 0.328
Falta de ajuste 6 2.219 0.370 4.62 0.342
Error puro 1 0.080 0.080
Total 9 23.900
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
33
65
5.MATRIZ
DE CORRELACION
66
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
34
67
68
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
35
69
0.13
O
191
5 En los gráficos de caja la caja esta
0.12
definida por el segundo y tercer
cuartil. Mientras que los bigotes por le
0.11
primero y el cuarto. Este tipo de
0.10
gráficos también es útil para detectar
valores atípicos.
0.09
0.08
0.07 4
Gold
Normal esperado
representa los datos de la
variable frente a los datos 0
normal.
70
Pruebas de normalidad
Kolmogorov-Smirnov a Shapiro-Wilk
Estadístico gl S ig . Estadístico gl S ig.
Gold .035 203 .200* .995 203 .708
Silver .049 203 .200* .995 203 .748
Tin .047 203 .200* .994 203 .654
Antimony .037 203 .200* .994 203 .567
Lead .048 203 .200* .990 203 .197
Zinc .034 203 .200* .996 203 .868
Mercury .037 203 .200* .993 203 .393
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
36
71
Pruebas de normalidad
Kolmogorov-Smirnov a Shapiro-Wilk
Estadístico gl S ig. Estadístico gl S ig.
Gold .035 203 .200* .995 203 .708
Silver .049 203 .200* .995 203 .748
Tin .047 203 .200* .994 203 .654
Antimony .037 203 .200* .994 203 .567
Lead .048 203 .200* .990 203 .197
Zinc .034 203 .200* .996 203 .868
Mercury .037 203 .200* .993 203 .393
72
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
37
73
MATRIZ DE CORRELACION
Correlaciones
Gold Silver Lead Zinc Tin Mercury Antimony
Gold Correlación de Pearson 1 -.051 .065 -.056 .034 -.062 -.114
Sig. (bilateral) .466 .360 .428 -629 .383 .104
N
203 203 203 203 203 203 203
Silver Correlación de Pearson -.051 1 1.44 -.002 -.025 .093 .078
Sig. (bilateral) .466 .040 .979 .727 .186 .269
N
203 203 203 203 203 203 203
Lead Correlación de Pearson .065 .144 1 .057 .116 -.072 -.179
Sig. (bilateral) .360 .040 .415 .100 .305 .011
N 203 203 203 203 203 203 203
Zinc Correlación de Pearson -.056 -.002 .057 1 .016 -.196 .58
Sig. (bilateral) -.056 .979 .415 .824 .005 .411
N
203 203 203 203 203 203 203
Tin Correlación de Pearson .034 -.025 .116 .016 1 -.044 -.016
Sig. (bilateral) .629 .727 .100 .824 .536 .820
N
.203 203 203 203 203 203 203
Mercury Correlación de Pearson -.062 .093 -.072 -.196 -.044 1 .038
Sig. (bilateral) .383 .186 .305 .005 .536 .590
N
.203 203 203 203 203 203 203
Antimony Correlación de Pearson -.114 -.078 -.179 .058 -.016 .038 1
Sig. (bilateral) .104 .269 .011 .411 .820 .590
N
203 203 203 203 203 203 203
* La correlación es significante al nivel 0,05 (bilateral).
** La correlación es significativa al nivel 0,01 (bilateral).
74
6. CLUSTER ANALISIS
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
38
75
76
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
39
77
78
Medición de la similitud:
Formación de conglomerados:
INTERCADE www.intercade.org
CONSULTANCY & TRAINING
40
79
Matriz de distancias
Archivo matricial de entrada
Caso Gold Silver Lead Zinc Tin Mercury Antimony
Gold 1.000 -.051 .065 -.056 .034 -.062 -.114
Silver -.051 1.000 .144 -.002 -.025 .093 -.078
Lead .065 .144 1.000 .057 .116 -.072 -.179
Zinc -.056 -.002 .057 1.000 .016 -.196 .058
Tin .034 -.025 .116 .016 1.000 -.044 -.016
Mercury -.062 .093 -.072 -.196 -.044 1.000 .038
Antimony -.114 -.078 -.179 .058 -.016 .038 1.000
80
INTERCADE www.intercade.org
CONSULTANCY & TRAINING