Вы находитесь на странице: 1из 58

UNIVERSIDAD PRIVADA DEL NORTE

FACULTAD WORKINGADULT ING. MINAS

CURSO: GEOESTADISTICA
CLASE I

Docente: ING. WILDER CHUQUIRUNA CHAVEZ

CAJAMARCA, JULIO 2016

CONCEPTOS BASICOS (BD, QAQC, Modelos)

ESTADISTICA
(Media, CV, Anlisis, correlacin)

VARIOGRAFIA (Conceptos, Anlisis)


Geology Modeling / 1 july 2009

Medidas Estadsticas

Medidas de
posicin

Promedio o MEDIA
Moda
Mediana
Percentiles

Medidas de
variabilidad

Rango
Varianza
DESVIACION ESTANDAR
COEF. DE VARIACION

Estadstica

Medidas de Posicin
n

Promedio o Media de la muestra

Xi
X
i 1 n

Mediana: Valor que deja el 50% de los datos


Con los datos Ordenados:
Nmero Impar de datos -- el dato central
Nmero Par de datos -- promedio de los dos
datos centrales.
Moda: Valor ms comn

Geology Modeling / 1 july 2009

Parmetros de tamao

Mo

Mnimo (P0)
Mximo (P100)
Moda (Mo)
Mediana (M = P50)
P0

P50

P100

Geology Modeling / 1 july 2009

MEDIA
Lejos, es la Medida de Tendencia Central ms
utilizada

0 1 2 3 4 5 6 7 8 9 10

Media = 5

Afectada por Valores Extremos (Outliers)


0 1 2 3 4 5 6 7 8 9 10 12 14

Media = 6

MEDIANA

En Arreglo Ordenado, la Mediana es el valor


del medio

Si n es impar,
Si n es par,

Mediana = X[(n+1)/2].
Mediana =(X[n/2]+X[n/2+1])

No es afectada por los valores extremos

(robusta), sino por el tamao de la muestra.

0 1 2 3 4 5 6 7 8 9 10

Mediana = 5

0 1 2 3 4 5 6 7 8 9 10 12 14

Mediana = 5

MODA

Valor que ocurre ms Frecuentemente


No es Afectado por Valores Extremos
Puede que no exista Moda
Pueden existir varias Modas
Se emplea en datos Categricos o
Numricos

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Moda = 9

0 1 2 3 4 5 6

No-Moda

Cundo usar Media, Moda o Mediana?


Datos son
categricos?

Si

MODA

No

El total es
de Inters?

Si

MEDIA

No

La primera consideracin es el tipo de


datos, si la variable es categrica, la
Moda es la nica medida que mejor
describe los datos
La segunda consideracin es preguntarse si el total de las observaciones
es de algn inters. Si la respuesta es
afirmativa, entonces la medida adecuada de la tendencia central es la

Media
Distribucin
Sesgada?
No

MEDIA

Si

MEDIANA

Si el total de las observaciones no es


de inters. Entonces, si el
histograma es sesgado, usar la
Mediana como medida de la
tendencia central.

En caso contrario la Media si es


moderadamente sesgada
En todos los casos el
histograma debe ser unimodal

Medidas de variabilidad
Rango: Diferencia entre los valores mximo y mnimo
n

Varianza muestral

S2

Desviacin estndar

Coeficiente Variacion

2
(
X

X
)
i
i 1

n 1

S S

s
C.V .
x
Geology Modeling / 1 july 2009

Variancia Muestral

Importante Medida de la Dispersin

Mide la Desviacin Cuadrtica Promedio

alrededor de la Media; esto es, toma en


cuenta cmo se distribuyen los datos alredor
de la Media

(X
n

Variancia Muestral : s2

i 1

X )

n 1

DEVIACIN ESTNDAR MUESTRAL


La ms Importante Medida de Dispersin

Muestra la Raz de la Desviacin cuadrtica


promedio alrededor de la Media

Tiene las misma Unidad que los Datos Originales

(X
n

i 1

X )

n 1

= 23,35

COMPARANDO DESVIACIONES
ESTNDAR
Datos A
11 12 13 14 15 16 17 18 19 20 21

Media = 15.5
^
s = 3.338

Datos B
11 12 13 14 15 16 17 18 19 20 21

Media = 15.5
^
s = .9258

Datos C
11 12 13 14 15 16 17 18 19 20 21

Media = 15.5
^
s = 4.57

ESTADSTICAS BSICAS
Yacimiento tipo prfido
cuprfero
CV = 0.7

Yacimiento de cobre de
mediana var. CV = 1.5
Yacimiento de oro de alta
variabilidad CV = 4.5

Varianza y soporte

Histograma

La escala de intensidades se divide en N clases.


Una frecuencia est asociada a cada centro de clase y
representada por un rectngulo proporcional
Las frecuencias pueden ser absolutas (Nb) o relativas (%)
Histogramme de MoS2.

MoS2 (%)
<0,15
0,29
0,43
0,57
0,71
0,86
1,00
1,14
1,28
1,42

Sondage n647

Nb Obs.
8
37
31
14
4
1
3
0
1
1

24
20
16
Nb d'obs

12
8
4
0
0

0.2
0.1

0.4
0.3

0.6
0.5

0.8
0.7

MOS2

1
0.9

1.2
1.1

1.3

Histograma

La seleccin del nmero de clases influye


en la legibilidad

15 a 20 clases es comunmente ptimo

7, 21 o 100 clases para un total de 800 observaciones

Zn(%)
Nb
3.8 16
9.3 88
14.8 220
20.2 219
25.8 125
31.2 41
36.8 9

Histograma en frecuencias acumuladas


Frecuencias acumuladas de 0% a 100%

Lectura rpida de percentiles

TIPOS DE DISTRIBUCIN

Distribucin Normal
Eventos debido a mltiples causas independientes,
Ex. granulometra de un sedimento, Densidad por alteracin, fluctuationes
mensuales de un nivel piezomtrico, geoqumica de un elemento mayor y mvil
(Fe, Mn,),

(x )2

f (x )

2 . 2

. 2.

con :
= media
= desviacin tpica

DISTRIBUCIN NORMAL (GAUSSIANA)

La distribucin gaussiana es simtrica:


g(z)

La media y mediana son iguales

0.40
0.35
0.30
0.25

95 %

0.20
0.15
0.10
0.05
0.00
0

2.5%

2.5%
2

10

12

14

16

Cualquier Distribucion puede pasar a Normal Gaussiana


(estandarizar).
X
Si X ~ N ( , y2 ) definimos: Y , entonces: Y ~ N (0,1)

Y tiene distribucion Normal Gaussiana

TIPOS DE DISTRIBUCIN
La ley Lognormal

Ex. distribucin geoqumica de elementos en trazas localmente concentra


(pepitas),

Caracteristicas de la distribucin

Los logaritmos de los valores siguen una ley normal


Media Moda Mediana (asimetra)
Mediana = Media geomtrica

Telnes - NORWAY
Sulfur in Norite

No of obs

270
252
234
216
198
180
162
144
126
108
90
72
54
36
18
0
0

xG M en

0.1

0.2

0.3

0.4

0.5

0.6
S

0.7

0.8

0.9

1.1

1.2

ANLISIS UNIVARIABLES VALORES


EXTREMOS
Valores extremos: afectan considerablemente las estadsticas

bsicas
Qu hacer con ellos?:

Declarar los valores extremos como errneos y eliminarlos


Clasificarlos en poblaciones estadsticas separadas
Usar estadsticas robustas, que son menos sensibles a los valores
extremos: mediana, coeficiente de correlacin de posicin
Transformar los datos para reducir su influencia
Bajarlos a un mximo razonable

Outliers: Observaciones que parecen no pertenecer a la misma


poblacin constituida por el resto de los datos
Generan considerables problemas al aplicar regresin, debido a que
tienen un efecto desproporcionado sobre los coeficientes de regresin
estimados
Los datos considerados extremos (outliers) puede eliminarse slo si se
ha comprobado que estn errados. En caso de ser datos verdaderos,
proveen informacin que puede ser crtica para la respuesta del
modelo.

ANLISIS UNIVARIABLE

La distribuciones son tiles para chequear la


presencia de dos poblaciones
CDF

PDF

ANLISIS ESTADSTICO

Son tiles para chequear la presencia de dos


poblaciones
Debe confirmarse con informacin geolgica

Agrupaciones de puntos? Investigar ....


18

Histogram
90

14

80

12

70

10

60

No of obs

Observed Value

16

8
6

50
40
30

20
10

2
0
-1,0

0,7

2,3

4,0

5,6

7,3

9,0

10,6

12,3

13,9

15,6

Var1

-2
-4

-3

-2

-1

Theoretical Quantile

ANALISIS ESTADSTICO

Grfico Q-Q: para comparar


dos distribuciones F1 y F2
cuantil a cuantil.
No se utiliza para comparar la
relacin par a par que hay
entre las variables.
Escoger una serie de valores
de probabilidad
pk, k = 1, 2, , K
Graficar q1(pk) versus q2(pk), k
= 1, 2, , K

Q-Q PLOT

Q-Q plot terico: Construccin


3,44
2,99
2,63
2,20
1,97
i

x(1) x(n) es la muestra


ordenada de menor a mayor

4,00

Qx(pi)

x1 , x2 ,...., xn valores observados


en una muestra

Q(p

Calcular pi = (i 0,5)/ n i

1,52
1,24
0,89
0,50

Para cada pi hacer Qx(pi) = x(i)

0,00

-0, 2

0,0

0,2

0,4

0,6

0,8

1,0

pi

Graficar Qx(pi) vs. pi

2,500

Sea F(x) distribucin terica a


comprobar.

)i

Qt(p)

2,000

1,304
0,942
0,500
0,145

Para p, (0 < p < 1) encontrar


Qt(p) = F-1(p)

-0,243

Graficar Q(p) vs. p

-2,070

-0,674
-1,105
-1,574

-2,500
-0,20

0,00

0,20

0,40

0,60

0,80

1,00

1,20

Q-Q plot terico

Para cada valor pi, graficar Qx(pi) contra Qt(pi)


para i = 1, 2, ..., n,

Qx(pi): emprico

4,0
3,5
3,0
2,5
2,0
1,5
1,0
0,5
0,0
-2,5

-2,0

-1,5

-1,0

-0,5

0,0

0,5

Qt(pi): tetico

1,0

1,5

2,0

ANLISIS ESTADSTICO ANLISIS DE


CONTACTO

Anlisis Estadstico Anlisis de Contacto

Geology Modeling / 1 july 2009

Analisis Bivariable: Covarianza y Correlacin


Cuantificacin de una nube de puntos
Nocin de dispersin alrrededor del centro de
gravedad
Momentos de Inercia => Varianzas y Covarianza
2

1 i N
2
(x) xx (xi (x))
N i 1

1 i N
2
(y) yy (y i (y))
N i 1

1 i N
xy (xi (x))(. y i (y))
N i 1

Geology Modeling / 1 july 2009

Geology Modeling / 1 july 2009

Correlacin
Covarianza

: parmetro adimensional [-,+]

Correlacin

: parmetro adimensional [-1,1]

xy

xy
xx . yy

Fe Ni Cu V
Fe 1.00 .90 .38 .81
Ni .90 1.00 .44 .73
Cu .38 .44 1.00 .52
V .81 .73 .52 1.00
Geology Modeling / 1 july 2009

CORRELACIN
Caso 1

Caso 2

Diferentes ejemplos de
coeficiente de correlacin

Y
= 1

= 0,68

Caso 3

Caso 4
Y

=0

=0

Caso 6

Caso 5
Y

Y
= -0,87
= -1

Diagrama Dispersin entre 2 Variables


Y

E[Y]

E[Y]

Cov 0

Cov +

E[X]

E[X]

E[Y]

E[Y]

Cov 0

Cov -

X
E[X]

E[X]

Regla Prctica de Interpretacin


Pendiente
Negativa

Correlacin
Pendiente
entre X e Y es Positiva

0.00

Ninguna

0.00

-0.19 - -0.01

Muy Dbil

0.01 - 0.19

-0.39 - -0.20

Dbil

0.20 - 0.39

-0.69 - -0.40

Modesta

0.40 0.69

-0.89 - -0.70

Fuerte

0.70 0.89

-0.99 - -0.90

Muy Fuerte

0.90 0.99

-1.00

Perfecta

1.00

CONCEPTOS BASICOS (BD, QAQC, Modelos)

ESTADISTICA (Media, CV, Anlisis, correlacin)

VARIOGRAFIA (Conceptos, Anlisis)


Geology Modeling / 1 july 2009

Variograma -Definicin

Es una herramienta que permite


analizar el comportamiento espacial
de una propiedad o variable sobre
una zona dada
Ejemplo:

Detectar direcciones de anisotropa


Zonas de
espacial)

influencia

y su

Variabilidad con la distancia

extensin

(correlacin

Variograma Terico-Definicin
Continuidad espacial
B

7
3

8
9

4
2

MEDIA = 5
VARIANZA=50/9
HISTOGRAMAS IGUALES

12

10

10

Variograma

Variograma

12

6
4

6
4
2

0
0

Distancia

Distancia

ESTIMADOR DEL VARIOGRAMA

1
(x1 , x 2 ) var ianza (Z (x1 ) Z (x 2 ) )
2

Variograma:

pero en el caso estacionario:

(E ( Z (x) Z (x h) )2 0

1
(x, h) E Z (x ) Z (x h)2
2
El estimador del variograma es:

1 N (h )
2

(h)
z
(
x
)

z
(
x

h
)

2 N (h) 1
*

Variograma Experimental-obtencin

Datos Igualmente espaciados:

N (h)
1
2
*( h )
(
z
(
x
)

z
(
x

h
))
i
i
2 N (h) i 1

x1

* (h)

x2

x3

x4

x5

x6

1
(z(x1 ) z(x2 ))2 (z(x2 ) z(x3 ))2 (z(x3 ) z(x4 ))2 (z(x4 ) z(x5 ))2 (z(x5 ) z(x6 ))2
2 *5

* (2h)

1
(z(x1 ) z(x3 ))2 (z(x2 ) z(x4 ))2 (z(x3 ) z(x5 ))2 (z(x4 ) z(x6 ))2
2*4

* (3h)

1
(z(x1 ) z(x4 ))2 (z(x2 ) z(x5 ))2 (z(x3 ) z(x6 ))2
2*3

Variograma Experimental-obtencin

1
( h)
2 N (h)
*

( z ( xi ) z ( x j )) 2

xi x j h

Se escoge una direccin

Se escoge una distancia o lag h

Se calcula

para valores de h,2h,

3h,...,nh
Se grafica

* versus los valores

h,2h, 3h,...,nh

Mapa de Variograma

PROPIEDADES DEL VARIOGRAMA

Simtrico

(h ) ( h )

Se anula en el origen

(0) 0
(h ) 0

Positivo o nulo

En el infinito, crece ms lento que una parbola


Toda suma de variogramas es un variograma
El producto de variogramas no es necesariamente un
variograma

RETACIN DE VARIOGRAMAS EXPERIMENTALES


Variograma Vertical
Meseta

Efecto pepita
Rango

Distancia

Meseta = la varianza (1.0 si los datos estn estandarizados)


Alcance = la distancia a la cual el variograma alcanza la meseta (95%)
Efecto pepita = suma de variabilidad debida a microestructuras
geolgicas y error de medicin

Cualquier error en la medicin del valor o la posicin asignada a la medida


se traduce en un efecto pepita mas alto.
Cuando los datos son escasos el efecto pepita aparece ms alto de lo
esperado

Variograma terico (7)


Comportamiento direccional

El estudio de los variogramas direccionales permite identificar


las anisotropas de la variable regionalizada.

Modelos elementales (2)


3

3 |h| 1 |h|

C
si | h | a
Modelo esfrico: (h) 2 a 2 a
C en caso contrario

alcance a, meseta C

Modelos elementales (3)

3 | h |

(
h
)

C
1

exp
Modelo exponencial:

El parmetro a es el alcance prctico: corresponde a la distancia


para la cual el variograma llega al 95% de su meseta C.

Modelos elementales (4)

3 | h |2
Modelo gaussiano: (h) C 1 exp 2
a

alcance prctico a, meseta C

Modelos elementales (Estructuras)

Geology Modeling / 1 july 2009

PROBLEM VARIOGRAMS
AZIMUTH = 0 DIP = 0
(h) = 0.400 + 0.329 Sph 30.7(h) + 0.271 Sph 270.1(h)

1.5

(h)

6
720
0
764
1
715
9
734
8
8 09
4
793
4
84 1
4
881
8

803

709

0
605
2
499
4
378

0.5

7
188

5
240
1
257
9
284
2
299
0
311
1
333
6
354
7
3 66
3
399
9
420
4
45 0
3
447
5
473
5
513
4
551
8
545
0
575
3
610
5
629
2
65 2

1.0

223
8

*
Sample variogram points with less than
350 pairs have not been plotted.

62.5

125.0

Lag distance (h)

187.5

250.0

CLCULO DE VARIOGRAMAS EXPERIMENTALES

2-D o 3-D, regular o irregularmente espaciado


Especificacin de Direccin (regular):
Especificacin de direccin (irregular):
Y axis (North)

Bandwidth

Azimuth

Azimuth
tolerance
X axis (East)

CLCULO DE VARIOGRAMAS EXPERIMENTALES

Ejemplo: Comienzo con una separacin (#4)

2 ( h)

1
[ z( u) z( u h)]2

N ( h) N ( h )

Comenzar en un nodo y comparar su


valor con todos los nodos que caigan
dentro del la tolerancia de separacin y
tolerancia angular.

...

CLCULO DE VARIOGRAMAS EXPERIMENTALES

2 ( h)

1
[ z( u) z( u h)]2

N ( h) N ( h )

Ir al siguiente nodo.

...

Variograma Experimental-distancia & direccin

clase de distancia h
clase de distancia 2h
clase de distancia 3h

Variograma Experimental-obtencin

Variograma Experimental-tolerancia angular

Tolerancia angular

CONCLUSION PRIMERA PARTE

Ley espacial
Esperanza matemtica
(Probabilidades) o momento de
primer orden
E (Z ( x 0 ) ) m ( x 0 )

Momentos de segundo orden:


2 (x) E

Varianza

Covarianza

Variograma

Z (x) m(x)
2

C (x1 , x 2 ) E Z (x1 ) m(x1 )Z (x 2 ) m(x 2 )


E Z (x1 ) Z (x 2 ) m(x1 ) m(x 2 )
1
*( h )
( z ( xi ) z ( x j )) 2

2 N (h ) x x h
i

Correlograma

(x1 , x 2 )

C (x1 , x 2 )

2 (x1 ) 2 (x 2 )