Академический Документы
Профессиональный Документы
Культура Документы
Datos: Univariable y
Multivariable
Despliegue de datos
Tablas de frecuencia e histogramas
Estadsticas bsicas
Distribucin normal y lognormal
Grfico de dispersin
Q-q plot
Coeficiente de correlacin
Objetivos del Anlisis
Exploratorio De Datos
Desplegar los datos en diferentes formas
Entender los datos: poblaciones estadsticas vs.
poblaciones geolgicas
Seleccionar poblaciones geolgicas
Decisin de estacionaridad
Identificar deriva en los datos
Asegurar la calidad de los datos
Resumir parte de la informacin contenida en los
datos
Familiarizarse con los datos y la geologa
Desagrupar datos para modelamiento
geoestadstico
Despliegue de Datos
Anlisis utilizando plantas y secciones
Despliegue de Datos
Visualizacin en 3-D
interpretacin
Despliegue de Datos
Otras formas de desplegar los datos:
Mapas codificados con color
Mapas de indicadores (Deteccin de deriva
en la variable media mvil)
Histogramas
Histograma
Histograma: despliegue
200
180
de frecuencia de
160
140
Frecuencia
120
80
clases 60
40
Histograma acumulado:
20
0
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,6 3,8 4 4,2 4,4 4,6 4,8 5
despliegue de la Clase
80%
40%
20%
0%
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,6 3,8 4 4,2 4,4 4,6 4,8 5
Clase
Frecuencia
Histogramas
Histogramas
Computa el nmero de muestras en cada clase.
Ancho de clase suele ser constante la altura de cada
barra del histograma es proporcional a la frecuencia de la clase
Entrega estadsticas de las muestras (no de la poblacin)
Escala logartmica puede ser til
Media y varianza son muy sensibles a valores extremos
Mediana y rango intercuartil son medidas ms robustas
Cmo construirlo?
Dependiendo del nmero de muestras, escoger un nmero de
clases
Desplegar el rango importante de los datos (colas no se ven
bien)
Desplegar estadsticas con un nmero razonable de decimales
Frecuencia Acumulada
1
Histogramas
0
Histograma Acumulado
Puede servir para distinguir poblaciones estadsticas
Puede utilizarse para comparar la distribucin de
datos con modelos paramtricos (normal /
lognormal)
Se utiliza para transformar la distribucin de
muestras a cualquier otra distribucin deseada
Puede utilizarse para ver el efecto de compositar a
un determinado largo
Cuntas muestras vamos a cortar?
Histogramas
El histograma de frecuencias acumuladas no requiere definir
un ancho de clase; pueden crearse a la resolucin de los datos
Una valiosa herramienta descriptiva y usada para inferencia
G(z)1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0 2 4 6 8 10 12 14 16
z
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0 2 4 6 8 10 12 14 16
z
Estadsticas Bsicas
Medidas de posicin:
1 n 1
D D
m z (u ) z (u )du
Media n 1
Desviacin estndar
s s2 2
Rango intercuartil
IQR Q 3 Q 1
Coeficiente de variacin
s
CVexp . CVpobl.
m
Estadsticas Bsicas
Yacimiento tipo prfido
cuprfero CV = 0.7
Yacimiento de cobre de
mediana var. CV = 1.5
Yacimiento de oro de alta
variabilidad CV = 4.5
Estadsticas Bsicas
Medidas de forma:
Coeficiente de asimetra (skewness)
n
1
n
( z (u ) m)
3
Coeficiente de asimetra 1
s3
Positivo Cercano a 0 Negativo
Frec. Frec.
Frec.
Mm z(x)
M
z(x) mM
m z(x)
Estadsticas Bsicas
Coeficiente de aplanamiento (Kurtosis)
1 n
n 1
( z (u ) m ) 4
Coeficiente de aplanamiento
s4
0.35
0.30
0.25
Distribucin Normal
0.20
0.15
0.10
0.05
0.00
0 2 4 6 8 10 12 14 16
z
Propiedades:
Completamente definida por su media y
varianza
Tiene una descripcin matemtica
concisa
Favorable para enfoques tericos de
estimacin
Funcin de densidad de probabilidad: 2
1 z
1
2
g( z ) e
2
g(z)
0.40
0.35
0.30
0.25
Distribucin Normal
0.20
0.15
0.10
0.05
0.00
0 2 4 6 8 10 12 14 16
z
z
Estandarizacin: y
Distribucin normal estndar N(0,1)
2
y
1
g( y ) e 2
2
Funcin de distribucin acumulada:
y
G( y ) g( y ) dy
0.35
0.30
0.25
Distribucin Normal
0.20
0.15
0.10
0.05
0.00
0 2 4 6 8 10 12 14 16
z
Funcin de Distribucin de
densidad de probabilidad
probabilidad acumulada
g(z) G(z)1.0
0.40
0.9
0.35
0.8
0.30 0.7
0.25 0.6
0.20 0.5
0.4
0.15
0.3
0.10
0.2
0.05 0.1
0.00 0.0
0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 12 14 16
z z
g(z)
0.40
0.35
0.30
0.25
Distribucin Normal
0.20
0.15
0.10
0.05
0.00
0 2 4 6 8 10 12 14 16
z
Intervalos de confianza
68% 95%
g(z) g(z)
0.40 0.40
0.35 0.35
0.30 0.30
0.25 0.25
0.20 0.20 95 %
0.15 68% 0.15
0.10 0.10
0.05
16% 16%
0.05 2.5% 2.5%
0.00 0.00
0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 12 14 16
z z
g(z)
0.40
0.35
0.30
0.25
Distribucin Normal
0.20
0.15
0.10
0.05
0.00
0 2 4 6 8 10 12 14 16
z
g(y)
0.40
0.35
0.30
0.25
0.20
0.15 90 %
0.10
0.05
0
-4 -3 -2 -1 0 1 2 3 4 y
g(z)
0.35
0.30
0.25
Distribucin Lognormal
0.20
0.15
0.10
0.05
0.00
0 2 4 6 8 10
z
0.30
0.25
Distribucin Lognormal
0.20
0.15
0.10
0.05
0.00
0 2 4 6 8 10
z
g(z) G(z)
0.35 1.0
0.9
0.30
0.8
0.25 0.7
0.6
0.20
0.5
0.15
0.4
0.10 0.3
0.2
0.05
0.1
0.00 0.0
0 2 4 6 8 10 0 2 4 6 8 10 z
z
Grficos de Probabilidad
Q-q plot de una distribucin normal o
lognormal con la distribucin de las
muestras
Grficos de Probabilidad
Son tiles para chequear la presencia
de dos poblaciones
Grficos de Probabilidad
Son tiles para chequear la presencia
de dos poblaciones
Debe confirmarse con informacin
geolgica
Grfico de Dispersin
Anlisis bivariable
Pares deben corresponder a la misma
ubicacin en el espacio (co-localizados)
Grfico de Dispersin
2,5
2
Variable 2
1,5
0,5
0
0 0,5 1 1,5 2 2,5 3
Variable 1
Correlacin
El coeficiente de correlacin es una medida de
la dependencia lineal entre las dos variables
1 n
( z 1 m Z1 )( z 2 m Z 2 )
n 1
Z1 Z 2
Y Y
= 0,73
= -0,68
X X
Caso 1 Caso 2
Y Y
Correlacin = 1 = 0,68
X X
Diferentes
ejemplos de Caso 3
Y
Caso 4
Y
coeficiente =0 =0
de X X
correlacin
Caso 5 Caso 6
Y Y
= -0,87
= -1
X X
Grficos de dispersin
Despliegue bivariable, estimado-verdadero, dos
variables, o la misma variable separada por algn
vector distancia (h-scatterplot)
El coeficiente de correlacin lineal vara entre -1 y +1 y
es sensible a valores extremos (puntos fuera de la
nube principal)
El coeficiente de correlacin de posicin es un
complemento til:
si rank > entonces unos pocos outliers daan la que en otro
caso sera una buena correlacin
si rank < entonces unos pocos outliers mejoran la que en otro
caso sera una pobre correlacin
si rank = 1 entonces una transformacin no lineal de una
variable puede hacer = 1
Q-q Plot
Grfico Q-Q: para comparar
dos distribuciones F1 y F2
cuantil a cuantil.
Frecuencia
Frecuencia
Frecuencia Acumulada
Frecuencia acumulada
Ley DDH
Ley RC