Capitulo 01 PDF

Apunte de clase
Geo-Estadistica lineal aplicada
Prof.: José Delgado Vega

Dr Geología de la Ingeniería ENSMP
Esp. Geoestadistica ENSMP
Esp. Explotación Minas a Cielo Abierto y Cantera ENSMP
Ing Civil de Minas U.A
LA BASE DE DATOS
Optimisation de la fosse finale avec MGM
Evaluation Des
Recherche
Ressources
Géologique
Modèle géologique
de bloc
Paramètres Economiques
•Prix du métal
•Coûts d’extraction
•Coûts de traitement
•Autres
Paramètres géo-métallurgiques
•Modélisation des lithologies Optimisation Economique
•Modélisation des gangues (Logiciel Whittle)
•Consommations d´acide
•Type de minéraux
Paramètres Géométriques
•Angles de Talus
•Géométrie de la fosse
•Topographie
•Autres
Analyse économique du
projet
Dimensionnement de la
fosse finale
GENERALIDADES
Déterministicos vs. Géo estadisticos
Déterministicos : Utilizan funciones matemáticas

para poder hacer las predicciones ;
Géo estadísticos (Estocásticos): Asocian

funciones matemáticas a los análisis estadísticos
para hacer interpolaciones (ex: Krigeage);
GENERALIDADES
• La estadística se ocupa de los métodos científicos

para recolectar, organizar, resumir, presentar y
analizar datos, así como obtener conclusiones
válidas y tomar decisiones razonables en base a
dicho análisis
• La geoestadística es una rama de la estadística

aplicada que desarrolla herramientas
matemáticas para el estudio de variables
distribuidas en el espacio, dependientes entre si,
llamadas variables regionalizadas.
¿QUÉ ES LA GEO ESTADÍSTICA?
• Estudio de la variable regionalizada
• Es la aplicación de la estadística a las

ciencias de la tierra
GENERALIDADES
• La geoestadística pone énfasis en:

– El contexto geológico de los datos
– La relación espacial entre los datos
– Datos medidos con un soporte volumétrico y precisión diferentes.
• La geoestadística es útil para:

– Cuantificar aspectos geológicos (“ponerle números a la geología”)
– Estimación / Simulación
– Cuantificación de la incertidumbre (categorización)
– Diseño de muestreo
– Análisis de riesgo
GENERALIDADES
• Principios Básicos:
– Trabaja dentro de restricciones geológicas (físicas)
– Entrega herramientas para cuantificar y aprovechar la correlación espacial
– Considera la cercanía y redundancia de la información disponible al punto a
estimar o simular
– Algoritmos para modelamiento geológico numérico y cuantificación de la
incertidumbre
• No facilita el trabajo, pero lo mejora (si es aplicada correctamente)
• La geoestadística no hace lo siguiente:

– Reemplazar buena información adicional
– Reemplazar la necesidad de sentido común y buen juicio
– Funcionar bien como una caja negra
– Ahorrar tiempo
– No reemplaza un buen trabajo de exploración
GENERALIDADES
• Las herramientas que son apropiadas en una etapa inicial pueden no serlo más
delante
• Algunas herramientas de modelamiento numérico:

– Estimación:
• Inverso del cuadrado de la distancia
• Kriging Simple / Ordinario
• Kriging de indicadores
• Cokriging
– Simulación de variables continuas:

• Simulación Gaussiana Secuencial
• Simulación por Bandas Rotantes
• Simulación de Indicadores
• Simulated Annealing
– Simulación de variables categóricas:

• Simulación de Indicadores
• Truncación de una Gaussiana
• Simulación PluriGaussiana
GENERALIDADES
GENERALIDADES
GENERALIDADES
LAS CINCO ETAPAS DE UN
PROYECTO MINERO
•PROSPECCION
•EXPLORACION
•DESARROLLO
•EXPLOTACION
•REHABILITACION Y ABANDONO
GENERALIDADES
GENERALIDADES
Nociones fundamentales
Variable regionalizada ( o regionalización )

Se trata de una función numérica que mide un atributo que
presenta una estructura en el espacio (por ejemplo , la ley del
cobre en un yacimiento )
Campo
El campo es el dominio en le cual se extiende la variable
regionalizada .Fuera del campo ,la variable no interesa o
simplemente no esta definida
GENERALIDADES
Soporte
Se trata del volumen sobre el cual se considera la

variable regionalizada .Es importante destacar que las
propiedades estadísticas de los valores depende De su
soporte (efecto soporte)
Compositos
Cuando los datos originales son testigos de sondages

cuyo soporte es variable ,una operación de
regularización
GENERALIDADES
“El interés por la geoestadística esta

basado en su habilidad para modelar la
variabilidad espacial de fenómenos de
ocurrencias natural que no pueden
ser totalmente modelados por procesos
determinísticos”
GENERALIDADES
¿La estructura de una variable Regionalizada ?
Es una variable aleatoria donde la localizacion,

el espacio y el tiempo son importante :
Ella presenta dos aspectos contradictorio
Tiene un aspecto aleatorio

+
Su comportamiento es mas estructurada
GENERALIDADES
Título del gráfico
4
leyes de cobre
0
0 50 100 150 200 250
distancias
GENERALIDADES
GENERALIDADES
Algunas Problemáticas generales
El conocimiento que se tiene de un depósito es siempre

fragmentario :solo se dispone de información cualitativa y de
muestras en las cuales se mide varios atributos : ley de cobre
,arsénico oro , potencia de los estratos , densidad de la rocas ,tipo
de litología
La densidad del muestreo influye en el conocimiento de la

“organización “ Espacial de los valores de la variable en estudio ,su
continuidad y otras características estructurales (anisotropía)
GENERALIDADES
Principios directores
1.-Respeto a los datos
2.-Principio del realismo
3.-Principio de la economía
GENERALIDADES
¿Son siempre nuestros datos equiprobables

y no sujetos a concentraciones?
GENERALIDADES
GENERALIDADES
¿Que pasa con la función de distribución de los datos?

GENERALIDADES
Tipos de muestreos
Regular Aleatorio Tran-sect
Aleatorio estratificado Grupos Contorno

GENERALIDADES
GENERALIDADES
Breve discusión de los
métodos tradicionales
de evaluación
• POLIGONO
λ =1
• PROMEDIO
1
• IVOR λi =
n
1
α
di
λi =
• KRIGEAGE (se vera después) ∑
1
i =1, n d i
α
α [1,3]
Ejemplo
COMENTARIOS
• El método tradicional media aritmética no

funciona bien en estimaciones locales
porque quedan bloques sin información.
• El método de los polígonos en general es
menos adecuado en estimaciones locales
porque asigna la misma ley a todos los
bloques de un mismo polígono
COMENTARIOS
• Los métodos tradicionales mencionados son

empíricos,demasiado geométricos y no consideran la
estructura del fenómeno mineralizado (la continuidad
de las leyes y la posible presencia de anisotropías)
• Dichos métodos presentan una sobre-estimación de las

leyes altas y una sub-estimación de las leyes bajas
Apunte de clase
Repaso general de estadística
Prof.: José Delgado Vega

Dr Geología de la Ingeniería ENSMP
Esp. Geoestadistica ENSMP
Esp. Explotación Minas a Cielo Abierto y Cantera ENSMP
Ing Civil de Minas U.A
CONCEPTOS BÁSICOS DE
ESTADÍSTICA
Pensemos en un país imaginario y pequeño llamado Elich ,
donde tres señores de diferentes corrientes de opiniones
discuten, al ver la siguiente estadista de los salarios en dicho
país.
Salarios de Elich
Media 1813529.41
Mediana 100000
Moda 10000
Desviación estándar 5674424.55

Varianza de la muestra 3.2199E+13
Coeficiente de
asimetría 2.92906839
Mínimo 10000
Máximo 20000000
Cuenta 170
Pensemos en un país imaginario y pequeño llamado Elich ,
donde tres señores de diferentes corrientes de opiniones
discuten, al ver la siguiente estadista de los salarios en dicho
país.
Salarios de Elich
Media 1813529.41
Mediana 100000
Moda 10000
Desviación estándar 5674424.55

Varianza de la muestra 3.2199E+13
Coeficiente de
asimetría 2.92906839
Mínimo 10000
Máximo 20000000
Cuenta 170
CONCEPTOS GENERALES
• Estadística normal v/s Estadística exploración

1-2
Definición de Estadística
• Estadística es la ciencia de recolectar,

organizar, presentar, analizar e interpretar
datos con el propósito de ayudar a una
toma de decisiones más efectiva.
Estadística Descriptiva
• Estadística Descriptiva: Conjunto de métodos y

procedimientos gráficos y numéricos que
organizan, resumen y presentan datos
• Es usada para transformar datos en información.
Estadística Inferencial
• Estadística Inferencial: Conjunto de métodos

utilizados para saber “algo” acerca de una
población basándose en una muestra.
• Brinda la base para estimaciones y pronósticos.
• Es usada para transformar información en
conocimiento.
CONCEPTOS ESTADÍSTICOS
• Estadígrafos de posición o tendencia
 Moda (Mo)
 Mediana (Me)
 Media ( )
 Percentiles (Pi)
 Cuartiles (Qi)  Q1= P25 Q2=P50=D5=Me Q3=P75
 Deciles (Di)  D1= P10 D2=P20 D5=P50 D9=P90
• Estadígrafos de disperción
 Rango (R)
 Desviasión estandar
 Varianza
 Coeficiente de variación
 Diferencia cuadrática media
 Varianza ponderada o Submuestras
 Coeficiencia de asimetría
 Curtosis
DISTRIBUCIÓN DE FRECUENCIA
• Y = f(x)  Distribución frecuencia contínua • Sesgamiento
• Simetría
• D. Normal
 Simétrica y unimodal.
• D. Lognormal
• Multimodal
 Valores NO logaritmicos  Maxima sesgada
• D. Datos analíticos
 Distorsión de los valores mas altos  Sesgamiento (+)
 Valores bajos ( poblaciones de muestras pequeñas o
división de intervalos de clase)  Multimodal
TRATAMIENTO O MANEJO DE DATOS
• Uso de intervalos clases
– < Cantidad intervalos de clase  Mejor descripción analítica y mayor

perdida de infomación.
– # Intervalos de clases  # Dist. Frecuencia para un mismo Modelo.
– Evaluación de depósitos y existencia de mineral

• Parte Central de la Distribución y usar aprox. 10 intervalos.
• Modelos extensos o valores fuera del rango  + de 10 intervalos.
• Amplitud de intervalo.
– Modelo de exploración geoquímica

• Separación de datos anómalos de una población normal.
• Existencia datos anómalos  hay depósito mineral.
• Dividir datos en 2 o mas poblaciones (Normal y anómalos)
• Mas información  12 a 20 intervalos.
Estadística Descriptiva
• Recolectar Datos
– Ej. Encuestas
• Presentar Datos
– Ej. Tablas y Gráficos
• Resumir Datos
– Ej. Media muestral = ∑X i
n
1-11
Resumen de
Tipos de Variables
DATOS
Cualitativos o de atributos Cuantitativos o numéricos
Discretos Continuos
(Conteo) (Medición)
Características
de los Datos
Tendencia Central (Posición)
Dispersión
(Variación)
Sesgo
Tendencia
Central
Media Media Media Mediana Moda

Aritmética Ponderada Geométrica
3-2
Media de la Población
• Para datos no agrupados, la media aritmética de la

población es la suma de todos los valores en ella
dividida entre el total de valores en la población:
µ = Σx / N
– donde µ representa la media de la población.
– N es el número total de elementos en la población.
– x representa cualquier valor en particular.
– Σ indica la operación de sumar.
3-4
Media de una Muestra
• Para datos no agrupados, la media de una

muestra es la suma de todos los valores
divididos entre el número total de los mismos:
x = Σx / n
– donde xdenota la media muestral
– n es el número total de valores en la muestra.
3-6
Propiedades de la
Media Aritmética
• Todo conjunto de datos tiene un valor medio.
• Al evaluar la media se incluyen todos los valores.
• Un conjunto de valores sólo tiene una media.
• Desventaja
– Es afectada por los valores extremos.
3-8
Media Ponderada
• La media ponderada de un conjunto de números

x1, x2, ..., xn, con las ponderaciones
correspondientes w1, w2, ...,wn, se calcula con la
fórmula:
xw = ( w1 x1 + w2 x2 + ... + wn xn ) /( w1 + w2 + ...wn )
xw = Σ ( w * x ) / Σw
3-14
Media Geométrica
• La media geométrica (MG) de un conjunto
de n números positivos se define como la
raíz n-ésima del producto de los n valores.
Su fórmula es:
MG = n ( x1)( x 2)( x3)...( xn)
– La media geométrica se usa para encontrar el
promedio de porcentajes, razones, índices o
tasas de crecimiento.
3-10
Mediana
• Mediana: es el punto medio de los valores

después de ordenarlos de menor a mayor,
o de mayor a menor. La misma cantidad de
valores se encuentra por arriba de la
mediana que por debajo de ella.
• Nota: para un conjunto con un número par
de números, la mediana será el promedio
aritmético de los dos números medios.
3-12
Propiedades de la mediana
• La mediana es única para cada conjunto de datos.

• No se ve afectada por valores muy grandes o muy
pequeños.
Moda
• Valor que ocurre más a menudo.
• No es afectada por valores extremos.
• Puede no existir una moda.
• Pueden haber varias modas.
• Usada para datos numéricos o categorías.
0 1 2 3 4 5 6
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Sin Moda
Moda = 9
3-18
Media de Datos Agrupados
• La media de una muestra de datos agrupados se

puede “estimar” con la formula:
Σ( f * x ) Σ( f * x )
x= =
Σf n
– f = frecuencia de cada clase
– x = punto medio o marca de la clase
– n = número de observaciones
Ejemplo
Media de Datos Agrupados
CLASE MARCA FRECUENCIA M X FREC.

1-3 2 1 2
4-6 5 3 15
7-9 8 5 40
10 - 12 11 7 77
13 - 15 14 4 56
16 - 18 17 2 34
22 224
224
Media ⇒ = 10.18
22
3-21
Mediana de datos agrupados
• La mediana de una muestra de datos agrupados se calcula

mediante la siguiente fórmula:
 ( n + 1) / 2 − ( F + 1) 
m=
 
 * w + Lm
 fm 
– n= número de elementos de la distribución
– F= suma de todas las frecuencias de clase hasta pero sin incluir la
clase mediana.
– fm= Frecuencia de la clase mediana
– W = ancho del intervalo de clase
– Lm= Límite inferior del intervalo de clase mediano
Ejemplo
Mediana de Datos Agrupados
CLASE FRECUENCIA FR. ACUM.
1-3 1 1
4-6 3 4
7-9 5 9
10 - 12 7 16
13 - 15 4 20
16 - 18 2 22
22
22 + 1
Ubicación de la mediana = = 11.5
2
 ( 22 + 1) / 2 − (9 + 1) 
m=  * 3 + 10
 7 
3-25
Moda de datos agrupados
• La moda de los datos agrupados se encuentra de la clase

que contiene la frecuencia de clase mayor.
 d1 
Mo = LMo +  *w
 d1 + d 2 
– LMo= Límite inferior de la clase modal
– d1= Frecuencia de la clase modal menos la frecuencia de la clase
que se encuentra inmediatamente por debajo de ella (en valor).
– d2= Frecuencia de la clase modal menos la frecuencia de la clase
que se encuentra inmediatamente por encima de ella (en valor).
– w= Ancho del intervalo de la clase modal.
Ejemplo
Moda de Datos Agrupados
CLASE FRECUENCIA
1-3 1
4-6 3
7-9 5
10 - 12 7
13 - 15 4
16 - 18 2
22
 (7 − 5) 
 (7 − 5) + (7 − 4) 
Mo = 10 +  *3
 
Medidas de Dispersión
Medidas de Dispersión
Dispersión
Varianza Desviación Estándar Coeficiente de

Variación
Alcance Varianza de Desviación
la Población Estándar de
la Población
Varianza de la
Muestra Desviación
Estándar de
Alcance Intercuartil la Muestra
Alcance
• Diferencia entre la mayor y la menor de las

observaciones
– Alcance = xmayor – xmenor
• No toma en cuenta la forma en que están

distribuidos los datos.
Alcance: 12 - 7 = 5 Alcance: 12 - 7 = 5
7 8 9 10 11 12 7 8 9 10 11 12
Cuartiles
• Los datos se ordenan de menor a mayor.
25% 25% 25% 25%
( Q1 ) ( Q2 ) ( Q3 )
Observación Observación
Menor Mayor
• El alcance intercuartil es la distancia entre el tercer cuartil

Q3 y el primer cuartil Q1.
Desviación de la Media
Varianza de la Población
• Desviación cuadrática promedio con relación a

la media de la Población
Σ( x − µ ) 2
σ 2
=
N
Σx 2
σ 2
= −µ 2
N
Desviación Estándar
de la Población
• Raíz Cuadrada de la Varianza de la Población
Σ( x − µ ) 2
σ = σ 2
=
N
Σx 2
σ = σ 2
= −µ 2
N
Varianza de la Muestra
• Desviación cuadrática promedio (n-1) con

relación a la media de la Muestra
Σ( x − x ) 2
s = 2
n −1
Σx 2 2
nx
s =
2
−
n −1 n −1
de la Muestra
• Raíz Cuadrada de la Varianza de la Muestra
Σ( x − x ) 2
s= s 2
=
n −1
Σx2 2
nx
s= s 2
= −
n −1 n −1
Varianza de la Población
Datos Agrupados
Σf ( x − µ ) 2
σ 2
=
N
Σfx 2
σ 2
= −µ 2
x = marca de clase
de la Población Datos Agrupados
Σf ( x − µ ) 2
σ = σ 2
=
N
Σfx 2
σ = σ 2
= −µ 2
N
x = marca de clase
Varianza de la Muestra
Datos agrupados
Σf ( x − x ) 2
s =
2
n −1
Σfx 2 2
nx
s =
2
−
n −1 n −1
x = marca de clase
de la Muestra
Datos Agrupados
Σf ( x − x ) 2
s= s 2
=
n −1
Σfx 2 2
nx
s= s 2
= −
n −1 n −1
x = marca de clase
Ejemplo Desviación Estándar
de Datos Agrupados
CLASE MARCA FRECUENCIA M X FREC. (Marca - Media)2 x Frecuencia
1-3 2 1 2 66.94 66.94
4-6 5 3 15 26.85 80.55
7-9 8 5 40 4.76 23.80
10 - 12 11 7 77 0.67 4.69
13 - 15 14 4 56 14.58 58.31
16 - 18 17 2 34 46.49 92.98
22 224 327.27
MEDIA 10.18 VARIANZA 15.584
DESV. ESTAND. 3.948

4-17
Dispersión Relativa
• El coeficiente de variación es la razón de la
desviación estándar a la media aritmética,
expresada como porcentaje:
s
CV = (100%)
x
Ejemplo de Dispersión Relativa
Distribución A Distribución B
x = 10 x = 100
s=2 s=5
¿Cuál de las dos tiene menor dispersión?

Ejemplo de Dispersión Relativa
Distribución A Distribución B
2 5
CV = ×100 = 20% CV = ×100 = 5%
10 100
La distribución B tiene menor dispersión

Representación de los datos
Histograma
200
180
160
140
Frecuencia
120
100
80
60
40
20
0
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,6 3,8 4 4,2 4,4 4,6 4,8 5
Clase
Se interpreta probabilísticamente (probabilidad de un valor de pertenecer a una

determinada clase).
Función de densidad de probabilidad: f ( x ) = F ' ( x ) = Pr ob{x1 ≥ x ≥ x2 }
Nota: No olvidemos que un histograma no presenta ninguna información referente a la ubicación
espacial de los datos (que es clave en geoestadística)
Histograma acumulado
Función no decreciente con valores de

100%
frecuencia relativa entre 0 y 1.
Frecuencia acumulada
80%
De un gráfico de cumulativo podemos 60%
leer directamente probabilidades

40%
F ( x ) = Pr ob{X ≤ x}
20%
0%
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,6 3,8 4 4,2 4,4 4,6 4,8 5
Clase
∞
Relación entre densidad de probabilidades y
densidad cumulativa:
F ( x) =
−∞
∫ f ( x )dx
n
F ( x ) = ∑ pi
Muestras son un número finito de
realizaciones, por lo tanto:
i =1
Estadística básica
• medidas de posición
media, mediana, moda, mínimo, máximo, rango, deciles,
cuartiles, cuantiles
• medidas de dispersión
varianza, desviación estándar, coeficiente de variación,
rango intercuartil
• medidas de forma
coeficiente de asimetría, coeficiente de aplanamiento
Momentos
• Esperanza: (primer momento) es un promedio ponderado por las

probabilidades, si existe. Nos da una idea del centro de la distribución
n donde:
∑w z
i =1
i i
E{Z} = valor esperado de Z
E{Z } = m = n wi = Ponderador del dato i-ésimo
∑w
i =1
i n = número de datos
m = media
• En el caso continuo:
+∞ +∞
E{Z } = m = ∫ zdF ( z ) = ∫ zf ( z )dz
−∞ −∞
Esperanza y Varianza de una Variable
Aleatoria
Sea X una variable aleatoria discreta, y supongamos que toma valores
en el espacio {0, 1, 2, ..} con probabilidad
Pr{X = k } = pk
Entonces se define la esperanza de X como

∞
E [ X ] = ∑ k ⋅ pk
k =0
Y la varianza como
∞
V [X ] = ∑ (k − E [X ]) pk
2
k =0
Aleatoria
La interpretación es bastante sencilla
∞
E [ X ] = ∑ k ⋅ pk
k =0
probabilidad que la
posibles valores de X variable tome el valor k
El valor “promedio” que puede

asumir la variable
∞
V [X ] = ∑ (k − E [X ]) pk
2
k =0
Desviación cuadrática Desviación cuadrática de los posibles valores de

promedio X respecto de su promedio E[X]
Aleatoria
Sea X una variable aleatoria continua con valores en R, y con función de
densidad f(x). Se define la esperanza de X como
∞
E[X ] = ∫ x ⋅ f ( x) dx
−∞
Y se define la varianza de X como
∞
V [X ] = ∫ (x − E[X ])
2
f ( x) dx
−∞
Aleatoria
La interpretación para el caso continuo es similar. En efecto
∞
E[X ] = ∫ x ⋅ f ( x) dx
−∞
posible valor de X
Probabilidad de que la variable
El valor “promedio” que puede
aleatoria X tome un valor en el
asumir la variable
intervalo [x, x + dx]
∞
V [X ] = ∫ (x − E[X ])
2
f ( x) dx
−∞
Desviación cuadrática Desviación cuadrática de los posibles valores de
promedio X respecto de su promedio E[X]
Momentos
• Propiedades de la esperanza:
E{a} = a
E{bZ } = b ⋅ E{Z }
E{a + bZ } = a + b ⋅ E{Z }
∞
E{g ( Z )} = ∫ g ( z ) ⋅ f ( z ) ⋅ dz
−∞
• Propiedades de la varianza
Var{a} = 0
Var{aZ } = a 2 ⋅ Var{Z }
Var{b + Z } = Var{Z }
Más estadísticas
• Medidas de forma:
– Coeficiente de asimetría (skewness)
1 n
n
∑ ( z (uα ) − m) 3
Coeficiente de asimetría = α =1
s3
– Positivo Cercano a 0 Negativo

Frec. Frec. Frec.
Mm z(x) M mM
m
z(x) z(x)
Estadística de dos variables
• Análisis bivariable
• Pares deben corresponder a la misma ubicación
en el espacio (co-localizados)
Gráfico de Dispersión
2,5
2
Variable 2
1,5
0,5
0
0 0,5 1 1,5 2 2,5 3
Variable 1
Correlación
• El coeficiente de correlación es una medida de la
dependencia lineal entre las dos variables
1 n
⋅ ∑ ( z1α − mZ1 )( z2α − mZ 2 )
n α =1
ρ=
σ Z1 ⋅ σ Z 2
Q-q Plot
• Gráfico Q-Q: para comparar dos

distribuciones F1 y F2 cuantil a
cuantil.
• No se utiliza para comparar la

relación par a par que hay entre las
variables.
• Escoger una serie de valores de

probabilidad
pk, k = 1, 2, …, K
• Graficar q1(pk) versus q2(pk), k = 1, 2,

…, K
Q-q Plot
• Si todos los puntos caen en una línea de 45o, las dos
distribuciones son exactamente iguales
• Si la línea esta desplazada de los 45o, las dos distribuciones
tienen la misma forma pero diferentes medias
• Si la inclinación de la línea no es 45o, las dos distribuciones
tienen diferentes varianzas
• Si hay un carácter no lineal en el grafico Q-Q, las
distribuciones tienen diferentes formas en el histograma
g(z)
0.40
Distribución Normal
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00
0 2 4 6 8 10 12 14 16
z
• Propiedades:
– Completamente definida por su media y varianza
– Tiene una descripción matemática precisa
– Favorable para enfoques teóricos de estimación
• Función de densidad de probabilidad:
2
1  z −µ 
1 −  
2 σ 
g( z ) = ⋅e
2π ⋅ σ
g(z)
0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00
0 2 4 6 8 10 12 14 16
z
• Estandarización: z−µ
y=
σ
2
• Distribución normal estándar N(0,1) 1 −
y
g( y ) = e 2
2π
• Función de distribución acumulada:

y
G( y ) =
−∞
∫ g( y ) dy
• corresponde al área bajo la curva
g(z)
0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05
• Intervalos de confianza
0.00
0 2 4 6 8 10 12 14 16
z
68% 95%
g(z) g(z)
0.40 0.40
0.35 0.35
0.30 0.30
0.25 0.25
0.20 0.20 95 %
0.15 68% 0.15
0.10 0.10
0.05
16% 16%
0.05 2.5% 2.5%
0.00 0.00
0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 12 14 16
z z
g(z)
0.35
0.30
0.25
0.20
Distribución Lognormal
0.15
0.10
0.05
0.00
0 2 4 6 8 10
z
• Una población es lognormal si los logaritmos de los datos están distribuídos como
una normal
• Propiedades:
– En Ciencias de la Tierra es común encontrar variables cuya distribución es
cercana a una lognormal
– Relación con la distribución normal la hace fácil de utilizar
– También es favorable para enfoques teóricos de estimación
• Función de densidad de probabilidad:
1  ln y − α 
f Y ( y ) = F 'Y ( y ) = g o  
βy  β 
g(z)
0.35
0.30
Distribución Lognormal
0.25
0.20
0.15
0.10
 ln y − α 
0.05
1
f Y ( y ) = F 'Y ( y ) = g o  
0.00
0 2 4 6 8 10
βy  β 
z
m = eα + β σ 2 = m 2 [e β − 1]
2 2
/2
 σ2   ln y − α 
α = ln m − β / 2 2
β = ln1 + 2
2
 FY ( y ) = Prob{Y ≤ y )} = Go   para todo y > 0
 m   β 
g(z) G(z)
0.35 1.0
0.9
0.30
0.8
0.25 0.7
0.6
0.20
0.5
0.15 0.4
0.3
0.10
0.2
0.05
0.1
0.00 0.0
0 2 4 6 8 10 0 2 4 6 8 10 z
z
La Distribución Log Normal
Valor esperado
.
Varianza
CAPÍTULO 1
SESIÓN 3
EJERCICIOS
GRACIAS

Capitulo 01 PDF

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Capitulo 01 PDF

Загружено:

Авторское право:

Доступные форматы

Apunte de clase

Geo-Estadistica lineal aplicada

Prof.: José Delgado Vega

Déterministicos vs. Géo estadisticos

Déterministicos : Utilizan funciones matemáticas

Géo estadísticos (Estocásticos): Asocian

• La estadística se ocupa de los métodos científicos

• La geoestadística es una rama de la estadística

• Estudio de la variable regionalizada

• Es la aplicación de la estadística a las

• La geoestadística pone énfasis en:

• La geoestadística es útil para:

• No facilita el trabajo, pero lo mejora (si es aplicada correctamente)

• La geoestadística no hace lo siguiente:

• Algunas herramientas de modelamiento numérico:

– Simulación de variables continuas:

– Simulación de variables categóricas:

Variable regionalizada ( o regionalización )

Se trata del volumen sobre el cual se considera la

Cuando los datos originales son testigos de sondages

“El interés por la geoestadística esta

Es una variable aleatoria donde la localizacion,

Ella presenta dos aspectos contradictorio

Tiene un aspecto aleatorio

El conocimiento que se tiene de un depósito es siempre

La densidad del muestreo influye en el conocimiento de la

1.-Respeto a los datos

2.-Principio del realismo

¿Son siempre nuestros datos equiprobables

¿Que pasa con la función de distribución de los datos?

Regular Aleatorio Tran-sect

Aleatorio estratificado Grupos Contorno

• El método tradicional media aritmética no

• Los métodos tradicionales mencionados son

• Dichos métodos presentan una sobre-estimación de las

Prof.: José Delgado Vega

Desviación estándar 5674424.55

Desviación estándar 5674424.55

• Estadística normal v/s Estadística exploración

• Estadística es la ciencia de recolectar,

• Estadística Descriptiva: Conjunto de métodos y

• Estadística Inferencial: Conjunto de métodos

– < Cantidad intervalos de clase  Mejor descripción analítica y mayor

– # Intervalos de clases  # Dist. Frecuencia para un mismo Modelo.

– Evaluación de depósitos y existencia de mineral

– Modelo de exploración geoquímica

Cualitativos o de atributos Cuantitativos o numéricos

Tendencia Central (Posición)

Media Media Media Mediana Moda

• Para datos no agrupados, la media aritmética de la

Media de una Muestra

• Para datos no agrupados, la media de una

• La media ponderada de un conjunto de números

• Mediana: es el punto medio de los valores

• La mediana es única para cada conjunto de datos.

Media de Datos Agrupados

• La media de una muestra de datos agrupados se

CLASE MARCA FRECUENCIA M X FREC.

Mediana de datos agrupados

• La mediana de una muestra de datos agrupados se calcula

Moda de datos agrupados

• La moda de los datos agrupados se encuentra de la clase

Varianza Desviación Estándar Coeficiente de