Вы находитесь на странице: 1из 117

Apunte de clase

Geo-Estadistica lineal aplicada

Prof.: José Delgado Vega


Dr Geología de la Ingeniería ENSMP
Esp. Geoestadistica ENSMP
Esp. Explotación Minas a Cielo Abierto y Cantera ENSMP
Ing Civil de Minas U.A
LA BASE DE DATOS
Optimisation de la fosse finale avec MGM
Evaluation Des
Recherche
Ressources
Géologique
Modèle géologique
de bloc
Paramètres Economiques
•Prix du métal
•Coûts d’extraction
•Coûts de traitement
•Autres

Paramètres géo-métallurgiques
•Modélisation des lithologies Optimisation Economique
•Modélisation des gangues (Logiciel Whittle)
•Consommations d´acide
•Type de minéraux
Paramètres Géométriques
•Angles de Talus
•Géométrie de la fosse
•Topographie
•Autres
Analyse économique du
projet
Dimensionnement de la
fosse finale
GENERALIDADES

Déterministicos vs. Géo estadisticos

Déterministicos : Utilizan funciones matemáticas


para poder hacer las predicciones ;

Géo estadísticos (Estocásticos): Asocian


funciones matemáticas a los análisis estadísticos
para hacer interpolaciones (ex: Krigeage);
GENERALIDADES

• La estadística se ocupa de los métodos científicos


para recolectar, organizar, resumir, presentar y
analizar datos, así como obtener conclusiones
válidas y tomar decisiones razonables en base a
dicho análisis

• La geoestadística es una rama de la estadística


aplicada que desarrolla herramientas
matemáticas para el estudio de variables
distribuidas en el espacio, dependientes entre si,
llamadas variables regionalizadas.
¿QUÉ ES LA GEO ESTADÍSTICA?

• Estudio de la variable regionalizada

• Es la aplicación de la estadística a las


ciencias de la tierra
GENERALIDADES

• La geoestadística pone énfasis en:


– El contexto geológico de los datos
– La relación espacial entre los datos
– Datos medidos con un soporte volumétrico y precisión diferentes.

• La geoestadística es útil para:


– Cuantificar aspectos geológicos (“ponerle números a la geología”)
– Estimación / Simulación
– Cuantificación de la incertidumbre (categorización)
– Diseño de muestreo
– Análisis de riesgo
GENERALIDADES
• Principios Básicos:
– Trabaja dentro de restricciones geológicas (físicas)
– Entrega herramientas para cuantificar y aprovechar la correlación espacial
– Considera la cercanía y redundancia de la información disponible al punto a
estimar o simular
– Algoritmos para modelamiento geológico numérico y cuantificación de la
incertidumbre

• No facilita el trabajo, pero lo mejora (si es aplicada correctamente)

• La geoestadística no hace lo siguiente:


– Reemplazar buena información adicional
– Reemplazar la necesidad de sentido común y buen juicio
– Funcionar bien como una caja negra
– Ahorrar tiempo
– No reemplaza un buen trabajo de exploración
GENERALIDADES
• Las herramientas que son apropiadas en una etapa inicial pueden no serlo más
delante

• Algunas herramientas de modelamiento numérico:


– Estimación:
• Inverso del cuadrado de la distancia
• Kriging Simple / Ordinario
• Kriging de indicadores
• Cokriging

– Simulación de variables continuas:


• Simulación Gaussiana Secuencial
• Simulación por Bandas Rotantes
• Simulación de Indicadores
• Simulated Annealing

– Simulación de variables categóricas:


• Simulación de Indicadores
• Truncación de una Gaussiana
• Simulación PluriGaussiana
GENERALIDADES
GENERALIDADES
GENERALIDADES
LAS CINCO ETAPAS DE UN
PROYECTO MINERO

•PROSPECCION

•EXPLORACION

•DESARROLLO

•EXPLOTACION

•REHABILITACION Y ABANDONO
GENERALIDADES
GENERALIDADES
Nociones fundamentales

Variable regionalizada ( o regionalización )


Se trata de una función numérica que mide un atributo que
presenta una estructura en el espacio (por ejemplo , la ley del
cobre en un yacimiento )

Campo
El campo es el dominio en le cual se extiende la variable
regionalizada .Fuera del campo ,la variable no interesa o
simplemente no esta definida
GENERALIDADES
Soporte

Se trata del volumen sobre el cual se considera la


variable regionalizada .Es importante destacar que las
propiedades estadísticas de los valores depende De su
soporte (efecto soporte)

Compositos

Cuando los datos originales son testigos de sondages


cuyo soporte es variable ,una operación de
regularización
GENERALIDADES

“El interés por la geoestadística esta


basado en su habilidad para modelar la
variabilidad espacial de fenómenos de
ocurrencias natural que no pueden
ser totalmente modelados por procesos
determinísticos”
GENERALIDADES
¿La estructura de una variable Regionalizada ?

Es una variable aleatoria donde la localizacion,


el espacio y el tiempo son importante :

Ella presenta dos aspectos contradictorio

Tiene un aspecto aleatorio


+
Su comportamiento es mas estructurada
GENERALIDADES
Título del gráfico

4
leyes de cobre

0
0 50 100 150 200 250
distancias
GENERALIDADES
GENERALIDADES
Algunas Problemáticas generales

El conocimiento que se tiene de un depósito es siempre


fragmentario :solo se dispone de información cualitativa y de
muestras en las cuales se mide varios atributos : ley de cobre
,arsénico oro , potencia de los estratos , densidad de la rocas ,tipo
de litología

La densidad del muestreo influye en el conocimiento de la


“organización “ Espacial de los valores de la variable en estudio ,su
continuidad y otras características estructurales (anisotropía)
GENERALIDADES

Principios directores

1.-Respeto a los datos

2.-Principio del realismo

3.-Principio de la economía
GENERALIDADES

¿Son siempre nuestros datos equiprobables


y no sujetos a concentraciones?
GENERALIDADES
GENERALIDADES

¿Que pasa con la función de distribución de los datos?


GENERALIDADES
Tipos de muestreos

Regular Aleatorio Tran-sect

Aleatorio estratificado Grupos Contorno


GENERALIDADES
GENERALIDADES
Breve discusión de los
métodos tradicionales
de evaluación
• POLIGONO
λ =1
• PROMEDIO
1
• IVOR λi =
n
1
α
di
λi =
• KRIGEAGE (se vera después) ∑
1
i =1, n d i
α
α [1,3]
Ejemplo
COMENTARIOS

• El método tradicional media aritmética no


funciona bien en estimaciones locales
porque quedan bloques sin información.
• El método de los polígonos en general es
menos adecuado en estimaciones locales
porque asigna la misma ley a todos los
bloques de un mismo polígono
COMENTARIOS

• Los métodos tradicionales mencionados son


empíricos,demasiado geométricos y no consideran la
estructura del fenómeno mineralizado (la continuidad
de las leyes y la posible presencia de anisotropías)

• Dichos métodos presentan una sobre-estimación de las


leyes altas y una sub-estimación de las leyes bajas
Apunte de clase
Repaso general de estadística

Prof.: José Delgado Vega


Dr Geología de la Ingeniería ENSMP
Esp. Geoestadistica ENSMP
Esp. Explotación Minas a Cielo Abierto y Cantera ENSMP
Ing Civil de Minas U.A
CONCEPTOS BÁSICOS DE
ESTADÍSTICA
Pensemos en un país imaginario y pequeño llamado Elich ,
donde tres señores de diferentes corrientes de opiniones
discuten, al ver la siguiente estadista de los salarios en dicho
país.
Salarios de Elich
Media 1813529.41
Mediana 100000
Moda 10000

Desviación estándar 5674424.55


Varianza de la muestra 3.2199E+13
Coeficiente de
asimetría 2.92906839
Mínimo 10000
Máximo 20000000
Cuenta 170
Pensemos en un país imaginario y pequeño llamado Elich ,
donde tres señores de diferentes corrientes de opiniones
discuten, al ver la siguiente estadista de los salarios en dicho
país.
Salarios de Elich
Media 1813529.41
Mediana 100000
Moda 10000

Desviación estándar 5674424.55


Varianza de la muestra 3.2199E+13
Coeficiente de
asimetría 2.92906839
Mínimo 10000
Máximo 20000000
Cuenta 170
CONCEPTOS GENERALES

• Estadística normal v/s Estadística exploración


1-2

Definición de Estadística

• Estadística es la ciencia de recolectar,


organizar, presentar, analizar e interpretar
datos con el propósito de ayudar a una
toma de decisiones más efectiva.
Estadística Descriptiva

• Estadística Descriptiva: Conjunto de métodos y


procedimientos gráficos y numéricos que
organizan, resumen y presentan datos
• Es usada para transformar datos en información.
Estadística Inferencial

• Estadística Inferencial: Conjunto de métodos


utilizados para saber “algo” acerca de una
población basándose en una muestra.
• Brinda la base para estimaciones y pronósticos.
• Es usada para transformar información en
conocimiento.
CONCEPTOS ESTADÍSTICOS
• Estadígrafos de posición o tendencia
 Moda (Mo)
 Mediana (Me)
 Media ( )
 Percentiles (Pi)
 Cuartiles (Qi)  Q1= P25 Q2=P50=D5=Me Q3=P75
 Deciles (Di)  D1= P10 D2=P20 D5=P50 D9=P90

• Estadígrafos de disperción
 Rango (R)
 Desviasión estandar
 Varianza
 Coeficiente de variación
 Diferencia cuadrática media
 Varianza ponderada o Submuestras
 Coeficiencia de asimetría
 Curtosis
DISTRIBUCIÓN DE FRECUENCIA
• Y = f(x)  Distribución frecuencia contínua • Sesgamiento

• Simetría

• D. Normal
 Simétrica y unimodal.
• D. Lognormal
• Multimodal
 Valores NO logaritmicos  Maxima sesgada
• D. Datos analíticos
 Distorsión de los valores mas altos  Sesgamiento (+)
 Valores bajos ( poblaciones de muestras pequeñas o
división de intervalos de clase)  Multimodal
TRATAMIENTO O MANEJO DE DATOS
• Uso de intervalos clases

– < Cantidad intervalos de clase  Mejor descripción analítica y mayor


perdida de infomación.

– # Intervalos de clases  # Dist. Frecuencia para un mismo Modelo.

– Evaluación de depósitos y existencia de mineral


• Parte Central de la Distribución y usar aprox. 10 intervalos.
• Modelos extensos o valores fuera del rango  + de 10 intervalos.
• Amplitud de intervalo.

– Modelo de exploración geoquímica


• Separación de datos anómalos de una población normal.
• Existencia datos anómalos  hay depósito mineral.
• Dividir datos en 2 o mas poblaciones (Normal y anómalos)
• Mas información  12 a 20 intervalos.
Estadística Descriptiva

• Recolectar Datos
– Ej. Encuestas
• Presentar Datos
– Ej. Tablas y Gráficos
• Resumir Datos
– Ej. Media muestral = ∑X i

n
1-11

Resumen de
Tipos de Variables

DATOS

Cualitativos o de atributos Cuantitativos o numéricos

Discretos Continuos
(Conteo) (Medición)
Características
de los Datos

Tendencia Central (Posición)

Dispersión
(Variación)

Sesgo
Tendencia
Central

Media Media Media Mediana Moda


Aritmética Ponderada Geométrica
3-2

Media de la Población

• Para datos no agrupados, la media aritmética de la


población es la suma de todos los valores en ella
dividida entre el total de valores en la población:
µ = Σx / N
– donde µ representa la media de la población.
– N es el número total de elementos en la población.
– x representa cualquier valor en particular.
– Σ indica la operación de sumar.
3-4

Media de una Muestra

• Para datos no agrupados, la media de una


muestra es la suma de todos los valores
divididos entre el número total de los mismos:
x = Σx / n
– donde xdenota la media muestral
– n es el número total de valores en la muestra.
3-6

Propiedades de la
Media Aritmética
• Todo conjunto de datos tiene un valor medio.
• Al evaluar la media se incluyen todos los valores.
• Un conjunto de valores sólo tiene una media.

• Desventaja
– Es afectada por los valores extremos.
3-8

Media Ponderada

• La media ponderada de un conjunto de números


x1, x2, ..., xn, con las ponderaciones
correspondientes w1, w2, ...,wn, se calcula con la
fórmula:
xw = ( w1 x1 + w2 x2 + ... + wn xn ) /( w1 + w2 + ...wn )
xw = Σ ( w * x ) / Σw
3-14

Media Geométrica
• La media geométrica (MG) de un conjunto
de n números positivos se define como la
raíz n-ésima del producto de los n valores.
Su fórmula es:
MG = n ( x1)( x 2)( x3)...( xn)
– La media geométrica se usa para encontrar el
promedio de porcentajes, razones, índices o
tasas de crecimiento.
3-10

Mediana

• Mediana: es el punto medio de los valores


después de ordenarlos de menor a mayor,
o de mayor a menor. La misma cantidad de
valores se encuentra por arriba de la
mediana que por debajo de ella.
• Nota: para un conjunto con un número par
de números, la mediana será el promedio
aritmético de los dos números medios.
3-12

Propiedades de la mediana

• La mediana es única para cada conjunto de datos.


• No se ve afectada por valores muy grandes o muy
pequeños.
Moda
• Valor que ocurre más a menudo.
• No es afectada por valores extremos.
• Puede no existir una moda.
• Pueden haber varias modas.
• Usada para datos numéricos o categorías.

0 1 2 3 4 5 6
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Sin Moda
Moda = 9
3-18

Media de Datos Agrupados

• La media de una muestra de datos agrupados se


puede “estimar” con la formula:

Σ( f * x ) Σ( f * x )
x= =
Σf n
– f = frecuencia de cada clase
– x = punto medio o marca de la clase
– n = número de observaciones
Ejemplo
Media de Datos Agrupados

CLASE MARCA FRECUENCIA M X FREC.


1-3 2 1 2
4-6 5 3 15
7-9 8 5 40
10 - 12 11 7 77
13 - 15 14 4 56
16 - 18 17 2 34
22 224

224
Media ⇒ = 10.18
22
3-21

Mediana de datos agrupados

• La mediana de una muestra de datos agrupados se calcula


mediante la siguiente fórmula:

 ( n + 1) / 2 − ( F + 1) 
m=
 
 * w + Lm
 fm 
– n= número de elementos de la distribución
– F= suma de todas las frecuencias de clase hasta pero sin incluir la
clase mediana.
– fm= Frecuencia de la clase mediana
– W = ancho del intervalo de clase
– Lm= Límite inferior del intervalo de clase mediano
Ejemplo
Mediana de Datos Agrupados
CLASE FRECUENCIA FR. ACUM.
1-3 1 1
4-6 3 4
7-9 5 9
10 - 12 7 16
13 - 15 4 20
16 - 18 2 22
22
22 + 1
Ubicación de la mediana = = 11.5
2
 ( 22 + 1) / 2 − (9 + 1) 
m=  * 3 + 10
 7 
3-25

Moda de datos agrupados

• La moda de los datos agrupados se encuentra de la clase


que contiene la frecuencia de clase mayor.
 d1 
Mo = LMo +  *w
 d1 + d 2 
– LMo= Límite inferior de la clase modal
– d1= Frecuencia de la clase modal menos la frecuencia de la clase
que se encuentra inmediatamente por debajo de ella (en valor).
– d2= Frecuencia de la clase modal menos la frecuencia de la clase
que se encuentra inmediatamente por encima de ella (en valor).
– w= Ancho del intervalo de la clase modal.
Ejemplo
Moda de Datos Agrupados
CLASE FRECUENCIA
1-3 1
4-6 3
7-9 5
10 - 12 7
13 - 15 4
16 - 18 2
22

 (7 − 5) 
 (7 − 5) + (7 − 4) 
Mo = 10 +  *3
 
Medidas de Dispersión
Medidas de Dispersión
Dispersión

Varianza Desviación Estándar Coeficiente de


Variación
Alcance Varianza de Desviación
la Población Estándar de
la Población
Varianza de la
Muestra Desviación
Estándar de
Alcance Intercuartil la Muestra
Alcance

• Diferencia entre la mayor y la menor de las


observaciones
– Alcance = xmayor – xmenor

• No toma en cuenta la forma en que están


distribuidos los datos.
Alcance: 12 - 7 = 5 Alcance: 12 - 7 = 5

7 8 9 10 11 12 7 8 9 10 11 12
Cuartiles
• Los datos se ordenan de menor a mayor.

25% 25% 25% 25%

( Q1 ) ( Q2 ) ( Q3 )
Observación Observación
Menor Mayor

• El alcance intercuartil es la distancia entre el tercer cuartil


Q3 y el primer cuartil Q1.
Desviación de la Media
Varianza de la Población

• Desviación cuadrática promedio con relación a


la media de la Población

Σ( x − µ ) 2
σ 2
=
N
Σx 2
σ 2
= −µ 2

N
Desviación Estándar
de la Población

• Raíz Cuadrada de la Varianza de la Población

Σ( x − µ ) 2
σ = σ 2
=
N
Σx 2
σ = σ 2
= −µ 2

N
Varianza de la Muestra

• Desviación cuadrática promedio (n-1) con


relación a la media de la Muestra

Σ( x − x ) 2
s = 2

n −1
Σx 2 2
nx
s =
2

n −1 n −1
Desviación Estándar
de la Muestra

• Raíz Cuadrada de la Varianza de la Muestra

Σ( x − x ) 2
s= s 2
=
n −1

Σx2 2
nx
s= s 2
= −
n −1 n −1
Varianza de la Población
Datos Agrupados

Σf ( x − µ ) 2
σ 2
=
N
Σfx 2
σ 2
= −µ 2

x = marca de clase
Desviación Estándar
de la Población Datos Agrupados

Σf ( x − µ ) 2
σ = σ 2
=
N
Σfx 2
σ = σ 2
= −µ 2

N
x = marca de clase
Varianza de la Muestra
Datos agrupados
Σf ( x − x ) 2
s =
2

n −1
Σfx 2 2
nx
s =
2

n −1 n −1
x = marca de clase
Desviación Estándar
de la Muestra
Datos Agrupados

Σf ( x − x ) 2
s= s 2
=
n −1

Σfx 2 2
nx
s= s 2
= −
n −1 n −1
x = marca de clase
Ejemplo Desviación Estándar
de Datos Agrupados
CLASE MARCA FRECUENCIA M X FREC. (Marca - Media)2 x Frecuencia
1-3 2 1 2 66.94 66.94
4-6 5 3 15 26.85 80.55
7-9 8 5 40 4.76 23.80
10 - 12 11 7 77 0.67 4.69
13 - 15 14 4 56 14.58 58.31
16 - 18 17 2 34 46.49 92.98
22 224 327.27

MEDIA 10.18 VARIANZA 15.584

DESV. ESTAND. 3.948


4-17

Dispersión Relativa
• El coeficiente de variación es la razón de la
desviación estándar a la media aritmética,
expresada como porcentaje:

s
CV = (100%)
x
Ejemplo de Dispersión Relativa

Distribución A Distribución B
x = 10 x = 100
s=2 s=5

¿Cuál de las dos tiene menor dispersión?


Ejemplo de Dispersión Relativa

Distribución A Distribución B
2 5
CV = ×100 = 20% CV = ×100 = 5%
10 100

La distribución B tiene menor dispersión


Representación de los datos
Histograma
200

180

160

140
Frecuencia

120

100

80

60

40

20

0
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,6 3,8 4 4,2 4,4 4,6 4,8 5

Clase

Se interpreta probabilísticamente (probabilidad de un valor de pertenecer a una


determinada clase).
Función de densidad de probabilidad: f ( x ) = F ' ( x ) = Pr ob{x1 ≥ x ≥ x2 }
Nota: No olvidemos que un histograma no presenta ninguna información referente a la ubicación
espacial de los datos (que es clave en geoestadística)
Histograma acumulado

Función no decreciente con valores de


100%

frecuencia relativa entre 0 y 1.

Frecuencia acumulada
80%

De un gráfico de cumulativo podemos 60%

leer directamente probabilidades


40%

F ( x ) = Pr ob{X ≤ x}
20%

0%
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,6 3,8 4 4,2 4,4 4,6 4,8 5

Clase


Relación entre densidad de probabilidades y
densidad cumulativa:
F ( x) =
−∞
∫ f ( x )dx
n
F ( x ) = ∑ pi
Muestras son un número finito de
realizaciones, por lo tanto:
i =1
Estadística básica

• medidas de posición
media, mediana, moda, mínimo, máximo, rango, deciles,
cuartiles, cuantiles
• medidas de dispersión
varianza, desviación estándar, coeficiente de variación,
rango intercuartil

• medidas de forma
coeficiente de asimetría, coeficiente de aplanamiento
Momentos

• Esperanza: (primer momento) es un promedio ponderado por las


probabilidades, si existe. Nos da una idea del centro de la distribución

n donde:
∑w z
i =1
i i
E{Z} = valor esperado de Z
E{Z } = m = n wi = Ponderador del dato i-ésimo
∑w
i =1
i n = número de datos
m = media
• En el caso continuo:
+∞ +∞
E{Z } = m = ∫ zdF ( z ) = ∫ zf ( z )dz
−∞ −∞
Esperanza y Varianza de una Variable
Aleatoria
Sea X una variable aleatoria discreta, y supongamos que toma valores
en el espacio {0, 1, 2, ..} con probabilidad

Pr{X = k } = pk

Entonces se define la esperanza de X como



E [ X ] = ∑ k ⋅ pk
k =0
Y la varianza como

V [X ] = ∑ (k − E [X ]) pk
2

k =0
Esperanza y Varianza de una Variable
Aleatoria
La interpretación es bastante sencilla

E [ X ] = ∑ k ⋅ pk
k =0
probabilidad que la
posibles valores de X variable tome el valor k

El valor “promedio” que puede


asumir la variable

V [X ] = ∑ (k − E [X ]) pk
2

k =0

Desviación cuadrática Desviación cuadrática de los posibles valores de


promedio X respecto de su promedio E[X]
Esperanza y Varianza de una Variable
Aleatoria
Sea X una variable aleatoria continua con valores en R, y con función de
densidad f(x). Se define la esperanza de X como


E[X ] = ∫ x ⋅ f ( x) dx
−∞

Y se define la varianza de X como


V [X ] = ∫ (x − E[X ])
2
f ( x) dx
−∞
Esperanza y Varianza de una Variable
Aleatoria
La interpretación para el caso continuo es similar. En efecto

E[X ] = ∫ x ⋅ f ( x) dx
−∞

posible valor de X
Probabilidad de que la variable
El valor “promedio” que puede
aleatoria X tome un valor en el
asumir la variable
intervalo [x, x + dx]


V [X ] = ∫ (x − E[X ])
2
f ( x) dx
−∞
Desviación cuadrática Desviación cuadrática de los posibles valores de
promedio X respecto de su promedio E[X]
Momentos
• Propiedades de la esperanza:
E{a} = a
E{bZ } = b ⋅ E{Z }
E{a + bZ } = a + b ⋅ E{Z }

E{g ( Z )} = ∫ g ( z ) ⋅ f ( z ) ⋅ dz
−∞

• Propiedades de la varianza

Var{a} = 0
Var{aZ } = a 2 ⋅ Var{Z }
Var{b + Z } = Var{Z }
Más estadísticas
• Medidas de forma:
– Coeficiente de asimetría (skewness)
1 n
n
∑ ( z (uα ) − m) 3
Coeficiente de asimetría = α =1
s3

– Positivo Cercano a 0 Negativo


Frec. Frec. Frec.

Mm z(x) M mM
m
z(x) z(x)
Estadística de dos variables
• Análisis bivariable
• Pares deben corresponder a la misma ubicación
en el espacio (co-localizados)
Gráfico de Dispersión

2,5

2
Variable 2

1,5

0,5

0
0 0,5 1 1,5 2 2,5 3
Variable 1
Correlación
• El coeficiente de correlación es una medida de la
dependencia lineal entre las dos variables

1 n
⋅ ∑ ( z1α − mZ1 )( z2α − mZ 2 )
n α =1
ρ=
σ Z1 ⋅ σ Z 2
Q-q Plot

• Gráfico Q-Q: para comparar dos


distribuciones F1 y F2 cuantil a
cuantil.

• No se utiliza para comparar la


relación par a par que hay entre las
variables.

• Escoger una serie de valores de


probabilidad
pk, k = 1, 2, …, K

• Graficar q1(pk) versus q2(pk), k = 1, 2,


…, K
Q-q Plot
• Si todos los puntos caen en una línea de 45o, las dos
distribuciones son exactamente iguales
• Si la línea esta desplazada de los 45o, las dos distribuciones
tienen la misma forma pero diferentes medias
• Si la inclinación de la línea no es 45o, las dos distribuciones
tienen diferentes varianzas
• Si hay un carácter no lineal en el grafico Q-Q, las
distribuciones tienen diferentes formas en el histograma
g(z)
0.40

Distribución Normal
0.35

0.30

0.25

0.20

0.15

0.10

0.05

0.00
0 2 4 6 8 10 12 14 16
z

• Propiedades:
– Completamente definida por su media y varianza
– Tiene una descripción matemática precisa
– Favorable para enfoques teóricos de estimación
• Función de densidad de probabilidad:
2
1  z −µ 
1 −  
2 σ 
g( z ) = ⋅e
2π ⋅ σ
Distribución Normal
g(z)
0.40

0.35

0.30

0.25

0.20

0.15

0.10

0.05

0.00
0 2 4 6 8 10 12 14 16
z

• Estandarización: z−µ
y=
σ
2
• Distribución normal estándar N(0,1) 1 −
y

g( y ) = e 2

• Función de distribución acumulada:


y

G( y ) =
−∞
∫ g( y ) dy
• corresponde al área bajo la curva
Distribución Normal
g(z)
0.40

0.35

0.30

0.25

0.20

0.15

0.10

0.05

• Intervalos de confianza
0.00
0 2 4 6 8 10 12 14 16
z

68% 95%

g(z) g(z)
0.40 0.40

0.35 0.35

0.30 0.30

0.25 0.25

0.20 0.20 95 %
0.15 68% 0.15

0.10 0.10

0.05
16% 16%
0.05 2.5% 2.5%
0.00 0.00
0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 12 14 16
z z
g(z)
0.35

0.30

0.25

0.20

Distribución Lognormal
0.15

0.10

0.05

0.00
0 2 4 6 8 10
z

• Una población es lognormal si los logaritmos de los datos están distribuídos como
una normal
• Propiedades:
– En Ciencias de la Tierra es común encontrar variables cuya distribución es
cercana a una lognormal
– Relación con la distribución normal la hace fácil de utilizar
– También es favorable para enfoques teóricos de estimación
• Función de densidad de probabilidad:

1  ln y − α 
f Y ( y ) = F 'Y ( y ) = g o  
βy  β 
g(z)
0.35

0.30

Distribución Lognormal
0.25

0.20

0.15

0.10

 ln y − α 
0.05

1
f Y ( y ) = F 'Y ( y ) = g o  
0.00
0 2 4 6 8 10

βy  β 
z

m = eα + β σ 2 = m 2 [e β − 1]
2 2
/2

 σ2   ln y − α 
α = ln m − β / 2 2
β = ln1 + 2
2
 FY ( y ) = Prob{Y ≤ y )} = Go   para todo y > 0
 m   β 
g(z) G(z)
0.35 1.0

0.9
0.30
0.8

0.25 0.7

0.6
0.20
0.5
0.15 0.4

0.3
0.10
0.2
0.05
0.1

0.00 0.0
0 2 4 6 8 10 0 2 4 6 8 10 z
z
La Distribución Log Normal

Valor esperado

.
Varianza
CAPÍTULO 1
SESIÓN 3
EJERCICIOS
GRACIAS

Вам также может понравиться