Вы находитесь на странице: 1из 25

1 INDICE

1 INDICE...................................................................................................... 1
2 INTRODUCCION......................................................................................... 2
3 OBJETIVOS................................................................................................ 3
4 FUNDAMENTO TEORICO............................................................................4
4.1 Geoestadistica....................................................................................4
4.2 Variograma......................................................................................... 5
4.3 Histograma......................................................................................... 6
5 Calculo del variograma............................................................................. 8
5.1 Formulacin del problema..................................................................8
5.2 Calculo y anlisis del Variograma de datos aleatorios........................9
5.2.1 Variograma de datos aleatorios................................................10
5.2.2 Anlisis de datos ordenados.......................................................11
5.2.3 Comparacion de datos ordenados y aleatorios..........................13
5.3 Calculo y anlisis del Variograma de datos agrupados.....................15
6 CONCLUSIONES...................................................................................... 17
7 RECOMENDACIONES...............................................................................17
8 BIBLIOGRAFIA......................................................................................... 18
2 INTRODUCCION

El estudio de fenmenos con correlacin espacial, por medio de mtodos

geo estadsticos, surgi a partir de los aos sesenta, especialmente con el

propsito de predecir valores de las variables en sitios no muestreados.

Como antecedentes suelen citarse trabajos de Sichel (1947; 1949) y Krige

(1951). El primero observ la naturaleza asimtrica de la distribucin del

contenido de oro en las minas surafricanas, la equipar a una distribucin de

probabilidad lognormal y desarroll las frmulas bsicas para esta

distribucin. Ello permiti una primera estimacin de las reservas, pero bajo

el supuesto de que las mediciones eran independientes, en clara

contradiccin con la experiencia de que existen zonas ms ricas que otras.

Una primera aproximacin a la solucin de este problema fue dada por

gelogo G. Krige que propuso una variante del mtodo de medias mviles, el

cual puede considerarse como el equivalente al krigeado simple que, como

se ver ms adelante, es uno de los mtodos de estimacin lineal en el

espacio con mayores cualidades tericas. La formulacin rigurosa y la

solucin al problema de prediccin (estimacin en muchos textos

geoestadsticos) vinieron de la mano de Matheron (1962) en la escuela de

minas de Pars. En los aos sucesivos la teora se fue depurando, ampliando

su campo de validez y reduciendo las hiptesis necesarias (Samper y


Carrera, 1990). De la minera las tcnicas geoestadsticos, se han

"exportado" a muchos otros campos como hidrologa, fsica del suelo,

ciencias de la tierra y ms recientemente al monitoreo ambiental y al

procesamiento de imgenes de satlite.

3 OBJETIVOS

Conocer los principales conceptos y la definicin de la


Geoestadistica.

Conocer el concepto, uso y funcionamiento del variograma.

Comparar diferentes variogramas obtenidos de una muestra en


comn pero con diferentes formas de agrupamiento.

Comprender la importancia y uso de las variables regionalizadas


mediante el uso del variograma.

4 FUNDAMENTO TEORICO
4.1 Geoestadistica
.
La Geoestadistica se define como el estudio de fenmenos

regionalizados, es decir, que se extienden en el espacio y presentan

una cierta continuidad. Su inters primordial es la estimacin,

prediccin y simulacin de dichos fenmenos (Myers, 1987). Esta

herramienta ofrece una manera de describir la continuidad espacial,

que es un rasgo distintivo esencial de muchos fenmenos naturales, y


proporciona adaptaciones de las tcnicas clsicas de regresin para

tomar ventajas de esta continuidad (Isaaks & Srivastava, 1989).

Petitgas (1996), la define como una aplicacin de la teora de

probabilidades a la estimacin estadstica de variables espaciales. La

modelacin espacial es la adicin ms reciente a la literatura

estadstica. Geologa, ciencias del suelo, agronoma, ingeniera

forestal, astronoma, o cualquier disciplina que trabaja con datos

colectados en diferentes locaciones espaciales necesita desarrollar

modelos que indiquen cuando hay dependencia entre las medidas de

los diferentes sitios. Usualmente dicha modelacin concierne con la

prediccin espacial, pero hay otras reas importantes como la

simulacin y el diseo muestral (Cressie, 1989). Cuando el objetivo es

hacer prediccin, la geoestadstica opera bsicamente en dos etapas.

La primera es el anlisis estructural, en la cual se describe la

correlacin entre puntos en el espacio. En la segunda fase se hace

prediccin en sitios de la regin no muestreados por medio de la

tcnica kriging (captulo 4). Este es un proceso que calcula un

promedio ponderado de las observaciones muestrales. Los pesos

asignados a los valores muestrales son apropiadamente determinados

por la estructura espacial de correlacin establecida en la primera

etapa y por la configuracin de muestreo (Petitgas, 1996). Los

fundamentos bsicos de estas etapas son presentados a continuacin.


4.2 Variograma

El teorema central del lmite, uno de los fundamentales en estadstica,


estudia el comportamiento de la suma de variables aleatorias, cuando
crece el nmero de sumandos, asegurando su convergencia hacia una
distribucin normal en condiciones muy generales. Este teorema, del
cual existen diferentes versiones que se han ido desarrollando a lo
largo de la historia, tiene una gran aplicacin en inferencia estadstica,
pues muchos parmetros de diferentes distribuciones de probabilidad,
como la media, pueden expresarse en funcin de una suma de
variables. Permite tambin aproximar muchas distribuciones de uso
frecuente: binomial, Poisson, chi cuadrado, t-student, gamma, etc.,
cuando sus parmetros crecen y el clculo se hace. Por otro lado, la
suma de variables aleatorias aparece en forma natural en muchas
aplicaciones de la ingeniera: determinacin de masa forestal, carga
soportada por una estructura, tiempo de espera de servicios, etc.

Todo ello explica por qu muchos mtodos estadsticos requieren la


condicin de normalidad para su correcta aplicacin y, en
consecuencia, este teorema es un componente importante de la
formacin estadstica de los ingenieros. El teorema se apoya y
relaciona entre s con otros conceptos y procedimientos bsicos en
estadstica, como los de variable aleatoria y sus transformaciones,
distribucin muestral, convergencia, tipificacin, clculo de
probabilidades, etc., algunos de los cuales podran plantear problemas
de aprendizaje.

4.3 Variable regionalizada

Una variable medida en el espacio de forma que presente una

estructura de correlacin, se dice que es una variable regionalizada.

De manera ms formal se puede definir como un proceso estocstico

d
con dominio contenido en un espacio euclidiano d-dimensional R ,

d
{Z(x): x D R }. Si d = 2, Z(x) puede asociarse a una variable

medida en un punto x del plano (Daz-Francs, 1993). En trminos

prcticos Z(x) puede verse como una medicin de una variable

aleatoria (p.ej. concentracin de un contaminante) en un punto x de

una regin de estudio. Recurdese que un proceso estocstico es una

coleccin de variables aleatorias indexadas; esto es, para cada x en el

conjunto de ndices D, Z(x) es una variable aleatoria. En el caso de

que las mediciones sean hechas en una superficie, entonces Z(x)

puede interpretarse como la variable aleatoria asociada a ese punto

del plano (x representa las coordenadas, planas o geogrficas, y Z la

variable en cada una de ellas). Estas variables 18 aleatorias pueden


representar la magnitud de una variable ambiental medida en un

conjunto de coordenadas de la regin de estudio.

4.4 Histograma

Un histograma es una representacin grfica de una variable en forma

de barras, donde la superficie de cada barra es proporcional a la

frecuencia de los valores representados. En el eje vertical se

representan las frecuencias, y en el eje horizontal los valores de las

variables, normalmente sealando las marcas de clase, es decir, la

mitad del intervalo en el que estn agrupados los datos.

As pues, podemos evidenciar comportamientos, observar el grado de

homogeneidad, acuerdo o concisin entre los valores de todas las

partes que componen la poblacin o la muestra, o, en contraposicin,

poder observar el grado de variabilidad, y por ende, la dispersin de

todos los valores que toman las partes, tambin es posible no

evidenciar ninguna tendencia y obtener que cada miembro de la

poblacin toma por su lado y adquiere un valor de la caracterstica

aleatoriamente sin mostrar ninguna preferencia o tendencia, entre

otras cosas

En general se utilizan para relacionar variables cuantitativas

continuas, pero tambin se lo suele usar para variables cuantitativas


discretas, en cuyo caso es comn llamarlo diagrama de frecuencias y

sus barras estn separadas, esto es porque en el "x" ya no se

representa un espectro continuo de valores, sino valores cuantitativos

especficos como ocurre en un diagrama de barras cuando la

caracterstica que se representa es cualitativa o categrica. Su

utilidad se hace ms evidente cuando se cuenta con un gran nmero

de datos cuantitativos y que se han agrupado en intervalos de clase.

Como ejemplo se puede tomar el puntaje obtenido en una prueba a

un grupo de alumnos.
5 ANALISIS Y COMPARACION DE DATOS

Para realizar esta simulacin se utiliz la hoja de clculo de Excel, el

software de programacin Visual Basic y el software estadstico

MiniTab. Se utiliz la hoja de clculos de Excel para la generacin de

datos aleatorios y el almacenamiento de datos. El Visual Basic se

utiliz para generar el variograma y agrupar los datos de manera

necesaria. Minitab se utiliz para generar los histogramas necesarios.

5.1 Formulacin del problema


Durante las actividades de exploracin de una mina se

obtuvieron por medio de una perforacin diamantina 10000

muestras con las siguientes caractersticas:

Las muestras presentan una ley aleatoria entre 0 y 1.


Las muestras analizadas estn distanciados 1m en forma
vertical.

Para esto se pide calcular la media, varianza, histograma y

variograma de las siguientes maneras:

Utilizando todos los datos sin agrupar.


Agrupando los datos de 20 en 20, sin compartir
elementos.
Agrupando los datos de 20 en 20 compartiendo 4
elementos.
Agrupando los datos de 20 en 20 compartiendo 8
elementos.
Agrupando los datos de 20 en 20 compartiendo 12
elementos.
Agrupando los datos de 20 en 20 compartiendo 16
elementos.

5.2 Clculo y anlisis del Variograma de datos sin


agrupar
5.2.1 Variograma de datos sin agrupar:

El valor de las leyes se obtuvo mediante el uso de la hoja de clculo

de Excel. Estos nmeros fueron generados de forma aleatoria.

Los valores ( h) utilizados para el variograma se obtuvieron con el

Visual Basic de la siguiente manera:


Los datos obtenidos con el Visual Basic se almacenaron en el Excel y

se obtuvieron las siguientes graficas:

Media:

MEDIA=0.5021

Desviacin estndar :

VARIANZA =
0.085084
Histograma:

Histograma de DATOS SI N AGRUPAR


Normal
300 Media 0.5026
Desv.Est. 0.2893
N 10000
250

200
Frecuencia

150

100

50

0
-0.18 0.00 0.18 0.36 0.54 0.72 0.90 1.08
DATOS SIN AGRUPAR

Variograma: Se graficaron los primeros 200 metros


VARIOGRAMA DE DATOS SIN AGRUPAR

5.3 Clculo y anlisis del Variograma de datos agrupados

Para obtener el promedio de los nmeros agrupados de 20 en 20

compartiendo 4, 8,12 y 16 valores se cre una sentencia en Visual

Basic, la cual nos arroja los valores promedios, la distancia entre cada

valor del Variograma y el Variograma. El programa creado fue el

siguiente:
Donde en cantidad compartida se coloca la cantidad de

unidades que se van a compartir entre cada grupo, siendo en este

caso 4, 8 ,12 y 16 la sentencia utilizada fue la siguiente:


5.3.1 Agrupando de 20 en 20 compartiendo 4 elementos

Agrupando lo datos de 20 en 20 y compartiendo 4 elementos entre cada

grupo se obtuvo los siguientes datos:

Media: MEDIA = 0.5023


Varianza:

VARIANZA = 0.0042
Histograma:

DATOS AGRUPADOS DE 20 EN 20 COMPARTI ENDO 4 ELEMENTOS


Normal
Media 0.5023
100
Desv.Est. 0.06521
N 624

80
Frecuencia

60

40

20

0
0.300 0.375 0.450 0.525 0.600 0.675
DATOS AGRUPADOS DE 20 EN 20 COM

Variograma: se graficaron solo los primeros 500 metros

VARIOGRAMA DE DATOS AGRUPADOS DE 20 EN 20 COMPARTIENDO 4 DATOS


Como se observar en el Variograma no existe mucha influencia del

primer dato sobre los dems, esto debido a que solo se comparten 4

datos.

5.3.2 Agrupando de 20 en 20 compartiendo 8 elementos

Agrupando lo datos de 20 en 20 y compartiendo 8 elementos entre cada

grupo se obtuvo los siguientes datos:

Media:

MEDIA = 0.5031

Varianza:

VARIANZA = 0.0043
Histograma:

Histograma de DATOS AGRUPADOS COMPARTIENDO 8


Normal
140 Media 0.5031
Desv.Est. 0.06545
N 832
120

100
Frecuencia

80

60

40

20

0
0.300 0.375 0.450 0.525 0.600 0.675 0.750
DATOS AGRUPADOS COMPARTIENDO 8
Varianza: se graficaron los primeros 400 metros

VARIOGRAMA DE DATOS AGRUPADOS DE 20 EN 20 COMPARTIENDO 8 DATOS

El grafico muestra los datos del Variograma hasta los primeros 400

metros , el punto rojo representa la meseta y como nos indica el

grafico no existe mucha influencia del primer dato sobre los dems.

5.3.3 Agrupando de 20 en 20 compartiendo 12 elementos

Con los datos agrupados de 20 en 20 compartiendo 12 elementos se

obtuvieron los siguientes datos:

Media:

MEDIA = 0.5019

Varianza:

Histograma: VARIANZA =
0.004356
Histograma de DATOS AGRUPADOS COMPARTI ENDO 12
Normal
160 Media 0.5019
Desv.Est. 0.06603
140 N 1248

120

100
Frecuencia

80

60

40

20

0
0.32 0.40 0.48 0.56 0.64 0.72
DATOS AGRUPADOS DE 20EN 20 COM

Variograma: Se graficaron los primeros 304 metros

VARIOGRAMA DE DATOS AGRUPADOS DE 20 EN 20 COMPARTIENDO 12 DATOS

Como se observa en la grfica del Variograma de los primeros 300 metros

existe un poco de influencia del primer dato sobre los dems,


aproximadamente 20 metros, esto debido a que las agrupaciones comparten

12 elementos.

5.3.4 Agrupando de 20 en 20 compartiendo 16elementos

Con los datos agrupados de 20 en 20 compartiendo 16 elementos se

obtuvieron los siguientes datos:

Media:

MEDIA = 0.50202
Varianza:

VARIANZA =
Histograma: 0.004349

DATOS AGRUPADOS COMPARTIENDO 16


Normal
180 Media 0.5020
Desv.Est. 0.06597
160 N 2496

140

120
Frecuencia

100

80

60

40

20

0
0.28 0.35 0.42 0.49 0.56 0.63 0.70 0.77
DATOS AGRUPADOS DE COM

Varianza: Se graficaron los primeros 300 metros


VARIOGRAMA DE DATOS AGRUPADOS DE 20 EN 20 COMP

Se puede observar en el Variograma que existe una mucha influencia

del primer dato sobre los primeros datos, alrededor de 24 metros, esto

debido a que los grupos tomados tienen 16 elementos en comn.

5.3.5 Comparando los datos agrupados de 20 en 20 compartiendo 4,


8,12 y 16
Mediante el uso de la hoja de clculo de Excel se graficar los 100

primeros metros de los variogramas de los grupos de 20 en 20

compartiendo 4, 8,12 y 16 elementos. Para as poder comparar la

influencia que tiene el primer dato sobre las dems muestra en los

diferentes casos.
6 CONCLU
SIONES

Existen

muchos

indicadores como la media, varianza , coeficiente de variacin ,


histogramas y otros indicadores que utiliza la estadstica que nos

sirven para comparar y analizar muestras , pero que solo se limitan a

analizar los valores de los datos y consideran el ordenamiento y

posicin de un dato respecto al otro.


El variograma es una herramienta muy til para el anlisis de

muestras en las que se debe de considerar la posicin de un dato con

respecto a los otros, como se pudo observar en la comparacin de dos

muestras con los mismos datos pero en diferente orden, los

indicadores estadsticos coincidan en todos los casos, pero los

variograma entre una muestra desordenada y una ordenada era

totalmente diferentes.
De los datos agrupados, se puede concluir que a mayor cantidad de

datos compartidos existe una mayor influencia del primer dato sobre

los dems, en el caso en el que se compartieron 16 datos se encontr

que la primera muestra puede influir hasta en 24 metros. Mientras

que en los grupos que compartan solo cuatro elementos se encontr

que el primer elemento tena poco a casi ninguna influencia sobre las

dems muestras.
De la grfica en la que se compararon todos los variogramas de los

datos agrupados se observa que a mayor cantidad de datos

compartidos existe una mayor influencia de la primera muestra sobre

las dems.
7 BIBLIOGRAFIA

http://www.calidad.com.mx/docs/art_64_1.pdf
http://www.uoc.edu/in3/emath/docs/Distrib_Normal.pdf
http://www.vitutor.com/estadistica/descriptiva/a_17.html
http://matap.dmae.upm.es/WebpersonalBartolo/Probabilidad/7_distrib
ucion_normal.pdf
http://es.wikipedia.org/wiki/Teorema_del_l%C3%ADmite_central

Вам также может понравиться