Вы находитесь на странице: 1из 42

INSTITUTO POLITCNICO NACIONAL

ESCUELA SUPERIOR DE CMPUTO

E S C O M
Trabajo Terminal

Desarrollo de un Sistema de Cmputo para la


Modelacin
Geoestadstica de Fenmenos Espaciales
Que para cumplir con la opcin curricular en la carrera de:

Ingeniera en Sistemas Computacionales con


Especialidad en Sistemas

Presentan

Ral Gaona Serrano


David Lerma Martnez

Directores

Dr. Martn Alberto Daz Viera

M. en C. Flavio Arturo Snchez Garfias

Instituto Politcnico Nacional


Escuela Superior de Cmputo

Informe Tcnico
(Serie Amarilla)

Autores:
Gaona Serrano Ral
Lerma Martnez David

Resumen

El presente es un informe tcnico del Trabajo Terminal No. 687 Sistema para la
modelacin geoestadstica de fenmenos georeferenciados cuya finalidad es dar un
resumen de los objetivos y resultados obtenido a lo largo del desarrollo y el
procedimiento que se utiliz para ello.

Advertencia
Este informe contiene informacin desarrollada por la Escuela Superior de Cmputo del
Instituto Politcnico Nacional y por tanto su uso queda restringido a las aplicaciones
que explcitamente se convengan.
La aplicacin no convenida exime a la escuela de su responsabilidad tcnica y da lugar
a las consecuencias legales que para el efecto se determinen.

NDICE
Captulo 1

Introduccin

1.1 Objetivo

1.2 Motivacin

1.3 Contribuciones en la Ingeniera

Captulo 2

Antecedentes

Captulo 3

Estado del Arte

Captulo 4

Desarrollo

13

4.1 Manejo de Proyectos

13

4.2 Manejo de Datos

16

4.3 Visualizacin Cientfica

20

4.4 Mtodos de Modelacin de Correlacin, Interpolacin y Simulacin

21

Captulo 5 Resultados, Experimentos

22

5.1 Resultados EDA

22

5.2 Pruebas de Mtodos de Modelacin

31

5.3 Anlisis Espacial

32

5.4 Obtencin del Modelo Computacional

34

5.5 Modelado del Variograma

37

Captulo 6 Caso de estudio: Estimacin de la precipitacin en Mxico D.F. usando


datos de pluvimetros y de radar
22
Anlisis geoestadstico de los datos de pluvimetros:
1) Anlisis exploratorio de los datos
2) Estimacin del variograma
3) Modelacin del variograma
4) Estimacin espacial usando Kriging

Anlisis geoestadstico conjunto de los datos de pluvimetros y de radar:


1) Anlisis estadstico conjunto.
2) Estimacin del variograma cruzado.
3) Modelacin del variograma cruzado.
4) Ajuste de un modelo de corregionalizacin lineal.
5) Estimacin espacial conjunta usando CoKriging

Captulo 7 Conclusiones y trabajo futuro.

37

Bibliografa

38

Anexo

39

INTRODUCCIN
En ste trabajo terminal se dise un prototipo de programa de geoestadstica, de
propsito general, cuya finalidad es brindar un conjunto de facilidades reunidas en una
herramienta flexible y portable, que permite la realizacin de estimaciones y
simulaciones de fenmenos georeferenciados. Entre las facilidades que esta herramienta
proporciona al usuario estn: interfaz grfica intuitiva, grficos de visualizacin
cientfica de los resultados y una eficiente administracin de la informacin.

Uno de los aspectos fundamentales que motivan el desarrollo de este sistema de


cmputo es que los programas comerciales de geoestadstica que existen actualmente en
el mercado son prcticamente inaccesibles tanto para la industria como para el sector
educativo por sus elevados costos y limitada portabilidad, ya que mayormente se
encuentran implantados en estaciones de trabajo. Pero adems no son lo suficientemente
flexibles ni amigables, lo cual dificulta enormemente la realizacin de investigaciones
aplicadas mediante el uso de esta disciplina, la cual tiene una relevante importancia en
reas como minera, contaminacin ambiental, hidrogeologa y la industria petrolera.

Debido a que por un lado existen bibliotecas numricas implementadas en FORTRAN


77 de procedimientos geoestadsticos, como GSLIB, que recogen el estado actual del
conocimiento acumulado en esta rama de la estadstica espacial y por otra parte la
madurez alcanzada en las herramientas de desarrollo de software libre, estn dadas las
premisas necesarias para la reutilizacin de estos cdigos integrndolos en un sistema
de cmputo interactivo y multiplataforma con muy bajo costo de desarrollo.

En particular se eligi el lenguaje C++ y QT de Trolltech como las principales


herramientas de desarrollo por su versatilidad y flexibilidad para acometer un trabajo de
esta naturaleza., que permita su posterior actualizacin, extensin y adecuacin en el
futuro.

Objetivo
Desarrollar un prototipo bsico con capacidades grficas y numricas para la
modelacin geoestadstica de fenmenos georeferenciados. En particular, que ste
permita la experimentacin de algunas tcnicas de interpolacin espacial y de
simulacin estocstica.

Motivacin
Uno de los aspectos fundamentales que motivan el desarrollo de este sistema de
cmputo es que los programas comerciales de geoestadstica que existen actualmente en
el mercado son prcticamente inaccesibles tanto para la industria como para el sector
educativo por sus elevados costos y limitada portabilidad, ya que mayormente se
encuentran implantados en estaciones de trabajo. Pero adems no son lo suficientemente
flexibles ni amigables, lo cual dificulta enormemente la realizacin de investigaciones
aplicadas mediante el uso de esta disciplina.

Este proyecto constituye una magnfica oportunidad para aplicar los conocimientos
adquiridos durante la licenciatura ya que demanda el empleo de diversas herramientas
de computacin, entre las que se destacan: el desarrollo de grficos para la visualizacin
cientfica, el diseo de la interfaz grfica y la programacin y/o adaptacin de
algoritmos de simulacin numrica. Pero a su vez, tambin es un reto puesto que
requiere del trabajo integrado, donde un aspecto fundamental es el diseo adecuado que
permita lograr la interrelacin de los aspectos antes mencionados en un sistema eficiente
y funcional.

Contribuciones a la Ingeniera
Este proyecto de investigacin ha representado un gran esfuerzo no solo por los
alumnos si no tambin por los asesores y las personas que contribuyeron en las distintas
etapas de la investigacin. Pero al final todos estos esfuerzos estaban enfocados en el
desarrollo de un sistema que permita, a investigadores y estudiantes, realizar el anlisis
geoestadstico para el estudio de la variabilidad espacial de propiedades fsicas en
ciencias de la tierra.

Si bien es cierto que existen actualmente sistemas que contienen muchos de los
procedimientos ms comunes en la geoestadstica, la forma en que los usuarios pueden
interactuar con stos es muy rgida y limitada, lo cual dificulta la realizacin de
aplicaciones especficas debido a su poca flexibilidad y a la carencia de suficientes
opciones numricas y grficas que permitan un anlisis integral adecuado para la toma
de decisiones.

Es por ello que una de nuestras metas principales consiste en proporcionar un ambiente
de trabajo integrado y flexible que facilite la investigacin y la aplicacin de las
metodologas geoestadsticas pero a un menor costo. Con esto los investigadores podrn
resolver muchos de los problemas que pueden ser analizados mediante esta disciplina y
as contribuir a un desarrollo en esta rea actualmente poco difundida.

Por su naturaleza general, el presente trabajo no es una meta sino un punto de partida en
el impulso del desarrollo de la geoestadstica, puesto que est pensado desde su diseo
para ser mejorado, extendido y actualizado por ser sta, desde el punto de vista del

conocimiento, un rea relativamente joven y muy dinmica. Mientras que, debido a la


demanda cada vez creciente de soluciones especficas con un enfoque geoestadstico en
diversas ramas de las ciencias de la tierra nos impulsar a desarrollar programas hechos
a la medida de sus necesidades.

ANTECEDENTES
Generalmente cuando se modela un yacimiento petrolero ste posee informacin
incompleta en las diversas escalas, tiene una estructura espacial compleja, presenta una
variacin importante en las propiedades de las rocas, adems de que no se conocen a
priori las relaciones entre dichas propiedades.

En la ltima dcada la caracterizacin de yacimientos petroleros usando mtodos de


simulacin estocstica se ha establecido como uno de los enfoques ms exitosos para la
modelacin de sus propiedades petrofsicas (porosidad, permeabilidad, saturacin, etc).

Las causas de dicha popularidad de estos mtodos radican en que:

Son suficientemente flexibles y se adaptan a las diversas condiciones o escenarios


que se presentan en la evaluacin de los yacimientos.

Permiten la integracin en modelos de dos y tres dimensiones de diversas fuentes de


informacin (datos de ncleos, registros, ssmica, etc)

Generan distribuciones geolgicamente realistas de las propiedades que se modelan.

Los valores simulados reproducen los valores y las caractersticas estadsticas de los
datos.

Posibilitan la evaluacin del grado de incertidumbre del modelo bajo diferentes


escenarios.

En la actualidad existen unos cuantos cdigos comerciales que de una manera u otra
siguen este enfoque, entre los que podemos citar:

1. SigmaView Landmark Graphics Corporation (http://www.lgc.com/ )


2. (RC)2 Antero Seismic Micro-Technology (http://www.seismicmicro.com/ )
3. RMSgeomod Irap RMS - Roxar Software Solutions (http://www.roxar.com/)
4. Gocad Earth Decision Sciences (http://www.t-surf.com/ )
5. RML-HereSim 3D Beicip Franlab (http://www.beicip.com/ )

En la totalidad de los casos arriba listados son programas bien diseados aunque
limitados a ciertos y determinados mtodos de simulacin, con costos de licencias
bastante elevados; adems estn implantados en una plataforma de cmputo especfica,
es decir son poco portables.

Una dificultad importante a la que nos enfrentamos es que resulta imposible adaptar o
modificar un mtodo de simulacin existente o programar algn otro nuevo mtodo de
simulacin.

Por otra parte, existe un rico acerbo de metodologas y programas desarrollados en


varios lenguajes (C, Fortran, Pascal) que son de dominio pblico que pudieran ser
adaptados e integrados en una plataforma flexible que permitira:

Experimentar con diferentes variantes de los mtodos existentes.

Realizar adaptaciones y/o modificaciones hechas a la medida de las necesidades de


cada yacimiento.

Una muestra del grado de actualidad y madurez alcanzado en esta rea lo constituyen
los siguientes libros recientemente publicados que resumen el estado del arte de este
enfoque:

1. Christian Lantuejoul, Geostatistical Simulation: Models and Algorithms, Springer


Verlag, 2002.
2. Consentino L., Integrated Reservoir Studies, TECHNIP, 2001.
3. Deutsch, C. V., Geostatistical Reservoir Modeling, Oxford University Press, 2002.
4.

Kelkar M. and G. Prez, Applied Geostatistics for Reservoir Characterization, SPE,


2002.

ESTADO DEL ARTE


Origen, definicin y objeto de estudio de la Geoestadstica
En los aos 60, Matheron acu el trmino de Geoestadstica. Reconocido como el padre
de esta disciplina, Matheron formaliz y generaliz matemticamente un conjunto de
tcnicas desarrolladas por D. G. Krige (1941) que explotaban la correlacin espacial para
hacer predicciones en la evaluacin de reservas de las minas de oro en Sudfrica. l
defini a la Geoestadstica como "la aplicacin del formalismo de las funciones aleatorias
al reconocimiento y estimacin de fenmenos naturales" (Matheron, 1962). Si bien ms
adelante nos detendremos en el concepto de una funcin aleatoria, baste decir de momento
que puede visualizarse como la asociacin de una variable aleatoria a cada punto del
espacio.

La geoestadstica es una rama de la estadstica aplicada que se especializa en el anlisis


y la modelacin de la variabilidad espacial en ciencias de la tierra. Su objeto de estudio
es el anlisis y la prediccin de fenmenos en espacio y/o tiempo, tales como: ley de
metales, porosidades, concentraciones de un contaminante, etc. Aunque el prefijo geoes usualmente asociado con geologa, sin embargo la geoestadstica tiene sus orgenes
en la minera.

Definiciones alternativas:

Rama de la estadstica aplicada que se caracteriza por tomar en cuenta la


relacin espacial de las variables en estudio.

Rama de la estadstica que se enfoca a analizar, procesar e inferir resultados de


datos georeferenciados.

La geoestadstica es un conjunto de tcnicas para el anlisis y prediccin de


valores distribuidos en el espacio y/o en el tiempo, dichos valores se asumen
correlacionados entre s.

Etapas del anlisis geoestadstico


Actualmente, la geoestadstica es un conjunto de tcnicas usadas para analizar y
predecir valores de una propiedad distribuida en espacio o tiempo. En contraposicin
con la estadstica clsica o convencional, tales valores no se consideran independientes,
por el contrario se suponen de manera implcita que estn correlacionados unos con
otros, es decir que existe una dependencia espacial. Intuitivamente esto indica que
mientras ms cercanos estn situados dos puntos estn mas correlacionados y mientras
ms separados hay menos relacin entre estos.

El proceso de estimacin y modelacin de la funcin que describe la correlacin


espacial es conocido como anlisis estructural. Una vez realizado el anlisis
estructural, la prediccin de valores en puntos no muestrales se puede hacer aplicando
la tcnica de interpolacin "kriging" o simulndolos a travs de simulaciones
condicionales.

La primera etapa, conocida como anlisis exploratorio de datos, est basada en tcnicas
estadsticas convencionales que nos permiten obtener todo un conjunto de informacin,
desconocida a priori sobre la muestra bajo estudio, que es imprescindible para realizar
correctamente cualquier anlisis estadstico y en particular un anlisis geoestadstico.

Entonces a grosso modo un anlisis geoestadstico est compuesto por tres etapas:

a) el anlisis exploratorio de los datos,


b) el anlisis estructural y
c) las predicciones (estimaciones o simulaciones)

Campos de aplicacin
La geoestadstica ha sido ampliamente aplicada en diversas ramas de las ciencias
aplicadas y en las ingenieras, entre otras tenemos: petrleo, minera, pesca, geofsica
marina, hidrogeologa, medio ambiente, estudios forestales, salud pblica, ingeniera

civil, procesamiento de imgenes, cartografa, finanzas, ciencias de materiales,


meteorologa, edafologa, etc.

Petrleo

Modelos geolgico petrofsicos de yacimientos

Anlisis de permeabilidad absoluta y su escalamiento

Simulacin de facies

Caracterizacin de yacimientos

Integracin de informacin

Anlisis de riesgo

Evaluacin de reservas

Hidrogeologa

Solucin de problemas inversos (permeabilidad, transmisividades).

Estimaciones de los niveles piezomtricos

Diseo de Redes ptimas de monitoreo

Estimacin de los lmites de la pluma de un contaminante

Minera

Estudiar la factibilidad de un yacimiento

Clculo de reservas

Clculo y estimacin de la varianza del yacimiento

Pronstico de las variaciones de la mena a travs de simulacin

Medio Ambiente

Estimacin de contaminantes en atmsfera, suelo, cuerpos de agua.

Estimacin de contaminantes in situ.

Estudios de riesgo e impacto ambiental.

Salud Pblica

Anlisis de la distribucin espacial de enfermedades.

Estimacin de la exposicin de personas a elementos nocivos (acsticos,


qumicos, polvos, etc.)

Industria Forestal y Agrcola

Estudio de la distribucin espacial y la afectacin de plagas.

Inventarios forestales

Estudio cuantitativo de los suelos y sus propiedades qumicas y mecnicas.

Industria Pesquera

Estimacin in situ de la potencialidad de pesca

Relacin entre la distribucin espacial de especies de peces y diferentes


variables (profundidad, temperatura, salinidad, etc)

Software

1970S BLUEPACK Centro de Geoestadstica de Fontainebleau.


1988 GEO-EAS (Enviromental Protection Agency, U.S.A.) Programa para
DOS.

1992 GSLIB Clayton Deutsch y Andr Journel U. Stanford Cdigo abierto


de dominio pblico escrito en lenguaje FORTRAN.

1996 VARIOWIN Yvan Pannatier (Suiza) versin de GEO-EAS en MSWindows.

1990s I S A T I S (nueva versin de BLUEPACK) Software comercial de


geoestadstica de propsito general (Geovariances).

DESARROLLO
El desarrollo del prototipo esta divido en cuatro etapas, una que refiere al manejo de
proyectos y otras tres, mismas que se refieren a las etapas de un anlisis geoestadstico,
Anlisis Exploratorio de Datos, Mtodos de Modelacin y Visualizacin Cientfica.

Manejo de Proyectos
Este, aunque no lo parezca, es uno de los puntos ms importantes de este sistema, ya
que dentro del anlisis de requerimientos, se encontraban los siguientes puntos:

Permitir una buena administracin de los datos.

Permitir al usuario guardar los anlisis que se realicen.

Empaquetar y distribuir los proyectos realizados con este software.

Por estas razones fue imprescindible considerar una estructura para cada proyecto, en la
cual se consideraran los puntos anteriores.

Pareciese que con esta solucin fuera suficiente para cumplir, pero no podra utilizarse
cualquier tipo de archivo, ya que si esto fuera almacenado en un simple archivo de
texto, esto causara problemas en cuestin de la portabilidad, ya que si estamos
ofreciendo un sistema portable, tambin los proyectos y/o resultados que genere este,
debern ser portables. Para esto consideramos el formato XML, el cual garantiza la
portabilidad de la informacin contenida en este tipo de archivos (.xml), adems de que
es posible con este formato tener una estructura jerrquica de cada tem del proyecto y
consecuentemente una buena administracin de los datos que el proyecto contenga.
Para el uso de este formato nos apoyamos en el modulo de XML1que proporciona Qt, el
cual es de gran ayuda, ya que contiene el API necesario para crear y editar la estructura
de estos archivos.
1

El modulo XML provee una buena forma para trabajar con el formato XML usando la interfaz
de SAX2 (Simple API for XML) la cual agrega la implementacin de DOM nivel 2 (Document
Object Model).

Adems de esto se ofreci dentro de la ventana principal una visualizador del proyecto
en el cual se pueda observar de manera rpida el estado actual del proyecto. A esta parte
se le llam Historial de Proyecto y es una herramienta til que la mayora del software
existente no proporciona.

Adems se propuso una estructura de proyectos, la cual fue analizada por el equipo en
conjunto por el equipo de desarrollo y los asesores con el fin de depurar todos los
errores que pudieran surgir de una estructura mal diseada y se llego con esto a
considerar la siguiente estructura como la ms adecuada.

El diagrama anterior muestra como esta estructurado y se almacena un proyecto


generado por el sistema, y como se puede apreciar el proyecto puede contener ms de

un archivo de datos para ser analizados, estos son los llamados nodos, los cuales adems
contienen los siguientes tems:

Manejo de Datos: Aqu es donde se puede encontrar una referencia hacia el


archivo de datos que ese este manejando en el proyecto.

EDA: (Exploratory Data Analysis) Aqu se encontraran todos los resultados que se
obtengan al realizar el anlisis exploratorio de los datos.

Variograma: Aqu se encontraran las referencias a los resultados que sean


obtenidos mediante el anlisis variogrfico.

Estimacin: Aqu se contendrn los resultados de cualquier estimacin


(interpolacin) que se les realicen a los datos.

Simulacin: Aqu se contendrn los resultados de cualquier simulacin aplicada a


los datos.

Todos los resultados obtenidos, correspondern al archivo de datos de este nodo,


adems para cada uno de los puntos anteriores se podrn tener n resultados, los cuales
sern clasificados dentro de su tipo correspondiente.

Manejo de Datos.
El manejo de datos es la parte encargada de la forma de interactuar con los archivos de
datos. La parte principal del manejo de datos es el formato en que se estructuran las
muestras de los fenmenos espaciales para su anlisis, cada tipo de software utiliza un
formato especfico y en base al estudio de algunos de ellos se obtuvo el siguiente
formato:

Y esta es la estructura que utilizaremos para leer y escribir los archivos de datos para el
sistema. Adems cabe mencionar que la estructura anterior es simplemente texto plano,
y esta es la forma clsica de manejar los archivos de datos de otros software similares,
sin embargo en un futuro se puede implementar el manejo de los archivos por medio de
una base da datos, ya que en ocasiones los archivos con los que se trabaja son
demasiado grandes y esta puede ser una solucin para un mejor almacenamiento y trato
de los mismos.

La parte que comprende el manejo de datos esta divida a su vez en dos secciones:

Edicin de datos

Anlisis Exploratorio de Datos

Edicin de Datos
Una vez que se cargan los archivos de datos en un determinado proyecto el usuario debe
tener una forma para visualizarlos y manipularlos. Para esto se cuenta con una especie
hoja de clculo en la que el usuario puede visualizar los datos de una forma clara y
estructurada, Adems de opciones para modificar el archivo de datos como copiar,

cortar, pegar y borrar datos o aplicar alguna transformacin sobre las variables (p.e. una
trasformacin logartmica).

Entre las mejoras consideradas en este punto se tienen la posibilidad de insertar ms


columnas al archivo de datos para el caso de tener que agregar otra variable o insertar
mas filas para agregar un nuevo valor o simplemente la posibilidad de activar o
desactivar algunos valores para alguna variable sin la necesidad de tener que guardar un
nuevo archivo.

Anlisis Exploratorio de Datos


El EDA (Exploratory Data Analysis) es un conjunto de tcnicas estadsticas y grficas
que permiten establecer un buen entendimiento bsico del comportamiento de los datos
y de las relaciones existentes entre las variables que se estudian.

Las etapas de un anlisis exploratorio de datos son las siguientes:

Realizar un examen grfico de la naturaleza de las variables individuales y un


anlisis descriptivo numrico que permita cuantificar algunos aspectos grficos
de los datos.

Realizar un examen grfico de las relaciones entre las variables y un anlisis


descriptivo numrico que cuantifique el grado de interrelacin existente entre
ellas.

Evaluar algunos supuestos bsicos subyacentes a muchas tcnicas estadsticas,


por ejemplo, normalidad, linealidad y homocedasticidad.

Identificar los posibles valores atpicos (outliers) y evaluar el impacto potencial


que puedan ejercer en anlisis estadsticos posteriores.

Evaluar, el impacto potencial que pueden tener los datos ausentes (missing)
sobre la representatividad de los datos analizados.

Para cumplir los puntos del Anlisis Exploratorio de Datos el usuario cuenta con el
siguiente men dentro del sistema.

Estadstica Univariada
Permite realizar un anlisis grfico y numrico sobre cada una de las variables de forma
independiente y obtener los estadgrafos bsicos de las mismas.

La informacin numrica obtenida para una variable por la opcin de estadstica bsica
es la siguiente:

Mnimo

Primer Quartil

Mediana

Tercer Quartil

Mximo

Valor Medio

Varianza

Desviacin Estndar

Curtosis

Sesgo

Y los grficos que se pueden visualizar son los siguientes:

Histograma

BoxPlot

Q-QPlot

Las mejoras consideradas hasta el momento para la opcin de estadstica bsica son la
interaccin de los con los grficos, que el usuario tenga la posibilidad de seleccionar
que grficos de los mencionados desea visualizar, cambiar el intervalo del histograma o
la opcin de zoom.

Estadstica Bivariada
Permite obtener el grado de correlacin entre dos variables del archivo de datos as
como una muestra grafica por medio de un grafico de dispersin.

La informacin numrica obtenida para una variable por la opcin de estadstica


Bivariada es la siguiente:

Correlacin

Covarianza

Y los grficos que se pueden visualizar son los siguientes:

Grfico de dispersin de variables

2 Histograma

Las mejoras consideradas para ente punto son que cada histograma sea adaptado de
forma que corresponda al grafico de dispersin, como se muestra en la siguiente figura:

////////////////////////////////////////imagen

Anlisis de Tendencia
Se realizan una exploracin visual de los grficos en cada una de las direcciones de los
ejes (x, y). Otro modo de corroborar la presencia de no estacionaridad de la media es
mediante el variograma. Cuando ste muestra un crecimiento ms rpido que una
funcin cuadrtica es un indicador de la posible presencia de tendencia.

Los grficos necesarios son los siguientes:

Grfico de dispersin XY

Grafico de dispersin en X

Grafico de dispersin en Y

Grafico de dispersin en algn ngulo determinado

Regresin Lineal
El objeto de un anlisis de regresin es investigar la relacin estadstica que existe entre
una variable dependiente (Y) y una o ms variables independientes (

, ... ). Para

poder realizar esta investigacin, se debe postular una relacin funcional entre las
variables. Debido a su simplicidad analtica, la forma funcional que ms se utiliza en la
prctica es la relacin lineal. Cuando solo existe una variable independiente, esto se
reduce a una lnea recta.

En este caso simplemente se utiliza una formula para obtener la recta que nos describe
dicha relacin entre dos variables y se muestra el grfico correspondientes (la formula
se encuentra definida en el apndice).

Visualizacin Cientfica.

Este modulo comprende el diseo y desarrollo de los grficos necesarios para mostrar
los resultados al usuario, el resultado final es una imagen la cual puede ser en dos o en
tres dimensiones.

Para poder cumplir con los requisitos en cuestin, fue necesario el realizar un estudio de
las herramientas de visualizacin que ofrecieran las caractersticas que se estaban
buscando, estas caractersticas requeridas son las siguientes:

Ser compatibles con Qt de Trolltech.

Tener las herramientas grficas bsicas que nos permitan construir grficos
estadsticos y grficos de superficie en tres dimensiones.

Que permitan la manipulacin del grafico, respondiendo a eventos que faciliten


la visualizacin de una imagen.

Que sean portables.

Estos requerimientos planteados no los cumpla por completo ninguna biblioteca actual
de software libre, pero se encontraron dos bibliotecas que nos proporcionaban en
conjunto una solucin optima a estos, esta es la biblioteca de grficos 2D Qwt 2y la
biblioteca de Grficos 3D QwtPlot3D3. Y aunque se encuentran aun en proceso de
desarrollo ya se han liberado sus primeras versiones que, en base a pruebas,
consideramos estables y funcionales. Estas entonces son las principales herramientas
con las cuales realizamos la representacin grafica de los resultados obtenidos en el
sistema. Utilizando la biblioteca de QwtPlot3D fue posible no solo representar los datos
obtenidos como resultado de los mtodos de estimacin y simulacin, si no que adems
fue posible agregar una gran gama de transformaciones geomtricas que sirven para
proporcionar al usuario una manera cmoda y gil de visualizar la imagen 3D que se
estaba desplegando.

Mtodos de Modelacin de Correlacin, Interpolacin y Simulacin.


En esta etapa del desarrollo era necesario analizar los mtodos necesarios para realizar
el modelado del variograma, las interpolaciones y simulaciones, estudiarlos y ver la
forma de agregarlos al sistema, existen pocas bibliotecas las cuales permitan realizar un
buen anlisis geoestadstico, pero de entre ellas una de las mas utilizadas y considerada
2

La biblioteca de Qwt contiene componentes de Interfaz Grafica de Usuario y clases tiles que
permiten a los desarrolladores crear grficos eficientemente. Incluye un widget para graficar en
2D, este provee manejo de escalas, sliders, compases, termmetros, arreglos, etc.

QwtPlot3D no es un programa, pero una de sus principales caractersticas es que utiliza Qt/OpenGL y
que adems esta basado en la biblioteca de programacin C++. Esta provee un complete widget de
grficos 3D para los programadores.

la mejor por muchos usuarios es GSLib4. Esta biblioteca es libre por lo cual decidimos
que era la mejor opcin, no obstante exista un inconveniente y era el hecho de que esta
biblioteca fue desarrollada en Fortran, y hoy en da el Fortran, aunque no es un lenguaje
que pueda considerarse para realizar un proyecto como el nuestro, aun es utilizado por
mucha de la comunidad cientfica e investigadores, los cuales prefieren despreocuparse
por los detalles de el sistema y concentrarse en el desarrollo de mtodos matemticos.
Por eso es que existe una gran cantidad de bibliotecas numricas desarrolladas en este
lenguaje que hasta la fecha tienen una gran funcionalidad.
Por ello el esfuerzo principal en esta etapa se centro en la forma de interpretar estos
mtodos (Fortran) y en la manera de re-codificarlos y pasarlos a el lenguaje C++. Este
esfuerzo tubo como resultado la generacin de las bibliotecas dinmicas (.so y .dll en
sistemas Unix y Windows respectivamente).

Procedimiento para la conversin de los mtodos en Fortran a lenguaje C++ y generacin de


bibliotecas dinmicas.

RESULTADOS O EXPERIMENTOS
Resultados del EDA
Para mostrar los resultados del sistema respecto al anlisis exploratorio de datos se
usar el siguiente archivo de datos tomado del programa GSLIB.
Clustered 140 primary and secondary data
2
3
Xlocation
4

GSLIB acrnimo para Geostatistical Software LIBrary. Este nombre fue usado originalmente
por una coleccin de programas geoestadsticos desarrollados en la Universidad de Stanford
los ltimos 15 aos. El GSLIB original fue inspirado en el manual de GSLIB: Geostatistical
Software Library and User's Guide by Clayton Deutsch and Andr Journel, 1992
http://www.gslib.com/

.
Ylocation
.
Primary
.
Secondary
.
Declustering Weight
.
39.5 18.5
.06
.22
5.5 1.5
.06
.27
38.5 5.5
.08
.40
20.5 1.5
.09
.39
27.5 14.5
.09
.24
40.5 21.5
.10
.48
15.5 3.5
.10
.21
6.5 25.5
.11
.36
38.5 21.5
.11
.22
23.5 18.5
.16
.30
.5 25.5
.16
.31
9.5 19.5
.17
.30
36.5 43.5
.18 1.60
21.5 5.5
.19
.59
13.5 3.5
.19
.18
40.5 7.5
.19
.75
31.5 17.5
.22
.44
46.5 40.5
.24
.58
10.5 7.5
.26
.54
28.5 11.5
.28
.62
8.5 7.5
.28
.97
47.5
.5
.31 2.88
4.5 37.5
.32
.35
14.5 21.5
.33
.48
22.5 48.5
.34
.48
18.5 6.5
.34
.23
3.5 38.5
.34
.51
11.5 46.5
.40
.47
31.5 26.5
.45
.74
14.5 29.5
.46 2.52
14.5 43.5
.51 1.21
38.5 28.5
.57 5.55
45.5 14.5
.62 2.30
4.5 30.5
.65 1.06
6.5 41.5
.67
.43
7.5 12.5
.71 2.07
26.5 23.5
.79 1.40

Edicin de Datos

1.619
1.619
1.416
1.821
1.349
.944
1.214
1.619
1.146
1.821
1.349
1.012
.944
1.416
1.146
1.012
1.619
1.821
1.281
1.551
1.281
2.023
.944
1.619
2.023
1.619
.944
1.079
1.619
1.025
1.079
1.083
1.281
1.416
1.821
1.551
1.281

Fig. 5.1 Ventana para la edicin de Datos

La pantalla anterior muestra la ventana final para el manejo de los datos. Una vez que
los archivos de datos han sido importados desde el manejador de proyectos, estos
pueden ser cargados en el Worksheet para su edicin. El Worksheet es parecido a una
hoja de clculo de Excel, en el cual se puede adems de visualizar el archivo de datos de
forma organizada y con los datos ms sobresalientes (como coordenadas, variables y
nmero total de registros) editar dicho archivo en caso de que se desee copiar, pegar o
realizar alguna transformacin logartmica sobre las variables.

Estadstica Bsica
Una vez tratados los datos se procede a realizar una inspeccin de las variables de
forma individual por medio de la opcin de estadstica bsica del men EDA.

Al seleccionar esta opcin desde la ventana principal aparece la siguiente ventana.

Fig. 5.2 Ventana para la seleccin del archivo de datos y la variable para la estadstica bsica

En esta ventana se selecciona el archivo de datos y alguna de las variables del mismo.
Adems se seleccionan solo los estadgrafos que se deseen visualizar.

Y el resultado se obtiene es una ventana como la siguiente

Fig. 5.3 Ventana de resultados de una estadstica bsica

En donde se pueden ver los resultados as como los grficos de la funcin de


distribucin normal, el histograma y boxplot. Adems esta ventana nos proporciona
interaccin con los grficos en

cuanto a los colores para obtener una mejor

visualizacin y nos permite guardar las imgenes en una gran variedad de formatos para
su anlisis ya o uso posterior en algn documento o simplemente imprimirlo
directamente
.

Estadstica Bivariada
Cuando se selecciona realizar una estadstica Bivariada desde la ventana principal
aparece la siguiente ventana

Fig. 5.4 Ventana para la seleccin del archivo de datos y las dos variables para la estadstica
bivariada

En esta pantalla se selecciona el archivo de datos y las dos variables sobre la cuales se
quiere apreciar su distribucin y correlacin.

Regresin Lineal

Para realizar un anlisis de regresin lineal de igual forma que para una estadstica
bivariada se seleccionan dos variables y se obtiene el grafico correspondiente.

Fig. 5.5 Resultado de un anlisis de regresin lineal

Pruebas Herramientas de graficacin 2D y 3D


A un inicio solo tenamos pensado utilizar Qt y OpenGL para realizar los grficos
necesarios, tanto en 2D como en 3D, pero pronto nos dimos cuenta de que el manejar
una variedad amplia de grficos sin tener una marco de trabajo, era algo muy
complicado y que tal vez nos hubiera requerido mayor tiempo de desarrollo y muchas
lneas mas de cdigo, por eso nos dimos a la tarea de elegir herramientas de software
libre que nos proporcionaran este marco inicial para poder realizar grficos 2D y 3D de
una manera sencilla pero que cumpliera con los requerimientos necesarios.

Hablando de los requerimientos, recordaremos los que afectan al manejo de grficos 2D


y 3D, entre ellos se encuentran los siguientes:

Permitir generar grficos estadsticos en 2D (histograma, scatterplot, regresin,


QQ-PP, etc).

Permitir manipular esos grficos 2D, cambiando tanto los parmetros del grafico
como las propiedades de los mismos.

Generar grficos 3D, de mapas o superficies.

Permitir la manipulacin de estos grficos 3D, pudindose aplicar las


transformaciones geomtricas, de rotacin y traslacin en cualquiera de sus ejes,
escalamiento.

Permitir el manipular los parmetros y propiedades 1del grafico 3D.

Permitir realizar cortes al grafico 3D en cualquiera de las tres direcciones (X, Y


o Z).

Qt como lo mencionamos a un inicio nos provee de herramientas de graficacin, pero


estas son muy bsicas, son basadas en el manejo de lneas, crculos y rectngulos, y
algunas otras funcionalidades, pero en general muy bsicas todas estas.

Fig. 5.6 Resultados del QCanvas

Una de las mejores y mas completas herramientas que encontramos es Root, esta
herramienta es software libre, y contiene una gran cantidad de mtodos y utileras para
generar grficos bastante buenos y de una manera sencilla, tiene la posibilidad de
generar grficos tanto 2D como 3D, utiliza OpenGL, y en suma es un software bastante
completo pero tenia un inconveniente, y es que no era compatible directamente con Qt.

Fig. 5.7 Resultados de QTRoot

Pero encontramos una herramienta que nos permita resolver este inconveniente, y se
pens que seria la solucin perfecta para iniciar el desarrollo de nuestro software, esta
herramienta es QtRoot, una biblioteca que sirve de interfaz entre Root y Qt, permitiendo
tener embebido Root dentro de cualquier aplicacin realizada en QT de manera sencilla

y practica, se realzaron muchas pruebas con este software y obtuvimos resultados


satisfactorios.

Fig. 5.8 Otros resultados de QTRoot

Pero sigue existiendo otro inconveniente, y era el hecho de que utilizar esta biblioteca
nos frenaba la portabilidad del sistema, ya que esta biblioteca nicamente funciona para
Linux, y este fue el motivo por el cual se decidi buscar otras alternativas, que aunque
no superaran en potencia a Root, por lo menos nos brindaran un marco inicial para la
generacin de imgenes y que garantizaran la portabilidad del sistema.

En este punto de nuestra investigacin encontramos dos nuevas bibliotecas, estas son
QwtPlot y QwtPlot3D, estas herramientas nos brindan un manejo de grficos 2D y 3D
muy aceptable y son completamente acoplables con Qt, y son adems portables. Pero un
inconveniente es que estas son herramientas de software libre, las cuales no tienen una
garanta de uso, y adems no existe la suficiente documentacin para su manejo.

Para iniciarnos en el desarrollo utilizando estas herramientas fue necesaria la ayuda de


las listas de correo de Qt, por medio de las cuales tuvimos la ayuda y cooperacin de los

integrantes de este grupo, dentro de los cuales encontramos al propio autor de esta
biblioteca de QwtPlot, Uwe Rathmann <rathmann@users.sourceforge.net>, quien nos
brindo ayuda en ciertas cuestiones necesarias para iniciarnos en el manejo de esta
herramienta.

Fig. 5.9 Resultados de QWT

Sobre QwtPlot3D, diremos que es una biblioteca que va sobre la misma lnea que
QwtPlot, pero sta est enfocada el desarrollo de grficos 3D utilizando OpenGL, esta
herramienta nos sirvi para generar los grficos 3D que representaran los resultados
obtenidos en los mtodos, y adems de esto nos provea de utilidades para la
manipulacin de las imgenes 3D generadas.

Fig. 5.10 Resultados de QWTPlot3D

Una vez concluida esta bsqueda de herramientas que cumplieran los requerimientos
del sistema, entonces se pudo dar comienzo a la integracin de todo en nuestro sistema.
Esta integracin involucra el acoplamiento de los grficos generados dentro de ventanas
generadas en Qt, que nos permitieran cambiar sus tamaos, dependiendo el tamao de la
ventana contenedora, que nos permitirn conectar los elementos internos del grafico con
los Widgets de Qt, en general que nos permitieran el completo acoplamiento con Qt. A
continuacin observamos unos de estos resultados.

Pruebas de Mtodos de Modelacin


Nuestro sistema tiene por objetivo la obtencin de un modelo computacional que
represente un fenmeno espacial. Para esto se eligi la geoestadstica, y en especial
decidimos utilizar GSlib, esta biblioteca de mtodos de modelacin geoestadstica es de
uso libre y es una de las herramientas mas utilizadas dentro del ambiente de desarrollo
de software de geoestadstica.
Una de las principales ventajas que vimos en esta librera es en cuestin de quien es el
autor de la misma, ya que uno de los autores es Clayton V. Deutsch, una persona
bastante reconocida en esta materia.
GSLib nos provee de herramientas para la obtencin del modelo, para la estimacin
(kriging) y para obtener simulaciones del modelo. Estos mtodos nos dan como
resultado un archivo de salida con los resultados en forma de tabla, de los cuales se
pueden obtener grficos como los siguientes.

Fig. 5.11 Resultados del software GSLib

Pero existieron desventajas significativas que nos hicieron buscar mas alternativas, una
de ellas es que GSlib esta escrita en Fortran, y hablar de Fortran hoy en da es algo
complicado, al inicio de este trabajo de investigacin realizamos un estudio sobre lo que
significa Fortran hoy en da, y entre otras cosas nos dimos cuenta de que Fortran no es
un lenguaje que haya muerto aun, ya que vimos que existen muchos mtodos y
bibliotecas de mtodos escritas en Fortran, los cuales no pueden ser tirado a la basura,
por lo que vimos que la mejor solucin para este tipo de cdigos era traducirlos a un
lenguaje como C++ o Java, ya que son los lenguajes que actualmente nos permiten el
uso de interfaces graficas y el manejo de nuevas herramientas de programacin o el uso
de frameworks los cuales aadan funcionalidad al sistema.

Es por lo anterior que decidimos traducir los cdigos que forman GSlib al lenguaje
C++, esto no es fcil ya que Fortran es un lenguaje que utiliza el paradigma de la
programacin estructurada, lo cual lo hace difcil de reutilizar y de entender.

En la bsqueda de resolver este problema encontramos otra biblioteca llamada F2C la


cual es una biblioteca encargada de traducir automticamente cdigos escritos en
Fortran al lenguaje C. Esta fue una solucin factible por el hecho de que, F2C es una
herramienta de software libre y al generar salidas en ANSI C, nos garantiza la
portabilidad del sistema.

Para lograr este objetivo de convertir los mtodos Fortran a cdigo C y despus a una
biblioteca dinmica, la cual provea los mtodos de modelacin, estimacin y simulacin
de forma dinmica, es decir, que en cualquier momento podemos hacer una llamada a
esta funcin, pasndole los parmetros correspondientes y esperar a que este nos regrese
un archivo de texto plano con los resultados correspondientes al mismo. Para esto
entonces es necesario seguir el siguiente algoritmo.

Anlisis Espacial
El anlisis espacial es un grafico sumamente necesario para poder realizar un anlisis
estructural de los datos, y este proceso es posible realizarlo con nuestro sistema. Al
crear una vista XY de los datos de nuestro archivo, tenemos que considerar no solo sus
coordenadas si no que adems deberemos conocer el valor de la variable en ese punto
para poder diferenciar los distintos niveles en los que deseemos visualizar el mapa.

Para cumplir con el objetivo de generar esta vista XY de los datos fue necesario utilizar
Qwt, esta biblioteca nos permite manejar correctamente las escalas, para que sean lo
mas claras posibles. Adems nos permite manipular cada rango de puntos (tomando la
variable como referencia) en smbolos de distintos colores para que sea observe un
mapa XY con los puntos bien definidos y sea as mas fcil de interpretar.

El objetivo de este tipo de grficos ser que el usuario pueda obtener una vista en planta
de los datos y que adems pueda observar la distribucin de los valores para cierta
variable. Tambin, en base a la experiencia de cada usuario, este podr tener una idea
del tipo de distribucin que presentan los datos, de los valores atpicos de la muestra y
de la posible tendencia de los mismos.

Fig. 5.12 Ventana de resultados del anlisis espacial

Obtencin del Modelo Computacional


Para realizar cualquier tipo de simulacin o de estimacin mediante nuestro sistema y
en general en cualquier otro sistema de este tipo, antes es necesario crear el modelo, el
cual nos representara en un grafico, la funcin de la correlacin que mantienen nuestros
datos.

Para cumplir con este propsito es necesario realizar un variograma o tambin llamado
semivariograma, el cual nos representa el modelo. Para esto es necesario llamar al
mtodo para estimar el variograma con la biblioteca dinmica incluida en nuestro
sistema, esta biblioteca dinmica es llamada libgam.so,.dll, su propsito es analizar la
correlacin entre dos variables (por lo menos), con lo cual nos regresa una tabla con
cada uno de los puntos estimados. El usuario tendr derecho de elegir tanto el archivo
de datos del cual tomara las variables correlacionadas, as como los distintos parmetros
necesarios para ejecutar el mtodo.

La figura siguiente muestra el proceso de eleccin de parmetros y muestra tambin el


grfico correspondiente al variograma estimado,

fue necesario adems agregar

informacin sobre la varianza del error.

Fig. 5.13 Ventana de resultado del variograma

Una vez que se obtiene un modelo computacional del fenmeno que se esta analizando,
este modelo ser utilizado por los mtodos de estimacin para generar una imagen
suavizada del fenmeno estudiado.

Para este propsito en nuestro sistema adems se incluye la biblioteca dinmica


kb2d.so, .dll la cual es la encargada de realizar este proceso y a la salida nos devuelve
un mapa, dentro de una malla definida por el usuario, sobre la cual se observan los
valores interpolados.

En nuestro sistema este tipo de grficos son superficies en tres dimensiones, las pueden
ser manipuladas por los usuarios, para realizar las transformaciones geomtricas
conocidas para poder observar la imagen en distintas perspectivas.

La siguiente figura nos muestra la ventana del sistema encargada de recoger los
parmetros del usuario necesarios para poder ejecutar el mtodo de estimacin por
Kriging, y nos desplegara la imagen correspondiente al mapa calculado.

Fig. 5.14 Ventana de resultado del mtodo de interpolacin Kriging

Adems de la generacin de este tipo de superficies o mapas es necesario brindar otra


funcionalidad que es el mostrar grficos que nos delimiten con mayor eficiencia los
resultados obtenidos. Para ello se utilizan las curvas de nivel, en este tipo de grficos
podemos observar mas detalles de la imagen que tal vez pudieran ser difciles de
apreciar en una imagen suavizada como los es el mapa de kriging.

Fig. 5.14 Mapa de contorno

Fig. 5.15 Mapa de contorno dentro de Qt

Modelado del Variograma


En esta opcin podr elegirse el modelo que ser ajustado a los puntos estimados del
variograma previamente calculado, la eleccin del modelo a ajustar es completamente
realizado por el usuario de manera visual, para ellos el sistema permite que los
resultados obtenidos con parmetros del modelo que el usuario va variando sean vistos

inmediatamente y con ello se permite al usuario ajustar el modelo en base a prueba y


error, que es el mtodo tradicional.

Una mejora a futuro ser que el software implemente mtodos automticos para la
eleccin del mejor modelo y ajuste, y con esto dar la oportunidad a usuarios inexpertos
de obtener modelos confiables para variables que se estn analizando.

CONCLUSIONES Y TRABAJOS FUTUROS


Con el presente trabajo se realizando una contribucin importante a la sociedad, ya que
este sistema es una herramienta aplicable a distintas reas de estudio, las cuales son
vitales para el desarrollo social; como ejemplo tenemos a la industria petrolera, una de
las mas grandes del pas, y de la cual depende la economa en gran medida, por lo que
esta herramienta tiene por objetivo contribuir con este tipo de industrias, facilitando el
anlisis de el fenmeno y disminuyendo costos que pueden ser originados por un mal
estudio previo del fenmeno, por ejemplo al realizar exploraciones de pozos petroleros,
analizando todos los factores que afecten su obtencin de manera conjunta
(correlacin).

Aunque la herramienta que se desarrollo en esta investigacin es una versin funcional,


esta pensado agregar mas elementos y mdulos que brinden una mayor funcionalidad al
sistema y que puedan resolver problemas mas especficos. Lo que se pretende a futuro
es realizar versiones del sistema enfocadas a cada rea de aplicacin, agregando
mtodos especficos para cada una de ellas y logrando as que el sistema sea mas
especializado y con esto lograr obtener resultados especiales para cada una se estas
reas en las que sea utilizado.

Otro de los propsitos a futuro ser el implementar mas mtodos de modelacin as


como de anlisis estadstico, adems crear mtodos que agreguen funcionalidades no
contempladas por las herramientas actuales de este tipo, entre los cuales tenemos
planeado utilizar el reconocimiento de patrones para automatizar tareas y con esto tratar
de realizar un sistema experto.

Al final lo que se quiere lograr es crear un laboratorio de anlisis geoestadstico, en el


cual se pueda realizar un anlisis completo de cierto fenmeno y con esto se lograra que
el usuario ya no tenga que utilizar distintas herramientas de software para cada fase del
anlisis, si no que todo se integre en un entorno de trabajo, en el cual de manera sencilla
pueda realizarse un completo anlisis del fenmeno.

BIBLIOGRAFA
Dr. Martn Daz Viera, Instituto Mexicano del Petrleo
Christian Lantuejoul, Geostatistical Simulation: Models and Algorithms, Springer
Verlag, 2002.
Consentino L., Integrated Reservoir Studies, TECHNIP, 2001.
Deutsch, C. V., Geostatistical Reservoir Modeling, Oxford University Press, 2002.
Kelkar M. and G. Prez, Applied Geostatistics for Reservoir Characterization, SPE,
2002.

SigmaView Landmark Graphics Corporation (http://www.lgc.com/ )


(RC)2 Antero Seismic Micro-Technology (http://www.seismicmicro.com/ )
RMSgeomod Irap RMS - Roxar Software Solutions (http://www.roxar.com/)
Gocad Earth Decision Sciences (http://www.t-surf.com/ )
RML-HereSim 3D Beicip Franlab (http://www.beicip.com/ )

Вам также может понравиться