Академический Документы
Профессиональный Документы
Культура Документы
Relatrio final
Professor Orientador: Carlos Jorge Ferreira Silvestre Co-Orientador: Paulo Jorge Coelho Ramalho Oliveira Alunos: 44171 Rui Martins 44155 Lus de Sousa ____________________________ ____________________________ ____________________________ ____________________________
30-09-2002
RESUMO
Dado um conjunto finito de amostras de um dado fenmeno natural, distribudo no espao (como a elevao ou concentrao de ozono no ar), existem vrias formas de interpolar uma superfcie contnua, que o represente no seu todo. O aspecto espacial deste tipo de fenmenos, remete a sua representao num suporte informtico, para os Sistemas de Informao Geogrfica (SIG); rea da informtica desenvolvida ainda na dcada de 1960. Foi analisado o mercado presente dos SIG, considerando estes sistemas como ferramentas, no s de anlise e visualizao de informao espacial, como tambm de gerao dessa mesma informao. Esta anlise levou escolha do ArcGis da ESRI, como suporte informtico a usar. Passou-se depois anlise dos diferentes mtodos a usar na interpolao, onde se destacaram os mtodos Geoestatsticos, nomeadamente os mtodos de Krigagem. Por ltimo foram geradas alguns superfcies, num processo interactivo de refinamento dos modelos geoestatsticos, usando as tcnicas de Validao e Validao Cruzada.
PALAVRAS CHAVE
Sistemas de Informao Geogrfica (SIG) Interpolao de Superfcies Geoestatstica Krigagem Anlise Exploratria Espacial Validao Cruzada Validao Erro de Medio
30-09-2002
AGRADECIMENTOS
Gostaramos de agradecer a colaborao do Doutor Carlos Silvestre e Doutor Paulo Oliveira pelo apoio e orientao fornecidos ao longo do desenvolvimento deste trabalho. Agradecimentos especiais ao Engenheiro Serralha pelo apoio e solicitude sempre demostrados ao longo destes ltimos 13 meses. Por ltimo agradecemos a todos os colegas que alguma vez, de uma ou de outra maneira contriburam para a progresso deste trabalho.
ii
30-09-2002
NDICE
RESUMO.I PALAVRAS CHAVE..I AGRADECIMENTOSII NDICE......III LISTA DE FIGURAS....................................................................................VI LISTA DE TABELAS................................................................................ VIII CAPTULO I - INTRODUO .....................................................................1 INTRODUO ...............................................................................................1 1.1 Enquadramento.......................................................................................1 1.2 Objectivos...............................................................................................1 1.3 Estrutura .................................................................................................2 1.4 Resultados ..............................................................................................3 CAPTULO II - SISTEMAS DE INFORMAO GEOGRFICA..............4 2.1 Introduo...............................................................................................4 2.2 O que um SIG? ....................................................................................4
2.2.1 Definio Genrica de SIG ................................................................................. 5 2.2.2 Outras definies de SIG .................................................................................... 5
2.3 Representao da Informao num SIG Vectores/Raster .....................6 2.4 Tipos de Sistemas de Informao Geogrfica........................................9
2.4.1 Sistemas de Informao Geogrfica ................................................................. 10 2.4.2 Funcionalidade do SIG...................................................................................... 10 2.4.3 Desktop Mapper ................................................................................................ 10 2.4.4 Limitaes do DM ............................................................................................ 12 2.4.5 CAD Mapping Systems ..................................................................................... 12 2.4.6 Diferenas SIG-CAD ........................................................................................ 13 2.2.7 Resumo.............................................................................................................. 13
2.5 Para que serve um SIG? .......................................................................14 CAPTULO III - ESTUDO DE MERCADO ................................................16 3.1 Introduo.............................................................................................16 3.2 IDRISI 32 .............................................................................................16
3.2.1 CARTA LINX................................................................................................... 19 3.2.2 Concluses ........................................................................................................ 19
iii
30-09-2002
3.7 Comparao e Escolha .........................................................................34 CAPTULO IV - INTERPOLAO DE SUPERFCIES ............................36 4.1 Introduo.............................................................................................36 4.2 Mtodos Determinsticos......................................................................36
4.2.1 Inverso da Potncia das Distncias (Inverse Distance Weighting - IDW) ...... 37 4.2.2 Interpolao Polinomial Global ........................................................................ 39 4.2.3 Interpolao Polinomial Local .......................................................................... 40 4.2.4 Funes de Base Radial (Radial Basis Functions -RBF) ................................. 41 4.3.5 Concluses ........................................................................................................ 43
4.2 Geoestatstica........................................................................................43
4.2.1 Introduo ......................................................................................................... 43 4.2.2 Modelo Geoestatstico....................................................................................... 44 4.2.2.1 Funo Aleatria Estacionria................................................................... 45 4.2.2.2 Estacionariedade do Semivariograma e da Covarincia espacial.............. 45 4.2.3 Anlise Estrutural.............................................................................................. 46 4.2.3.1 Parmetros do Semivariograma................................................................. 47 4.2.3.2 Modelo Esfrico......................................................................................... 49 4.2.3.3 Modelo Exponencial.................................................................................. 49 4.2.3.4 Modelo Gaussiano ..................................................................................... 49 4.2.3.5 Modelos de Anisotropia............................................................................. 50 4.2.3.6 O que se v num Semivariograma ............................................................. 51 4.2.4 Estimao algoritmos de interpolao de krigagem ...................................... 51 4.2.4.1 Krigagem Simples ..................................................................................... 53 4.2.4.2 Krigagem Ordinria ................................................................................... 54 4.2.4.3 Krigagem Universal................................................................................... 54 4.2.5 Consideraes sobre os ponderadores do estimador de krigagem .................... 55
4.3 Concluso .............................................................................................56 CAPTULO V - GERAO DE SUPERFCIES.........................................58 5.1 Integrao dos Dados ...........................................................................58 5.2 Anlise Exploratria Espacial ..............................................................62
5.2.1 Descrio Univariada das amostras .................................................................. 63 5.2.2 Descrio Espacial ............................................................................................ 65 5.2.3 Mapas de Voronoi............................................................................................. 67
iv
30-09-2002
5.7 Concluso .............................................................................................94 CAPTULO VI - CONCLUSO...................................................................96 6.1 Estudo de Mercado...............................................................................96 6.2 Interpolao de Superfcies ..................................................................96 6.3 Trabalho Futuro..................................................................................103 ANEXO A BREVE HISTRIA DOS SIG ..............................................105 ANEXO B - SEMIVARIOGRAMAS .........................................................107 B.1 rea de Trabalho Completa...............................................................107
B.1.1 Krigagem Ordinria........................................................................................ 107 B.1.2 Krigagem Universal com deriva de 1 ordem ................................................ 108 B.1.3 Krigagem Universal com deriva de 2 ordem ................................................ 109
ANEXO C - DERIVAS ...............................................................................116 C.1 rea de Trabalho Completa...............................................................116 C.2 Zona do Monte da Guia .....................................................................116 C.3 Zona a Leste do Monte da Guia.........................................................117 REFERNCIAS...........................................................................................118
30-09-2002
LISTA DE FIGURAS
Figura 2.1 Representao Vectorial. ....................................................................................... 7 Figura 2.2 Mapa de Densidade Populacional na Holanda, representado por vectores. .......... 8 Figura 2.3 Pormenor de uma camada raster representando o relevo da Serra de Gredos ...... 8 Figura 2.4 Diferenas entre as duas formas de representao do mundo num SIG ................ 9 Figura 3.1 Exemplo de Anlise com Programao por Filtros ............................................. 18 Figura 3.2 Sistema ArcGis .................................................................................................... 20 Figura 3.3 Escalabilidade do sistema ArcGis........................................................................ 20 Figura 3.4 Horizontalidade das Extenses ............................................................................ 22 Figura 3.5 Janela do FOCUS................................................................................................. 25 Figura 3.6 PCI Modeler......................................................................................................... 26 Figura 3.7 Grfico da Estrutura de Mercado em 1994 .......................................................... 30 Figura 3.8 Grfico da Estrutura de Mercado em 1999 .......................................................... 31 Figura 3.9 Grfico da Estrutura de Mercado em 2000.......................................................... 32 Figura 4.1 Vizinhana elptica .............................................................................................. 38 Figura 4.2 Superfcie gerada por IDW .................................................................................. 39 Figura 4.3 Superfcies geradas por polinomiais globais ....................................................... 39 Figura 4.4 - Superfcie gerada por polinomiais locais ............................................................. 40 Figura 4.5 Superfcie gerada por RBF .................................................................................. 41 Figura 4.6 RBF versus IDW.................................................................................................. 41 Figura 4.7 Exemplo RBF com 3 amostras ............................................................................ 42 Figura 4.8 Parmetros do Semivariograma ........................................................................... 48 Figura 4.9 Representao grfica de modelos transitivos normalizados .............................. 49 Figura 4.10 - Representao grfica da anisotropia geomtrica .............................................. 50 Figura 4.11 - Representao grfica da anisotropia zonal ....................................................... 51 Figura 4.12 Semivariogramas em amostras diferentes.......................................................... 51 Figura 4.13 Krigagem Simples.............................................................................................. 53 Figura 4.14 Krigagem Ordinria ........................................................................................... 54 Figura 4.15 Krigagem Universal com deriva de 2 Ordem ................................................... 55 Figura 4.16 Diferenas entre mtodos Geostatsticos e Determinsticos .............................. 56 Figura 5.1 Shapefiles linha da costa, batimetria, enrocamento e afloramento rochoso. ....... 58 Figura 5.2 Shapefiles e Mapa georeferenciado. .................................................................... 59 Figura 5.3 Pontos de referncia para projeco .................................................................... 60 Figura 5.4 Shapefiles, Mapa georeferenciado e Pontos de leitura. ....................................... 61 Figura 5.5 Shapefiles, pontos de leitura, pontos de batimetria e altimetria .......................... 62 Figura 5.6 Histograma inicial................................................................................................ 63 Figura 5.7 Histograma aps a introduo de pontos ............................................................. 65 Figura 5.8 Deriva nos dados iniciais ..................................................................................... 65 Figura 5.9 Deriva aps a incluso de pontos......................................................................... 66 Figura 5.10 Deriva Noroeste - Sudoeste ............................................................................... 66 Figura 5.11 Exemplo de um Mapa de Voronoi..................................................................... 67 Figura 5.12 Mapas Voronoi Simples, inicial (esquerda) e com pontos adicionais (direita) . 68 Figura 5.13 Mapas Voronoi IQR, inicial (esquerda) e com pontos adicionais (direita) ....... 68 Figura 5.14 Mapas Voronoi Aglomerado, inicial (esquerda) e pontos adicionais (direita) .. 69 Figura 5.15 Mapas Voronoi Mdia, inicial (esq) e com pontos adicionais (dir)................... 69 Figura 5.16 Krigagem ordinria com modelo exponencial e com modelo gaussiano .......... 71 _______________________________________________________________________ Rui Martins, Lus de Sousa vi
30-09-2002
Figura 5.17 Modelo gaussiano esquerda e modelo exponencial direita ........................... 71 Figura 5.18 Krigagem Universal com deriva de primeira ordem ......................................... 72 Figura 5.19 Krigagem Universal com deriva de segunda ordem .......................................... 73 Figura 5.20 Grfico de Validao Cruzada........................................................................... 73 Figura 5.21 Sub-amostra do Monte da Guia ......................................................................... 79 Figura 5.22 Histograma da sub-amostra do Monte da Guia ................................................. 80 Figura 5.23 Deriva dos dados na zona do Monte da Guia .................................................... 80 Figura 5.24 Mapas Voronoi Aglomerado (esquerda) e IQR (direita) ................................... 81 Figura 5.25 Sub-amostra a Leste do Monte da Guia............................................................. 84 Figura 5.26 Histograma do zona leste do Monte da Guia..................................................... 85 Figura 5.27 Deriva dos dados no zona leste do Monte da Guia........................................... 85 Figura 5.28 RBF (esquerda), Polinomial Local (centro) e KU 1 Ordem (direita) ............... 87 Figura 5.29 Conjunto de pontos com igual latitude e longitude ........................................... 89 Figura 6.1 Superfcie final gerada com KO e semivariograma Combinado. ........................ 98 Figura 6.2 - Superfcie final gerada com KU 1 ordem e semivariograma Combinado. ......... 99 Figura 6.3 Monte da Guia gerado com KO e semivariograma Combinado........................ 100 Figura 6.4 Monte da Guia gerado com KU 1 ordem e semivariograma Esfrico.............. 100 Figura 6.5 Resultados na zona a Leste do Monte da Guia .................................................. 101 Figura 6.7 TIN do Monte da Guia gerado com KO e semivariograma Combinado ........... 102 Figura 6.8 TIN gerado com KU de 1 ordem e semivariograma Combinado..................... 103 Figura B.1 Semivariogramas usados com KO na rea de trabalho completa. .................... 107 Figura B.2 Semivariogramas usados com Krigagem Universal com deriva de 1 ordem. . 108 Figura B.3 Semivariogramas usados com Krigagem Universal com deriva de 2 ordem. . 109 Figura B.4 Semivariogramas usados com KO na rea do Monte da Guia.......................... 110 Figura B.5 Semivariogramas da KU com deriva de 1 ordem na zona do Monte da Guia. 111 Figura B.6 Semivariogramas da KU com deriva de 2 ordem na zona do Monte da Guia. 112 Figura B.7 Semivariogramas da Krigagem Ordinria da zona a Leste do Monte da Guia. 113 Figura B.8 Semivariogramas da Krigagem Universal com deriva de 1 ordem. ................ 114 Figura B.9 Semivariogramas da Krigagem Universal com deriva de 2 ordem. ................ 115 Figura C.1 Derivas usadas nos modelos da amostragem completa..................................... 116 Figura C.2 Derivas usadas nos modelos da zona do Monte da Guia .................................. 116
vii
30-09-2002
LISTA DE TABELAS
Tabela 3.1 - Prefixos dos comandos existentes no Grass......................................................... 24 Tabela 3.2 - Nmero de Licenas Activas em 1994 ................................................................ 29 Tabela 3.2 - Factores de Escolha.............................................................................................. 35 Tabela 5.1 Pontos auxiliares de projeco ............................................................................ 60 Tabela 5.2 Validao Cruzada para Semivariograma Esfrico............................................. 75 Tabela 5.3 - Validao Cruzada para Semivariograma Exponencial....................................... 76 Tabela 5.4 - Validao Cruzada para Semivariograma Gaussiano .......................................... 76 Tabela 5.5 - Validao Cruzada para Semivariograma Combinado ........................................ 77 Tabela 5.6 - Resultados mais significativos ............................................................................. 77 Tabela 5.7 Validao para melhores modelos....................................................................... 78 Tabela 5.8 Resultados mais significativos no Monte da Guia .............................................. 82 Tabela 5.9 Validao para a zona do monte da Guia ............................................................ 83 Tabela 5.10 Resultados mais significativos na Zona a Leste................................................ 85 Tabela 5.11 Validao Cruzada para Mtodos Determinsticos ........................................... 86 Tabela 5.12 Validao para a zona Leste............................................................................. 87 Tabela 5.13 Tratamento da varincia fornecida para amostra completa............................... 89 Tabela 5.14 Validao Cruzada com e sem Erro de Medio na Amostra Completa .......... 90 Tabela 5.15 Validao com Erro de Medio na Amostra Total .......................................... 91 Tabela 5.16 - Validao Cruzada com e sem Erro de Medio na zona do Monte da Guia... 91 Tabela 5.17 Validao com Erro de Medio para o Monte da Guia ................................... 92 Tabela 5.18 - Validao Cruzada com e sem Erro de Medio na Zona Leste ...................... 93 Tabela 5.19 Validao com Erro Medio na zona Leste...................................................... 93 Tabela B.1 Parmetros dos Semivariogramas de KO na rea de trabalho completa .......... 107 Tabela B.2 Parmetros dos Semivariogramas de KU com deriva de 1 ordem. ................. 108 Tabela B.3 - Parmetros dos Semivariogramas de KU com deriva de 2 ordem................... 109 Tabela B.4 Parmetros dos Semivariogramas de Krigagem Ordinria............................... 110 Tabela B.5 Parmetros dos Semivariogramas da KU com deriva de 1 ordem. ................. 111 Tabela B.6 Parmetros Semivariogramas da KU com deriva de 2 ordem......................... 112 Tabela B.7 Parmetros dos Semivariogramas da Krigagem Ordinria............................... 113 Tabela B.8 Parmetros Semivariogramas da KU com deriva de 1 ordem......................... 114 Tabela B.9 Parmetros dos Semivariogramas da KU com deriva de 2 ordem. ................. 115
30-09-2002
CAPTULO I INTRODUO
1.1 Enquadramento
Desde sempre o Homem sentiu necessidade de representar o mundo que o rodeia. As primeiras representaes do mundo conhecido comearam por ser desenhadas em placas de barro que depois eram cozidas. Os mapas passaram depois a ser desenhos em suportes mais familiares (como o papiro ou o couro), que evoluram ao longo do tempo, quer nas tcnicas de desenho usadas, quer nas dimenses e formas do mundo representado. Lentamente os mapas tornaram-se em mais do que figuras, transformaram-se em ferramentas complexas de anlise. Com o aparecimento dos computadores estas ferramentas passaram a ter suporte digital, e tornando-se, deste modo, acessveis a mais pessoas. Esta evoluo culmina no aparecimento dos primeiros Sistemas de Informao Geogrfica (SIG), durante a dcada de 1960, depois de uma srie de inovaes tecnolgicas, quer no Hardware, quer no Software dos computadores de ento. Os SIG fazem j parte do dia a dia moderno, embora tal no seja completamente perceptvel. A maioria das empresas de grande ou mdia dimenso tm departamentos SIG, ou requerem servios nesta rea. Os SIG so usados em muitos pases como poderosas ferramentas de gesto e governao, a nvel das Cmaras Municipais. A sua flexibilidade permite aos SIG tratar de qualquer tipo de informao que tenha um componente geogrfico, e nos dias de hoje quase todo o tipo de informao se pode ligar a informao geogrfica. O desenvolvimento dos SIG apresenta ainda grandes desafios s Cincias da Informtica, no s na criao de novas ferramentas que beneficiem de tecnologias mais recentes, como na sua integrao apropriada nos domnios de anlise. Este uma rea em franco desenvolvimento e expanso, apresentando boa razes de investigao.
1.2 Objectivos
O Objectivo deste Trabalho Final de Curso desenvolver um Sistema de Informao Geogrfica, de modo a que este represente a informao tridimensional obtida, durante as
30-09-2002
operaes de diversos veculos robticos autnomos. Esta informao ser processada para mostrar a sua posterior utilizao no sistema de controlo de misso dos veculos. Com base num sistema SIG disponvel comercialmente, assente numa base de dados pretende-se estudar as caractersticas dos dados disponveis, e estudar a melhor forma de os representar.
1.3 Estrutura
Este documento encontra-se organizado em seis captulos, o primeiro dos quais constitudo pela presente introduo. Aqui se apresenta o enquadramento e a motivao que deram origem a este trabalho, so apresentados os objectivos a atingir, delineada a estrutura do relatrio e enunciam-se os resultados do trabalho desenvolvido. O segundo captulo introduz conceitos bsicos de SIG, caractersticas bases e funes deste tipo de sistemas. So aqui delimitados os diferentes tipos de SIG existentes no mercado, e apresentadas as diferentes orientaes de cada um deles. No terceiro captulo so analisados alguns sistemas presentemente no mercado, tendo em vista os objectivos finais do trabalho. igualmente analisada a estrutura passada e presente do mercado dos SIG. Por fim so comparados os diferentes SIG estudados e efectuada uma escolha perante certos critrios, de acordo com os objectivos a atingir. O quarto captulo apresenta as diferentes tcnicas de interpolao de superfcies, a partir de um conjunto finito de amostras. So apresentados os mtodos Determinsticos e Geoestatsticos, e o modelo matemtico que permite efectuar a anlise do caso de estudo. No quinto captulo, so postos em prtica os modelos estudados no captulo pretrito. So seleccionadas trs zonas de anlise na rea de estudo, para as quais se procede anlise exploratria espacial. So ento aplicados os mtodos de interpolao, e filtrados os resultados usando, primeiramente a Validao Cruzada, e por ltima a Validao. No ltimo e sexto captulo so discutidos os resultados obtidos, perante as opes tomadas. So igualmente apresentados alguns dos resultados finais.
30-09-2002
1.4 Resultados
Este trabalho levou obteno dos seguintes resultados: ?? Ficheiros em formato TIN (Triangulated Irregular Network) das superfcies finas geradas ?? Camadas SIG geoestatsticas das superfcies geradas (formato Arc/Info - layer) ?? Conjuntos de teste e de treino usados na Validao, bem como as respectivas camadas vector geradas (formato Arc/Info - shapefile)
30-09-2002
30-09-2002
Sistema: um framework para manipular, pesquisar, analisar e disseminar informao. Informao: dados processados de uma forma utilizvel. Geogrfico: dados referenciados espacialmente. Um SIG uma base de dados digital no qual uma comum coordenada espacial o principal meio de referncia. Os SIG requerem[1]: . Entradas de dados provenientes de mapas, fotos areas, satlites e outras fontes; . Armazenamento e pesquisa de dados; . Transformao de dados, anlise e modelao, incluindo estatsticas espaciais; . Sadas de dados, tal como mapas, relatrios e planos. Trs observaes acerca desta definio: Primeira: os SIG esto relacionados com outras aplicaes de base de dados, mas com uma diferena importante. As bases de dados dos SIG usam referncias geogrficas como o principal meio de guardar e aceder a informao. Segunda: os SIG integram tecnologia. Onde outras tecnologias podem ser usadas apenas para analisar fotos areas e imagens de satlite, de modo a criarem modelos estatsticos, ou para desenhar mapas, estas capacidades so conjuntamente oferecidas com um SIG. Terceira: um SIG com o seu conjunto de funes, deve ser visto como um processo e no meramente como software ou hardware. Os SIG servem para tomar decises. O modo como os dados so armazenados e analisados dentro de um SIG deve reflectir a maneira como a informao ir ser usada numa tarefa especfica ou na tomada de uma deciso[1].
2.2.2 Outras definies de SIG
- Um sistema para capturar, armazenar, comprovar, integrar, manipular, analisar e visualizar dados que esto espacialmente georeferenciados.[2]. - Sistemas automatizados para a captura, armazenagem, composio, anlise e visualizao de dados espaciais[3]. - Um sistema de hardware, software e procedimentos desenhados para suportar a captura, gesto, manipulao, anlise, modelado e visualizao de dados espacialmente referenciados para resolver problemas complexos de planeamento e gesto[4].
30-09-2002
Uma das razes porque to difcil existir acordo numa nica definio de SIG por existirem diversas vertentes em que podem ser aplicados, cada uma para diferentes propsitos e para diferentes tipos de tomada de decises. *AM/FM (Automated Mapping and Facilities Management) AM/FM no so geralmente utilizados para anlise espacial, e faltam-lhes a topologia das estruturas de dados dos SIG. * CAD (Computer-Aided Design) Sistemas projectados para desenho. Tratam dados espaciais como grficos em vez de os tratarem como informao. * LIS (Land Information System) * Multipurpose Cadastre: Sistemas que guardam informao sobre parcelas de terra. De um ponto de vista prtico um Sistema de Informao Geogrfica um sistema informtico capaz de realizar uma gesto completa de dados geogrficos referenciados. Por referenciados entende-se que estes dados geogrficos ou mapas tm coordenadas geogrficas reais associadas, permitindo-nos estas manejar e fazer anlises com dados reais como longitudes, permetros ou reas. Todos estes dados alfanumricos associados aos mapas em conjunto com os que queiramos acrescentar so geridos por uma base de dados integrada no SIG. O que distingue os SIG de outros tipos de sistemas de informao, tal como bases de dados e spreadsheets, que os SIG lidam com informao espacial. Os SIG tm capacidade de relacionar diferentes camadas de informao (layers) para o mesmo ponto, combinando, analisando e, finalmente apresentar os resultados. A informao espacial usa a localizao, num sistema de coordenadas, como a sua referncia base.
30-09-2002
informao em camadas. Este um aspecto importante dos SIG, que conhecido como integrao de dados. Qualquer actividade econmica ou social com uma dimenso espacial no pode ser correctamente entendida sem as suas qualidades espaciais serem referenciadas. A informao espacial tem duas partes essenciais: localizao e propriedades (atributos). Na localizao alm da latitude e longitude podem ser usados outros tipos de convenes. Os atributos servem, como o prprio nome indica, para descreverem propriedades ou caractersticas de pontos geogrficos. Esses atributos normalmente so guardados em tabelas. Os SIG guardam e processam dados em dois formatos, vectorial e raster (este um termo da lngua inglesa, infelizmente no existe qualquer equivalente em portugus).
Figura 2.1 Representao Vectorial. No modelo vectorial, o mundo simulado como um mosaico de linhas e pontos interligados representando a localizao e fronteiras de entidades geogrficas. Os dados so representados por arcos, polgonos, pontos e ns. A principal vantagem do formato de dados vectorial que permite uma representao precisa, o que muito til em actividades tais como engenharia. Tambm possvel nos SIG baseados no modelo vectorial definir relaes espaciais de conectividade e adjacncia. Contudo, a maior desvantagem de dados vectoriais que as fronteiras dos mapas de polgonos resultantes so discretas, onde na realidade os mapas de polgonos podem representar alteraes graduais tal como mapas de solo.
30-09-2002
Figura 2.2 Mapa de Densidade Populacional na Holanda, representado por vectores. Ao invs, nos modelos raster (mapas de pixels), a resoluo depende do tamanho do pixel, logo a resoluo pode ir ate onde se desejar. Este modelo torna-se mais adequado quando o detalhe essencial.
Figura 2.3 Pormenor de uma camada raster representando o relevo da Serra de Gredos Cada camada raster na realidade uma matriz bidimensional, em que para cada clula existe um valor nico que corresponde a uma nica caracterstica representada. Esta a representao tradicional de imagens em formato digital, pois de facto uma imagem digital sempre representada por um conjunto de pixels. Este formato o mais usado para representar caracterstica como a elevao do terreno. _______________________________________________________________________ Rui Martins, Lus de Sousa
30-09-2002
A principal desvantagem das camadas raster em relao s camadas vectoriais o facto de ocuparem muito mais espao. Se por exemplo quisermos representar uma estrada teremos que ter um ficheiro que indique para uma dada zona quais os pixels que fazem parte da estrada e quais no fazem, isto equivale a uma tabela. Essa mesma estrada pode ser representado por uma simples linha num modelo vectorial, o que numa base de dados equivale unicamente a uma linha de uma tabela. Podemos ainda referir que para uma camada raster necessitamos de uma tabela para representar uma nica caracterstica geogrfica, ao passo que numa camada vectorial, uma tabela pode conter dados a cerca de inmeras caractersticas.
Figura 2.4 Diferenas entre as duas formas de representao do mundo num SIG
30-09-2002
Um SIG em sentido completo gere uma base de dados espacial. Permite a criao e estruturao dos dados partindo de fontes de informao como os mapas, a digitalizao, bases de dados existentes, etc. Para alm de possibilitar a anlise, visualizao e edio em mapas da base de dados, um SIG conta com ferramentas que permitem criar novos dados derivados dos existentes. 2.4.2 Funcionalidade do SIG - Construir dados geogrficos: Mediante dados geomtricos existentes em CAD, ou capturando-os por digitalizao, vectorizao de imagens, GPS, etc. O sistema permite depur-los e estrutur-los topologicamente, associando-os com bases de dados alfanumricas. Desta forma obter-se-o dados espaciais preparados para o seu uso na anlise. - Modelao cartogrfica: Criao de novos mapas a partir de mapas existentes: Combinando atributos do terreno como pendentes, vegetao, tipo de solo, etc. Mediante um modelo matemtico, podem-se criar novas variveis, como um ndice de eroso, de perigo de incndios, etc. - O SIG permite-nos analisar os mapas estruturados em combinao com bases de dados associadas. Podem ser interrogados para seleccionar os dados de interesse, ver os resultados interactivamente escolhendo a simbologia em funo dos atributos associados e produzir cartografia de qualidade. Tambm se podem preparar aplicaes medida, como um plano de controlo de incndios, de avaliao de impactos ambientais, um modelo que preveja a evoluo de um incndio ou de um alagamento, aplicaes verticais, como um sistema de gesto municipal ou uma aplicao para uma central elctrica, etc. 2.4.3 Desktop Mapper Recentemente tm aparecido aplicaes simples de visualizao e anlise de dados com componente espacial para sistemas micro-computadores. Como de esperar estes sistemas apresentam um custo inferior a um SIG completo. A denominao habitual destas aplicaes em ingls Desktop Mapper (DM), que significa algo como "Cartografia de escritrio". Em primeiro lugar, estas ferramentas permitem o uso de dados espaciais (possivelmente criados e estruturados com um SIG) por parte de utilizadores que no so peritos em programao, cartografia, geologia, etc., da mesma forma como estes mesmos utilizadores empregam _______________________________________________________________________ Rui Martins, Lus de Sousa
10
30-09-2002
processadores de textos, folhas de clculo ou bases de dados, sem quaisquer conhecimentos de topografia, manuteno, teoria de computao, etc. Fundamentalmente os DM permitem ver e analisar a estrutura espacial dos dados. Por outro lado, estas aplicaes servem tambm de veculo para a criao de aplicaes concretas que trabalhem com dados espaciais com por exemplo uma aplicao que gira um inventrio da fauna de uma certa zona protegida ou uma aplicao vertical para um banco. Grande parte da capacidade de adequao destes produtos deriva das possibilidades de integrao com outras aplicaes atravs dos mecanismos fornecidos por ambientes de trabalho como Microsoft Windows, Mac OS, OS/2 PM, Windows NT e X Windows. Desta maneira, e conjuntamente com aplicaes especficas, podem-se criar contornos de trabalho verticais que resolvam grande parte dos problemas de um determinado profissional, integrando-se a anlise e visualizao espacial com a preparao de documentos, modelos de clculo, etc. Da mesma maneira, podem-se incorporar dados no geridos directamente pelo DM, como por exemplo, imagem de vdeo ou fotografias. Este tipo de aplicao tem um mercado potencial muito mais amplo que um SIG tradicional, pelas mesmas razes que o tm os processadores de texto, folhas de clculo ou bases de dados. Permitem criar um modelo geogrfico do funcionamento dum negcio ou organizao. O facto de que grande parte das bases de dados existentes usem dados geogrficos - estima-se que mais do 85 % contenham um componente geogrfico - permite que o DM mostre padres, relaes e tendncias que de outra maneira seriam dificilmente detectveis. Actualmente os DM usam-se em: departamentos de marketing, vendas, distribuio e retalho, telecomunicaes, propriedade imobiliria, planeamento, seguros, servios de urgncia (bombeiros, polcia), sade, e administrao local. Um requisito bsico para estas aplicaes serem exploradas que junto com a aplicao se administrem os dados espaciais bsicos referidos rea de interesse do cliente, de forma j estruturada. (Mapas de municpios, infra-estruturas, dados topogrficos, urbanos...). Assim vm a ser ferramentas de explorao dos dados gerados por um SIG. Normalmente sero utilizadores de SIG os que disponibilizaro os dados e as aplicaes para um sistema DM. No que diz a respeito ao uso de um DM como complemento de um SIG, h que distinguir que algumas ferramentas DM trabalham directamente com as bases de dados dum SIG determinado, enquanto que outras requerem um formato prprio. No segundo caso, se se quer utilizar o DM como visualizador dum SIG determinado deve-se estabelecer primeiro um mecanismo que adapte os dados do SIG aos requerimentos e estruturao do DM. _______________________________________________________________________ Rui Martins, Lus de Sousa
11
Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica 2.4.4 Limitaes do DM - No pode criar novos mapas por digitalizao,
30-09-2002
incorporao de dados geomtricos no estruturados, pois habitualmente no se conta com a capacidade de depurao dos dados, criao de topologia e transformao para a sua correcta localizao espacial. - Tambm no se podero criar novos temas combinando dados existentes por anlise de sobreposio. No se conta com funes avanadas de manipulao da topologia nem de modelao cartogrfica. - No se podem gerir dados tridimensionais. Isto exclui a criao de vistas perspectivas, anlise de visibilidade, etc. (Embora se possam criar aplicaes que implementem alguma funcionalidade deste tipo, como criar curvas de nvel, aplicar modelos de iluminao, ...) - Outra rea na qual um DM insuficiente no tratamento de dados de deteco remota, que requer capacidade de processo de grandes quantidades de dados raster. - Tambm no se podem esperar de um DM as capacidades mais avanadas dos SIG modernos, como "meta dados" de qualidade, controlo de concorrncia dinmico ou variabilidade temporal dos dados. 2.4.5 CAD Mapping Systems Alguns vendedores de sistemas CAD (Computer Aided Design - programas de delineao e desenho) consideraram poder evoluir facilmente um destes sistemas, e converte-lo num SIG. Os sistemas que aparecem desta forma denominam-se CAD Mapping Systems (CMS), e habitualmente o vendedor chama-os SIG. Normalmente estes sistemas so o resultado da combinao de dois sistemas existentes no mercado, um CAD e um RDBMS (Relacional DataBase Management System - Sistema de gesto de bases de dados relacional). Desta forma os dados alfanumricos contidos nas bases de dados associam-se com elementos grficos dum arquivo - desenho de CAD. A verdade que um CAD apresenta algumas caractersticas que dificultam o desenvolvimento dum SIG. Um SIG no a soma de um CAD e um RDBMS; mais exactamente, o RDBMS encontra-se no corao do sistema, e as capacidades grficas, subtilmente diferentes das do CAD, encontram-se intimamente ligadas ao RDBMS.
12
30-09-2002
Algumas das diferenas fundamentais entre a parte grfica dum SIG e um CAD so: - Propsitos diferentes: O SIG reflecte a realidade. O CAD desenha algo que ainda no existe. - Ambos tm um estrato geomtrico, mas a criao destes elementos distinta: em CAD so criados por um delineador, com exactido, em SIG so obtidos a partir de mapas ou do terreno, com certo erro e impreciso inevitvel, mas mensurvel. - O CAD segmenta os dados em arquivos independentes que no partilham um espao de coordenadas global. Em SIG os dados formam um conjunto contnuo. (Isto implica diferentes formas de acesso e diferentes problemas de concorrncia). - A informao num SIG pelo menos uma ordem de magnitude maior, os objectos so muito mais complexos. (Estima-se que a infra-estrutura municipal tipo requeira entre meio e um Gigabyte por cada cem mil habitantes). - Os CAD habitualmente permitem a ligao com uma base de dados, mas no permitem uma integrao suficiente, como por exemplo para responder a perguntas que combinem critrios alfanumricos e espaciais. (No contam com uma linguagem de consulta alfanumrico/espacial, nem a possibilidade de anlise de sobreposio, e normalmente o conceito de topologia muito pobre) - H alguns tipos de dados caractersticos do SIG que um CAD no gere: dados raster referenciados geograficamente e com atributos, como os de Deteco Remota, ou Modelos Digitais do Terreno, que no se podem implementar eficazmente com um programa de criao de slidos. - Um CAD separa as entidades geomtricas em camadas ou nveis. Num SIG tal partio no deve existir, pois complica a manuteno dos dados.
2.2.7 Resumo
importante conhecer as diferenas entre SIG e DM, porque corrente cometer o erro especialmente se se conta com recursos largos - de adquirir um sistema SIG quando o que se necessita realmente um DM. O SIG requerer um enorme investimento em equipas, pessoal e treino, e no proporcionar a agilidade de visualizao e anlise que d um DM nem a facilidade de uso duma aplicao vertical.
13
30-09-2002
Deve ficar claro que SIG e DM no competem por um mesmo mercado, porque tm mbitos distintos que se complementam e podem coexistir na mesma organizao. Por outro lado h que distinguir os sistemas CAD; de propsito muito diferente aos SIG e com limitaes insolveis para o seu uso como SIG. CAD e SIG podem coexistir numa organizao, mas normalmente f-lo-o em departamentos diferentes. Por exemplo, um departamento de planeamento usar SIG para determinar a localizao dum novo hospital, enquanto que o departamento de arquitectura usar CAD para desenh-lo. No que diz respeito aos chamados SIG, que se baseiam num sistema CAD e um DBMS, devem ser examinados com cuidado antes de ser adoptados. Possivelmente s so teis para utilizadores com experincia e grandes quantidades de dados em CAD, e s para actividades muito concretas como a engenharia civil.
14
Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica Distribuio: Que padres de distribuio espacial existem?
30-09-2002
Esta pergunta mais complexa. Aparece ao querer determinar, por exemplo, se o cancro uma causa importante de mortalidade entre as pessoas que residem nas proximidades de uma central nuclear. Ou tambm, ao querer conhecer quantas situaes anormais se produzem numa determinada distribuio espacial e onde se localizam. Modelizao: Que sucede se...? Questo que se traz baila ao tentar conhecer o que se passa num sistema quando ocorre um facto determinado. Por exemplo, que ocorre a um sistema rodovirio se construirmos uma nova estrada, ou que sucederia se se produzisse uma determinada planta txica na rede de abastecimento de gua potvel. As respostas requerem, para alm da informao geogrfica, outras informaes adicionais, como por exemplo, determinadas leis cientficas.
15
30-09-2002
3.2 IDRISI 32
O Idrisi produzido pelos Clark Labs da Clark University desde 1989, sendo um dos mais antigos sistemas no mercado. Comea por ser um Desktop Mapper, mas apresenta igualmente muitas das funcionalidades de um SIG propriamente dito, permitindo fazer alguma anlise topolgica de considervel complexidade. O Idrisi apresenta igualmente uma faceta virada para o processamento de imagem, em especial, no tratamento e melhoramento de imagens raster. De resto este sistema privilegia claramente o trabalho com fotografia e camadas raster. Foi tambm pensado para ser um SIG cooperante com novas tecnologias em especial a Percepo Remota. Podemos chamar ao Idrisi um dois em um, pois tanto o podemos usar como um simples Desktop Mapper, ou como um SIG. Como interface o Idrisi bastante fraco, apresentando alguns problemas de usabilidade srios, como o excesso de cones e menus. A maior parte da interaco feita atravs de menus e preenchimento de valores em tabelas, sendo este um modo de interaco muito lento e pouco intuitivo comparado com os mtodos de Apontar e Clicar. De facto esta interface
16
30-09-2002
estar alguns anos atrs das actuais encontradas nos ambientes Microsoft, fazendo lembrar algumas aplicaes do Windows 3 e precedentes. No captulo da interaco de realar o sistema de programao por filtros disponibilizado pelo Idrisi, ao qual dado o nome de Macro Modeler. Esta aplicao permite construir programas de anlise topolgica graficamente. As sadas e entradas so camadas, normalmente raster, os filtros so algoritmos de anlise e classificao topolgica. Em relao aos algoritmos propriamente ditos, estes so relativamente poucos e de reduzido poder analtico, sendo a maioria de classificao binria. Para operaes mais complexas necessrio combinar vrios algoritmos, ou ento dar-lhes maior quantidade de informao. No final pode-se acabar com modelos muito complexos, com os mesmos ficheiros de camadas a serem entradas de muitos filtros, acrescentando ainda ficheiros auxiliares de clculo. O Idrisi completamente aberto ao desenvolvimento. Usando a tecnologia COM de Invocao de Procedimentos Remotos possvel construir aplicaes que interajam com o Idrisi. Segundo a Clark Labs o Idrisi totalmente condescendente com esta tecnologia, sendo assim possvel desenvolver todas as suas actuais faculdades. Falando agora da portabilidade, o Idrisi encontra-se disponvel para quase todas as plataformas Microsoft. Dado ser produzido h mais de dez anos, o Idrisi foi evoluindo ligado s diferentes plataformas da Microsoft que apareceram desde ento. Para alm das verses actuais do sistema operativo Windows, o Idrisi corre tambm nas verses pr sistema operativo desta aplicao, e mesmo em verses antigas do MS-DOS, indo at verso 5.0 e anteriores. J aqui foi dito que o Idrisi no apenas um Desktop Mapper, e que tambm apresenta caractersticas de um SIG real. Mas ento porque no este sistema, um dos grandes SIG do mercado? Porque est o seu preo relativamente longe dos sistemas de grande envergadura?
17
30-09-2002
Figura 3.1 Exemplo de Anlise com Programao por Filtros Como primeira grande desvantagem deste sistema, est a ausncia de paralelismo, o Idrisi no tem qualquer funcionalidade multi-utilizador. Todo o acesso s Bases de Dados e Mapas feito por apenas uma aplicao no havendo qualquer hiptese de edio simultnea. Esta falha preponderante na incapacidade do Idrisi ser o sistema para uma grande equipa SIG. Na mesma linha aparece a ausncia de uma linguagem de desenvolvimento prpria. Apesar de ser 100% condescendente com a tecnologia COM, uma linguagem de desenvolvimento uma das ferramentas indispensveis a um SIG de grande envergadura, para uma grande equipa. O desenvolvimento por Invocao de Procedimentos Remotos tem duas desvantagens. Primeiro necessrio haver algum conhecimento da arquitectura do sistema em causa. Segundo necessrio usar um ambiente diverso para o desenvolvimento, o que sem dvida o complica, em relao programao no ambiente prprio. H ainda que referir que a tecnologia COM, est ela prpria a cair em desuso, havendo outras tecnologias a serem usadas maioritariamente. Por fim h que referir a total ausncia de anlise a Trs Dimenses (3D). Esta pode-se tornar na falha principal. No mercado esta uma rea onde o desenvolvimento dos SIG est mais aceso, havendo j extenses 3D para os principais sistemas. O Idrisi permite visualizar camadas raster de relevo a trs dimenses, mas mais nada para alm disto, o que se revela algo relativamente intil. Esta barreira parece ser bastante difcil de transpor, pois a interface do Idrisi no est de modo algum virada para este tipo de funcionalidades. A dificuldade de apresentar representaes 3D, aliada a uma interface com o utilizador ineficiente provavelmente a maior deficincia do Idrisi. _______________________________________________________________________ Rui Martins, Lus de Sousa 18
30-09-2002
Trata-se da nica extenso disponibilizada pela Clark Labs para o Idrisi. Tem como principal funo a elaborao de mapas electrnicos, no entanto apresentado como sendo igualmente capaz de desenvolver Bases de Dados e de editar a topologia de um mapa. Concentra algumas das funes ncleo de mais baixo nvel de um SIG propriamente dito. Infelizmente esta extenso no est disponvel em verso de demonstrao, pelo que no foi experimentada. No captulo da criao de mapas esta ferramenta parece ser extremamente eficaz. capaz de capturar a informao a partir de vrias fontes, como mesas digitalizadoras, GPS, e introduo de Coordenadas Geogrficas. Atravs de GPS possvel registar a topologia terrestre viajando atravs do terreno em estudo e marcando as coordenadas GPS e a respectiva altura em pontos escolhidos. Tendo um conjunto de pontos, aplicado um algoritmo estatstico e criado um mapa raster da elevao do terreno.
3.2.2 Concluses
O Idrisi pretende ser um SIG de baixo custo, oferecendo bastante funcionalidade a um preo reduzido. O seu preo base de 600 dlares, fora manuais. O Carta Linx custa 400 dlares, mas oferecido um desconto de 50% a utilizadores do Idrisi, no incluindo manuais. Se primeira vista este parece ser um bom negcio, olhando para este produto e para os seus concorrentes do mercado verifica-se que tal no assim. De facto, produtos como o Manifold GIS apresentam caractersticas muito semelhantes por menos de metade do preo. Se for tido em conta o facto de que em termos de interface e interaco com utilizador o Idrisi quase de certeza o pior de todos a escolha dificilmente pode recair sobre o Idrisi. A esta altura da anlise de mercado, para alm de ter ficado patente que o Idrisi no seria uma opo, comeou a ficar igualmente claro que os sistemas de menor envergadura esto demasiado inclinados para a anlise terrestre. Fica tambm um apontamento para o facto de para esse tipo de sistemas ser bastante difcil encontrar verses de demonstrao, a excepo foi mesmo o Idrisi.
19
30-09-2002
3.3 ARCGIS
O ArcGis um sistema de informao geogrfico integrado, composto por trs partes: ArcGis Desktop Software, ArcSDE Gateway e ArcIMS Server. O ArcGis Desktop um termo que remete para um conjunto integrado de poderosas aplicaes SIG. As aplicaes oferecidas pela ESRI so: O ArcView, o ArcEditor e o ArcInfo e as Extenses ArcGis. O ArcSDE Gateway uma interface para gerir bases de dados geogrficas multi-utilizador enquanto que o ArcIMS Server um SIG baseado na internet para permitir que esses dados e servios sejam distribudos.
Figura 3.2 Sistema ArcGis O ArcGis fornece todo um esqueleto que permite implementar um SIG tanto para um simples utilizador como para muitos utilizadores. um sistema escalvel que se pode tornar num sistema SIG de qualquer tamanho, e que pode assentar sobre um nico computador ou sobre uma rede.
20
30-09-2002
A opo para um Desktop SIG pode passar pelo ArcView, ArcEditor ou pelo ArcInfo visto que ambos partilham o mesmo core de aplicaes. ArcMap, ArcCatalog, ArcToolbox. A grande vantagem de os pacotes partilharem o mesmo core de aplicaes que as diferenas entre os pacotes podem ser vistas como incrementos de funcionalidades . Se for escolhido o ArcView e se houver necessidade no futuro de mudar para o ArcInfo ser muito mais fcil pois os pacotes partilham a mesma interface e os mesmos conceitos operacionais. Consequentemente haver um aumento de usabilidade.
3.3.1 Aplicaes do ArcGIS Desktop
O ArcMap a aplicao central de qualquer um dos pacotes do ArcGis Desktop e usado para efectuar todas as principais tarefas como cartografia, anlise e edio de mapas. O ArcCatalog permite organizar e gerir toda a informao num sistema SIG. Inclui ferramentas para pesquisar e encontrar informao geogrfica, gravar e ver meta data, visualizar rapidamente qualquer tipo de dados, etc. O ArcToolbox como o prprio nome indica uma caixa de ferramentas essencialmente para converso e gesto de dados. Existem duas verses desta aplicao. Uma vem com o ArcView/ArcEditor e outra, mais completa, com o ArcInfo.
3.3.2 Extenses do ArcGIS
Antes do aparecimento das extenses um utilizador que pretendesse efectuar uma anlise raster teria que licenciar diferentes tipos de software consoante o pacote SIG que possusse. Se possusse o ArcView licenciava o ArcView Spatial Analyst mas se possusse o ArcInfo licenciava o ArcGrid. O objectivo das extenses foi incorporar as melhores caractersticas de verses anteriores das extenses do ArcView e ArcInfo e torna-las comuns a todos os pacotes. Com as extenses, so reduzidos os custos de aprendizagem, operacionalidade e de aquisio. As extenses existentes so: ArcGis Spatial Analyst, ArcGis 3D Analyst, ArcGis Geostatistical Analyst, ArcGis StreetMap, ArcPress for ArcGis, MrSID Encoder for ArcGis, TIFF/LZW Compression. O ArcGis Spatial Analyst permite obter informao acerca dos dados, identificar
relaes espaciais, encontrar localizaes apropriadas, calcular o custo acumulado de viajar de um ponto at outro.
21
30-09-2002
Figura 3.4 Horizontalidade das Extenses O ArcGis 3D Analyst permite visualizar uma superfcie de vrios pontos de vista, determinar o que visvel de um determinado ponto, etc. O poder do ArcGis Geostatistical Analyst reside na capacidade para criar superfcies contnuas atravs da medio dispersa de pontos. Possui ferramentas para anlise de erro, comparao de modelos, etc. O ArcGis StreetMap um parente do software para a visualizao de ruas. O ArcPress permite obter uma melhoria na cor e impresso de documentos e utilizado no sector da Imprensa. O MrSID Encoder produz imagens MrSID de outras imagens at 500 MB. Por ltimo a extenso TIFF/LZW Compression permite usar compresso TIFF/LZW tecnologia esta que patenteada pela UNISYS. Chegados a este ponto uma das questes relevantes que se levanta : quais so as vantagens dos produtos ArcGis em relao a outros SIG existentes no mercado? Uma das vantagens que a sua escalabilidade comparvel da Microsoft, apesar de os seus produtos serem licenciados separadamente, quer isto dizer que para passar, por exemplo, do ArcView para o ArcInfo s se tem que proceder a um upgrade. A sua usabilidade tambm comparvel aos produtos da Microsoft pois permite que utilizadores pouco treinados adquiram uma rpida aprendizagem. A famlia ArcGis foi construda usando um esqueleto COM (Component Object Model) isto torna possvel o desenvolvimento de aplicaes com os ArcObjects utilizando linguagens como o VB e C++. No entanto a principal razo o baixo custo para Investigao e Ensino. No momento de fazer escolhas dentro da famlia de produtos da ESRI outra questo que se coloca : Porqu o ArcInfo e no o ArcView? Esta questo fica automaticamente respondida se tivermos em conta que a aplicao ArcToolbox traz mais 170 ferramentas, o ArcInfo permite vectorizar imagens raster _______________________________________________________________________ Rui Martins, Lus de Sousa
22
30-09-2002
(vectorizao) e a diferena de preos entre o ArcInfo e o ArcView para instituies dedicadas a Investigao/Ensino muito pouco significativa.
3.4 GRASS
O Grass tambm referenciado por Geographic Resources Analysis Support System igualmente um SIG utilizado para gesto de informao, processamento de imagem, produo de grficos, anlise espacial e visualizao de muitos tipos de dados. um software grtis produzido sob licena da GNU. Foi originalmente escrito pelos laboratrios de pesquisa e engenharia do exrcito dos Estados Unidos como uma ferramenta para gesto de territrio e planeamento ambiental usada pelos militares. O Grass transformou-se num utilitrio poderoso com um vasto alcance em diferentes reas de pesquisa cientfica. O Grass pode ser corrido usando quer uma linha de comandos quer uma interface grfica. Devido a ser um sistema open source a sua interface por comandos mais completa do que a interface grfica. Os novos mdulos que vo surgindo so disponibilizados primeiro na interface por comandos. Actualmente existe uma verso do Grass para correr no Windows NT/2000 mas ainda se encontra em fase experimental. A linguagem de desenvolvimento C. Os sistemas operativos que suportam o Grass so: Linux, Sun Solaris, Solaris x86 etc. O Grass permite anlise espacial e visualizao 2D e 3D tal como qualquer outro SIG e tem bastantes modelos de gerao de dados. Esses modelos assentam sobretudo nas reas de eroso e hidrologia. A principal desvantagem de se usar um sistema de informao
geogrfica como o Grass reside na muito fraca documentao visto ser um sistema em constante evoluo. Outra grande desvantagem o facto de o modo de interface por
comandos ser muito pesado para utilizadores ainda no ambientados com o Grass pois requer um grande treino e memorizao. Apesar de os comandos terem como prefixo uma letra que elucida o utilizador sobre qual a operao que pretende efectuar, no esconde de forma nenhuma a fraca usabilidade.
23
Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica Tabela 3.1 - Prefixos dos comandos existentes no Grass
30-09-2002
3.5 GEOMATICA
O Geomatica no pretende ser de modo algum um Desktop Mapper, este sistema a todos os nveis um SIG completo. Est projectado para grandes instituies onde o SIG ser uma ferramenta de trabalho de grande importncia, consumindo muitos recursos e uma quantidade significativa de tcnicos. No to pouco um nico programa, mas sim um agregado de diferentes aplicaes, cada qual com a sua funcionalidade especfica, dirigida a perfis de utilizadores diferentes. tambm um sistema inclinado para o trabalho com imagens de satlite, normalmente camadas raster, a partir das quais vo sendo criadas outras camadas, vectoriais e raster, e as bases de dados correspondentes. Ao iniciar o trabalho a equipa SIG, no tem s como objectivo criar as bases de dados e camadas especficas para posterior anlise, como tambm deve desenvolver o prprio sistema no sentido de facilitar esse trabalho. Vai ser dada agora uma viso geral dos principais mdulos do Geomatica e as suas funes caractersticas.
3.5.1 FOCUS
a janela principal, o nosso primeiro olhar para dentro do Geomatica. Aqui vemos os nossos mapas e camadas, e fazemos a maioria das operaes mais simples atravs de facilidades de apontar e clicar. Como interface, e principal janela para o sistema, est bem concebida, a esta altura o utilizador ainda no se apercebe do monstro que reside detrs desta janela. A janela dividese em trs partes, a zona de botes e menus (barras superiores), rvore de ficheiros e mapas (lateral esquerda), zona de visualizao de mapas (todo o resto, ocupa a maior parte da
24
30-09-2002
janela). Os menus so poucos mas os suficientes, os botes esto bem agrupados, as suas representaes so aceitveis e quando no esto disponveis aparecem desfocados.
Figura 3.5 Janela do FOCUS A sua principal funo visualizar os mapas e as suas respectivas camadas. Mas este visualizar bastante profundo, podem ser vistos um nmero indefinido de camadas sobrepostas, mapas de 8, 16 e 32 bits, de qualquer tamanho ou resoluo; estando todas as camadas adequadamente geo-referenciadas. Mas uma vez de realar que apesar de estarem muitos mapas carregados no Focus, no se chega a sentir confuso em lidar com todos eles, dado a ser relativamente navegar entre eles, na rvore de mapas, com a ajuda do rato. Outra funo importante o processamento e melhoramento grfico das imagens disponveis, normalmente fotografias de satlite. Est ao dispor do utilizador uma biblioteca de algoritmos de processamento de imagem, incluindo : ?? Algoritmos de filtragem de imagem; ?? Utilitrios de Interpolao; ?? Algoritmos de Classificao; ?? Anlise Espacial; ?? Anlise de Modelos Digitais de Elevao (DEM). Mas o Focus no se fica por aqui, permite fazer inspeco de dados atravs de histogramas, ou de gerao de perfis. Pode-se, por exemplo, calcular distncias ou permetros apenas com alguns cliques do rato; ou editar as tabelas de atributos directamente. Existem ainda algoritmos especficos para a depurao da classificao de imagens; algoritmos que _______________________________________________________________________ Rui Martins, Lus de Sousa
25
30-09-2002
produzem mapas cartogrficos bastante avanados, com referencias de latitude e longitude muito apuradas, et coetra, et coetra.
3.5.2 OrthoEngine
a ferramenta que vai permitir criar mapas e extrair informao a duas e trs dimenses das fontes mais comuns de informao de um SIG, as imagens de Fotogrametria. As imagens fontes para um SIG so as fotografias tiradas em voo, dos satlites temos fotografias, assim como as imagens de radar e imagens digitais do terreno. O Orthoengine vai permitir, a partir destas fontes criar modelos digitais do terreno, modelos de elevao (DEM), assim como modelos a trs dimenses. Tudo isto de forma automtica, recorrendo a algoritmos de extraco de informao avanada. Este pacote vem ainda munido de um conjunto de funcionalidades, que, para alm de permitirem fazer este trabalho, tambm o facilitam poupando tempo e esforo.
3.5.3 PCI Modeler
Mais uma vez estamos perante um ambiente de programao grfica por filtros. A sua principal funo a mesma que o Macro Modeler do Idrisi, mas medida que explorado, torna-se claro que o seu mbito muito maior.
Figura 3.6 PCI Modeler O PCI Modeler comea pois por ser um ambiente que permite fazer anlise topolgica a partir de uma ou mais camadas, a partir das quais se pode gerar outras camadas, com o sistema de filtro j explicado, os mapas ou camadas so sadas ou entradas de filtros que so algoritmos de anlise. A primeira diferena que surge em relao ao Macro Modeler o facto de este aparecer como uma aplicao completamente independente, com uma janela prpria e menus prprios, este e outros factores vo dar uma maior usabilidade ao PCI Modeler. _______________________________________________________________________ Rui Martins, Lus de Sousa
26
30-09-2002
Graficamente o PCI Modeler bastante avanado, no s se pode montar um esquema de anlise com o rato, como as caixas que representam os filtros so de algum modo transparentes (os filtros do Macro Modeler so graficamente compactos), dando a possibilidade de definir alguns parmetros com apenas alguns cliques. Mas, conforme se vai aprendendo a trabalhar com o PCI Modeler, vai-se igualmente percebendo a dimenso das suas possibilidades. Em primeiro lugar est disposio uma biblioteca com mais de trezentos algoritmos, e s este factor marca a diferena, para alm de que nem todos eles se dedicam anlise topolgica. Existem algoritmos que importam ficheiros em formatos externos ao Geomatica, que os voltam a importar para outros formatos, algoritmos que ajudam e permitem fazer alguma classificao. claro que o factor mais importante a existncia de um nmero gigantesco de algoritmos disponveis. A nica forma de aproveitar todo este poder de anlise e processamento ter vrias pessoas a usar este mdulo do Geomatica.
3.5.4 FLY!
Este o mdulo que permite levar a cabo a anlise a trs dimenses. Tendo por base ficheiros DEM, ou mesmo vectores, o FLY! capaz de criar um modelo a trs dimenses do terreno em causa, do qual se podem visualizar diferentes perspectivas, quase em tempo real. A principal caracterstica que se deve salientar em relao a esta ferramenta de anlise 3D a simulao de voo. O FLY! d a possibilidade de explorar o modelo a trs dimenses do terreno, simulando que o utilizador voa por cima do mesmo. Com o auxlio do rato o utilizador controla a direco e velocidade de voo, escolhendo trajectrias e pontos de observao. Mas ainda possvel simular condies atmosfricas, ou por exemplo simular o efeito do nevoeiro na visibilidade do voo. Resta ainda referir que tudo isto feito recorrendo s mais recentes tcnicas de rendering.
3.5.5 EASI
Este o mdulo de desenvolvimento do Geomatica, que tal como todos os outros apresenta caractersticas que o levam para alm do desenvolvimento. Ao programador apresentada uma linguagem de programao baseada na sintaxe do C, o que de facto facilita o desenvolvimento. Para alm de esta linguagem poder ser usada para expandir o Geomatica e as suas funcionalidades, tambm uma excelente linguagem de scripting, dando a possibilidade de criar automatismos de trabalho de grande utilidade. _______________________________________________________________________ Rui Martins, Lus de Sousa
27
30-09-2002
O EASI comea por ser um ambiente baseado numa linha de comandos que permite efectuar toda a interaco utilizador/sistema independentemente do sistema operativo envolvente. Serve de ponte entre os diferentes sistemas base (ex: Sun / Microsoft), eliminado diferenas de editores dos sistemas operativos e formatos de prprios entre outros. Daqui, como j referido, parte-se para a possibilidade de criar scripts, e para o desenvolvimento do ambiente propriamente dito. Assim descritos os principais mdulos do Geomatica, onde muito ficou por dizer, devem ser referidas algumas das principais extenses que podero fazer parte do pacote a adquirir, consoante as reas de interesse. EASI/PACE - Oferece funcionalidades avanadas no tratamento de imagens de satlite, quer de origem ptica, ou de radar. Incluindo: SPANS ou PAMAP - Permitem ir ainda mais alm na anlise geogrfica terrestre, em particular para bacias hidrogrficas e na rea da geologia. ACE - Extenso das funcionalidades de cartografia. O Geomatica j na sua base bastante poderoso neste captulo, com o ACE pode-se chegar ainda mas longe. Anlise Hyperspectral - possvel, usando uma extenso PACE, efectuar anlise terrestre baseada em espectros e ngulos espectrais. Esta extenso vem adicionar possibilidades de classificao diferentes das convencionais, podendo capturar informao que nos modos mais comuns (Anlise de radar e ptica), no ser possvel.
3.4.6 Concluses
Esta foi sem dvida a soluo de maiores dimenses que foi possvel estudar. Os trinta dias de avaliao foram evidentemente escassos para conhecer por completo todo o ambiente do Geomatica. Em primeiro lugar fica claro que a dimenso do Geomatica no se enquadra com aquilo que procuramos. De facto, para ter um sistema deste tipo a funcionar convenientemente so necessrios muitos tcnicos e operadores, sendo no s til ter vrios familiarizados com todo o sistema, como ter vrios especialistas para cada um dos mdulos de trabalho. Este dos factores que vai levar a que a escolha no recaia sobre o Geomatica. Finalmente, e mais relevante, sero os preos destes produtos. S o Geomatica Prime custa 7200 , custando cada uma das sua extenses 3200 . O preo das extenses para
28
30-09-2002
OrthoEngine varia entre os 3200 e os 4300 . O Sistema na sua totalidade com todas as extenses ora em mais de 40000 .
Mostrou-se bastante difcil encontrar dados slidos acerca da estrutura do Mercado SIG, mais ainda, reportando-se a anos mais afastados. Estes foram os dados mais antigos encontrados, retirados do International SIG Sourcebook de 1994. Baseiam-se no nmero de licenas emitidas e ainda activas, por cada fabricante. de notar que h altura existiam j algumas centenas de empresas em estado embrionrio, ou com expresso marginal no mercado, que aqui no aparecem quantificadas[6]. Tabela 3.2 - Nmero de Licenas Activas em 1994
Fabricante ESRI Intergraph Spans ERDAS Graphics Design System GenaMap Topologic Total Nmero 800000 100000 2500 2000 1200 350 30 906080 Quota 0,88 0,11 0,003 0,002 0,001 > 0,001 > 0,001
29
30-09-2002
Figura 3.7 Grfico da Estrutura de Mercado em 1994 O nmero de licenas activas pode no ser o melhor indicador da estrutura de Mercado, pois uma licena de ArcView no tm o mesmo preo que uma de Spans. Os valores de facturao monetria so indicadores mais correctos mas no foram encontrados para anos anteriores a 1994. H ainda a acrescentar que neste estava em actividade a empresa que fornecia o System 9, um SIG bastante difundido na poca, mas para qual no existia registo do nmero de licenas activas. Outro aspecto importante facto de a SmallWorld, apesar de estar j em actividade, no ter sido ainda sido adquirida pela General Electrics. Pode-se referir ainda que estava por esta altura eminente a compra da ERDAS pela ESRI, passando a haver um cooperao tecnolgica entre as duas empresas, embora continuando no mercado com os dois nomes. O Mercado assim caracterizado mostra claramente uma situao de Monoplio[17,18] por parte da ESRI, ressalvando novamente o facto de o nmero de licenas no ser o melhor indicador da sua estrutura. A ESRI declara ter, num dia normal, por volta de um milho de utilizadores dos seus produtos SIG. claro que o tipo de produtos influncia estes nmeros, a esta altura empresa como a ESRI ou a Intergraph, operavam sobretudo no mercado dos sistema Desktop, enquanto que outras como a Spans (empresa que veio a evoluir o Geomatica), operavam mais no mercado dos SIG de grande dimenso. Estes dados do incio da dcada de 1990 (poca ainda de alguma embrionagem no mercado SIG), so pouco conclusivos, mas para anos mais recentes foram encontrados dados mais slidos, baseados nas receitas anuais das empresas no Mercado. _______________________________________________________________________ Rui Martins, Lus de Sousa
30
30-09-2002
Os dados referentes a 1999 e 2000, foram publicados pela DaraTech, um organismo independente de anlise de alguns mercados de software[7]. As quotas de mercado aqui apresentadas referem-se s receitas de cada empresa no ano de 1999, que na globalidade do mercado perfizeram um valor de 845 milhes de dlares.
Figura 3.8 Grfico da Estrutura de Mercado em 1999 Passa-se agora a uma anlise mais cuidada, recorrendo ao clculo dos ndices de Mercado. ndice de Herfindahl [17,18] : H = 0.352 + 0.282 + 0.062 + 0.052 + 0.042 + 2x (0.032) 3x(0.022) = = 0,1225 + 0,0784 + 0,0036 + 0,0025 + 0,0016 + 0,0018 + 0,0012 = = 0,2116 ndices de Concentrao C1 = 0.35 C2 = 0.35 + 0.28 C3 = 0.35 + 0.28 + 0.06 C4 = 0.35 + 0.28 + 0.06 + 0.05 = 0.35 = 0.63 = 0.69 = 0.74 31
30-09-2002
Por estes ndices se constata, que o mercado era em 1999 um Oligoplio [17,18]. O ndice de Herfindahl encontra-se ligeiramente acima de 0,2 mas mesmo assim acima. Pelos ndices de concentrao observa-se que as duas maiores empresas detm 63% do mercado, e as quatro maiores, quase trs quartos do mesmo. A liderana do mercado parece bastante slida, pela parte da ESRI e da Intergraph, mas no se aproxima em nada do Monoplio verificado pelo dados relativos a 1994. Tambm de sublinhar o aparecimento de bastantes empresas com quotas de mercado entre 2 e 10 por cento. Podem-se ento desenhar dois cenrios, as empresas de topo lideram o mercado generalista, apresentando solues flexveis e escalveis; por outro lado existe um grande conjunto de empresas que se movimentam num mercado de Concorrncia Monopolista, onde encontram pequenos nichos de mercado, que abarcam apresentando solues especficas. Estima-se mais uma vez que as empresas com quotas de mercado inferior a 2% sejam vrias centenas.
3.6.3 Estrutura do Mercado em 2000
As receitas totais do Mercado subiram neste ano para 939 milhes de dlares. No entanto d-se uma viragem na sua estrutura, uma vez que a Intergraph perde quase metade da sua quota.
Figura 3.9 Grfico da Estrutura de Mercado em 2000 _______________________________________________________________________ Rui Martins, Lus de Sousa
32
Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica Mais uma vez calculam-se os ndices de Mercado [17,18]. ndice de Herfindahl H = 0.362 + 0.162 + 0.072 + 3x(0.062)+ 2x(0.032) + 3x(0.022) = = 0,1296 + 0,0256 + 0,0049 + 0,0108 + 0,0018 + 0,0012 = = 0,1739 ndices de Concentrao C1 = 0.36 C2 = 0.36 + 0.16 C3 = 0.36 + 0.16 + 0.07 C4 = 0.36 + 0.16 + 0.07 + 0.06 = 0.36 = 0.52 = 0.59 = 0.65
30-09-2002
Verifica-se ento uma mudana curiosa de 1999 para 2000, o mercado passa repentinamente de um Oligoplio, para um Mercado de Concorrncia Monopolista [17,18]. Aparentemente no se pe o caso de um Mercado de Concorrncia Perfeita, pois as receitas cresceram 94 milhes de dlares, mais de 10%, e no houve um aumento visvel do nmero de empresas a operar no mercado. Apesar de toda esta movimentao a ESRI conseguiu solidificar ainda mais a sua posio no mercado. Passou para os 36% de quota, mas este aumento traduziu-se em 34 milhes de dlares de ganho em relao ao ano anterior. De 304 milhes de dlares de receitas em 1999, passou para 338 milhes em 2000. A Intergraph parece estar a sofrer os efeitos da entrada de dois grandes gigantes do sector Electrotcnico no mercado, a General Electric, que anos antes tinha adquirido a SmallWorld e a Simens, com uma entrada de gigante nos sistemas SIG ligados distribuio elctrica. Esta ascendncia pode indicar que a situao de Mercado de Concorrncia seja apenas uma situao de transio, enquanto cai um dos gigantes e se espera que algum ocupe o seu lugar.
3.5.4 Outros dados referentes ao Mercado
J em 2001 foi publicado pela Geospatial Information and Technology Association (GITA) um estudo intitulado The Geospatial Technology Report 2001., que trouxe informaes interessantes acerca do mercado dos SIG. Este estudo teve em conta as respostas dadas a questionrios por parte de 147 empresas[8-9]. _______________________________________________________________________ Rui Martins, Lus de Sousa
33
30-09-2002
O estudo d conta que a liderana de mercado varia de sector para sector, o que refora de algum modo a estrutura de Concorrncia Monopolista. Concretamente, no mercado do Gs, lidera a General Electrics, no mercado das Telecomunicaes a Intergraph, nos mercados da Electricidade, das Condutas e Hidrogrfico lidera a ESRI. No entanto a fatia de mercado fora destes segmentos, representa a fatia de leo, para o qual no h informao. O estudo apresenta tambm informao acerca dos sistemas operativos usados como suporte aos SIG. O Microsoft Windows lidera largamente com 77% do mercado, a seguir esto os sistemas hbridos Windows/UNIX com 16%, e os puramente UNIX com apenas 4%. O estudo conjectura ainda que com a introduo dos novos sistemas Windows XP e Windows.NET, desapaream do mercado os sistemas UNIX.
3.6.5 Concluses
O Mercado dos SIG constitudo por um pequeno grupo de empresas com bastante implantao no mercado e um sem nmero de pequenas empresas que lutam entre si pelos nichos de mercado onde no chegam os gigantes. Neste grupo maior frequente aparecerem e desaparecerem pequenas empresas que nunca chegam a adquirir quotas de mercado significantes. Surge ento aqui um primeira indicao, ao seleccionar um SIG que se pretenda usar durante um perodo de tempo relativamente grande, corre-se o risco de o seu fabricante sair do mercado entretanto. Ao optar-se por um SIG completo, que dever estar em constante evoluo, pode ser uma m deciso a parceria com uma empresa mais pequena. A situao do ano de 2000 muito certamente transitria, sendo de esperar a adaptao da estrutura do Mercado novamente a uma situao de Oligoplio. A ESRI lidera claramente o Mercado, mas deixa livre essa liderana em alguns sectores importantes, permitindo assim uma concorrncia algo saudvel. data da realizao deste texto no existiam ainda dados concretos acerca do ano de 2001, no entanto de referir que os primeiros nmeros apontavam j para um novo crescimento global do Mercado SIG na ordem dos 10%, ultrapassando claramente 1 bilio de dlares de receitas.[9]
34
Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica Tabela 3.2 - Factores de Escolha
30-09-2002
Factor de Escolha
Importao de dados do exterior Vectorizao Usabilidade Linguagem Prpria Nmero de operadores Assistncia Documentao Preo
IDRISI32
ARCINFO
GEOMATICA PRIME
GRASS
Bom Fraca Fraca No tem Reduzido Apenas nos EUA Boa Razovel
Muito Bom Muito Boa Boa Tem, sintaxe comum - C Muito Alto
Inexistente Muito Fraca Muito Fraca No tem, open source- C/Java Muito Reduzido
Representado em Representado no No Portugal Reino Unido Representado Muito Boa Boa, dispersa Fraca Bom Mau, > 25000 E Grtis
Os sistemas que sobressaem primeira vista so o Geomatica e o ArcInfo, aparecendo como os nicos com dimenso suficiente para trabalho em vista. Os factores que determinaram a escolham entre estes dois foram o preo, sobremaneira, o nmero de operadores e tcnicos necessrios ao seu correcto funcionamento, a documentao e a assistncia. O Geomatica apesar de ser um sistema mais completo em algumas reas, como o processamento de imagem e a vectorizao, revelou-se um sistema muito pesado para as necessidades. O ArcInfo para actividades de Investigao e Ensino revela-se um sistema de custos muito inferiores. Em termos de nmero de pessoas envolvidas o Geomatica um sistema muito mais exigente, requerendo, como referido anteriormente grande nmero de tcnicos. Pelo contrrio o ArcInfo revela-se neste aspecto bastante flexvel, podendo ser explorado quer por um nmero muito reduzido de tcnicos (talvez mesmo s um), quer por um nmero grande de tcnicos ligados a uma Base de Dados centralizada, onde se ligam vrias estaes de trabalho. A juntar a todos estes elementos est a existncia da extenso ao ArcInfo, para interpolao de superfcies, o Geostatistical Analyst, que como se ver mais ser crucial para es trabalho. Apesar de existirem outras aplicaes de interpolao no mercado, o
Geostatistical Analyst neste momento o estado da arte no que diz respeito a aplicaes informticas de Geoestatstica [10]. Com estes elementos a escolha recaiu sobre o ArcInfo, que foi posteriormente adquirido com as extenses ArcGis Spatial Analyst, ArcGis 3D Analyst e ArcGis Geostatistical Analyst. _______________________________________________________________________ Rui Martins, Lus de Sousa 35
30-09-2002
4.1 Introduo
Tendo um conjunto de amostras de elevao (ou de profundidade neste caso), e querendo gerar uma superfcie contnua, ha que definir um mtodo de preencher os espaos vazios onde no foi recolhida informao. Partindo dos pontos conhecidos necessrio atribuir valores aos pontos para os quais desconhecido o seu valor. Tal conseguido atravs de tcnicas de interpolao. No entanto esta interpolao deve ser o mais precisa possvel, de modo a ser gerada uma superfcie o mais prxima possvel da realidade, e de modo a ser usada correctamente noutros formas de anlise e modelao GIS, tal como na sua modelao a trs dimenses ( 3D ). Existem dois tipos de mtodos de interpolao usados na gerao de superfcies, os mtodos de interpolao Determinstica e os mtodos de interpolao Geoestatstica. As tcnicas Determinsticas calculam superfcies baseadas na extenso de semelhana entre os pontos, ou no grau de suavidade pretendido, atravs de funes matemticas. As tcnicas Geoestatsticas geram superfcies baseando-se em estatsticas e modelos de previso de superfcies que incluem erros e incerteza na previso[12].
36
30-09-2002
considerar, incluem-se todos os pontos da amostra no clculo, ou apenas alguns? E nesse caso quantos pontos incluir? E devem ser todos os pontos considerados com igual influncia no clculo do valor do ponto em causa? possvel que um ponto demasiado afastado esteja numa zona completamente diferente da zona em causa. Dadas estas questes existem dois grandes grupos de mtodos Determinsticos, os Globais, que calculam a predio num dado ponto usando informao de todos os pontos conhecidos, e os Locais, que calculam a predio baseada numa dada vizinhana. Apresenta-se agora uma breve descrio de alguns dos mtodos Determinsticos.
4.2.1 Inverso da Potncia das Distncias (Inverse Distance Weighting IDW)
Esta soluo selecciona um certo nmero de pontos conhecidos em redor do ponto a estimar. Como indica o prprio nome, neste mtodo atribudo um peso a cada amostra considerada no clculo, em funo da sua distncia ao ponto a calcular. Quanto mais afastada a amostra estiver menor ser o seu peso, e vice-versa. O IDW assume que cada ponto exerce um influncia local que diminui com a distncia, desta forma este mtodo segue a assuno de que os valores medidos mais prximos uns dos outros tendem a ser mais semelhantes do que aqueles medidos a distncias maiores[11]. A frmula usada a que se segue:
(4.1) Onde Z(x0)* o valor que se est a calcular para a posio x0 , N o nmero de pontos conhecidos e considerados na vizinhana de , ? i so os pesos associados a cada ponto conhecido, e Z(xi) o valor observado no ponto conhecido si. A frmula que determina cada um dos pesos a seguinte:
(4.2)
37
30-09-2002
O valor di0 representa a distncia entre o ponto a calcular, X0, e os pontos de valor conhecido, si, com o aumento da distncia o peso reduzido por um factor p. Este factor indica a forma como varia o peso dos pontos com a distncia, quanto maior for o valor da potncia mais rapidamente decresce o peso dos pontos mais afastados. Neste mtodo, a soma dos pesos de todos os pontos considerados ajustada de modo a ser sempre 1. O nmero de pontos considerados na estimao deve ser suficiente para se obter um valor preciso, mas ao mesmo tempo prtico para a interpolao. Este nmero de pontos pode variar conforme a distribuio e nmero de amostras, e com a prpria configurao da superfcie. Se as amostras esto distribudas equitativamente e no houver mudanas drsticas das caractersticas da superfcie pode-se obter uma superfcie de preciso razovel. Antes de usar as frmulas e necessrio escolher qual o tipo de vizinhana a usar nos clculos. No caso de no serem conhecidas influncias direccionais nos dados recolhidos, o melhor ser considerar pontos de igual modo em todas as direces, sendo assim a vizinhana a usar ser um crculo. Mas se forem conhecidas influncias direccionais, como por exemplo o vento, j ser mais correcto usar outra forma de vizinhana. Usando o exemplo da influncia do vento, sendo a direco deste conhecida, a vizinhana ideal passaria a ser uma elipse com o eixo maior paralelo a esta direco. de esperar que amostras alinhadas com a direco do vento sejam mais semelhantes do que as alinhadas prependicularmente a este[11].
Figura 4.1 Vizinhana elptica Um superfcie gerada usando IDW influenciada pela escolha do factor p e pela forma da vizinhana escolhida. O IDW um interpolador exacto, onde os valores mximos e mnimos da superfcie so sempre valores da amostra.
38
30-09-2002
Este mtodo especialmente til quando existe uma variao tendencial nos dados recolhidos. Se por exemplo as amostras forem recolhidas numa encosta, tero valores mais baixos no sop da encosta e maiores no seu cume. Estas tendncias globais podem no ser detectadas em modelos Locais[11]. Numa Interpolao Polinomial Global, como o prprio nome indica, procurada um funo polinomial que melhor se enquadre no conjunto global de amostras. Para uma encosta com uma inclinao relativamente constante, ser usada um polinomial de primeira ordem, caso se esteja a modelar um vale, ser usada uma polinomial de segunda ordem positiva. Ou seja para modelar um superfcie com uma inflexo necessria uma polinomial de segunda ordem, duas inflexes, terceira ordem e assim por diante.
Figura 4.3 Superfcies geradas por polinomiais globais Este tipo de interpoladores no exacto, a superfcie gerada no coincide com todos os pontos recolhidos (pode at no coincidir com qualquer um). Embora estes mtodos obtenham resultados globais satisfatrios, ignoram pequenas alteraes como pequenas colinas ou pequenas depresses, caractersticas a que se d o nome de Variao Local[11]. De modo a evitar estas variaes recorre-se por vezes a polinomiais mais complexas, mas na maioria dos casos a complexidade crescente da polinomial tende a produzir resultados que no tm correspondncia nos fenmenos fsicos reais.
39
30-09-2002
Imagine-se que foram colhidas amostras numa rea constituda por uma encosta que termina planalto, do qual parte um nova encosta. Uma predio Global seria aqui desastrosa. Mas se em vez de uma polinomial forem usadas vrias mais pequenas, obtm-se uma superfcie constituda por vrios planos adjacentes que modelaro mais aceitavelmente a zona de estudo. A interpolao Polinomial Global usa ento, no uma, mas vrias polinomiais, cada uma calcula numa dada vizinhana. Tal como visto na interpolao IDW, a configurao desta vizinhana pode ser ajustada, de acordo com a informao disponvel sobre a zona de estudo. Mais ainda, pode-se tambm, definindo um parmetro de potncia p, influenciar o peso de cada ponto da vizinhana no clculo da polinomial local, em funo da sua distncia ao centro da vizinhana[11]. Para cada ponto da superfcie a gerar so escolhidos quais os pontos vizinhos a considerar, mediante a configurao da vizinhana definida. De seguida so atribudos os pesos a estes pontos e calculada a polinomial de ordem definida. O valor da polinomial no centro da vizinhana o valor atribudo ao ponto da predio.
Figura 4.4 - Superfcie gerada por polinomiais locais Neste exemplo, na primeira seco do terreno, calculado o valor do ponto azul usando uma vizinhana que compreende os pontos vermelhos, que geraram polinomial de 1 ordem a vermelho. Numa localizao seguinte, o ponto amarelo, calcula uma nova polinomial, deste feita, embora a vizinhana compreenda os mesmo pontos, a polinomial produzida ligeiramente diferente, dado haver uma pequena mudana na distribuio dos pesos. A interpolao segue assim por diante, at chegar o um novo ponto, de cor laranja, onde a vizinhana passa a compreender outro conjunto de pontos, de cor verde, e onde gerada mais uma polinomial, tambm a verde. As superfcies geradas por interpolao Polinomial Local conseguem modelar variaes dos dados a curtas distncias, algo que no possvel com uma Polinomial Global. Apesar de
40
30-09-2002
tudo, este interpolador continua a no ser exacto, existindo amostras pelas quais as superfcies geradas no passam.
4.2.4 Funes de Base Radial (Radial Basis Functions -RBF)
Este mtodo permite criar superfcies que incluem as tendncias globais e as variaes locais. A ideia base torcer e esticar a superfcie de modo a que esta passe por todos os pontos da amostra. Existem vrias maneiras de encontrar a forma desta superfcie. Por exemplo, forar a superfcie a formar curvas suaves (thin-plate spline), ou controlar a forma como so puxadas as pontas da superfcie. Este mtodo pode ser exemplificado como ajustar uma membrana de borracha de forma a passar por todos os pontos da amostra[11].
Figura 4.5 Superfcie gerada por RBF Tal como o mtodo IDW, o mtodo RBF exacto, ao contrrio dos mtodos Polinomiais. Comparativamente ao IDW, a grande novidade que traz o RBF o facto de as amostras deixarem de ser os pontos mximos e mnimos da superfcie gerada. A superfcie gerada apresenta maior suavidade, e modela melhor certos fenmenos fsicos como a elevao do terreno.
Figura 4.6 RBF versus IDW Uma funo RBF uma funo que muda consoante a distncia, quanto maior a distncia, maior o seu valor. Na figura que se segue existem trs amostras (nos pontos de
41
30-09-2002
coordenadas (4,6), (6,5) e (6,6)), para os quais esto representadas as respectivas RBF, cones neste caso, que representam simplesmente a distncia ao ponto da amostra.
Figura 4.7 Exemplo RBF com 3 amostras Na parte de baixo da figura temos uma seco do espao no plano y=5, onde esto representadas as projeces das trs RBF. Imagine-se agora que se est a interpolar o valor do ponto (7,5), os valores de cada RBF so neste ponto representados por ? 1, ? 2, e? 3. O valor do ponto (7,5) ser a mdia ponderada dos valores de cada uma das RBF nesta localizao, w1 ? 1 + w2 ? 2 + w3 ? 3. Para completar os clculos falta apenas conhecer os valore dos diferentes pesos w1, w2, w3, para tal usa-se o conhecimento de que nos pontos de amostragem a predio exacta. Tendo N pontos conhecidos e N pesos desconhecidos, construdo um sistema de N equaes a N incgnitas, que pode ser resolvido calculando os valores correctos de cada peso w. Existem vrias realizaes possveis do mtodo RBF, variando a forma das funes usadas nas amostras. O exemplo aqui apresentado usa RBF multiquadrticas, calculadas
42
30-09-2002
simplesmente em funo da distncia, outras funes podem ser usada como as RBF multiquadrticas inversas, ou funes de spline[11].
4.3.5 Concluses
Estes mtodos, chamados determinsticos, baseados em funes puramente matemticas, ignoram todo um conjunto de factores que esto na origem dos fenmenos fsicos. O seu objectivo simplesmente obter uma interpolao espacial dos valores observados. Este um dos problemas que os mtodos geoestatsticos se propem solucionar, recorrendo a uma metodologia baseada em probabilidades[13]. Apesar desta caracterstica mtodos como o RBF e o Polinomial Local podem obter resultados interessantes em zonas de grande densidade de amostragem[11], no ficando muito atrs dos mtodos geoestatsticos, e apresentando um soluo mais simples, e menos pesada computacionalmente.
4.2 Geoestatstica
4.2.1 Introduo
Em geral, coisas que esto mais prximas tendem a ser mais semelhantes que coisas que esto mais afastadas. Este um princpio fundamental da Geografia. Tobler, 1970 Na natureza existem vrios fenmenos distribudos no espao, que devido sua complexidade apresentam um elevado grau de incerteza. O conhecimento existente em relao a estes fenmenos , em geral, bastante reduzido e resume-se a um conjunto de observaes[13]. Como exemplos, refere-se o nmero de rvores por hectare numa floresta, o nvel de poluente num aqufero, a medio da temperatura numa dada regio, ou como no caso em estudo, a profundidade do mar. A Geoestatstica surgiu nos anos 60, como uma metodologia para quantificar a incerteza espacial de variveis que caracterizam os fenmenos naturais no espao[13]. Foi inicialmente aplicada na industria mineira para a avaliao de jazigos naturais[14]. A Geoestatstica permite no s considerar a distncia entre as amostras e o seu peso na estimao, como tambm a disposio global das mesmas[11]. Os mtodos geoestatsticos incluem autocorrelao (relaes estatsticas entre as amostras), e podem dar medidas de certeza ou exactido da estimaes geradas[11]. _______________________________________________________________________ Rui Martins, Lus de Sousa
43
30-09-2002
Quando se pretende adquirir conhecimento acerca de um fenmeno fsico contnuo (como a profundidade, a elevao, a composio dos solos, ou do ar), no possvel, na grande maioria dos casos, medir valores para todos os pontos da rea da estudo (o nmero de pontos numa rea de estudo relativamente grande pode ser considerado infinito numervel). As medies so feitas num conjunto finito de N pontos, para os quais conhecida a sua localizao espacial. Estas variveis, que incorporam localizao espacial no so completamente aleatrias, pois apresentam um comportamento estruturado que reflecte a semelhana de valores medidos em posies prximas no espao [15]. A este tipo de variveis aleatrias, Matheron deu a designao de Variveis Regionalizadas (VR) que, para alm do aspecto aleatrio da variao imprevisvel dos valores entre os pontos e o espao, compreendem um aspecto estruturado que reflecte as ligaes (correlaes) entre os pontos do espao onde o fenmeno ocorre [16]. A partir de um conjunto restrito de valores que representam a realizao de uma ou mais VR e do conhecimento qualitativo adquirido sobre um fenmeno espacial em estudo (experincia pessoal, conselho de especialistas, etc), pode ser desenvolvido um modelo que descreve a aleatoriedade espacial do fenmeno e permite quantificar a sua incerteza espacial. Neste sentido, a Geoestatstica associa a aleatoriedade com a VR atravs de um modelo estocstico, considerando que a VR uma de vrias realizaes possveis de uma funo aleatria [15].
4.2.2 Modelo Geoestatstico
Como foi visto anteriormente, a abordagem determinstica associa a qualquer ponto do espao no amostrado uma nica estimativa sem fornecer uma medida de estimao; a abordagem probabilstica, por seu turno, associa estimao uma probabilidade de ocorrncia [14]. Enquanto os modelos deterministas geralmente assentam no conhecimento fsico do fenmeno, a informao utilizada nos modelos probabilistas proveniente, na maior parte dos casos, de dados experimentais [14]. Nos modelos geoestatsticos, os dados amostrais so interpretados como provenientes de um processo aleatrio. O facto de estes modelos incorporarem a incerteza na sua concepo no significa que o fenmeno em si tenha resultado de um processo aleatrio, mas serve somente de base metodolgica inferncia espacial ou estimao de grandezas em reas no amostradas e quantificao da incerteza associada ao estimador[13]. A geoestatstica baseada em processos aleatrios com dependncia. Num contexto espacial ou temporal, tal dependncia designada auto-correlao. Com apenas um conjunto _______________________________________________________________________ Rui Martins, Lus de Sousa
44
30-09-2002
de valores medidos, no existe esperana de se conhecerem as regras de dependncia. Contudo, atravs de observaes contnuas de vrias amostras, as dependncias tornam-se aparentes. Um valor localizado espacialmente em x1 (denominao genrica de um conjunto de coordenadas geogrficas) interpretado como uma realizao z(x1) da varivel aleatria Z(x1). No espao A, no qual se dispersa o conjunto de amostras, temos as realizaes das N variveis aleatrias Z(x1), Z(x2), ..., Z(xn), correlacionadas entre si.
4.2.2.1 Funo Aleatria Estacionria
O conjunto de variveis aleatrias Z(xi), i=1, ..., N, correlacionadas entre si, constituem uma funo aleatria, da qual s se conhece uma realizao Z(xi) o conjunto dos dados experimentais. A soluo proposta no formalismo geoestatstico consiste em assumirem-se diversos graus de estacionariedade da funo aleatria, de modo a que a inferncia de alguns parmetros estatsticos seja possvel. Assim, se for admitido que todas as variveis aleatrias tm a mesma mdia, E{Z(x1)} = E{Z(x2)} = ... = E{Z(xi)} = E{Z(x)} = m, (4.3)
este parmetro, que passa a ser independente da localizao de xi, pode ser estimado custa de uma mdia aritmtica dos valores das realizaes das variveis aleatrias:
(4.4) Esta hiptese de estacionariedade da mdia parte integrante e fundamental do modelo probabilista geoestatstico e no pode nunca ser validada ou refutada na prtica, uma vez que, na realidade, s existe uma realizao da funo aleatria. Julgar esta hiptese de estacionariedade como apropriada julgar a mdia das amostras como representativa da rea A, ou que os valores das amostras so suficiente homogneos para validar aquela representatividade[13].
4.2.2.2 Estacionariedade do Semivariograma e da Covarincia espacial
A ideia da estacionariedade usada para se obter a replicao necessria[11]. Existem dois tipos de estacionariedade. O primeiro, como j foi visto, designado por estacionariedade da mdia, isto , a mdia constante entre amostras e independente da _______________________________________________________________________ Rui Martins, Lus de Sousa
45
30-09-2002
localizao. O segundo tipo de estacionariedade designado por estacionariedade do 2 momento para a covarincia e estacionariedade intrnseca para semivariogramas. A estacionariedade do 2 momento a suposio de que a covarincia a mesma entre quaisquer dois pontos que estejam mesma distncia e direco. A covarincia dependente da distncia entre quaisquer dois valores e no da sua localizao. Para os semivariogramas, a estacionariedade intrnseca a suposio que a varincia da diferena a mesma entre quaisquer dois pontos que estejam mesma distncia e direco independentemente dos pontos que se escolham [11]. A hiptese de estacionariedade em relao a estas estatsticas definida do seguinte modo: a correlao (4.5) e a varincia (4.6) entre duas variveis aleatrias depende somente da distncia espacial que as separa e independente da sua localizao. Dado um vector h que distancia duas variveis aleatrias, temos que: C(Z(x1), Z(x2)) = C(Z(xi), Z(xi + h)) = C(h), ?(Z(x1), Z(x2)) = ?(Z(xi), Z(xi + h)) = ?(h) (4.5) (4.6)
Tal como para a mdia, a hiptese de estacionariedade do segundo momento permite a inferncia daquelas medidas o semivariograma (4.7) e a covarincia (4.8) com base nas N amostras Z(xa), a = 1, ..., N
(4.7)
(4.8)
sendo
4.2.3 Anlise Estrutural
O elemento estruturante Biponto (par de pontos separados por uma distncia h) um instrumento geoestatstico de medida da continuidade espacial das caractersticas de um recurso natural ou fenmeno espacial. Esta medida desempenha um papel crucial na
metodologia geoestatstica, cumprindo, fundamentalmente, dois objectivos: a caracterizao e a quantificao do modo como se dispersam espacialmente as caractersticas de um recurso _______________________________________________________________________ Rui Martins, Lus de Sousa
46
30-09-2002
o grau de continuidade espacial, o modo diferencial como a grandeza se dispersa no espao (anisotropia) prtica que se denomina, na linguagem geoestatstica, anlise estrutural; por outro lado serve de base aos processos de inferncia espacial/estimao e simulao. O biponto apesar de no abranger a noo de conjunto conexo (dois pontos podem pertencer simultaneamente a X, e este no ser conexo), , no entanto, o elemento estruturante privilegiado na prtica geoestatstica de anlise de continuidade espacial de um recurso natural, quando este provem de um conjunto de amostras ou observaes, normalmente discreto, limitado e, na maioria das vezes, escasso. Para diferentes valores de h (designado em terminologia anglosaxnica por lag size) obtm-se as diferentes nuvens, que so representativas da correlao linear entre os valores Z(x) das amostras localizadas em x e os valores das amostras distanciadas de h, Z(x + h). O conjunto destas nuvens, para os diferentes passos h, contm a quase totalidade da informao disponvel, a partir do biponto, relativa ao grau de disperso/continuidade da varivel Z(x). No entanto, para uma melhor interpretao e posterior utilizao, necessrio sintetizar as nuvens em instrumentos que, resumindo a sua disperso, permitem visualizar a sua evoluo com h [13].
4.2.3.1 Parmetros do Semivariograma
A Figura 4.8 ilustra um semivariograma experimental com caractersticas muito prximas do ideal. O seu padro representa o que, intuitivamente, se espera de dados de campo, isto , que as diferenas {Z(xi) - Z(xi + h)} decresam medida que h, a distncia que os separa decresce. esperado que observaes mais prximas geograficamente tenham um comportamento mais semelhante entre si do que aquelas separadas por maiores distncias. Desta maneira, esperado que ? (h) aumente com a distncia h. Os parmetros do semivariograma podem ser observados directamente da Figura 4.8 : 1. Alcance (a): distncia dentro da qual as amostras se apresentam correlacionadas espacialmente. 2. Patamar (C): o valor do semivariograma correspondente ao seu alcance (a). Deste ponto em diante, considera-se que no existe mais dependncia espacial entre as amostras, porque a varincia da diferena entre pares de amostras (Var[Z(x) Z(x+h)]) torna-se invariante com a distncia.
3. Pepita (C0): idealmente, ? (0)=0. Na prtica, medida que h tende para 0 (zero), ? (h)
47
30-09-2002
semivariograma para distncias menores do que a menor distncia entre as amostras. Parte desta
descontinuidade pode ser tambm devida a erros de medio [11], mas impossvel quantificar se a maior contribuio provm dos erros de medio ou da variabilidade de pequena escala no captada pela amostragem.
Figura 4.8 Parmetros do Semivariograma O grfico do semivariograma experimental, ? (h) , calculado atravs da equao (4.7), formado por uma srie de valores, conforme ilustra a Figura 4.8, sobre os quais se objectiva ajustar uma funo. importante que o modelo ajustado represente a ? (h) em relao a h. Deste modo, as estimativas obtidas sero mais exactas e, portanto mais confiveis. Os modelos aqui apresentados so considerados modelos bsicos, denominados de modelos isotrpicos (quando uma funo depende apenas da distncia entre dois locais e no da posio relativa desse locais). Esto divididos em dois tipos: modelos com patamar e modelos sem patamar. Modelos do primeiro tipo so referenciados na geoestatstica como modelos transitivos. Alguns dos modelos transitivos atingem o patamar (C) assimptoticamente. Para tais modelos, o alcance (a) arbitrariamente definido como a distncia correspondente a 95% do patamar. Modelos do segundo tipo no atingem o patamar, e continuam a aumentar enquanto a distncia aumenta. Tais modelos so utilizados para modelar fenmenos que possuem capacidade infinita de disperso, o caso do modelo Potncia. Os modelos transitivos mais utilizados so: modelo esfrico, modelo exponencial e modelo gaussiano. Estes modelos esto apresentados na figura 4.9 com o mesmo alcance (a).
48
30-09-2002
Trata-se de um dos modelos mais usados em geoestatstica, funo de dois parmetros: um patamar C, limite superior para o qual tendem os valores do semivariograma com o aumento dos valores de h (que neste exemplo toma o valor de 1), e o alcance (a), distncia a partir da qual os valores de ?(h) param de crescer e so iguais a um patamar que normalmente coincidente com a varincia de Z(x) [13]. O modelo esfrico tem a seguinte expresso:
(4.9)
4.2.3.3 Modelo Exponencial
uma funo dos mesmos parmetros do modelo esfrico. O patamar corresponde ao valor para o qual o semivariograma tende assimptoticamente. O valor do alcance (a) a distncia em que o modelo atinge 95% do patamar: ?(a) = 0.95C. O modelo exponencial tem a seguinte expresso:
(4.10)
4.2.3.4 Modelo Gaussiano
Os modelos apresentados anteriormente tm um crescimento relativamente rpido junto da origem, como se pode constatar pela figura 4.9, denunciando um comportamento tpico de fenmenos relativamente irregulares. No entanto existem outros fenmenos, bastante mais
49
30-09-2002
regulares e contnuos, que denunciam um crescimento lento de ?(h) originando um comportamento parablico na origem. O modelo Gaussiano tem a seguinte expresso:
(4.11) O alcance neste modelo igualmente a distncia para o qual o modelo atinge 95% do patamar.
4.2.3.5 Modelos de Anisotropia
A continuidade espacial de um recurso natural, por exemplo, pode variar com as diferentes direces do espao. Uma dada caracterstica de um recurso natural diz-se que tem uma estrutura de continuidade espacial istropa quando o semivariograma (ou covarincia) tem o mesmo comportamento em todas as direces (isto , ?(h) depende somente do mdulo do vector h). Na situao em que a varivel em estudo se estende preferencialmente, de um modo mais contnuo, numa direco particular, d origem a uma estrutura anistropa. A anisotropia estrutural pode ser entendida como a variabilidade ou continuidade diferencial dependente das direces do espao[13]. Os modelos mais comuns de anisotropia so: a anisotropia geomtrica e a anisotropia zonal. 1. Anisotropia Geomtrica Semivariogramas estimados para diferentes direces apresentam o mesmo modelo, o mesmo patamar, mas amplitudes diferentes a amplitude mxima verifica-se na direco perpendicular amplitude mnima.
50
30-09-2002
2. Anisotropia Zonal Quando o patamar do semivariograma diferente para a direco perpendicular considerada.
Com um simples exemplo grfico, pode-se perceber aquilo que a forma de um Semivariograma representa.
Figura 4.12 Semivariogramas em amostras diferentes No conjunto de amostras da esquerda existe uma grande diferena entre medies feitas em locais adjacentes, o que proporciona um Semivariograma quase horizontal e constante. No centro temos um conjunto de amostras com alguma correlao espacial, o efeito de pepita j quase zero, existe j um patamar quase definido. No conjunto da direita, a correlao espacial entre as amostras muito maior, pelo que o Semivariograma gerado quase perfeito.
4.2.4 Estimao algoritmos de interpolao de krigagem
A partir da definio do modelo global de semivariograma , ento, possvel estimar valores do fenmeno espacial em pontos desconhecidos da rea de estudo. Neste tipo de situaes habitual utilizarem-se os mtodos de interpolao de krigagem. O nome de krigagem designa um conjunto de algoritmos de regresso linear, com base num critrio de _______________________________________________________________________ Rui Martins, Lus de Sousa
51
30-09-2002
mnimos quadrados, em homenagem ao investigador Daniel Kridge que se apercebeu, durante o seu trabalho de prospeco nas minas sul africanas, que a varincia de disperso dos teores reais de ouro num painel de pesquisa de uma mina sempre mais fraca que a varincia de disperso dos resultados de uma amostragem interior, estando subjacente um erro sistemtico da sobrestimao dos painis ricos e subestimao dos pobres. Apenas se poder evitar este tipo de erros, se a estimao do teor mdio de determinada zona incluir toda a informao disponvel e ponderada por coeficientes que tomem em considerao a estrutura espacial do fenmeno, e portanto a sua irregularidade[16]. Os algoritmos de krigagem tm por base o estimador linear de regresso [Z(x0)*], definido por:
(4.12) Onde ?i so ponderadores a afectar s amostras e Z(xi) representa os valores da VR em vrios pontos das amostras do espao i=1, 2, ..., N na vizinhana de x0. m e mi so os valores esperados de z(x0) e z(xi), respectivamente. seguintes condies: 1. A mdia dos desvios entre os valores reais e os estimadores deve ser nula condio de no enviezamento universal: E[Z(x0) Z(x0)*] = 0, de modo a desagregar os agrupamentos preferenciais de amostras. Amostras agregadas tm menos peso que amostras isoladas. 2. A varincia de estimao, s E2 = Var[Z(x0) Z(x0)*], deve ser mnima. A krigagem actualmente utilizada devido principalmente ao facto de requerer apenas a modelao do semivariograma e possibilitar o clculo da varincia de estimao atravs de ponderadores, no dependendo dos valores da VR. Apresenta como principais propriedades : 1) Exactido. As estimativas das amostras Z(xa) em locais conhecidos so idnticas aos seus valores experimentais: 2) Regularidade. Os interpoladores de krigagem fornecem sempre uma soluo nica e 3) Varincia de estimao no depende dos valores das amostras Z(xa). Isto significa que a mesma configurao amostral (com as mesmas relaes geomtricas entre amostras e o ponto a estimar) reproduz sempre a mesma varincia de estimao em Este estimador construdo com base nas
52
30-09-2002
qualquer parte da rea A. Assim, a varincia de estimao no mede a incerteza da estimao resultante da variabilidade local [13]. As diferenas existentes entre os interpoladores de krigagem assentam na definio do modelo de funo aleatria Z que habitualmente decomposta numa componente residual R e numa componente de deriva m: Z = R + m [14]. A componente residual modelada como uma funo aleatria estacionria de mdia zero e covarincia CR(h) = E[R(x)*R(x+h)], o que leva a que o valor esperado da FA Z na posio x0 seja dado pelo valor da componente de deriva naquele local, ou esperana de Z. Consoante o modelo de deriva m escolhido, trs variantes da krigagem podem ser consideradas: Krigagem Simples (KS); Krigagem Ordinria (KO) e Krigagem Universal (KU).
4.2.4.1 Krigagem Simples
Neste tipo de krigagem a componente de deriva modelada como a mdia estacionria dos valores da amostra. Esta mdia m conhecida e constante na rea de estudo. Deste modo, com base na expresso (4.12) podemos definir o estimador de krigagem simples como:
(4.13) Os N ponderadores ?iKS so determinados de modo a minimizar a varincia do erro s E2 de acordo com a segunda condio do estimador geral de krigagem. Este algoritmo normalmente aplicado em situaes em que o formalismo terico do modelo impe o conhecimento da mdia da funo aleatria, ou ento quando existe um bom conhecimento da tendncia (deriva) do fenmeno. Nestes casos podem assumir-se os valores dessa deriva (quando conhecida em todo o campo) como a mdia das variveis aleatrias referentes aos valores amostrados e aos pontos no espao no amostrado [13].
53
30-09-2002
Na KO a mdia m desconhecida e varia localmente na rea de estudo. Isto significa que a estacionariedade da mdia limitada a uma dada vizinhana V, centrada na posio a estimar x0 [14]. Apesar de desconhecida, a mdia m pode ser filtrada da estimao forando a que a soma dos ponderadores de krigagem seja igual a 1 [14]. Assim, o estimador de krigagem expresso por
(4.11)
Neste caso, o modelo de deriva considera que a mdia varia localmente dentro de uma determinada vizinhana V em funo das coordenadas, segundo a expresso geral
(4.15) onde as funes fk so conhecidas e os coeficientes ak desconhecidos e constantes. Deste modo a deriva fica modelada por uma polinomial. Assim, utilizando a expresso (4.12) podemos descrever o estimador de KU, como:
(4.16)
54
30-09-2002
Contudo, para o clculo dos coeficientes de deriva ak necessrio impor os seguintes constrangimentos:
(4.17) com k=0, 1 ..., K; o que leva seguinte expresso para o estimador de KU
(4.18)
A determinao dos ponderadores que iro ser usados na estimao do ponto desconhecido resumem dois factores: - A distncia estrutural (segundo membro): quanto mais prximas estiverem as amostras do ponto desconhecido maior peso tero no estimador; - A desagregao (primeiro membro): quanto mais correlacionadas estiverem as amostras, maior o efeito de agrupamento ou redundncia e menor ser o seu peso individual na construo do estimador. [13] [?] = [K]-1 * [M] (4.19)
O primeiro membro desta equao a inversa da matriz que resulta de se aplicar o modelo escolhido atravs do semivariograma. Essa matriz no mais do que a varincia existente entre todas as amostras vizinhas ao ponto que se pretende estimar.
55
30-09-2002
O segundo membro surge aplicando a cada ponto vizinho conhecido do ponto desconhecido o modelo determinado no semivariograma, em funo da distncia a cada amostra vizinha.
4.3 Concluso
Existem dois grupos de algoritmos de interpolao de superfcies, os Determinsticos e os Geoestatsticos. Enquanto que os primeiros tentam ajustar ao conjunto de pontos conhecidos uma funo matemtica que modele as caractersticas do fenmeno em causa, os segundos usam estatsticas e modelos de previso que podem modelar incerteza e erros de medio. A Geoestatstica compe-se de duas fases principais, a Variografia, onde se quantifica a forma como os dados variam consoante a distncia entre si, e a Predio, onde se estimam valores para os pontos desconhecidos. No primeiro processo tenta-se encontrar o modelo que melhor descreva a auto-correlao existente entre os dados, modelo esse que se traduz num Semivariograma. o Semivariograma que vai permitir estimar valores desconhecidos; existem diversos tipos de Semivariogramas, entre os quais se destacam trs, Esfrico, Exponencial e Gaussiano. Dentro dos mtodos Geostatsticos, consideraram-se a Krigagem Simples, a Krigagem Ordinria e a Krigagem Universal. A Krigagem Universal comporta derivas polinomiais, ao passo que os outros dois mtodos no, usando apenas mdias dos valores medidos. No entanto a Krigagem Ordinria considera mdias locais em redor do ponto de estimao, enquanto que a Krigagem Simples considera apenas a mdia global, para toda a rea de estimao. Por esta razo, a Krigagem Simples foi excluda dos modelos a usar, pois no se revelou realista em relao amostra deste estudo (este facto ser aprofundado no Captulo V). Os mtodos Geostatsticos comportam melhor as caractersticas de variveis que modelam fenmenos fsicos naturais, como o caso. Tome-se por exemplo a amostra da figura 4.16;
56
30-09-2002
Existem cinco medies esquerda com valores baixos, e uma com um valor alto direita, de esperar que a amostra da direita tenha uma influncia maior na superfcie gerada. Usando um mtodo determinstico (IDW), a influncia dos pontos mais baixos estende-se bastante pela superfcie, e o ponto mais alto aparece como um pico no meio de uma zona de valores mdios. Com um mtodo Geoestatstico, no s dada maior influncia ao ponto medido isolado, como identificada uma deriva (uma inclinao) da que sobe da esquerda para a direita da superfcie.
57
30-09-2002
58
30-09-2002
As shapefiles encontram-se numa projeco de Mercator no paralelo 383330, num Datum WGS84. O passo seguinte foi a georeferenciao do raster de um mapa do Monte da Guia e respectiva rea circundante numa escala de 1 para 3750. Esta georeferenciao foi levado a cabo em pontos de morfologia bem distinta como a ponta norte do molhe leste, a Ponta da Greta, a Ponta das Furnas, a ponta dos Peixes Reis e a Ponta das Garas.
Figura 5.2 Shapefiles e Mapa georeferenciado. Com estes dois elementos j integrados, ficou a faltar a incluso das amostras de profundidade no conjunto. As amostras encontravam-se inicialmente num ficheiro de texto, com quatro campos diferentes por amostra, um valor em longitude (eixo xx), um valor em latitude (eixo yy), a leitura de profundidade no ponto (eixo zz) e um valor de varincia. A primeira operao foi transportar estes dados para o formato ArcGIS, criando com eles uma Base de Dados prpria para a continuao do trabalho. O ArcGIS interpreta automaticamente os valores de x e y como medidas de posio e pode j a esta altura mostrar, cada registo da Base de Dados criada, como um ponto num layer vectorial. Apesar destes automatismos, a integrao deste conjunto de dados seria bem mais laboriosa, uma vez que no se poderia fazer atravs de uma georeferenciao como no raster, teria que ser efectuada uma projeco no espao dos dados j integrados. _______________________________________________________________________ Rui Martins, Lus de Sousa
59
30-09-2002
Figura 5.3 Pontos de referncia para projeco Os valores de posio indicam a distncia, em metros, de cada amostra relativamente ao ponto de coordenadas 383048 Norte e 283806 Oeste. Este ponto coincide com o canto inferior esquerdo do mapa j integrado, e representa interseco dos eixos xx e yy, o ponto de coordenadas (0,0). Com esta informao adicionamos Base de Dados pontos de referncia nas interseces dos meridianos e paralelos representados no mapa raster. Tabela 5.1 Pontos auxiliares de projeco Longitude 28 38 06" W 28 38' 00" W 28 38' 00" W 28 37' 30" W 28 37' 30" W Latitude 38 30 48" N 38 31' 00" N 38 31' 30" N 38 31' 00" N 38 31' 30" N X 0 145,081519 145,081519 870,489113 870,489113 Y 0 371,0648 298,72691 371,06483 1298,72691
Tendo estes pontos como guias, passou-se projeco deste layer. Seguindo a projeco do layer do vector da linha da costa, usou-se uma Projeco de Mercator no paralelo 38 33' 30" Norte, no mesmo Datum, WGS84.
60
30-09-2002
Figura 5.4 Shapefiles, Mapa georeferenciado e Pontos de leitura. Como se pode observar pela figura, apesar de haver um grande quantidade de amostras, existiam ainda zonas considerveis sem informao de profundidade na Base de Dados, tanto no mar como em terra, sendo completamente inexistente na ltima. Recorrendo informao de altimetria e batimetria, presente no mapa raster sob a forma de curvas de nvel, foi enriquecida a Base de Dados com esta informao adicional. Foram introduzidos, entre outros, pontos sobre a linha da costa, nos 10, 50 e 100 metros de altura, e nos 20, 30, 50 e 100 metros de profundidade. Este conjunto final de amostras abrange uma zona com aproximadamente 2271 metros de ordenadas por 2612 metros de coordenadas.
61
30-09-2002
Figura 5.5 Shapefiles, pontos de leitura, pontos de batimetria e altimetria Com esta nova informao adicionada ao conjunto de informao puderam-se finalmente aplicar os modelos geoestatsticos explorados no captulo IV.
30-09-2002
De seguida apresentada e interpretada a informao dada pelo ESDA acerca da amostragem em estudo.
5.2.1 Descrio Univariada das amostras
A Mediana, na figura 5.6, indica que 50% dos valores esto acima de -15,16 metros e que os outros 50% esto abaixo de -15,16 metros, o meio da distribuio. A vantagem da mediana em relao mdia que a mediana no sensvel a valores extremos tambm denominados outliers. Como a mediana e a mdia, neste caso onde existe uma grande amostragem, esto relativamente prximas, indicam que no existem muitos desvios de valores nas amostras. Comprovado igualmente pelos valores mximo e mnimo presentes na amostragem.
Figura 5.6 Histograma inicial Analisando o desvio padro pode-se constatar que apesar da mdia ser de -18,749 metros, como existe um grande desvio padro pode-se garantir que existe alguma inclinao. Esta inclinao corresponde tendncia que as amostras tm de apresentar valores mais profundos medida que se afastam da costa. Pela anlise do coeficiente de assimetria (skewness) verifica-se que a distribuio no simtrica, caso em que a mdia menor que a mediana. Mais propriamente est-se perante uma distribuio assimtrica negativa com o valor de assimetria de -0,83206. Quando assim acontece as mdias locais baixam e as varincias aumentam pois existe maior discrepncia entre as amostras. Este fenmeno justificado pela influncia que tem a distncia a que esto o mximo e mnimo de uma distribuio assimtrica. So estas situaes caracterizadas por
63
30-09-2002
um aumento das varincias locais que normalmente implicam a inferncia espacial com maior incerteza e maiores erros [13]. Analisando agora os quartis pode-se concluir que as amplitudes entre o primeiro quartil e a mediana, e a mediana e o terceiro quartil so aproximadamente equidistantes. No entanto, o nmero de amostras no se encontra bem distribudo face ao intervalo considerado, isto , o intervalo entre o valor mximo e mnimo presentes nas amostras. Analisando ainda a
amplitude inter-quartil (Q - Q) conclu-se que 50% dos elementos do meio da amostra, esto contidos num intervalo com uma amplitude de 20,337 metros, o que vai de encontro rea de estudo do fenmeno fsico. O valor kurtosis uma medida que revela se a distribuio dos dados achatada ou pontiaguda quando comparada com a distribuio normal, cujo valor 3, e indica com que probabilidade a distribuio ir criar outliers. Em termos grosseiros indica a distncia a que esto os valores mximo e mnimo da mdia da distribuio. O valor kurtosis de uma distribuio normal de 3, e dado pela seguinte expresso:
(5.1) onde xi so os valores das amostras, x a mdia, N o nmero total de amostras e s o desvio padro. Com os dados em questo, verifica-se que o valor de kurtosis de 2,7929, o que representa uma distribuio relativamente achatada quando comparada com uma distribuio normal. Aps terem sido introduzidos os 6203 pontos adicionais, mostrados na figura 5.6, verificou-se que as nicas alteraes significativas foram, por um lado o aumento do valor de kurtosis e por outro um pequeno aumento quer do primeiro quartil, quer da mediana. Os pontos introduzidos foram alguns pontos de batimetria, altimetria e pontos da linha da costa onde a cota zero. A alterao que se verificou no valor do kurtosis foi pouco significativa e apenas tornou a distribuio ligeiramente pontiaguda quando comparada com uma distribuio normal. As alteraes ocorridas com o primeiro quartil e com a mediana podem ser justificadas com a diferente proporo de valores que foram introduzidos. Foram introduzidos mais valores de altimetria e da linha da costa, valores esses que so superiores mediana, e que provocaram um ligeiro desvio desta, de -15,16 para -14,813.
64
30-09-2002
Uma das ferramentas que includa no ESDA para descrio espacial o analisador de derivas. Esta ferramenta aps por no plano xy as amostras faz uma projeco dos pontos nos planos xz e yz. De seguida ajusta funes polinomiais que permitam descrever as derivas a que os dados esto sujeitos. Com os dados iniciais, figura 5.8, constata-se a existncia de derivas, quer no sentido Norte Sul (linha azul) quer no sentido Este - Oeste (linha verde) pois as linhas no so horizontais.
Figura 5.8 Deriva nos dados iniciais Com a incluso dos pontos de batimetria, altimetria e linha da costa, figura 5.9, as derivas continuaram a ser claramente visveis. De modo a apurar em que sentido se faz sentir exactamente a deriva, rodaram-se os dados, no sentido contrrio ao dos ponteiros do relgio, e verificou-se que a deriva existe e se faz sentir no sentido Noroeste Sudoeste, claramente
65
30-09-2002
visvel na figura 5.10. Pela sua forma em U o melhor ajustamento ser atravs de um polinmio de segunda ordem.
Figura 5.10 Deriva Noroeste - Sudoeste A existncia de uma deriva igualmente confirmada se for tido em linha de conta o campo onde estas amostras foram recolhidas. No campo, podemos observar, medida que nos deslocamos de Noroeste para Sudeste, que comeamos com valores de altimetria bastante elevados e chegamos a valores de profundidade que vo aumentando gradualmente nesse sentido. Uma das implicaes imediatas desta concluso a ineficcia do mtodo de Krigagem Simples para este conjunto de dados, pois existe uma deriva. Este mtodo trabalha com um mdia constante ao longo de toda a rea de estudo, o que irreal quando existe uma tendncia clara nos dados.
66
30-09-2002
Os mapas de Voronoi so compostos por uma srie de polgonos formados em torno de cada ponto de amostragem. Os polgonos de Voronoi so criados de tal maneira que, cada ponto dentro do polgono esteja mais perto do ponto de amostragem contido no polgono, do que de qualquer outro. Depois de criados os polgonos so definidos os vizinhos, sendo estes todos os que partilham arestas com o polgono da a amostra em causa.
Figura 5.11 Exemplo de um Mapa de Voronoi Neste exemplo podemos ver uma amostra a amarelo cercada por um polgono de Voronoi a vermelho. Os polgonos azuis so os vizinhos da amostra amarela. Todos os pontos do polgono vermelho esto mais perto da amostra amarela do que qualquer outra. Usando estas definies podem-se calcular uma srie de diferentes estatsticas teis. Por exemplo a mdia local encontra-se calculando a mdia dos pontos nos polgonos azuis e vermelho, ou seja a mdia local num polgono mdia do seu valor e dos valores dos seus vizinhos. Seguidamente apresentam-se os mtodos de clculo dos mapas de Voronoi utilizados neste estudo. Simples o valor atribudo a um polgono o mesmo do ponto de amostragem nele contido. D indicaes acerca da influncia local de cada ponto. Alcance Inter-Quartil (IQR) so calculados o primeiro e terceiro quartil a partir da distribuio dos valores das amostras do polgono e dos seus vizinhos. O valor atribudo ao polgono de Voronoi a diferena entre o valor do primeiro e do terceiro quartis. D indicaes acerca da variabilidade local. Aglomerado os polgonos so todos agrupados em cinco classes, se a classe de um polgono for diferente de todas as dos seus vizinhos este considerado neutro (representado a cinzento). Este mtodo permite identificar outliers.
67
30-09-2002
Mdia o polgono toma o valor da mdia do seu valor com os dos seus vizinhos. Permite asseverar da suavidade local. Foram usados alguns dos tipos de mapas de Voronoi gerados pelo ESDA, quer para tomar conhecimento das caractersticas dos dados, quer para perceber o modo como a incluso de valores de altitude e batimetria afectaram estas caractersticas.
Figura 5.12 Mapas Voronoi Simples, inicial (esquerda) e com pontos adicionais (direita) A introduo dos novos dados vem, como esperado, tirar influncia a algumas das amostras do conjunto inicial. Principalmente em terra, onde a informao era totalmente ausente, as novas amostras vm retirar peso a algumas das amostras obtidas perto da linha da costa, que como tal dariam um indicao bastante errada acerca da evoluo da superfcie em terra. Daqui se conclu que neste captulo a incluso de amostras adicionais foi bem sucedida.
Figura 5.13 Mapas Voronoi IQR, inicial (esquerda) e com pontos adicionais (direita) Outro dos objectivos da incluso de amostras adicionais fica igualmente patente como bem sucedido, olhando para os mapas de Voronoi IQR. Em praticamente todo o espao da amostragem h uma diminuio da variabilidade local.
68
30-09-2002
Figura 5.14 Mapas Voronoi Aglomerado, inicial (esquerda) e pontos adicionais (direita) Tal como visto na anlise dos histogramas, a introduo de novos dados no mudou significativamente a probabilidade de existncia de outliers. Pode-se no entanto constatar, nos mapas de Voronoi Aglomerado, que a existncia destes deixa de ser tendencialmente no mar para passarem a estar em terra.
Figura 5.15 Mapas Voronoi Mdia, inicial (esq) e com pontos adicionais (dir) Nestes mapas fica patente que as novas amostras includas propiciam uma superfcie mais suave, dado que vo adicionar informao em zonas para as quais no existia. Este era igualmente um dos objectivos da incluso de amostras adicionais, e pode ser dado como cumprido.
69
30-09-2002
Todos estes modelos foram usados com Anisotropia. As polinomiais de deriva usadas nos mtodos de Krigagem Universal, foram as geradas pela ferramenta ESDA, que como se pode ver nas figuras 5.9 e 5.10, seguem a deriva identificada anteriormente na anlise de estrutura espacial. Para a exucuo dos algoritmos de interpolao foi usada uma mquina com um processador INTEL Pentium III, com uma frequncia de relgio de 933 MHz, e com 512 Mbytes de memria RAM. Este sub-captulo mostra o caminho levado desde a escolha dos modelos de Semivariograma a usar at s superfcies finais, passando pelos processos de Validao e Validao Cruzada, quer permitem seleccionar os modelos mais correctos para a amostra em causa.
5.3.1 Modelos de Semivariograma
Depois de se ter chegado concluso que no seria realstico aplicar a krigagem simples, restaram trs hipteses: krigagem ordinria, krigagem universal de segunda ordem e krigagem universal de primeira ordem. Apesar de se ter verificado que para se tratar a forma em U da deriva seria mais correcto utilizar um polinmio de segundo grau, decidiu-se fazer tambm algumas experincias com a primeira ordem, visto que a estimao um processo interactivo e que varia muito de caso de estudo para caso de estudo. Na krigagem ordinria verificou-se que o maior alcance o mesmo para todos os modelos e que s o menor alcance varia. O modelo que apresenta um valor maior para este ltimo o modelo exponencial, seguido do modelo esfrico e sendo o menor deles no modelo gaussiano. Este fenmeno, devido a existir uma anisotropia mais acentuada no modelo guassiano, provoca uma forma elptica mais acentuada porque a amplitude entre o maior e menor alcance maior, como se observa na figura 5.16.
70
30-09-2002
Figura 5.16 Krigagem ordinria com modelo exponencial e com modelo gaussiano A esta reduo incremental do menor alcance quando percorremos os modelos do exponencial para o gaussiano passando pelo modelo esfrico, corresponde um aumento incremental do efeito de pepita quando se percorrem os diferentes modelos no mesmo sentido. Quanto maior for o alcance de menor raio menor ser o efeito de pepita fazendo com que as amostras vizinhas exeram uma maior influncia nos pontos a estimar.
Figura 5.17 Modelo gaussiano esquerda e modelo exponencial direita Quanto menor for o efeito de pepita menor ser a influncia do conjunto total de amostras. Zonas onde exista uma grande quantidade de pontos o modelo exponencial (com menor efeito de pepita logo sofre uma maior influncia de pontos vizinhos) ser o melhor a aplicar, tal como se poder verificar em cima pela figura da direita. Na zona do monte da Guia onde existe uma grande amostragem de pontos foi notrio o desaparecimento de algum do padro de amostragem que o mapa tinha junto da linha da costa. Por outro lado zonas onde se dever fazer sentir uma maior influncia do conjunto total de amostras, o modelo gaussiano dever ser o melhor modelo. Neste caso, onde se deveria ter em linha de conta um conjunto de pontos mais dispersos, o modelo exponencial realou o padro de amostragem na zona onde foi feita uma viagem mais longe da costa e j em alto mar. Nesta zona o modelo _______________________________________________________________________ Rui Martins, Lus de Sousa 71
30-09-2002
gaussiano foi claramente superior pois conseguiu esconder esse padro de amostragem aproveitando melhor a influncia dispersa que o conjunto de amostras naquela zona consegue oferecer. Na krigagem Universal de primeira ordem observou-se o mesmo efeito, isto , os modelos que tm um efeito de pepita mais elevado apresentam um valor maior no alcance menor. Nesta experincia o resultado que saltou mais vista foi o do modelo exponencial ser praticamente isotrpico. No modelo gaussiano a direco da elipse variou cerca de 342 onde se verificou tambm uma diminuio do patamar alcanado, que provavelmente indicar que num patamar entre a dos modelos exponencial e esfrico e entre a do modelo gaussiano a auto-correlao sofre uma alterao na direco em que se faz sentir, figura 5.18.
Figura 5.18 Krigagem Universal com deriva de primeira ordem Na krigagem Universal mas agora com uma deriva de segunda ordem, verificou-se o mesmo efeito que anteriormente, ou seja, o modelo que apresenta um menor raio de menor alcance tem um efeito de pepita superior. Nesta experincia foi no modelo exponencial que se verificou uma alterao de 315 na direco da elipse. Tal ocorrncia pode-se dever ao facto de o seu alcance ser maior, mas como apresenta uma isotropia quase perfeita, a direco da elipse no ir influenciar a escolha da melhor linha para modelar o semivariograma, como se pode ver na figura 5.19.
72
30-09-2002
Figura 5.19 Krigagem Universal com deriva de segunda ordem De modo a encontrar o modelo mais adequado aos dados em questo recorreu-se aos valores de Validao Cruzada, proporcionados pela ferramenta ESDA.
5.3.2 Validao Cruzada
A Validao Cruzada construda usando todos os dados conhecidos do modelo. Para cada ponto de amostragem conhecido retira-se o seu valor do conjunto de pontos, aplica-se ento o modelo nesta localizao espacial e estima-se um valor hipottico, ignorando que a amostra existe. Finalmente compara-se este valor com o valor medido. Este procedimento repetido para todos os pontos da amostragem, um de cada vez, obtendo-se no final uma regresso linear com os valores medidos contrapostos aos valores estimados para as mesmas localizaes.
Figura 5.20 Grfico de Validao Cruzada Nos testes de validao cruzada o ESDA apresenta um conjunto de estatsticas que permitem comparar formalmente diferentes modelos. Segue-se uma breve descrio das indicaes dadas por estes valores. _______________________________________________________________________ Rui Martins, Lus de Sousa
73
30-09-2002
Erro Mdio (EM) deve estar perto de zero e indica se a estimao ou no imparcial. No entanto este erro depende da escala dos dados. Raiz da Mdia Quadrada (RMQ) raiz quadrada da mdia das distncias quadradas da estimao recta da regresso linear da validao cruzada. Este valor d uma indicao da proximidade a que esto os valores estimados dos medidos. Quanto menor for melhor o modelo empregue. Mdia dos Erros Padro (MEP) Deve estar igualmente o mais perto de zero possvel. No entanto d tambm uma preciosa indicao de como est a ser tratada a variabilidade na estimao, se esta mdia estiver perto do Raiz da Mdia Quadrada. Se a MEP estiver acima do RMQ est a ser sobrestimada a variabilidade das estimaes, caso contrrio (MEP < RMQ) a variabilidade est a ser subestimada. Erro Mdio Aferido (EMA) a mdia dos erros de estimao aferidos. Deve estar perto de zero, d igualmente indicao da imparcialidade da estimao, mas agora no dependente da escala dos dados (erro aferido o resultado da diviso do erro de estimao pelo seu erro de estimao padro). Raiz da Mdia Quadrada Aferida (RMQA) outra forma de perceber a forma como est a ser tratada a variabilidade. Divide-se cada erro de estimao pelo seu erro padro estimado, o resultado destas divises deve ser, em mdia, semelhante, e a Raiz da Mdia Quadrada Aferida deve estar perto de um. Se este valor estiver acima de um est a ser subestimada a variabilidade, caso contrrio (RMQA < 1) est a ser sobrestimada. Como primeiro contacto com os valores de validao cruzada, passa-se a analisar os resultados obtidos por cada tipo de Semivariograma usado.
5.3.3 Semivariograma Esfrico
Para este tipo de Semivariograma a Krigagem Universal de 2 Ordem a que apresenta melhores resultados, este revelar-se- mesmo como o melhor modelo nesta fase. o modelo que obtm estimaes mais prximas dos valores medidos e o que trata melhor a variabilidade dos dados. Neste captulo a proximidade entre a RMQ e a MEP e a RMQP do os melhores valores de todas as simulaes levadas a cabo.
74
30-09-2002
Quanto aos outros mtodos de Krigagem, o mtodo Ordinrio obteve aqui diferenas grandes entre valores estimados e medidos, mas revelou uma melhor considerao de variabilidade e incerteza que a Krigagem Universal de 1 Ordem. Em relao imparcialidade da estimao embora a KU 1 ordem tenha um EM mais baixo, este valor empolado depois de aferido, passando a KO a ter o melhor valor, no entanto de assinalar a igual descida do EM para o EMA verificado na KU de 2 ordem. A incluso do factor de deriva de 2 Ordem beneficia aqui bastante a KU, tal como aferido na anlise espacial. No entanto, como vamos ver esta situao apenas se verifica para o Semivariograma Esfrico.
5.3.4 Semivariograma Exponencial
Para este Semivariograma a KO revela-se novamente menos eficaz que a KU, entre os dois mtodos de KU o de 1 ordem revela-se agora ligeiramente melhor. Apesar de o EM e o EMA serem menores para a KU de 2 ordem, tambm existe um decrescimento para o valor aferido na KU de 1 ordem, se bem que no to acentuado. A RMQ menor para a KU de 1 ordem, sendo este ltimo valor o mais acertado acerca da proximidade entre valores medidos e estimados. Quanto variabilidade o modelo de KU de 1 ordem claramente o melhor, mas todos obtm um valor de RMQA bastante alto, dando a indicao de que este tipo de Semivariograma subestima em demasia a variabilidade dos dados.
75
Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica Tabela 5.3 - Validao Cruzada para Semivariograma Exponencial
KO Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP 0,01697 1,847 0,4988 0,01523 4,591 1,3482 Melhor KU 1 Ord 0,0165 1,758 0,4663 0,01549 4,712 1,2917 Mdio KU 2 Ord 0,009902 1,813 0,5121 0,002979 5,633 1,3009 Pior
30-09-2002
Mais uma vez a KO fica claramente atrs da KU, e novamente a KU de 1 ordem obtm melhores resultados que a KU de 2 ordem. A KU de 2 ordem tem agora um valor mais baixo de RMQ, mas tem uma diferena muito grande deste valor para a MEP. Em relao imparcialidade das estimaes se bem que a KU tem o melhor EM, melhor EMA pertence, por pouca margem, KO; no entanto de realar a descida drstica do EM para o EMA, que se verifica nos trs modelos. Tabela 5.4 - Validao Cruzada para Semivariograma Gaussiano
KO Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP -0,01608 2,433 6,043 -0,00268 0,4022 3,61 Melhor KU 1 Ord -0,01171 2,152 4,035 -0,00283 0,5329 1,883 Mdio KU 2 Ord -0,01733 1,801 4,82 -0,00537 0,4956 3,019 Pior
Com o Semivariograma Gaussiano existe uma tendncia para a subestimao da variabilidade dos dados, por oposio ao que acontece com o Semivariograma Exponencial. No entanto de verificar como a KU de 1 ordem lida bastante melhor com esta caracterstica deste Semivariograma, obtendo valores bem razoveis de variabilidade.
5.3.6 Semivariograma Combinado
Com a combinao dos trs Semivariogramas so esbatidos alguns dos problemas encontrados na aplicao dos Semivariogramas Exponencial e Gaussiano, no entanto a KU de 2 Ordem falha redondamente. Tal como tinha lidado melhor com os Semivariogramas _______________________________________________________________________ Rui Martins, Lus de Sousa
76
30-09-2002
anteriores a KU de 1 ordem mostra-se mais uma vez eficaz, e finalmente so obtidos resultados para a KO que no ficam muito atrs dos valores da KU. Nomeadamente o valor da RMQ bastante abonatrio para a KO, o que no acontece com a KU de 2 ordem. A KU de 2 ordem falha igualmente na imparcialidade da estimao, registando um EMA bastante acima do EM, ao contrrio do que se passa nos outros dois modelos. Tabela 5.5 - Validao Cruzada para Semivariograma Combinado
KO Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP 0,00943 1,73 0,7035 0,005621 2,373 1,0265 Melhor KU 1 Ord 0,009045 1,705 0,5785 0,005567 2,87 1,1265 Mdio KU 2 Ord 0,00072 1,782 0,5908 -0,01245 3,675 1,1912 Pior
Seguem-se os modelos com melhores resultados de Validao Cruzada, escolhidos entre os doze aqui apresentados anteriormente. A escolha dos melhores segue uma lgica de eliminao de modelos com valores anormalmente altos, maioritariamente encontrados para a MEP e a RMQA. So tambm eliminados modelos com valores de RMQ acima de 2,1 (neste caso s um esteve acima deste valor, nos testes subsequentes, no Monte da Guia, este valor ser mais alto). Tabela 5.6 - Resultados mais significativos
Semivariograma Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP KO Combin. 0,00943 1,73 0,7035 0,005621 2,373 1,0265 -Melhor KU 1 Ord Combin. 0,009045 1,705 0,5785 0,005567 2,87 1,1265 -Segundo KU 2 Ord Esfrico -0,01863 1,732 2,124 -0,01045 0,8294 0,392 -Terceiro
So estes os modelos que melhores resultados de Validao Cruzada obtiveram, sendo igualmente os trs com valores mais baixos de RMQ. De destacar ainda um valor
77
30-09-2002
relativamente alto da MEP no modelo de KU de 2 Ordem com Semivariograma Esfrico, e valores tambm no muito bons de RMQA para os outros dois modelos aqui presentes.
5.5.8 Validao
A Validao, tal como a validao cruzada, fornece uma ideia de como o modelo prev valores para as localizaes desconhecidas. A validao cruzada no demonstra que o modelo de semivariograma correto, meramente que ele no est grosseiramente incorreto[17]. A validao por sua vez fornece uma viso mais apropriada da exactido do modelo. Do conjunto inicial de pontos criam-se dois conjuntos de pontos os quais somados so exactamente o conjunto de pontos inicial. Esses conjuntos de pontos criados designam-se por conjunto de teste e conjunto de treino. De seguida criam-se os modelos desejados utilizando o conjunto de treino. Ao contrrio da validao cruzada, no apenas retirado um ponto mas um conjunto de pontos (conjunto de teste). Para calcular a preciso da estimao comparamse os conjuntos de pontos (teste e treino) e determinam-se os erros provenientes da estimao. Para amostra completa foi feita a validao para os modelos que tinham apresentado melhores resultados na validao cruzada, ou seja, KO com semivariograma combinado, KU com deriva de primeira ordem com semivariograma combinado e KU com deriva de segunda ordem com semivariograma esfrico. Tabela 5.7 Validao para melhores modelos
KO Comb. Erro Mnimo Erro Mximo Mdia do Erro Soma do Erro Desvio Padro 0 45,565 0,601 37910,137 1,589 Melhor KU 1 Comb KU 2 Esf 0 46,739 0,599 37779,538 1,616 Mdio 0 49,917 0,667 42068,418 1,633 Pior
Na validao com a amostra completa foram utilizados para o conjunto de teste 63072 pontos, cerca de 15% do conjunto total de pontos. Os valores apresentados tentam dar alguma estatstica sobre o erro decorrente da validao. Assim verifica-se que o modelo que apresenta um erro mdio menor a KU com deriva de primeira ordem com um valor de 0,598991 metros. O modelo de KU com deriva de segunda ordem esfrico revelou-se o pior modelo apesar de ter tido uma validao cruzada _______________________________________________________________________ Rui Martins, Lus de Sousa 78
30-09-2002
muito boa. Ao revelar-se o pior modelo nesta fase veio confirmar o facto de na gerao da superfcie ter introduzido zonas onde o erro de estimao foi de cerca de 1000 metros. Onde notrio o pior desempenho deste modelo na soma dos erros de estimao. Com este modelo a soma foi de 42608 metros contra os 37780 metros da Krigagem Universal com deriva de 1 ordem. A validao na Krigagem Ordinria deu um resultado muito semelhante ao melhor modelo, o que vem confirmar mais uma vez que existe uma deriva acentuada nos dados e que deve ser tida em conta na gerao de superfcies.
O conjunto de dados inicial compreende uma rea bastante extensa, composta por subreas com caractersticas bastante diversas. Algumas destas sub-reas esto claramente pouco caracterizadas, e no so, de todo, o objectivo central do amostragem. Parte-se agora para um exame mais pormenorizado da rea objectivo desta amostragem, a caldeira e zonas circundantes do vulco adormecido do Monte da Guia.
Figura 5.21 Sub-amostra do Monte da Guia O subconjunto obtido com esta seleco de amostras compreende 303040 pontos, cobrindo uma rea com 1200 por 1214 metros de lado, apresentando uma densidade bastante maior de informao conhecida.
79
30-09-2002
Na figura 5.22 podemos observar a descrio univariada dos dados na zona do Monte da Guia. Observamos que nos 303040 pontos includos o ponto mximo de altimetria tem 145 metros e o mximo de batimetria tem -145 metros. Os valores de kurtosis e do coeficiente de assimetria (skewness), bem como as outras medidas de variabilidade no sofrem alteraes significativas relativamente ao histograma gerado depois de se introduzirem os pontos de batimetria, altimetria e linha da costa existentes no raster.
Figura 5.22 Histograma da sub-amostra do Monte da Guia Mais uma vez a deriva calcula pela ferramenta de anlise de derivas existente no ESDA, comprova que o fenmeno em estudo apresenta um tendncia na amostragem. As amostras medida que nos afastamos da linha da costa comeam a ser mais profundas. Em particular, forma em U particularmente acentuada pois atravessamos o Monte da Guia.
Figura 5.23 Deriva dos dados na zona do Monte da Guia Os mapas de Voronoi apresentaram algumas mudanas em relao ao conjunto global de amostras. O mapa de Aglomerado volta a identificar a possibilidade de ocorrncia de outliers em terra, desta vez mais demarcadamente. Mas a existirem so pontos com valores muito _______________________________________________________________________ Rui Martins, Lus de Sousa
80
30-09-2002
longe da mdia, e positivos sendo natural que apresentem este comportamento nos mapas Voronoi. O mapa IQR apresenta um variabilidade bastante diferente da original, tal deve-se existncia, mais uma vez, de pontos com valores muito longe da mdia, quer em terra quer no mar.
Figura 5.24 Mapas Voronoi Aglomerado (esquerda) e IQR (direita) Os outros mapas de Voronoi no apresentaram informao significantemente diferente da encontrada nos mapas do conjunto completo de amostras.
5.4.3 Resultados da Validao Cruzada
Apesar de existirem algumas semelhanas com as caractersticas do conjunto de dados completo, os resultados obtidos para este subconjunto so algo diversos. Em primeiro lugar h a assinalar um aumento do valor RMQ em todos os modelos aplicados. Tal deve-se ao facto de haver amostras com bastante influncia local, como se pde ver nos mapas de Voronoi, e de haver amostras em terra com valores muito distantes dos valores encontrados no grosso das amostras. Depois igualmente de realar o facto de o Semivariograma Esfrico obter melhores resultados para a KU de 1 Ordem do que com a KU de 2, tal como acontecera com o conjunto global. Esta mudana pode se explicar pela deriva que se registou para esta zona, embora semelhante na orientao e forma encontrada para o conjunto completo de dados, menos acentuada. A maioria dos pontos de maior profundidade no se encontram nesta rea, o que aplana a forma da deriva.
81
Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica Tabela 5.8 Resultados mais significativos no Monte da Guia
KO Semivariograma Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP Esfrico -0,02561 2,26 2,796 -0,00938 0,7955 0,536 Combin. 0,01033 1,921 0,7135 0,005419 2,557 1,2075 KU 1 Ord. Esfrico 0,003497 1,893 0,8208 -0,000898 2,207 1,0722 -Melhor
30-09-2002
KU 2 Ord Esfrico Combin. -0,01303 1,93 0,9409 -0,02022 2,104 0,9891 -Segundo -0,02476 1,946 1,384 -0,02008 1,391 0,562 -Terceiro
Mantm-se as caractersticas do conjunto completo neste subconjunto, zonas com grande profuso de informao e zonas com esparsa densidade de amostras. As dificuldades mantmse para os Semivariogramas Exponencial e Gaussiano, tal como visto na rea de estudo anterior. Os modelos com a KO continuaram a ter pouco sucesso, salvo mais uma vez no Semivariograma Combinado, nico com o qual a RMQ chega abaixo de 2. O Semivariograma Combinado funciona tambm, desta feita, com a KU de 2 Ordem, e no com a KU de 1 Ordem, ao contrrio do que se passou no conjunto de dados completo. Mais uma vez aparece um modelo que se destaca de certo modo de todos os outros, desta vez a KU de 1 Ordem, que apenas apresenta um valor de RMQA um pouco alto (2,207), mas com excelentes resultados em todos os outros parmetros. Aparentemente d-se, para este subconjunto das amostras, uma troca de posies entre os modelos de KU de 1 Ordem e o de 2 Ordem, deixando todo o resto muito parecido. Antes de se avanar na anlise de resultados necessrio responder a uma questo. Porque razo na amostra completa o modelo com melhores resultados foi com uma deriva de 1 ordem e no Monte da Guia o modelo com melhores resultados foi com uma deriva de 2 ordem? A razo desta mudana exactamente o Monte da Guia. A deriva considerada nos mapas global, isto , no foi considerada a existncia de derivas locais. Quando se faz esta restrio, o que antes era modelado com uma deriva de 1 ordem (devido ao mapa estender-se de uma zona montanhosa a uma zona com alguma profundidade) melhor modelado com uma deriva de 2 ordem, precisamente pela transio ao passar-se a linha da costa (efeito U).
82
30-09-2002
Nesta experincia foram utilizados 151760 pontos, cerca de 50% dos 303520 pontos includos nesta sub-amostra. Tabela 5.9 Validao para a zona do monte da Guia
KO Esf. Erro Mnimo Erro Mximo Mdia do Erro Soma do Erro Desvio Padro 0 79,742 0,929 141106,438 2,143 KO Comb. 0 70,695 0,753 114341,637 1,983 Melhor KU 1 Esf 0 83,967 0,719 109183,053 2,021 2 melhor KU 2 Esf 0 281,433 0,803 121824,561 2,221 Mau
Numa primeira anlise tabela de Validao da zona do Monte da Guia, o que se verifica que o melhor modelo foi o da KU de 1 ordem seguido pela KO com semivariograma combinado. A KO com semivariograma esfrico e a KU com deriva de 2 ordem mostraram resultados anormais, pelo que foram nesta fase descartados. Apesar de se ter verificado nos teste de Validao Cruzada uma melhor adequao da deriva de 2 ordem para esta sub-amostra, este modelo falha novamente os teste de Validao. Os valores de erro anormais (so estimados valores positivos em zonas onde a profundidade deveria rondar os 100 metros!), so provavelmente gerados por um aumento do nmero de ponderadores negativos. Assim sendo podem ser estimados valores muito para alm dos mximos e mnimos admissveis do ponto de vista do fenmeno fsico[13]. De modo a perceber melhor o que se passa em zonas mais densamente amostradas, partiuse para a anlise de uma rea contendo apenas amostras originais.
A primeira seleco de amostras no revelou grandes novidades, apesar de se reportar a uma rea mais estrita. As caractersticas essenciais do conjunto de amostras manteve-se aproximadamente o mesmo, registando-se apenas um ligeiro esbatimento da deriva, o que veio a permitir aos modelos de KU de 1 Ordem obter melhores resultados.
83
30-09-2002
Parte-se agora para a anlise de uma nova sub-amostra, ainda mais reduzida, compreendendo apenas pontos conhecidos originais, numa zona onde a amostragem foi exaustiva. Este conjunto compreende 18853 pontos de leitura, numa rea de 128 por 323 metros de lado, batendo as profundidades a Leste do Monte da Guia.
Nesta experincia foi utilizada uma pequena amostra do conjunto de pontos totais, 18853 pontos. Os seus valores mximo e mnimo so de -2,1939 m e -57,615 m respectivamente, j que esta sub-amostra foi restringida a amostras de profundidade. No entanto apesar de este intervalo entre o valor mximo e mnimo ser relativamente elevado, metade das amostras esto entre os -46,463 m e os -38,417m. As amostras apresentam pois uma mediana de 42,139m e uma mdia muito prxima de -41,973m. O valor de kurtosis de 9,7799 e indica precisamente que esta distribuio pontiaguda relativamente a uma distribuio normal, isto , apresenta um pico de valores e depois decresce muito rapidamente tendo valores muito afastados da mdia. O valor do coeficiente de assimetria (skewness) de 1,6835, isto , justifica o facto de a distribuio apresentar uma assimetria positiva.
84
30-09-2002
Figura 5.26 Histograma do zona leste do Monte da Guia Quanto existncia de derivas claro pelas figuras que se est presente uma deriva em que a modelao mais correcta passa por polinmio de primeiro grau.
As primeiras impresses retiradas dos valores de Validao Cruzada mostram mais ligeira subida dos valores da RMQ, mas por contraponto, uma melhor adaptao dos modelos variabilidade das amostras da rea de estudo. Mas o facto mais significativo o sucesso do modelo com Semivariograma Exponencial, face ao modelo com Semivariograma Esfrico. Tabela 5.10 Resultados mais significativos na Zona a Leste
Semivariograma Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP KO Combin. 0,06138 2,274 2,53 0,02432 0,8989 0,256 KU 1 Ord. Esfrico Exponen. 0,01783 2,085 2,388 0,007697 0,875 0,303 -Melhor 0,008738 1,999 2,12 0,004981 0,9487 0,121 -Segundo KU 2Ord. Combin. 0,0349 1,919 2,822 0,0134 0,6852 0,903 -Terceiro
85
30-09-2002
O Semivariograma Exponencial tm um melhor desempenho em reas onde a amostragem mais exaustiva, tal como apresentado no sub-captulo 5.3.1, o seu sucesso aqui total, apresentando os melhores valores para quase todos os parmetros de Validao Cruzada. Embora o Semivariograma Esfrico no seja to bom, continua a mostrar bons resultados, demonstrando mais uma vez a sua flexibilidade. O mesmo se pode constatar para o Semivariograma Combinado, que consegue at o valore mais baixo de RMQ. Por ltimo, de referir a superioridade dos modelo de KU de 1 Ordem face aos outros. Tal como seria de esperar nem o modelo de KO, nem o modelo de KU de 2 Ordem se adaptam to bem ao tipo de deriva encontrada, que define relativamente bem um plano inclinado de Noroeste para Sudoeste. Como referido no captulo 4, neste tipo de amostragem de esperar que alguns dos mtodos Determinsticos consigam bons resultados, nomeadamente o mtodo de Polinomiais Locais e o RBF. Foram ento usados estes mtodos, e tambm o IDW, para calcular superfcies que se pudessem comparar com as geradas pelos mtodos de Krigagem. Em seguida apresentam-se os resultados de Validao Cruzada para estes modelos. Tabela 5.11 Validao Cruzada para Mtodos Determinsticos
IDW Erro Mdio Raiz da Mdia Quadrada -0,08143 2,083 RBF -0,03817 2,025 Pol. Local -0,00623 1,879
Estes valores so bastante interessantes, em especial para a Polinomial Local, onde a RMQ inferior a qualquer das calculadas para os modelos de Krigagem. O modelo IDW j tem valores menores, como esperado, mas mesmo assim que no esto ao nvel dos valores obtidos para a Krigagem. No entanto as comparaes que se possam fazer entre estes mtodos e os de Krigagem so sempre deficientes dado que a Validao Cruzada d apenas valores de EM e RMQ para os primeiros.
86
30-09-2002
Figura 5.28 RBF (esquerda), Polinomial Local (centro) e KU 1 Ordem (direita) Na figura percebe-se claramente uma evoluo, no sentido da esquerda para a direita, da suavidade da superfcie gerada. No existem, na superfcie gerada pelo mtodo de Krigagem, mudanas bruscas de profundidade, a evoluo dos valores interpolados sempre suave e progressiva, mais prxima do fenmeno fsico real. Fica aqui bem patente a grande diferena entre mtodos Determinsticos e Geoestatsticos.
5.5.4 Validao
Na zona a Leste do Monte da Guia, para fazer os testes de validao foram utilizados 9427 pontos, cerca de 50% dos pontos existentes nesta sub-amostra. Tabela 5.12 Validao para a zona Leste
Semivariograma Erro Mnimo Erro Mximo Mdia do Erro Soma do Erro Desvio Padro KO Comb. 0,001 28,562 1,359 12815,548 2,118 KU 1 Esf 0,001 29,635 1,284 12107,818 1,962 -Melhor KU 1 Exp 0,001 29,157 1,263 11906,844 1,896 -Segundo KU 2 Comb 0,001 36,627 1,131 10660,658 1,652 -Terceiro
Aqui os resultados a que se chegaram no foram de modo algum surpreendentes. Como a zona tem dimenses reduzidas, o grau da deriva tem menos influncia da que atrs da KU de 2 ordem com semivariograma combinado os melhores resultados tenham sido alcanados com KU de 1 ordem. Entre o segundo e terceiro melhores modelos nesta experincia (ambos _______________________________________________________________________ Rui Martins, Lus de Sousa
87
30-09-2002
com deriva de 1 ordem) o que apresentou melhores resultados foi o que utilizou um semivariograma exponencial, indicado para zonas de intensa amostragem pois apresenta menor efeito de pepita. O modelo que utilizou semivariograma esfrico no ficou muito atrs, o que indica a boa adequabilidade do semivariograma esfrico para a maioria das ocasies. Em ltimo lugar ficou o modelo, KO com semivariograma combinado, que no utiliza qualquer espcie de deriva para a estimao dos pontos. Os diferentes desempenhos alcanados pelos quatro mtodos tambm so claramente visveis nos grficos. medida que o mtodo vai baixando de desempenho as cores nos grficos no se sobrepem tanto.
88
30-09-2002
Figura 5.29 Conjunto de pontos com igual latitude e longitude Como so muito poucas as leituras que temos para a mesma localizao, a estimao efectuada pelo ArcGis no muito realstica dando uma valor irrisrio na ordem dos nanometros. A moda da Varincia situa-se no intervalo [0,5 0,55], onde se situam os valores para mais de trezentas mil leituras; valores desta ordem so igualmente irrisrios para serem usados como erros de medio. Ao contrrio a mdia da Varincia da ordem de 1023, nmero completamente inadequado para ser usado como erro de medio (este valor esta muito acima de qualquer patamar dos modelos de Semivariograma vistos at aqui). Tal valor de mdia, deve-se a registos muito altos de Varincia, para um conjunto restrito de pontos. Para determinar um valor realstico para o erro de medio fez-se uma anlise da varincia de cada ponto e verificou-se o seguinte: Tabela 5.13 Tratamento da varincia fornecida para amostra completa VARINCIA MXIMA 1000 10000 20000 100000 200000 500000 MDIA DA VARINCIA 5,014262 8,127179 9,415062 11,647405 13,795281 15,931938 NMERO DE PONTOS 518 77 22 9 5 3
Esta tabela foi obtida dando igual valor de Varincia para todos os pontos com valores superiores ao mostrado na coluna da esquerda. Desta forma foi possvel baixar drasticamente _______________________________________________________________________ Rui Martins, Lus de Sousa
89
30-09-2002
a mdia da Varincia, para os valores que se podem ver na coluna do centro. Na coluna da direita est registado o nmeros de pontos encontrados com varincia superior ao tecto assumido na coluna da esquerda. Com varincias acima de mil ainda se encontra um nmero razovel de pontos, mas acima de cem mil este nmero quase residual. Podem-se considerar estes valores acima de cem mil como meros casos pontuais, para os quais a varincia infinita. Seguindo este raciocnio, pode-se considerar a Varincia Mdia deste conjunto de pontos como estando no intervalo [9,4 11,6], antes do qual se ignoram alguns pontos com varincias no infinitas, e para l do qual a Varincia Mdia comea a comportar pontos de varincia infinita. Neste intervalo optou-se, empiricamente, pelo valor de Varincia Mdia de dez. No entanto de salientar que qualquer outro valor escolhido dentro do intervalo [9,4 11,6] chegaria a resultados muito semelhantes aos apresentados seguidamente.
5.6.1 Amostra Completa
Depois de chegar a um valor de Varincia, com o qual se poderiam obter resultados visveis, foi aplicado este valor nos modelos de Krigagem mais bem sucedidos. A tabela 5.14 mostra as diferenas de Validao Cruzada obtidas para estes modelos, relativamente aos valores sem erro. Tabela 5.14 Validao Cruzada com e sem Erro de Medio na Amostra Completa
Semivariograma KO Combinado Com Erro Sem Erro -0,02693 2,008 3,296 -0,0082 0,6017 1,288 0,00943 1,73 0,7035 0,005621 2,373 1,0265 KU 1 Ord. Comb. Com Erro Sem Erro -0,01664 2,025 3,275 -0,00498 0,614 1,25 0,009045 1,705 0,5785 0,005567 2,87 1,1265
Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP
Claramente se percebe uma evoluo negativa dos valores de Validao Cruzada. Como seria de esperar, o aumento do efeito de pepita faz igualmente aumentar os valores da RMQ, pois vai produzir uma superfcie mais lisa, que no passa exactamente por todos os pontos medidos. H ainda a registar uma melhoria dos valores de RMQA, dando a entender uma melhor modelao da variabilidade, mas esta melhoria resulta em grande parte do grande aumento dos valores da MEP.
90
Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica Tabela 5.15 Validao com Erro de Medio na Amostra Total
KO Comb. Sem Erro Erro Mnimo Erro Mximo Mdia do Erro Soma do Erro Desvio Padro 0 45,565 0,601 37910,137 1,589 Com Erro 0 36,507 0,834 52596,393 1,842 KU 1 Comb Sem Erro 0 46,739 0,599 37779,538 1,616 Com Erro
30-09-2002
Na tabela 5.15 esto os resultados de Validao dos modelos com erro de medio, e o mtodo de Krigagem Universal de 1 ordem com semivariograma combinado continuou a apresentar melhores resultados face Krigagem Ordinria. No entanto com a introduo do erro verificou-se que no existiu melhoria, muito pelo contrrio a soma dos erros de estimao passou de 37780 metros para 51765 metros. Tal deve-se ao facto de o efeito de pepita ter aumentado, o que gera superfcies mais lisas e logo com maior impreciso.
5.6.2 Monte da Guia
Para este conjunto de dados, foram utilizados os mesmos mtodos de anlise da Varincia. Novamente se deparou com alguns pontos de varincia infinita, em condies muito semelhantes s encontradas na Amostra Completa; moda da Varincia muito perto de 0,5; mdia na ordem de 1023, e diferenas irrisrias em pontos com mais de uma medio. Esta semelhana quase total levou escolha do mesmo valor de Varincia Mdia a aplicar como Erro de Medio. Tabela 5.16 - Validao Cruzada com e sem Erro de Medio na zona do Monte da Guia
Semivariograma KO Esfrico Com Erro Sem Erro -0,03048 2,305 3,299 -0,00934 0,6895 0,994 -0,02561 2,26 2,796 -0,00938 0,7955 0,536 KO Combinado Com Erro Sem Erro -0,03413 2,227 3,296 -0,01039 0,6668 1,069 0,01033 1,921 0,7135 0,005419 2,557 1,2075 KU 1 Ord. Comb. Com Erro Sem Erro -0,01876 2,0201 3,293 -0,00564 0,6616 1,2729 0,003497 1,893 0,8208 -0,0009 2,207 1,0722
Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP
91
30-09-2002
As semelhanas continuam nos resultados de Validao Cruzada, com uma igual subida dos valores de RMQ e MEP, e no caso da KO com Semivariograma Combinado, uma ligeira melhoria de modelao da variabilidade. Na tabela 5.17 so apresentados os resultados de Validao para os modelos com erro de medio do zona do Monte da Guia. Ao se introduzir um erro de dez, o efeito de pepita aumentou, e a consequncia imediata a maior influncia do conjunto total de amostras na estimao de um ponto. O facto de ser modelado com uma deriva de 1 ordem faz com que supere os resultados alcanados com os modelos de Krigagem Ordinria. Tabela 5.17 Validao com Erro de Medio para o Monte da Guia
KO Comb. Sem Erro Erro Mnimo Erro Mximo Mdia do Erro Soma do Erro Desvio Padro 0 70,695 0,753 114341,637 1,983 Com Erro 0 77,426 1,026 155730,236 2,258 KU 1 Esf Sem Erro 0 83,967 0,719 109183,053 2,021 Com Erro 0 84,701 0,998 151458,293 2,226
A introduo do erro de medio continua a gerar resultados piores em toda a linha. Tal como nos modelos usados para a amostra completa, os efeitos de pepita iniciais eram todos muito baixos, pelo que este erro diminui consideravelmente a influncia de medies mais prximas do ponto de estimao.
5.6.3 Zona Leste
Por ltimo foi feita a mesma experincia com o erro para a zona a leste do Monte da Guia e os resultados a que se chegou esto apresentados nas tabelas que se seguem. O erro utilizado foi de 1,125, pois desta feita no foram encontrados pontos de varincia infinita. Este valor a mdia aritmtica das varincias de todos os pontos da sub-amostra da zona Leste.
92
30-09-2002
Tabela 5.18 - Validao Cruzada com e sem Erro de Medio na Zona Leste
Semivariograma KO Combinado Com Erro Sem Erro -0,06118 2,274 2,464 -0,02488 0,9225 0,19 0,06138 2,274 2,53 0,02432 0,8989 0,256 KU 1 Ord. Esfrico Com Erro Sem Erro -0,01737 2,079 2,337 -0,0077 0,8919 0,258 0,01783 2,085 2,388 0,007697 0,875 0,303 KU 1 Ord. Exponen. Com Erro Sem Erro -0,0062 0,008738 1,971 1,915 1,999 2,12
Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP
Ao contrrio do que de passava nos casos anteriores, o ArcGis fez simplesmente um ajuste ao efeito de pepita quando se introduziu directamente o erro. Nos casos anteriores, onde o erro de dez era superior ao efeito de pepita calculado atravs do modelo do semivariograma, era atribudo dez ao efeito de pepita. Sendo o valor do Erro de Medio bastante baixo, poucas alteraes se verificaram, no entanto em alguns casos registaram-se pequenas melhorias em algubs dos valores de Validao Cruzada. Tabela 5.19 Validao com Erro Medio na zona Leste
KO Comb. Sem Erro Erro Mnimo Erro Mximo Mdia do Erro Soma do Erro Desvio Padro 0,001 28,562 1,359 12815,548 2,118 KU 1 Exp. Sem Erro Erro Mnimo Erro Mximo Mdia do Erro Soma do Erro Desvio Padro 0,001 29,157 1,263 11906,844 1,896 Com Erro 0,001 25,112 1,172 11052,218 1,717 Com Erro 0,001 28,539 1,356 12810,675 2,116 KU 1 Esf Sem Erro 0,001 29,635 1,284 12107,818 1,962 KU 2 Comb. Sem Erro 0,001 36,627 1,131 10660,658 1,652 Com Erro 0,001 23,532 1,184 11163,306 1,668 Com Erro 0,001 27,114 1,254 11822,451 1,892
Os resultados de Validao tambm no apresentam grandes mudanas causadas pela introduo do Erro de Medio. Na KO com semivariograma Combinado, no existem quase
93
30-09-2002
diferenas; para os modelos de KU de 1 existem melhorias ligeiras ao ser introduzido o erro; enquanto que para a KU de 2 ordem o erro provoca pequenos aumentos dos valores. Em todos os modelos, para os quais foi introduzido erro de medio, no se obtiveram superfcies finais com diferenas visveis. Na zona a Leste do Monte da Guia, as superfcies geradas, so mesmo idnticas, no se observando quaisquer mudanas com a introduo do erro.
5.7 Concluso
Depois de estudados os mtodos a usar na interpolao de superfcies, foram seleccionados a KO e a KU cm derivas de primeira e segunda ordem. A estes mtodos foram aplicados quatro semivariogramas diferentes, Esfrico, Exponencial, Gaussiano e Combinado (dos anteriores trs). Estes diferentes mtodos foram aplicados a trs reas diferentes (todos no mesmo espao de estudo), tendo sido observados resultados distintos em cada uma delas. De forma a apreciar a adequao dos mtodos empregues em cada rea de estudo, foram usadas a Validao Cruzada e a Validao. Atravs da gerao de superfcies conseguiu-se perceber e chegar a alguns resultados, sobre a influncia do efeito de pepita na produo de superfcies. Verificou-se que zonas onde o padro de amostragem mais intenso consegue-se camuflar melhor esse padro utilizando um modelo de semivariograma com um efeito de pepita maior (a superfcie resultante mais polida). Quando o efeito de pepita menor o conjunto total das amostras tem uma influncia menor na gerao da superfcie. No caso de estudo est-se perante uma rea onde existem zonas com um intenso padro de amostragem e zonas onde a amostragem mais dispersa, da que no seja de estranhar que os modelos do semivariograma que apresentaram melhores resultados na validao cruzada, tenham sido aqueles onde se combinaram os modelos com menor e maior efeito de pepita, exponencial e gaussiano respectivamente, juntamente com o modelo esfrico. O modelo esfrico revela-se uma escolha equilibrada, pois como tem um crescimento intermdio consegue gerar melhores superfcies. Este semivariograma revela-se a melhor escolha, quando existe pouca informao sobre a distribuio espacial das amostras, confirmando-se assim a razo de ser o mais usado. Por ltimo resta referir que o semivariograma Combinado gerado
94
30-09-2002
pelo Geostatistical Analyst obteve resultados satisfatrios em quase todas as situaes, apresentando-se como o mais verstil dos semivariogramas usados. Aps a validao teve-se a confirmao que existe uma deriva e que deve ser considerada, pois o KU de 1 ordem apresentou melhores resultados que a KO. Finalmente de realar que a validao, na rea de trabalho, descartou a KU de 2 ordem comprovando assim que existiam estimaes incorrectas nas superfcies geradas. Na aproximao ao Monte da Guia, os melhores resultados alcanados foram a KO com o modelo de semivariograma combinado e a KU com deriva de 1 ordem esfrica, visto aqui tambm existirem zonas que tm muitas amostras e zonas onde as amostras esto mais dispersas. Assim sendo, na validao, os melhores modelos foram os que conseguem que a influncia das amostras seja intermdia ao longo da rea em estudo. de salientar que novamente a KU de 2 ordem foi o pior interpolador pois apresentou erros muito elevados na estimao. Na zona de amostra intensiva a leste do Monte da Guia, o melhor resultado na validao cruzada foi alcanado com o semivariograma exponencial, que se adequa melhor a zonas onde se deve fazer sentir mais a influncia de amostras na sua vizinhana, precisamente porque tem a tendncia para ter um menor efeito de pepita. O algoritmo de Krigagem que melhor resultados apresentou com este semivariograma foi o KU de 1 ordem, o que prova que existe uma deriva e que deve ser tida em conta. Na validao o melhor resultado foi alcanado com a KU de 2 ordem com semivariograma combinado. Pode-se justificar este resultado devido essencialmente zona de amostragem estar numa vertente, ou seja, uma deriva modelada com um polinmio de 2 grau constitui uma melhor aproximao realidade, sendo por isso o modelo que apresenta um erro mdio menor. Por fim, resta referir o efeito que a introduo do erro teve nestes trs casos de estudo. Nos dois primeiros casos de estudo, rea de trabalho e aproximao zona do Monte da Guia, a introduo do erro piorou os modelos pois o efeito de pepita aumentou diminuindo a influncia de medies mais prximas do ponto de estimao. Deste facto resultam superfcies mais lisas e logo com maior impreciso. Na zona a leste do Monte da Guia s em alguns casos da validao se notaram ligeiras melhorias, muito pouco significativas, e que se devem aos ajustes dos efeitos de pepita nos modelos com a introduo dos erros, feitos pelo ArcGis.
95
30-09-2002
CAPTULO VI CONCLUSO
6.1 Estudo de Mercado
A primeira parte deste relatrio, onde foi tomada uma deciso de qual o melhor SIG a adoptar, acabou por ser uma parte primordial no desenvolvimento deste TFC. A escolha, que recaiu sobre o ArcGis, revelou-se uma escolha acertada por inmeras razes; o ArcGis possu um leque de ferramentas que possibilitam realizar bastantes operaes em voga nos SIG. Alm disso traz consigo uma enorme quantidade de documentao, que descreve as funcionalidades e bastantes exerccios que se revelaram indispensveis na compreenso de todas essas funcionalidades. Aliada a isto, vem igualmente, toda uma interface de alto nvel e de fcil manuseamento e que se enquadra nas chamadas WYSIWYG. Outro dos factores que contribuiu para o ArcGis deixar de ser uma opo e passar a ser uma escolha foi a sua enorme escalabilidade. possvel percorrer toda a gama de produtos existentes na famlia ArcGis sem nunca ser perceptvel essa mudana, tal como possvel adoptar um sistema de informao persistente, que pode ir de um simples sistemas de ficheiros a uma base de dados com mltiplos utilizadores, acessvel inclusive pela internet. Para chegar a esta escolha, foi feito um estudo do mercado. Chegou-se concluso que o mercado est em expanso e que actualmente liderado pela ESRI . No deixa contudo, de existir uma grande quantidade de empresas de pequenas dimenses que exploram solues especficas para alguns sectores e que se conseguem manter activas nesses nichos de mercado. No entanto a adopo de um SIG, que est em constante evoluo, com uma empresa de pequenas dimenses poder revelar-se uma escolha fatal. O ArcGis adquirido inclui com trs extenses: o 3D Analyst, o Geostatistical Analyst e o Spatial Analyst. Cedo se tornou claro que a ferramenta que iria ser preponderante no trabalho seria o Geostatistical Analyst.
96
30-09-2002
processo de estimao ou simulao de valores da varivel, identificada com o atributo em estudo, em zonas no amostradas. O conjunto discreto e limitado de dados interpretado como uma realizao de um conjunto de variveis aleatrias, mais precisamente de uma funo aleatria estacionria. Julgar a hiptese de a funo aleatria ser estacionria em relao ao primeiro momento julgar a mdia das amostras como representativa de toda a rea. A KS impe a todos os pontos estimados uma mdia conhecida e constante, ao
contrrio da KO, no reproduzindo to bem as variaes locais de Z(x), isto , tende a atenuar os valores estimados em torno da mdia conhecida. A KO reproduz bastante melhor as mdias locais e, por este motivo, o algoritmo mais usado na prtica geoestatstica. A verso estacionria da KS usada somente, quando se pretende impor uma mdia global para os valores estimados. Por outro lado, julgar a hiptese de a funo aleatria ser estacionria em relao aos segundos momentos, a covarincia e o semivariograma, decidir que o instrumento usado para medir a continuidade ou variabilidade espacial das amostras, o semivariograma experimental, vlido e representativo de toda a rea coberta pelas amostras[13]. As amostras deixam assim de estar relacionadas por uma mdia constante em toda a rea de trabalho e passam a estar correlacionadas. Ainda neste captulo foram apresentados os interpoladores determinsticos e geoestatsticos. Logo a ficou demonstrado a superioridade destes ltimos pois alm de terem em conta a aproximao aos pontos vizinhos, tm em conta tambm o modo como os pontos vizinhos esto correlacionados. No captulo seguinte procedeu-se gerao de superfcies e a todo o processo de iterao na determinao das melhores superfcies. Foram usados quatro semivariogramas (Esfrico, Exponencial, Gaussiano e Combinado), para trs mtodos de Krigagem (Ordinria, Universal com deriva de 1 ordem e Universal com deriva de 2 ordem). Mais uma vez as ferramentas do ArcGis Geostatiscal Analyst revelaram-se de grande importncia, pois permitiram efectuar a triagem de modo a que se chegasse s melhores superfcies. Como primeiro filtro usou-se a Validao Cruzada, apesar deste mtodo no asseverar exactamente a correco de um modelo, permite identificar modelos errados, para a amostragem em causa. Desta feita a Validao Cruzada permitiu identificar a inadquao dos modelos com semivariograma Gaussiano a todos as amostragens estudadas. Permitiu tambm perceber que o semivariograma Exponencial se enquadra melhor em reas mais densamente amostradas. Ficou nesta fase clara a versatilidade dos semivariogramas Esfrico e Combinado que passaram os testes de Validao Cruzada em todas as diferentes reas de estudo. _______________________________________________________________________ Rui Martins, Lus de Sousa
97
30-09-2002
Figura 6.1 Superfcie final gerada com KO e semivariograma Combinado. Uma segunda filtragem foi efectuada usando a Validao, sendo desta feita identificadas incorreces nos mtodos de Krigagem Universal. Estes mtodos tendem a gerar valores extraordinariamente fora do intervalo de amostragem, em zonas de fraca amostragem. Todos os modelos de Krigagem Universal com deriva de 2 ordem foram aqui descartados, e mesmo com deriva de 1 ordem se encontraram anomalias deste gnero. A identificao destas anomalias permite chegar a duas concluses, primeira, a inadquao da Krigagem Universal a amostragens esparsas, e segunda, a limitao, j enunciada da Validao Cruzada. Ficou aqui patente que a Validao Cruzada no avalia por si s, a qualidade das superfcies geradas. por isso imperioso usar, em qualquer processo geoestatstico semelhante, os testes de Validao, mesmo sendo estes muito mais morosos.
98
30-09-2002
Figura 6.2 - Superfcie final gerada com KU 1 ordem e semivariograma Combinado. Os melhores resultados na rea de trabalho completa foram alcanados com a KO e com a KU com deriva de 1 ordem. Ambos os modelos utilizaram semivariogramas combinados, que tendem a simular melhor o facto de existirem zonas com grande intensidade de amostragem e zonas onde a amostragem mais dispersa. Na KU, a deriva, isto , a tendncia que os dados mostram, revelou que este caso de estudo, ser modelada mais correctamente com um polinmio de 1 grau. Na zona do Monte da Guia, os melhores modelos produzidos foram alcanados com a Krigagem Ordinria e semivariograma Combinado e com a Krigagem Universal com deriva de 1 ordem e semivariograma Esfrico. As caractersticas desta amostragem revelaram-se bastante semelhantes amostragem completa, com a Krigagem Universal de 2 ordem a ser mais uma vez descartada pela existncia de valores interpolados anmalos.
99
30-09-2002
Figura 6.4 Monte da Guia gerado com KU 1 ordem e semivariograma Esfrico. Na zona de amostragem intensiva a Leste do Monte da Guia encontraram-se condies algo diversas dos conjuntos de amostras anteriores. As anomalias provocadas pelo mtodo de Krigagem Universal foram bastante menores, obtendo este mtodo bons resultados com _______________________________________________________________________ Rui Martins, Lus de Sousa 100
30-09-2002
deriva de 1 ordem e semivariograma Exponencial, e com deriva de 2 ordem e semivariograma Combinado. Novamente a Krigagem Ordinria com semivariograma Combinado apresentou bons resultados. O aumento da intensidade de amostragem permitiu aos mtodos que anteriormente falharam obter aqui os melhores resultados, sendo de destacar os sucessos do semivariograma Exponencial e da deriva de 2 ordem, que apenas se registaram nestas condies.
Figura 6.5 Resultados na zona a Leste do Monte da Guia Depois da triagem terminada de destacar o sucesso, em todos os diferentes conjuntos de amostras, da Krigagem Ordinria com semivariograma Combinado. Este o mais verstil de todos modelos, tendo bons desempenhos em condies, quer de grande, quer de fraca intensidade de amostragem. O semivariograma Combinado tinha sido j identificado como tal, dado combinar da melhor maneira as caractersticas dos semivariogramas Exponencial e Gaussiano. A versatilidade do mtodo de Krigagem Ordinria vem do facto de ser considerada a deriva apenas numa vizinhana limitada, que se vai adaptando, ao longo da rea de interpolao, s caractersticas dessa mesma vizinhana.
30-09-2002
Figura 6.6 TIN gerado com KO e semivariograma Combinado Por ltimo, foram gerados os melhores modelos para cada conjunto de amostras, considerando um erro de medio com base na varincia registada para cada amostra. Como seria de esperar, a introduo do erro permitiu aplainar as superfcies geradas, mas com o custo de resultados piores quer de Validao quer de Validao Cruzada. Na zona a Leste do Monte da Guia a introduo do erro teve resultados diferentes, no se registando um impacto negativo na qualidade dos modelos, mas as melhorias observadas foram diminutas.
30-09-2002
Figura 6.8 TIN gerado com KU de 1 ordem e semivariograma Combinado A questo mais importante levantada foi o falhano da Krigagem Universal com deriva de 2 ordem nas reas de amostragem maiores. Especialmente na zona envolvente do Monte da Guia seria de esperar que este modelo obtivesse os melhores modelos, dado existir um ponto de altitude dominante. Mas este mtodo gerou aqui valores anmalos, muito para alm do admitido. Estes anomalias esto documentadas nos manuais de Geoestatstica, e praticamente incapacita a Krigagem Universal para conjuntos de amostras mais esparsos. Mais grave ainda _______________________________________________________________________ Rui Martins, Lus de Sousa 103
30-09-2002
o facto de no estudo do fundo dos oceanos a informao ser quase sempre pouco abrangente devido sua extenso. pois pertinente o estudo aprofundado de formas de contornar esta incapacidade da Krigagem Universal. A representao digital da elevao em terra, estudada ha bastante tempo, tendo sido uma das primeiras reas de interesse no mundo dos SIG. Nos dias de hoje, com o auxlio de tcnicas como a Fotografia Area, poucas sero as reas terrestres no documentadas digitalmente. Mas para o fundo do Mar, passa-se quase o oposto. Primeiro, s recentemente se tornou possvel registar informao no Mar, como se faz em terra com fotografia area, e s recorrendo a satlites. Depois h o facto de existirem ainda reas considerveis de fundo dos oceanos por explorar, e acerca dos quais a informao muito escassa, ou mesmo inexistente. Por estas razes o estudo de formas de representar e guardar informao do fundo dos oceanos poder estar ainda nos primeiros passos.
30-09-2002
ANEXO A
A histria dos SIG comea com as primeiras tentativas de representar o mundo num mapa, inicialmente em placas de barro que seriam posteriormente cozidas. Da se evoluiu para os mapas em papiro e mais tarde em papel. Entretanto foram ficando na Histria nomes como Erathotenes (raio da Terra sec. II A.C.), Ptolomeu (mapa Mediterrneo sec. II D.C.), at chegada da era das descobertas. Nos sculos XV e XVI, sucedem uma srie de inovaes que culminam no Atlas de Mercator, considerado como o pai da Cartografia Moderna. No sculo XVIII novas informaes so recolhidas um pouco por todo Mundo, as viagens martimas de investigao levadas a cabo por Cook, a explorao do continente Americano nas colnias que vo tornando independentes, e as primeiras exploraes do corao do continente Africano. No sculo seguinte, do-se uma nova srie de progressos, impulsionados pela disseminao dos Caminhos de Ferro, tanto na Europa como na Amrica. No final deste sculo fundada a National Geografic Society, e so produzidos os primeiros mapas com informao demogrfica em nveis de cor, em 1890 fundada a International Business Machines Cooporation (IBM). No incio do sculo XX comeam a ser usados mapas no estudos das cincias sociais, apoiando reas como a Educao e Economia. Ainda antes da Primeira Guerra Mundial comea a ser usada a tcnica de Fotografia Area, originalmente de bales ou dirigveis, viria a permitir a produo dos primeiros Fotomosaicos. Depois de 1918 d-se a primeira grande revoluo automvel, a sua rpida implantao leva ao aparecimento dos primeiros mapas de estradas. Durante a Segunda Guerra Mundial criado o Colossus, considerado o primeiro computador da Histria, totalmente mecnico, em 1946 fica pronto o ENIAC o primeiro computador elctrico. Em 1949 inventado o primeiro transstor, na dcada de cinquenta dse a primeira fase de miniaturizao electrnica e aparecem os primeiros dispositivos de digitalizao. _______________________________________________________________________ Rui Martins, Lus de Sousa 105
30-09-2002
No incio da dcada de sessenta, ao se deparar com grandes dificuldades em lidar com o crescente volume informao geogrfica disponvel, e necessitando de tomar decises acerca da gesto de recursos naturais, o Governo do Canad inicia um processo que vai levar ao desenvolvimento de um conjunto de programas informticos para compilar toda esta informao. Este considerado o primeiro Sistema de Informao Geogrfica (SIG), e levou criao do Canada Geographic Information Systems. Comeam a ser desenvolvidos uma srie de aplicaes de gesto de recursos e de modelao de fenmenos fsicos, ainda nesta dcada aparecem os primeiros programas de desenho assistido por computador. Nos anos setenta comea a implantar-se a rea de investigao SIG, aparecem as primeiras grandes companhias como a ESRI e ERDAS, so lanados vrios programas de investigao em conjunto com Universidades nos Estados Unidos e so levadas a cabo as primeiras conferncias de SIG. Em 1982 posto venda o primeiro SIG comercial o ARC/INFO 1.0, em 1986 este programa passa a estar disponvel para computadores pessoais, em 1987 saem para o mercado o SPANS e o IDRISI. Em 1992 est venda o ArcView 1.0, os SIG comeam a estar abertos a pessoas sem formao SIG. Quatro anos depois aparece o ArvView 2.0, entra-se em definitivo no poca dos Desktop Mappers, proliferam inmeras empresas especializadas em SIG, em especial nos Estados Unidos. Por esta altura os SIG de maior dimenso j possuem sistemas de gesto de base de dados prprios. Em 1999 os SIG comeam a tornar-se sistemas distribudos, funcionando com bases de dados centralizados a que se ligam inmeras estaes de trabalho. No incio do sculo XXI, os SIG tomam a internet como suporte de trabalho. Aparecem inmeros sites informativos, e so disponibilizadas bases de dados com mapas detalhados de todo o planeta. Esto a ser desenvolvidos projectos no sentido de aproveitar a tecnologia UMTS, para a criao uma nova gerao de SIG prontos a serem usados para qualquer tarefa onde quer que se esteja.
30-09-2002
ANEXO B SEMIVARIOGRAMAS
B.1 rea de Trabalho Completa
Nas figuras que se seguem os Semivariogramas Combinado, Exponencial, Gaussiano e Esfrico, so apresentados pela mesma ordem, de cima para baixo e da direita para esquerda.
B.1.1 Krigagem Ordinria
Figura B.1 Semivariogramas usados com KO na rea de trabalho completa. Tabela B.1 Parmetros dos Semivariogramas de KO na rea de trabalho completa REA DE TRABALHO Semivariograma Semivariograma Semivariograma Esfrico Exponencial Gaussiano 0.020056 0.020056 0.020056 0.0095428 0.011081 0.0076693 223.85 224.49 204.02 8.5899 0 34.768 Semivariograma Combinado 0.019207 0.019207 0 0.23304
30-09-2002
Figura B.2 Semivariogramas usados com Krigagem Universal com deriva de 1 ordem.
Tabela B.2 Parmetros dos Semivariogramas de KU com deriva de 1 ordem. REA DE TRABALHO Semivariograma Semivariograma Semivariograma Esfrico Exponencial Gaussiano 0.010306 0.010306 0.0097127 0.0074095 0.0089625 0.0052593 133.95 127.56 119.43 0 0 15.385 Semivariograma Combinado 0.0098703 0.0098703 0 0.13562
30-09-2002
Figura B.3 Semivariogramas usados com Krigagem Universal com deriva de 2 ordem.
Tabela B.3 - Parmetros dos Semivariogramas de KU com deriva de 2 ordem. Semivariograma Esfrico 0.0074085 0.0043351 59.933 3.3551 REA DE TRABALHO Semivariograma Semivariograma Exponencial Gaussiano 0.0074085 0.0074085 0.0063232 0.0033424 63.55 54.144 0 10.685 Semivariograma Combinado 0.0037369 0.001813 20.992 0.062849
30-09-2002
Tabela B.4 Parmetros dos Semivariogramas de Krigagem Ordinria. ZONA DO MONTE DA GUIA Semivariograma Semivariograma Semivariograma Esfrico Exponencial Gaussiano 0.017384 0.017384 0.017384 0.0084002 0.0096678 0.0065841 237.15 232.37 220.73 7.0924 0 31.887 Semivariograma Combinado 0.016648 0.016648 0 0.24218
30-09-2002
Tabela B.5 Parmetros dos Semivariogramas da KU com deriva de 1 ordem. ZONA DO MONTE DA GUIA Semivariograma Semivariograma Semivariograma Esfrico Exponencial Gaussiano 0.0074069 0.0074069 0.0074069 0.00609 0.0070905 0.0042725 117.52 110.42 111.11 0.44582 0 12.591 Semivariograma Combinado 0.0070934 0.0070934 0 0.11914
30-09-2002
Tabela B.6 Parmetros Semivariogramas da KU com deriva de 2 ordem. ZONA DO MONTE DA GUIA Semivariograma Semivariograma Semivariograma Esfrico Exponencial Gaussiano 0.0028607 0.0028607 0.0022594 0.0023854 0.0028607 0.0018525 39.0323 37.805 34.547 0.49078 0 4.5651 Semivariograma Combinado 0.0028607 0.0028607 27.425 1.4184
30-09-2002
Tabela B.7 Parmetros dos Semivariogramas da Krigagem Ordinria. ZONA A LESTE DO MONTE DA GUIA Semivariograma Semivariograma Semivariograma Esfrico Exponencial Gaussiano 319.24 319.24 319.24 245.34 319.24 219.98 60.239 56.723 60.65 0 0 6.0902 Semivariograma Combinado 305.74 305.74 0 6.0902
30-09-2002
Tabela B.8 Parmetros Semivariogramas da KU com deriva de 1 ordem. ZONA A LESTE DO MONTE DA GUIA Semivariograma Semivariograma Semivariograma Esfrico Exponencial Gaussiano 133.06 133.06 133.06 111.14 97.473 98.681 7.8781 9.144 8.2389 5.236 3.8914 5.773 Semivariograma Combinado 133.06 98.681 8.2389 5.773
30-09-2002
Tabela B.9 Parmetros dos Semivariogramas da KU com deriva de 2 ordem. ZONA A LESTE DO MONTE DA GUIA Semivariograma Semivariograma Semivariograma Exponencial Gaussiano Esfrico 27.522 27.522 27.522 4.2299 4.2299 4.2299 0.38251 0.65663 0.41985 6.1571 6.395 Semivariograma Combinado 26.357 26.357 0 6.395
30-09-2002
ANEXO C DERIVAS
30-09-2002
Figura C.3 Derivas usadas nos modelos da zona a Leste do Monte da Guia
30-09-2002
REFERNCIAS
[1] Kenneth E. Foote e Margaret Lynch. The Geographer's Craft Project, Department of Geography, The University of Colorado at Boulder. Geographic Information Systems as an Integrating Technology: Context, Concepts, and Definitions, 1995. [2] R. Chorley Handling Geographic Information. Report to the Committee of Enquiry, chaired by Lord Chorley HM Stationary Office publication, 1987. [3] Clarke, K. C. Analytical and Computer Cartography, Prentice-Hall, Englewood Cliffs, NJ, 1990. [4] http://www.cesga.es/ [5] David Cowen. NCGIA Notional Conference for Geographical Information Analysis, International Journal of Geographic Information Systems, pp117-136, 1989. [6] 1994 International GIS Sourcebook, GIS World, Inc., Fort Collins, CO., 1994. [7] http://www.daratech.com [8] The Geospatial Technology Report 2001 -GITA [9] Joe Francica, A review of the Geospatial Technology Report 2001 by GITA, Directions Magazine, 16 de Janeiro 2002. [10] C. A. Felgueiras, A. V. Monteiro, E. G. Camargo, G. C. Neto e S. D. Fuks. Integrating Geostatistical Tools in Geographical Information Systems. Em I Brazilian Workshop on GeoInformatics GEO-INFO, Outubro 1999. [11] Kevin Johnston, Jay M. Ver Hoef, Konstantin Krivoruchko, Neil Lucas. Using ArcGis Geostatistical Analyst, ESRI, 2001. [12] ArcGIS Geostatistical Analyst: Statistical Tools for Data Exploration, Modeling, and Advanced Surface Generation. An ESRI White Paper, ESRI, Redlands, CA, Agosto 2001. [13] Amlcar Soares, Geoestatstica para as cincias da terra e do ambiente. Coleco ensino da cincia e da tecnologia, IST Press, Lisboa, 2000. [14] P. Goovaerts, Geostatistic for natural resources evaluation. Oxford University Press, New York, 1997.
30-09-2002
[15] J. P. Chils e P. Delfiner, Geostatistics. Modeling Spatial Uncertainty. Wiley Series in Probability and Statistics. Wiley Interscience Publication, 1999. [16] A .J. Sousa. e F. Muge, Elementos de geoestatstica. Laboratrio de Mineralugia e Planeamento Mineiro, Instituto Superior Tcnico, Universidade Tcnica de Lisboa, 1990. [17] N. Cressie, The Origins of Kriging. Journal Mathematical Geology 22, pp. 239 252, 1990. [18] Jos Mata, Economia da Empresa, Fundao Caloueste Gulbenkian, Lisboa, 2000. [19] Paul A. Samuelson e William D. Nordhaus, Economia, McGraw Hill, Amadora, 1999. [20] Pat Halpin e outros, http://www.env.duke.edu/landscape, Landscape Ecology Lab Janeiro 2002.
Alguns dos stios consultados na internet que contriburam para o desenvolvimento deste trabalho: http://www.gis.com http://www.marinegis.com http://www.gisportal.com http://www.opengis.org http://www.cesga.es http://www.usgs.gov http://www.esri.com http://www.pcigeomatics.com http://www.clarklabs.org http://www3.baylor.edu/grass http://www.intergraph.com http://www.manifold.net http://www.gepower.com