Вы находитесь на странице: 1из 128

Licenciatura em Engenharia Informtica e de Computadores (LEIC)

Departamento de Engenharia Informtica

Trabalho Final de Curso (Ref. TFC/LEIC 01/02 n39)

Relatrio final

Sistema de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

Professor Orientador: Carlos Jorge Ferreira Silvestre Co-Orientador: Paulo Jorge Coelho Ramalho Oliveira Alunos: 44171 Rui Martins 44155 Lus de Sousa ____________________________ ____________________________ ____________________________ ____________________________

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

RESUMO
Dado um conjunto finito de amostras de um dado fenmeno natural, distribudo no espao (como a elevao ou concentrao de ozono no ar), existem vrias formas de interpolar uma superfcie contnua, que o represente no seu todo. O aspecto espacial deste tipo de fenmenos, remete a sua representao num suporte informtico, para os Sistemas de Informao Geogrfica (SIG); rea da informtica desenvolvida ainda na dcada de 1960. Foi analisado o mercado presente dos SIG, considerando estes sistemas como ferramentas, no s de anlise e visualizao de informao espacial, como tambm de gerao dessa mesma informao. Esta anlise levou escolha do ArcGis da ESRI, como suporte informtico a usar. Passou-se depois anlise dos diferentes mtodos a usar na interpolao, onde se destacaram os mtodos Geoestatsticos, nomeadamente os mtodos de Krigagem. Por ltimo foram geradas alguns superfcies, num processo interactivo de refinamento dos modelos geoestatsticos, usando as tcnicas de Validao e Validao Cruzada.

PALAVRAS CHAVE
Sistemas de Informao Geogrfica (SIG) Interpolao de Superfcies Geoestatstica Krigagem Anlise Exploratria Espacial Validao Cruzada Validao Erro de Medio

_______________________________________________________________________ Rui Martins, Lus de Sousa

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

AGRADECIMENTOS

Gostaramos de agradecer a colaborao do Doutor Carlos Silvestre e Doutor Paulo Oliveira pelo apoio e orientao fornecidos ao longo do desenvolvimento deste trabalho. Agradecimentos especiais ao Engenheiro Serralha pelo apoio e solicitude sempre demostrados ao longo destes ltimos 13 meses. Por ltimo agradecemos a todos os colegas que alguma vez, de uma ou de outra maneira contriburam para a progresso deste trabalho.

_______________________________________________________________________ Rui Martins, Lus de Sousa

ii

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

NDICE
RESUMO.I PALAVRAS CHAVE..I AGRADECIMENTOSII NDICE......III LISTA DE FIGURAS....................................................................................VI LISTA DE TABELAS................................................................................ VIII CAPTULO I - INTRODUO .....................................................................1 INTRODUO ...............................................................................................1 1.1 Enquadramento.......................................................................................1 1.2 Objectivos...............................................................................................1 1.3 Estrutura .................................................................................................2 1.4 Resultados ..............................................................................................3 CAPTULO II - SISTEMAS DE INFORMAO GEOGRFICA..............4 2.1 Introduo...............................................................................................4 2.2 O que um SIG? ....................................................................................4
2.2.1 Definio Genrica de SIG ................................................................................. 5 2.2.2 Outras definies de SIG .................................................................................... 5

2.3 Representao da Informao num SIG Vectores/Raster .....................6 2.4 Tipos de Sistemas de Informao Geogrfica........................................9
2.4.1 Sistemas de Informao Geogrfica ................................................................. 10 2.4.2 Funcionalidade do SIG...................................................................................... 10 2.4.3 Desktop Mapper ................................................................................................ 10 2.4.4 Limitaes do DM ............................................................................................ 12 2.4.5 CAD Mapping Systems ..................................................................................... 12 2.4.6 Diferenas SIG-CAD ........................................................................................ 13 2.2.7 Resumo.............................................................................................................. 13

2.5 Para que serve um SIG? .......................................................................14 CAPTULO III - ESTUDO DE MERCADO ................................................16 3.1 Introduo.............................................................................................16 3.2 IDRISI 32 .............................................................................................16
3.2.1 CARTA LINX................................................................................................... 19 3.2.2 Concluses ........................................................................................................ 19

3.3 ARCGIS ...............................................................................................20


3.3.1 Aplicaes do ArcGIS Desktop ........................................................................ 21 3.3.2 Extenses do ArcGIS ........................................................................................ 21

3.4 GRASS .................................................................................................23 3.5 GEOMATICA ......................................................................................24


3.5.1 FOCUS.............................................................................................................. 24 3.5.2 OrthoEngine ...................................................................................................... 26 3.5.3 PCI Modeler ...................................................................................................... 26 3.5.4 FLY!.................................................................................................................. 27 3.5.5 EASI.................................................................................................................. 27 _______________________________________________________________________ Rui Martins, Lus de Sousa

iii

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

3.4.6 Concluses ........................................................................................................ 28

3.6 Estrutura do Mercado dos SIG .............................................................29


3.6.1 Estrutura do Mercado em 1994......................................................................... 29 3.6.2 Estrutura do Mercado em 1999......................................................................... 31 3.6.3 Estrutura do Mercado em 2000......................................................................... 32 3.5.4 Outros dados referentes ao Mercado................................................................. 33 3.6.5 Concluses ........................................................................................................ 34

3.7 Comparao e Escolha .........................................................................34 CAPTULO IV - INTERPOLAO DE SUPERFCIES ............................36 4.1 Introduo.............................................................................................36 4.2 Mtodos Determinsticos......................................................................36
4.2.1 Inverso da Potncia das Distncias (Inverse Distance Weighting - IDW) ...... 37 4.2.2 Interpolao Polinomial Global ........................................................................ 39 4.2.3 Interpolao Polinomial Local .......................................................................... 40 4.2.4 Funes de Base Radial (Radial Basis Functions -RBF) ................................. 41 4.3.5 Concluses ........................................................................................................ 43

4.2 Geoestatstica........................................................................................43
4.2.1 Introduo ......................................................................................................... 43 4.2.2 Modelo Geoestatstico....................................................................................... 44 4.2.2.1 Funo Aleatria Estacionria................................................................... 45 4.2.2.2 Estacionariedade do Semivariograma e da Covarincia espacial.............. 45 4.2.3 Anlise Estrutural.............................................................................................. 46 4.2.3.1 Parmetros do Semivariograma................................................................. 47 4.2.3.2 Modelo Esfrico......................................................................................... 49 4.2.3.3 Modelo Exponencial.................................................................................. 49 4.2.3.4 Modelo Gaussiano ..................................................................................... 49 4.2.3.5 Modelos de Anisotropia............................................................................. 50 4.2.3.6 O que se v num Semivariograma ............................................................. 51 4.2.4 Estimao algoritmos de interpolao de krigagem ...................................... 51 4.2.4.1 Krigagem Simples ..................................................................................... 53 4.2.4.2 Krigagem Ordinria ................................................................................... 54 4.2.4.3 Krigagem Universal................................................................................... 54 4.2.5 Consideraes sobre os ponderadores do estimador de krigagem .................... 55

4.3 Concluso .............................................................................................56 CAPTULO V - GERAO DE SUPERFCIES.........................................58 5.1 Integrao dos Dados ...........................................................................58 5.2 Anlise Exploratria Espacial ..............................................................62
5.2.1 Descrio Univariada das amostras .................................................................. 63 5.2.2 Descrio Espacial ............................................................................................ 65 5.2.3 Mapas de Voronoi............................................................................................. 67

5.3 Gerao de Superfcies.........................................................................69


5.3.1 Modelos de Semivariograma ............................................................................ 70 5.3.2 Validao Cruzada ............................................................................................ 73 5.3.3 Semivariograma Esfrico .................................................................................. 74 5.3.4 Semivariograma Exponencial ........................................................................... 75 5.3.5 Semivariograma Gaussiano............................................................................... 76 5.3.6 Semivariograma Combinado............................................................................. 76 5.3.7 Melhores Modelos depois da Validao Cruzada............................................. 77 _______________________________________________________________________ Rui Martins, Lus de Sousa

iv

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

5.5.8 Validao .......................................................................................................... 78

5.4 Zona Circundante do Monte da Guia ...................................................79


5.4.1 Amostra............................................................................................................. 79 5.4.2 Descrio univariada e espacial da zona do Monte da Guia............................. 80 5.4.3 Resultados da Validao Cruzada..................................................................... 81 5.4.4 Validao .......................................................................................................... 83

5.5 Zona de Amostragem Exaustiva a Leste ..............................................83


5.5.1 Amostra............................................................................................................. 83 5.5.2 Descrio univariada e espacial da zona a leste do Monte da Guia.................. 84 5.5.3 Resultados da Validao Cruzada..................................................................... 85 5.5.4 Validao .......................................................................................................... 87

5.6 Erro de Medio ...................................................................................88


5.6.1 Amostra Completa ............................................................................................ 90 5.6.2 Monte da Guia................................................................................................... 91 5.6.3 Zona Leste......................................................................................................... 92

5.7 Concluso .............................................................................................94 CAPTULO VI - CONCLUSO...................................................................96 6.1 Estudo de Mercado...............................................................................96 6.2 Interpolao de Superfcies ..................................................................96 6.3 Trabalho Futuro..................................................................................103 ANEXO A BREVE HISTRIA DOS SIG ..............................................105 ANEXO B - SEMIVARIOGRAMAS .........................................................107 B.1 rea de Trabalho Completa...............................................................107
B.1.1 Krigagem Ordinria........................................................................................ 107 B.1.2 Krigagem Universal com deriva de 1 ordem ................................................ 108 B.1.3 Krigagem Universal com deriva de 2 ordem ................................................ 109

B.2 Zona do Monte da Guia .....................................................................110


B.2.1 Krigagem Ordinria........................................................................................ 110 B.2.2 Krigagem Universal de 1 Ordem .................................................................. 111 B.2.3 Krigagem Universal com deriva de 2 ordem ................................................ 112

B.3 Zona a Leste do Monte da Guia.........................................................113


B.3.1 Krigagem Ordinria........................................................................................ 113 B.3.1 Krigagem Universal com deriva de 1 ordem ................................................ 114 B.3.3 Krigagem Universal com deriva de 2 ordem ................................................ 115

ANEXO C - DERIVAS ...............................................................................116 C.1 rea de Trabalho Completa...............................................................116 C.2 Zona do Monte da Guia .....................................................................116 C.3 Zona a Leste do Monte da Guia.........................................................117 REFERNCIAS...........................................................................................118

_______________________________________________________________________ Rui Martins, Lus de Sousa

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

LISTA DE FIGURAS
Figura 2.1 Representao Vectorial. ....................................................................................... 7 Figura 2.2 Mapa de Densidade Populacional na Holanda, representado por vectores. .......... 8 Figura 2.3 Pormenor de uma camada raster representando o relevo da Serra de Gredos ...... 8 Figura 2.4 Diferenas entre as duas formas de representao do mundo num SIG ................ 9 Figura 3.1 Exemplo de Anlise com Programao por Filtros ............................................. 18 Figura 3.2 Sistema ArcGis .................................................................................................... 20 Figura 3.3 Escalabilidade do sistema ArcGis........................................................................ 20 Figura 3.4 Horizontalidade das Extenses ............................................................................ 22 Figura 3.5 Janela do FOCUS................................................................................................. 25 Figura 3.6 PCI Modeler......................................................................................................... 26 Figura 3.7 Grfico da Estrutura de Mercado em 1994 .......................................................... 30 Figura 3.8 Grfico da Estrutura de Mercado em 1999 .......................................................... 31 Figura 3.9 Grfico da Estrutura de Mercado em 2000.......................................................... 32 Figura 4.1 Vizinhana elptica .............................................................................................. 38 Figura 4.2 Superfcie gerada por IDW .................................................................................. 39 Figura 4.3 Superfcies geradas por polinomiais globais ....................................................... 39 Figura 4.4 - Superfcie gerada por polinomiais locais ............................................................. 40 Figura 4.5 Superfcie gerada por RBF .................................................................................. 41 Figura 4.6 RBF versus IDW.................................................................................................. 41 Figura 4.7 Exemplo RBF com 3 amostras ............................................................................ 42 Figura 4.8 Parmetros do Semivariograma ........................................................................... 48 Figura 4.9 Representao grfica de modelos transitivos normalizados .............................. 49 Figura 4.10 - Representao grfica da anisotropia geomtrica .............................................. 50 Figura 4.11 - Representao grfica da anisotropia zonal ....................................................... 51 Figura 4.12 Semivariogramas em amostras diferentes.......................................................... 51 Figura 4.13 Krigagem Simples.............................................................................................. 53 Figura 4.14 Krigagem Ordinria ........................................................................................... 54 Figura 4.15 Krigagem Universal com deriva de 2 Ordem ................................................... 55 Figura 4.16 Diferenas entre mtodos Geostatsticos e Determinsticos .............................. 56 Figura 5.1 Shapefiles linha da costa, batimetria, enrocamento e afloramento rochoso. ....... 58 Figura 5.2 Shapefiles e Mapa georeferenciado. .................................................................... 59 Figura 5.3 Pontos de referncia para projeco .................................................................... 60 Figura 5.4 Shapefiles, Mapa georeferenciado e Pontos de leitura. ....................................... 61 Figura 5.5 Shapefiles, pontos de leitura, pontos de batimetria e altimetria .......................... 62 Figura 5.6 Histograma inicial................................................................................................ 63 Figura 5.7 Histograma aps a introduo de pontos ............................................................. 65 Figura 5.8 Deriva nos dados iniciais ..................................................................................... 65 Figura 5.9 Deriva aps a incluso de pontos......................................................................... 66 Figura 5.10 Deriva Noroeste - Sudoeste ............................................................................... 66 Figura 5.11 Exemplo de um Mapa de Voronoi..................................................................... 67 Figura 5.12 Mapas Voronoi Simples, inicial (esquerda) e com pontos adicionais (direita) . 68 Figura 5.13 Mapas Voronoi IQR, inicial (esquerda) e com pontos adicionais (direita) ....... 68 Figura 5.14 Mapas Voronoi Aglomerado, inicial (esquerda) e pontos adicionais (direita) .. 69 Figura 5.15 Mapas Voronoi Mdia, inicial (esq) e com pontos adicionais (dir)................... 69 Figura 5.16 Krigagem ordinria com modelo exponencial e com modelo gaussiano .......... 71 _______________________________________________________________________ Rui Martins, Lus de Sousa vi

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 5.17 Modelo gaussiano esquerda e modelo exponencial direita ........................... 71 Figura 5.18 Krigagem Universal com deriva de primeira ordem ......................................... 72 Figura 5.19 Krigagem Universal com deriva de segunda ordem .......................................... 73 Figura 5.20 Grfico de Validao Cruzada........................................................................... 73 Figura 5.21 Sub-amostra do Monte da Guia ......................................................................... 79 Figura 5.22 Histograma da sub-amostra do Monte da Guia ................................................. 80 Figura 5.23 Deriva dos dados na zona do Monte da Guia .................................................... 80 Figura 5.24 Mapas Voronoi Aglomerado (esquerda) e IQR (direita) ................................... 81 Figura 5.25 Sub-amostra a Leste do Monte da Guia............................................................. 84 Figura 5.26 Histograma do zona leste do Monte da Guia..................................................... 85 Figura 5.27 Deriva dos dados no zona leste do Monte da Guia........................................... 85 Figura 5.28 RBF (esquerda), Polinomial Local (centro) e KU 1 Ordem (direita) ............... 87 Figura 5.29 Conjunto de pontos com igual latitude e longitude ........................................... 89 Figura 6.1 Superfcie final gerada com KO e semivariograma Combinado. ........................ 98 Figura 6.2 - Superfcie final gerada com KU 1 ordem e semivariograma Combinado. ......... 99 Figura 6.3 Monte da Guia gerado com KO e semivariograma Combinado........................ 100 Figura 6.4 Monte da Guia gerado com KU 1 ordem e semivariograma Esfrico.............. 100 Figura 6.5 Resultados na zona a Leste do Monte da Guia .................................................. 101 Figura 6.7 TIN do Monte da Guia gerado com KO e semivariograma Combinado ........... 102 Figura 6.8 TIN gerado com KU de 1 ordem e semivariograma Combinado..................... 103 Figura B.1 Semivariogramas usados com KO na rea de trabalho completa. .................... 107 Figura B.2 Semivariogramas usados com Krigagem Universal com deriva de 1 ordem. . 108 Figura B.3 Semivariogramas usados com Krigagem Universal com deriva de 2 ordem. . 109 Figura B.4 Semivariogramas usados com KO na rea do Monte da Guia.......................... 110 Figura B.5 Semivariogramas da KU com deriva de 1 ordem na zona do Monte da Guia. 111 Figura B.6 Semivariogramas da KU com deriva de 2 ordem na zona do Monte da Guia. 112 Figura B.7 Semivariogramas da Krigagem Ordinria da zona a Leste do Monte da Guia. 113 Figura B.8 Semivariogramas da Krigagem Universal com deriva de 1 ordem. ................ 114 Figura B.9 Semivariogramas da Krigagem Universal com deriva de 2 ordem. ................ 115 Figura C.1 Derivas usadas nos modelos da amostragem completa..................................... 116 Figura C.2 Derivas usadas nos modelos da zona do Monte da Guia .................................. 116

_______________________________________________________________________ Rui Martins, Lus de Sousa

vii

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

LISTA DE TABELAS
Tabela 3.1 - Prefixos dos comandos existentes no Grass......................................................... 24 Tabela 3.2 - Nmero de Licenas Activas em 1994 ................................................................ 29 Tabela 3.2 - Factores de Escolha.............................................................................................. 35 Tabela 5.1 Pontos auxiliares de projeco ............................................................................ 60 Tabela 5.2 Validao Cruzada para Semivariograma Esfrico............................................. 75 Tabela 5.3 - Validao Cruzada para Semivariograma Exponencial....................................... 76 Tabela 5.4 - Validao Cruzada para Semivariograma Gaussiano .......................................... 76 Tabela 5.5 - Validao Cruzada para Semivariograma Combinado ........................................ 77 Tabela 5.6 - Resultados mais significativos ............................................................................. 77 Tabela 5.7 Validao para melhores modelos....................................................................... 78 Tabela 5.8 Resultados mais significativos no Monte da Guia .............................................. 82 Tabela 5.9 Validao para a zona do monte da Guia ............................................................ 83 Tabela 5.10 Resultados mais significativos na Zona a Leste................................................ 85 Tabela 5.11 Validao Cruzada para Mtodos Determinsticos ........................................... 86 Tabela 5.12 Validao para a zona Leste............................................................................. 87 Tabela 5.13 Tratamento da varincia fornecida para amostra completa............................... 89 Tabela 5.14 Validao Cruzada com e sem Erro de Medio na Amostra Completa .......... 90 Tabela 5.15 Validao com Erro de Medio na Amostra Total .......................................... 91 Tabela 5.16 - Validao Cruzada com e sem Erro de Medio na zona do Monte da Guia... 91 Tabela 5.17 Validao com Erro de Medio para o Monte da Guia ................................... 92 Tabela 5.18 - Validao Cruzada com e sem Erro de Medio na Zona Leste ...................... 93 Tabela 5.19 Validao com Erro Medio na zona Leste...................................................... 93 Tabela B.1 Parmetros dos Semivariogramas de KO na rea de trabalho completa .......... 107 Tabela B.2 Parmetros dos Semivariogramas de KU com deriva de 1 ordem. ................. 108 Tabela B.3 - Parmetros dos Semivariogramas de KU com deriva de 2 ordem................... 109 Tabela B.4 Parmetros dos Semivariogramas de Krigagem Ordinria............................... 110 Tabela B.5 Parmetros dos Semivariogramas da KU com deriva de 1 ordem. ................. 111 Tabela B.6 Parmetros Semivariogramas da KU com deriva de 2 ordem......................... 112 Tabela B.7 Parmetros dos Semivariogramas da Krigagem Ordinria............................... 113 Tabela B.8 Parmetros Semivariogramas da KU com deriva de 1 ordem......................... 114 Tabela B.9 Parmetros dos Semivariogramas da KU com deriva de 2 ordem. ................. 115

_______________________________________________________________________ Rui Martins, Lus de Sousa viii

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

CAPTULO I INTRODUO
1.1 Enquadramento
Desde sempre o Homem sentiu necessidade de representar o mundo que o rodeia. As primeiras representaes do mundo conhecido comearam por ser desenhadas em placas de barro que depois eram cozidas. Os mapas passaram depois a ser desenhos em suportes mais familiares (como o papiro ou o couro), que evoluram ao longo do tempo, quer nas tcnicas de desenho usadas, quer nas dimenses e formas do mundo representado. Lentamente os mapas tornaram-se em mais do que figuras, transformaram-se em ferramentas complexas de anlise. Com o aparecimento dos computadores estas ferramentas passaram a ter suporte digital, e tornando-se, deste modo, acessveis a mais pessoas. Esta evoluo culmina no aparecimento dos primeiros Sistemas de Informao Geogrfica (SIG), durante a dcada de 1960, depois de uma srie de inovaes tecnolgicas, quer no Hardware, quer no Software dos computadores de ento. Os SIG fazem j parte do dia a dia moderno, embora tal no seja completamente perceptvel. A maioria das empresas de grande ou mdia dimenso tm departamentos SIG, ou requerem servios nesta rea. Os SIG so usados em muitos pases como poderosas ferramentas de gesto e governao, a nvel das Cmaras Municipais. A sua flexibilidade permite aos SIG tratar de qualquer tipo de informao que tenha um componente geogrfico, e nos dias de hoje quase todo o tipo de informao se pode ligar a informao geogrfica. O desenvolvimento dos SIG apresenta ainda grandes desafios s Cincias da Informtica, no s na criao de novas ferramentas que beneficiem de tecnologias mais recentes, como na sua integrao apropriada nos domnios de anlise. Este uma rea em franco desenvolvimento e expanso, apresentando boa razes de investigao.

1.2 Objectivos
O Objectivo deste Trabalho Final de Curso desenvolver um Sistema de Informao Geogrfica, de modo a que este represente a informao tridimensional obtida, durante as

_______________________________________________________________________ Rui Martins, Lus de Sousa

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

operaes de diversos veculos robticos autnomos. Esta informao ser processada para mostrar a sua posterior utilizao no sistema de controlo de misso dos veculos. Com base num sistema SIG disponvel comercialmente, assente numa base de dados pretende-se estudar as caractersticas dos dados disponveis, e estudar a melhor forma de os representar.

1.3 Estrutura
Este documento encontra-se organizado em seis captulos, o primeiro dos quais constitudo pela presente introduo. Aqui se apresenta o enquadramento e a motivao que deram origem a este trabalho, so apresentados os objectivos a atingir, delineada a estrutura do relatrio e enunciam-se os resultados do trabalho desenvolvido. O segundo captulo introduz conceitos bsicos de SIG, caractersticas bases e funes deste tipo de sistemas. So aqui delimitados os diferentes tipos de SIG existentes no mercado, e apresentadas as diferentes orientaes de cada um deles. No terceiro captulo so analisados alguns sistemas presentemente no mercado, tendo em vista os objectivos finais do trabalho. igualmente analisada a estrutura passada e presente do mercado dos SIG. Por fim so comparados os diferentes SIG estudados e efectuada uma escolha perante certos critrios, de acordo com os objectivos a atingir. O quarto captulo apresenta as diferentes tcnicas de interpolao de superfcies, a partir de um conjunto finito de amostras. So apresentados os mtodos Determinsticos e Geoestatsticos, e o modelo matemtico que permite efectuar a anlise do caso de estudo. No quinto captulo, so postos em prtica os modelos estudados no captulo pretrito. So seleccionadas trs zonas de anlise na rea de estudo, para as quais se procede anlise exploratria espacial. So ento aplicados os mtodos de interpolao, e filtrados os resultados usando, primeiramente a Validao Cruzada, e por ltima a Validao. No ltimo e sexto captulo so discutidos os resultados obtidos, perante as opes tomadas. So igualmente apresentados alguns dos resultados finais.

_______________________________________________________________________ Rui Martins, Lus de Sousa

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

1.4 Resultados
Este trabalho levou obteno dos seguintes resultados: ?? Ficheiros em formato TIN (Triangulated Irregular Network) das superfcies finas geradas ?? Camadas SIG geoestatsticas das superfcies geradas (formato Arc/Info - layer) ?? Conjuntos de teste e de treino usados na Validao, bem como as respectivas camadas vector geradas (formato Arc/Info - shapefile)

_______________________________________________________________________ Rui Martins, Lus de Sousa

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

CAPTULO II SISTEMAS DE INFORMAO GEOGRFICA


2.1 Introduo
Nos ltimos anos diversas organizaes tm vindo a investir grandes recursos no desenvolvimento de bases de dados referenciados geograficamente, e em Sistemas de Informao Geogrfica. previsvel que durante os prximos anos se invistam vrios milhes de Euros nesta rea. Tudo isto est a acontecer num perodo de tempo relativamente curto, pois no h muito tempo os SIG eram ferramentas muito especializadas, s nas mos de algumas, poucas organizaes, sendo uma mera curiosidade para o pblico em geral. Podem ser dadas duas explicaes a esta rpida expanso dos SIG: - a primeira reside na queda dos custos dos equipamentos informticos necessrios, que cada dia os faz mais acessveis para um maior nmero de utilizadores; - a segunda, e de maior importncia, de que a geografia (e os dados que servem para a quantificar) j fazem parte do nosso mundo quotidiano; a maioria das decises que tomamos diariamente esto em relao com, ou influenciadas por, um facto geogrfico. Os auto-tanques de bombeiros, por exemplo, so enviados ao seu destino atravs da rota mais curta possvel, as atribuies econmicas dos governos aos entes locais baseiam-se frequentemente na distribuio geogrfica da populao, ou as doenas epidmicas que so estudadas graas identificao das reas onde se produzem e da velocidade a que se expandem.

2.2 O que um SIG?


O uso dos Sistemas de Informao Geogrfica aumentou bastante nas dcadas de oitenta e noventa; passaram do total desconhecimento prtica quotidiana no mundo dos negcios, nas universidades e nos organismos governamentais, sendo usados para resolver problemas

diversos. lgico, portanto, que foram propostas vrias definies.[20]

_______________________________________________________________________ Rui Martins, Lus de Sousa

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica


2.2.1 Definio Genrica de SIG

30-09-2002

Sistema: um framework para manipular, pesquisar, analisar e disseminar informao. Informao: dados processados de uma forma utilizvel. Geogrfico: dados referenciados espacialmente. Um SIG uma base de dados digital no qual uma comum coordenada espacial o principal meio de referncia. Os SIG requerem[1]: . Entradas de dados provenientes de mapas, fotos areas, satlites e outras fontes; . Armazenamento e pesquisa de dados; . Transformao de dados, anlise e modelao, incluindo estatsticas espaciais; . Sadas de dados, tal como mapas, relatrios e planos. Trs observaes acerca desta definio: Primeira: os SIG esto relacionados com outras aplicaes de base de dados, mas com uma diferena importante. As bases de dados dos SIG usam referncias geogrficas como o principal meio de guardar e aceder a informao. Segunda: os SIG integram tecnologia. Onde outras tecnologias podem ser usadas apenas para analisar fotos areas e imagens de satlite, de modo a criarem modelos estatsticos, ou para desenhar mapas, estas capacidades so conjuntamente oferecidas com um SIG. Terceira: um SIG com o seu conjunto de funes, deve ser visto como um processo e no meramente como software ou hardware. Os SIG servem para tomar decises. O modo como os dados so armazenados e analisados dentro de um SIG deve reflectir a maneira como a informao ir ser usada numa tarefa especfica ou na tomada de uma deciso[1].
2.2.2 Outras definies de SIG

- Um sistema para capturar, armazenar, comprovar, integrar, manipular, analisar e visualizar dados que esto espacialmente georeferenciados.[2]. - Sistemas automatizados para a captura, armazenagem, composio, anlise e visualizao de dados espaciais[3]. - Um sistema de hardware, software e procedimentos desenhados para suportar a captura, gesto, manipulao, anlise, modelado e visualizao de dados espacialmente referenciados para resolver problemas complexos de planeamento e gesto[4].

_______________________________________________________________________ Rui Martins, Lus de Sousa

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Uma das razes porque to difcil existir acordo numa nica definio de SIG por existirem diversas vertentes em que podem ser aplicados, cada uma para diferentes propsitos e para diferentes tipos de tomada de decises. *AM/FM (Automated Mapping and Facilities Management) AM/FM no so geralmente utilizados para anlise espacial, e faltam-lhes a topologia das estruturas de dados dos SIG. * CAD (Computer-Aided Design) Sistemas projectados para desenho. Tratam dados espaciais como grficos em vez de os tratarem como informao. * LIS (Land Information System) * Multipurpose Cadastre: Sistemas que guardam informao sobre parcelas de terra. De um ponto de vista prtico um Sistema de Informao Geogrfica um sistema informtico capaz de realizar uma gesto completa de dados geogrficos referenciados. Por referenciados entende-se que estes dados geogrficos ou mapas tm coordenadas geogrficas reais associadas, permitindo-nos estas manejar e fazer anlises com dados reais como longitudes, permetros ou reas. Todos estes dados alfanumricos associados aos mapas em conjunto com os que queiramos acrescentar so geridos por uma base de dados integrada no SIG. O que distingue os SIG de outros tipos de sistemas de informao, tal como bases de dados e spreadsheets, que os SIG lidam com informao espacial. Os SIG tm capacidade de relacionar diferentes camadas de informao (layers) para o mesmo ponto, combinando, analisando e, finalmente apresentar os resultados. A informao espacial usa a localizao, num sistema de coordenadas, como a sua referncia base.

2.3 Representao da Informao num SIG Vectores/Raster


Os dados nos SIG usualmente so guardados em mais do que uma camada de informao denominadas layers, de modo a que os problemas tcnicos causados por se tratarem grandes volumes de informao em simultneo sejam atenuados. mais fcil trabalhar em problemas de anlise espacial complexos com um layer de cada vez, do que ter que manipular todo um volume de informao redundante. O que os layers permitem separar todo esse volume de

_______________________________________________________________________ Rui Martins, Lus de Sousa

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

informao em camadas. Este um aspecto importante dos SIG, que conhecido como integrao de dados. Qualquer actividade econmica ou social com uma dimenso espacial no pode ser correctamente entendida sem as suas qualidades espaciais serem referenciadas. A informao espacial tem duas partes essenciais: localizao e propriedades (atributos). Na localizao alm da latitude e longitude podem ser usados outros tipos de convenes. Os atributos servem, como o prprio nome indica, para descreverem propriedades ou caractersticas de pontos geogrficos. Esses atributos normalmente so guardados em tabelas. Os SIG guardam e processam dados em dois formatos, vectorial e raster (este um termo da lngua inglesa, infelizmente no existe qualquer equivalente em portugus).

Figura 2.1 Representao Vectorial. No modelo vectorial, o mundo simulado como um mosaico de linhas e pontos interligados representando a localizao e fronteiras de entidades geogrficas. Os dados so representados por arcos, polgonos, pontos e ns. A principal vantagem do formato de dados vectorial que permite uma representao precisa, o que muito til em actividades tais como engenharia. Tambm possvel nos SIG baseados no modelo vectorial definir relaes espaciais de conectividade e adjacncia. Contudo, a maior desvantagem de dados vectoriais que as fronteiras dos mapas de polgonos resultantes so discretas, onde na realidade os mapas de polgonos podem representar alteraes graduais tal como mapas de solo.

_______________________________________________________________________ Rui Martins, Lus de Sousa

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 2.2 Mapa de Densidade Populacional na Holanda, representado por vectores. Ao invs, nos modelos raster (mapas de pixels), a resoluo depende do tamanho do pixel, logo a resoluo pode ir ate onde se desejar. Este modelo torna-se mais adequado quando o detalhe essencial.

Figura 2.3 Pormenor de uma camada raster representando o relevo da Serra de Gredos Cada camada raster na realidade uma matriz bidimensional, em que para cada clula existe um valor nico que corresponde a uma nica caracterstica representada. Esta a representao tradicional de imagens em formato digital, pois de facto uma imagem digital sempre representada por um conjunto de pixels. Este formato o mais usado para representar caracterstica como a elevao do terreno. _______________________________________________________________________ Rui Martins, Lus de Sousa

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

A principal desvantagem das camadas raster em relao s camadas vectoriais o facto de ocuparem muito mais espao. Se por exemplo quisermos representar uma estrada teremos que ter um ficheiro que indique para uma dada zona quais os pixels que fazem parte da estrada e quais no fazem, isto equivale a uma tabela. Essa mesma estrada pode ser representado por uma simples linha num modelo vectorial, o que numa base de dados equivale unicamente a uma linha de uma tabela. Podemos ainda referir que para uma camada raster necessitamos de uma tabela para representar uma nica caracterstica geogrfica, ao passo que numa camada vectorial, uma tabela pode conter dados a cerca de inmeras caractersticas.

Figura 2.4 Diferenas entre as duas formas de representao do mundo num SIG

2.4 Tipos de Sistemas de Informao Geogrfica


O termo SIG abrange sistemas muito variados, aplicando-se muitas vezes a aplicaes que no so propriamente um SIG. Podem-se distinguir trs tipos de programas que, embora possam denominar-se conjuntamente SIG tm diferenas fundamentais no seu mbito de aplicao. Em primeiro lugar distinguiremos um SIG propriamente dito, como um grande sistema informtico que gere completamente uma base de dados geogrficos. Por outro lado delimitaremos as aplicaes, s quais foi dado o nome de Desktop Mappers (DM) - sistemas de anlise e visualizao integrados entre as aplicaes Desktop de computador pessoal. Finalmente distinguiremos os sistemas de Desenho assistido por Computador (CAD) e sistemas semelhantes.

_______________________________________________________________________ Rui Martins, Lus de Sousa

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica


2.4.1 Sistemas de Informao Geogrfica

30-09-2002

Um SIG em sentido completo gere uma base de dados espacial. Permite a criao e estruturao dos dados partindo de fontes de informao como os mapas, a digitalizao, bases de dados existentes, etc. Para alm de possibilitar a anlise, visualizao e edio em mapas da base de dados, um SIG conta com ferramentas que permitem criar novos dados derivados dos existentes. 2.4.2 Funcionalidade do SIG - Construir dados geogrficos: Mediante dados geomtricos existentes em CAD, ou capturando-os por digitalizao, vectorizao de imagens, GPS, etc. O sistema permite depur-los e estrutur-los topologicamente, associando-os com bases de dados alfanumricas. Desta forma obter-se-o dados espaciais preparados para o seu uso na anlise. - Modelao cartogrfica: Criao de novos mapas a partir de mapas existentes: Combinando atributos do terreno como pendentes, vegetao, tipo de solo, etc. Mediante um modelo matemtico, podem-se criar novas variveis, como um ndice de eroso, de perigo de incndios, etc. - O SIG permite-nos analisar os mapas estruturados em combinao com bases de dados associadas. Podem ser interrogados para seleccionar os dados de interesse, ver os resultados interactivamente escolhendo a simbologia em funo dos atributos associados e produzir cartografia de qualidade. Tambm se podem preparar aplicaes medida, como um plano de controlo de incndios, de avaliao de impactos ambientais, um modelo que preveja a evoluo de um incndio ou de um alagamento, aplicaes verticais, como um sistema de gesto municipal ou uma aplicao para uma central elctrica, etc. 2.4.3 Desktop Mapper Recentemente tm aparecido aplicaes simples de visualizao e anlise de dados com componente espacial para sistemas micro-computadores. Como de esperar estes sistemas apresentam um custo inferior a um SIG completo. A denominao habitual destas aplicaes em ingls Desktop Mapper (DM), que significa algo como "Cartografia de escritrio". Em primeiro lugar, estas ferramentas permitem o uso de dados espaciais (possivelmente criados e estruturados com um SIG) por parte de utilizadores que no so peritos em programao, cartografia, geologia, etc., da mesma forma como estes mesmos utilizadores empregam _______________________________________________________________________ Rui Martins, Lus de Sousa

10

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

processadores de textos, folhas de clculo ou bases de dados, sem quaisquer conhecimentos de topografia, manuteno, teoria de computao, etc. Fundamentalmente os DM permitem ver e analisar a estrutura espacial dos dados. Por outro lado, estas aplicaes servem tambm de veculo para a criao de aplicaes concretas que trabalhem com dados espaciais com por exemplo uma aplicao que gira um inventrio da fauna de uma certa zona protegida ou uma aplicao vertical para um banco. Grande parte da capacidade de adequao destes produtos deriva das possibilidades de integrao com outras aplicaes atravs dos mecanismos fornecidos por ambientes de trabalho como Microsoft Windows, Mac OS, OS/2 PM, Windows NT e X Windows. Desta maneira, e conjuntamente com aplicaes especficas, podem-se criar contornos de trabalho verticais que resolvam grande parte dos problemas de um determinado profissional, integrando-se a anlise e visualizao espacial com a preparao de documentos, modelos de clculo, etc. Da mesma maneira, podem-se incorporar dados no geridos directamente pelo DM, como por exemplo, imagem de vdeo ou fotografias. Este tipo de aplicao tem um mercado potencial muito mais amplo que um SIG tradicional, pelas mesmas razes que o tm os processadores de texto, folhas de clculo ou bases de dados. Permitem criar um modelo geogrfico do funcionamento dum negcio ou organizao. O facto de que grande parte das bases de dados existentes usem dados geogrficos - estima-se que mais do 85 % contenham um componente geogrfico - permite que o DM mostre padres, relaes e tendncias que de outra maneira seriam dificilmente detectveis. Actualmente os DM usam-se em: departamentos de marketing, vendas, distribuio e retalho, telecomunicaes, propriedade imobiliria, planeamento, seguros, servios de urgncia (bombeiros, polcia), sade, e administrao local. Um requisito bsico para estas aplicaes serem exploradas que junto com a aplicao se administrem os dados espaciais bsicos referidos rea de interesse do cliente, de forma j estruturada. (Mapas de municpios, infra-estruturas, dados topogrficos, urbanos...). Assim vm a ser ferramentas de explorao dos dados gerados por um SIG. Normalmente sero utilizadores de SIG os que disponibilizaro os dados e as aplicaes para um sistema DM. No que diz a respeito ao uso de um DM como complemento de um SIG, h que distinguir que algumas ferramentas DM trabalham directamente com as bases de dados dum SIG determinado, enquanto que outras requerem um formato prprio. No segundo caso, se se quer utilizar o DM como visualizador dum SIG determinado deve-se estabelecer primeiro um mecanismo que adapte os dados do SIG aos requerimentos e estruturao do DM. _______________________________________________________________________ Rui Martins, Lus de Sousa

11

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica 2.4.4 Limitaes do DM - No pode criar novos mapas por digitalizao,

30-09-2002

vectorizao, uso de GPS, ou

incorporao de dados geomtricos no estruturados, pois habitualmente no se conta com a capacidade de depurao dos dados, criao de topologia e transformao para a sua correcta localizao espacial. - Tambm no se podero criar novos temas combinando dados existentes por anlise de sobreposio. No se conta com funes avanadas de manipulao da topologia nem de modelao cartogrfica. - No se podem gerir dados tridimensionais. Isto exclui a criao de vistas perspectivas, anlise de visibilidade, etc. (Embora se possam criar aplicaes que implementem alguma funcionalidade deste tipo, como criar curvas de nvel, aplicar modelos de iluminao, ...) - Outra rea na qual um DM insuficiente no tratamento de dados de deteco remota, que requer capacidade de processo de grandes quantidades de dados raster. - Tambm no se podem esperar de um DM as capacidades mais avanadas dos SIG modernos, como "meta dados" de qualidade, controlo de concorrncia dinmico ou variabilidade temporal dos dados. 2.4.5 CAD Mapping Systems Alguns vendedores de sistemas CAD (Computer Aided Design - programas de delineao e desenho) consideraram poder evoluir facilmente um destes sistemas, e converte-lo num SIG. Os sistemas que aparecem desta forma denominam-se CAD Mapping Systems (CMS), e habitualmente o vendedor chama-os SIG. Normalmente estes sistemas so o resultado da combinao de dois sistemas existentes no mercado, um CAD e um RDBMS (Relacional DataBase Management System - Sistema de gesto de bases de dados relacional). Desta forma os dados alfanumricos contidos nas bases de dados associam-se com elementos grficos dum arquivo - desenho de CAD. A verdade que um CAD apresenta algumas caractersticas que dificultam o desenvolvimento dum SIG. Um SIG no a soma de um CAD e um RDBMS; mais exactamente, o RDBMS encontra-se no corao do sistema, e as capacidades grficas, subtilmente diferentes das do CAD, encontram-se intimamente ligadas ao RDBMS.

_______________________________________________________________________ Rui Martins, Lus de Sousa

12

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica


2.4.6 Diferenas SIG-CAD

30-09-2002

Algumas das diferenas fundamentais entre a parte grfica dum SIG e um CAD so: - Propsitos diferentes: O SIG reflecte a realidade. O CAD desenha algo que ainda no existe. - Ambos tm um estrato geomtrico, mas a criao destes elementos distinta: em CAD so criados por um delineador, com exactido, em SIG so obtidos a partir de mapas ou do terreno, com certo erro e impreciso inevitvel, mas mensurvel. - O CAD segmenta os dados em arquivos independentes que no partilham um espao de coordenadas global. Em SIG os dados formam um conjunto contnuo. (Isto implica diferentes formas de acesso e diferentes problemas de concorrncia). - A informao num SIG pelo menos uma ordem de magnitude maior, os objectos so muito mais complexos. (Estima-se que a infra-estrutura municipal tipo requeira entre meio e um Gigabyte por cada cem mil habitantes). - Os CAD habitualmente permitem a ligao com uma base de dados, mas no permitem uma integrao suficiente, como por exemplo para responder a perguntas que combinem critrios alfanumricos e espaciais. (No contam com uma linguagem de consulta alfanumrico/espacial, nem a possibilidade de anlise de sobreposio, e normalmente o conceito de topologia muito pobre) - H alguns tipos de dados caractersticos do SIG que um CAD no gere: dados raster referenciados geograficamente e com atributos, como os de Deteco Remota, ou Modelos Digitais do Terreno, que no se podem implementar eficazmente com um programa de criao de slidos. - Um CAD separa as entidades geomtricas em camadas ou nveis. Num SIG tal partio no deve existir, pois complica a manuteno dos dados.
2.2.7 Resumo

importante conhecer as diferenas entre SIG e DM, porque corrente cometer o erro especialmente se se conta com recursos largos - de adquirir um sistema SIG quando o que se necessita realmente um DM. O SIG requerer um enorme investimento em equipas, pessoal e treino, e no proporcionar a agilidade de visualizao e anlise que d um DM nem a facilidade de uso duma aplicao vertical.

_______________________________________________________________________ Rui Martins, Lus de Sousa

13

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Deve ficar claro que SIG e DM no competem por um mesmo mercado, porque tm mbitos distintos que se complementam e podem coexistir na mesma organizao. Por outro lado h que distinguir os sistemas CAD; de propsito muito diferente aos SIG e com limitaes insolveis para o seu uso como SIG. CAD e SIG podem coexistir numa organizao, mas normalmente f-lo-o em departamentos diferentes. Por exemplo, um departamento de planeamento usar SIG para determinar a localizao dum novo hospital, enquanto que o departamento de arquitectura usar CAD para desenh-lo. No que diz respeito aos chamados SIG, que se baseiam num sistema CAD e um DBMS, devem ser examinados com cuidado antes de ser adoptados. Possivelmente s so teis para utilizadores com experincia e grandes quantidades de dados em CAD, e s para actividades muito concretas como a engenharia civil.

2.5 Para que serve um SIG?


At agora descreveu-se um SIG por meio de definies formais e por meio da sua capacidade para satisfazer questes de cariz espacial, relacionando conjuntos de dados atravs da sua localizao geogrfica. Um SIG pode igualmente ser descrito enumerando o tipo de questes s quais pode responder. Um SIG suficientemente sofisticado pode responder a cinco perguntas genricas: Localizao: O que h em...? A primeira das perguntas, procura identificar o que se encontra numa localizao determinada. A localizao pode ser descrita de vrios modos, por exemplo, pelo seu topnimo, pelo seu cdigo postal, ou por referncias geogrficas como latitude e longitude. Condio: Onde se encontra? A segunda pergunta a inversa da primeira e requer uma anlise espacial. Em lugar de identificar o que se encontra num ponto o que se procura um lugar que reuna certas condies (por exemplo, um terreno sem floresta, que tenha uma rea maior que 2000 metros quadrados, que esteja a menos de 100 metros de uma estrada e que as suas condies geolgicas lhe permitam suportar edifcios). Tendncia: O que mudou desde...? Esta pergunta envolve as duas anteriores e a sua resposta estabelece quais so as diferenas que ocorrem numa rea determinada atravs do tempo.

_______________________________________________________________________ Rui Martins, Lus de Sousa

14

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica Distribuio: Que padres de distribuio espacial existem?

30-09-2002

Esta pergunta mais complexa. Aparece ao querer determinar, por exemplo, se o cancro uma causa importante de mortalidade entre as pessoas que residem nas proximidades de uma central nuclear. Ou tambm, ao querer conhecer quantas situaes anormais se produzem numa determinada distribuio espacial e onde se localizam. Modelizao: Que sucede se...? Questo que se traz baila ao tentar conhecer o que se passa num sistema quando ocorre um facto determinado. Por exemplo, que ocorre a um sistema rodovirio se construirmos uma nova estrada, ou que sucederia se se produzisse uma determinada planta txica na rede de abastecimento de gua potvel. As respostas requerem, para alm da informao geogrfica, outras informaes adicionais, como por exemplo, determinadas leis cientficas.

_______________________________________________________________________ Rui Martins, Lus de Sousa

15

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

CAPTULO III ESTUDO DE MERCADO


3.1 Introduo
Ao se iniciar esta fase do trabalho algumas ideias estavam j esclarecidas. Ficou claro durante a fase anterior, que neste caso no seria suficiente um simples DM. No mbito do TFC pretende-se criar mapas, armazenar e gerir dados disponveis. Vrios foram os produtos com que se tomou contacto, visto o mercado ser relativamente alargado. Quatro foram os analisados mais profundamente atravs de verses de demonstrao, o Idrisi 32, o ArcGIS(com uma verso de avaliao do ArcView), o Grass e o Geomatica. Ficaram no entanto alguns por analisar, dos quais destacamos o Manifold GIS, que apenas existe em verso comercial, visto no haver verso de demonstrao; e o MGE da Intergraph, que apesar dos mltiplos pedidos de verses de demonstrao, nunca foram recebidos. Dos restantes sistemas considerados esto, entre outros o Smallworlds da General Electric, e o Autodesk GIS.

3.2 IDRISI 32
O Idrisi produzido pelos Clark Labs da Clark University desde 1989, sendo um dos mais antigos sistemas no mercado. Comea por ser um Desktop Mapper, mas apresenta igualmente muitas das funcionalidades de um SIG propriamente dito, permitindo fazer alguma anlise topolgica de considervel complexidade. O Idrisi apresenta igualmente uma faceta virada para o processamento de imagem, em especial, no tratamento e melhoramento de imagens raster. De resto este sistema privilegia claramente o trabalho com fotografia e camadas raster. Foi tambm pensado para ser um SIG cooperante com novas tecnologias em especial a Percepo Remota. Podemos chamar ao Idrisi um dois em um, pois tanto o podemos usar como um simples Desktop Mapper, ou como um SIG. Como interface o Idrisi bastante fraco, apresentando alguns problemas de usabilidade srios, como o excesso de cones e menus. A maior parte da interaco feita atravs de menus e preenchimento de valores em tabelas, sendo este um modo de interaco muito lento e pouco intuitivo comparado com os mtodos de Apontar e Clicar. De facto esta interface

_______________________________________________________________________ Rui Martins, Lus de Sousa

16

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

estar alguns anos atrs das actuais encontradas nos ambientes Microsoft, fazendo lembrar algumas aplicaes do Windows 3 e precedentes. No captulo da interaco de realar o sistema de programao por filtros disponibilizado pelo Idrisi, ao qual dado o nome de Macro Modeler. Esta aplicao permite construir programas de anlise topolgica graficamente. As sadas e entradas so camadas, normalmente raster, os filtros so algoritmos de anlise e classificao topolgica. Em relao aos algoritmos propriamente ditos, estes so relativamente poucos e de reduzido poder analtico, sendo a maioria de classificao binria. Para operaes mais complexas necessrio combinar vrios algoritmos, ou ento dar-lhes maior quantidade de informao. No final pode-se acabar com modelos muito complexos, com os mesmos ficheiros de camadas a serem entradas de muitos filtros, acrescentando ainda ficheiros auxiliares de clculo. O Idrisi completamente aberto ao desenvolvimento. Usando a tecnologia COM de Invocao de Procedimentos Remotos possvel construir aplicaes que interajam com o Idrisi. Segundo a Clark Labs o Idrisi totalmente condescendente com esta tecnologia, sendo assim possvel desenvolver todas as suas actuais faculdades. Falando agora da portabilidade, o Idrisi encontra-se disponvel para quase todas as plataformas Microsoft. Dado ser produzido h mais de dez anos, o Idrisi foi evoluindo ligado s diferentes plataformas da Microsoft que apareceram desde ento. Para alm das verses actuais do sistema operativo Windows, o Idrisi corre tambm nas verses pr sistema operativo desta aplicao, e mesmo em verses antigas do MS-DOS, indo at verso 5.0 e anteriores. J aqui foi dito que o Idrisi no apenas um Desktop Mapper, e que tambm apresenta caractersticas de um SIG real. Mas ento porque no este sistema, um dos grandes SIG do mercado? Porque est o seu preo relativamente longe dos sistemas de grande envergadura?

_______________________________________________________________________ Rui Martins, Lus de Sousa

17

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 3.1 Exemplo de Anlise com Programao por Filtros Como primeira grande desvantagem deste sistema, est a ausncia de paralelismo, o Idrisi no tem qualquer funcionalidade multi-utilizador. Todo o acesso s Bases de Dados e Mapas feito por apenas uma aplicao no havendo qualquer hiptese de edio simultnea. Esta falha preponderante na incapacidade do Idrisi ser o sistema para uma grande equipa SIG. Na mesma linha aparece a ausncia de uma linguagem de desenvolvimento prpria. Apesar de ser 100% condescendente com a tecnologia COM, uma linguagem de desenvolvimento uma das ferramentas indispensveis a um SIG de grande envergadura, para uma grande equipa. O desenvolvimento por Invocao de Procedimentos Remotos tem duas desvantagens. Primeiro necessrio haver algum conhecimento da arquitectura do sistema em causa. Segundo necessrio usar um ambiente diverso para o desenvolvimento, o que sem dvida o complica, em relao programao no ambiente prprio. H ainda que referir que a tecnologia COM, est ela prpria a cair em desuso, havendo outras tecnologias a serem usadas maioritariamente. Por fim h que referir a total ausncia de anlise a Trs Dimenses (3D). Esta pode-se tornar na falha principal. No mercado esta uma rea onde o desenvolvimento dos SIG est mais aceso, havendo j extenses 3D para os principais sistemas. O Idrisi permite visualizar camadas raster de relevo a trs dimenses, mas mais nada para alm disto, o que se revela algo relativamente intil. Esta barreira parece ser bastante difcil de transpor, pois a interface do Idrisi no est de modo algum virada para este tipo de funcionalidades. A dificuldade de apresentar representaes 3D, aliada a uma interface com o utilizador ineficiente provavelmente a maior deficincia do Idrisi. _______________________________________________________________________ Rui Martins, Lus de Sousa 18

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

3.2.1 CARTA LINX

Trata-se da nica extenso disponibilizada pela Clark Labs para o Idrisi. Tem como principal funo a elaborao de mapas electrnicos, no entanto apresentado como sendo igualmente capaz de desenvolver Bases de Dados e de editar a topologia de um mapa. Concentra algumas das funes ncleo de mais baixo nvel de um SIG propriamente dito. Infelizmente esta extenso no est disponvel em verso de demonstrao, pelo que no foi experimentada. No captulo da criao de mapas esta ferramenta parece ser extremamente eficaz. capaz de capturar a informao a partir de vrias fontes, como mesas digitalizadoras, GPS, e introduo de Coordenadas Geogrficas. Atravs de GPS possvel registar a topologia terrestre viajando atravs do terreno em estudo e marcando as coordenadas GPS e a respectiva altura em pontos escolhidos. Tendo um conjunto de pontos, aplicado um algoritmo estatstico e criado um mapa raster da elevao do terreno.
3.2.2 Concluses

O Idrisi pretende ser um SIG de baixo custo, oferecendo bastante funcionalidade a um preo reduzido. O seu preo base de 600 dlares, fora manuais. O Carta Linx custa 400 dlares, mas oferecido um desconto de 50% a utilizadores do Idrisi, no incluindo manuais. Se primeira vista este parece ser um bom negcio, olhando para este produto e para os seus concorrentes do mercado verifica-se que tal no assim. De facto, produtos como o Manifold GIS apresentam caractersticas muito semelhantes por menos de metade do preo. Se for tido em conta o facto de que em termos de interface e interaco com utilizador o Idrisi quase de certeza o pior de todos a escolha dificilmente pode recair sobre o Idrisi. A esta altura da anlise de mercado, para alm de ter ficado patente que o Idrisi no seria uma opo, comeou a ficar igualmente claro que os sistemas de menor envergadura esto demasiado inclinados para a anlise terrestre. Fica tambm um apontamento para o facto de para esse tipo de sistemas ser bastante difcil encontrar verses de demonstrao, a excepo foi mesmo o Idrisi.

_______________________________________________________________________ Rui Martins, Lus de Sousa

19

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

3.3 ARCGIS
O ArcGis um sistema de informao geogrfico integrado, composto por trs partes: ArcGis Desktop Software, ArcSDE Gateway e ArcIMS Server. O ArcGis Desktop um termo que remete para um conjunto integrado de poderosas aplicaes SIG. As aplicaes oferecidas pela ESRI so: O ArcView, o ArcEditor e o ArcInfo e as Extenses ArcGis. O ArcSDE Gateway uma interface para gerir bases de dados geogrficas multi-utilizador enquanto que o ArcIMS Server um SIG baseado na internet para permitir que esses dados e servios sejam distribudos.

Figura 3.2 Sistema ArcGis O ArcGis fornece todo um esqueleto que permite implementar um SIG tanto para um simples utilizador como para muitos utilizadores. um sistema escalvel que se pode tornar num sistema SIG de qualquer tamanho, e que pode assentar sobre um nico computador ou sobre uma rede.

Figura 3.3 Escalabilidade do sistema ArcGis

_______________________________________________________________________ Rui Martins, Lus de Sousa

20

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

A opo para um Desktop SIG pode passar pelo ArcView, ArcEditor ou pelo ArcInfo visto que ambos partilham o mesmo core de aplicaes. ArcMap, ArcCatalog, ArcToolbox. A grande vantagem de os pacotes partilharem o mesmo core de aplicaes que as diferenas entre os pacotes podem ser vistas como incrementos de funcionalidades . Se for escolhido o ArcView e se houver necessidade no futuro de mudar para o ArcInfo ser muito mais fcil pois os pacotes partilham a mesma interface e os mesmos conceitos operacionais. Consequentemente haver um aumento de usabilidade.
3.3.1 Aplicaes do ArcGIS Desktop

As aplicaes comuns so:

O ArcMap a aplicao central de qualquer um dos pacotes do ArcGis Desktop e usado para efectuar todas as principais tarefas como cartografia, anlise e edio de mapas. O ArcCatalog permite organizar e gerir toda a informao num sistema SIG. Inclui ferramentas para pesquisar e encontrar informao geogrfica, gravar e ver meta data, visualizar rapidamente qualquer tipo de dados, etc. O ArcToolbox como o prprio nome indica uma caixa de ferramentas essencialmente para converso e gesto de dados. Existem duas verses desta aplicao. Uma vem com o ArcView/ArcEditor e outra, mais completa, com o ArcInfo.
3.3.2 Extenses do ArcGIS

Antes do aparecimento das extenses um utilizador que pretendesse efectuar uma anlise raster teria que licenciar diferentes tipos de software consoante o pacote SIG que possusse. Se possusse o ArcView licenciava o ArcView Spatial Analyst mas se possusse o ArcInfo licenciava o ArcGrid. O objectivo das extenses foi incorporar as melhores caractersticas de verses anteriores das extenses do ArcView e ArcInfo e torna-las comuns a todos os pacotes. Com as extenses, so reduzidos os custos de aprendizagem, operacionalidade e de aquisio. As extenses existentes so: ArcGis Spatial Analyst, ArcGis 3D Analyst, ArcGis Geostatistical Analyst, ArcGis StreetMap, ArcPress for ArcGis, MrSID Encoder for ArcGis, TIFF/LZW Compression. O ArcGis Spatial Analyst permite obter informao acerca dos dados, identificar

relaes espaciais, encontrar localizaes apropriadas, calcular o custo acumulado de viajar de um ponto at outro.

_______________________________________________________________________ Rui Martins, Lus de Sousa

21

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 3.4 Horizontalidade das Extenses O ArcGis 3D Analyst permite visualizar uma superfcie de vrios pontos de vista, determinar o que visvel de um determinado ponto, etc. O poder do ArcGis Geostatistical Analyst reside na capacidade para criar superfcies contnuas atravs da medio dispersa de pontos. Possui ferramentas para anlise de erro, comparao de modelos, etc. O ArcGis StreetMap um parente do software para a visualizao de ruas. O ArcPress permite obter uma melhoria na cor e impresso de documentos e utilizado no sector da Imprensa. O MrSID Encoder produz imagens MrSID de outras imagens at 500 MB. Por ltimo a extenso TIFF/LZW Compression permite usar compresso TIFF/LZW tecnologia esta que patenteada pela UNISYS. Chegados a este ponto uma das questes relevantes que se levanta : quais so as vantagens dos produtos ArcGis em relao a outros SIG existentes no mercado? Uma das vantagens que a sua escalabilidade comparvel da Microsoft, apesar de os seus produtos serem licenciados separadamente, quer isto dizer que para passar, por exemplo, do ArcView para o ArcInfo s se tem que proceder a um upgrade. A sua usabilidade tambm comparvel aos produtos da Microsoft pois permite que utilizadores pouco treinados adquiram uma rpida aprendizagem. A famlia ArcGis foi construda usando um esqueleto COM (Component Object Model) isto torna possvel o desenvolvimento de aplicaes com os ArcObjects utilizando linguagens como o VB e C++. No entanto a principal razo o baixo custo para Investigao e Ensino. No momento de fazer escolhas dentro da famlia de produtos da ESRI outra questo que se coloca : Porqu o ArcInfo e no o ArcView? Esta questo fica automaticamente respondida se tivermos em conta que a aplicao ArcToolbox traz mais 170 ferramentas, o ArcInfo permite vectorizar imagens raster _______________________________________________________________________ Rui Martins, Lus de Sousa

22

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

(vectorizao) e a diferena de preos entre o ArcInfo e o ArcView para instituies dedicadas a Investigao/Ensino muito pouco significativa.

3.4 GRASS
O Grass tambm referenciado por Geographic Resources Analysis Support System igualmente um SIG utilizado para gesto de informao, processamento de imagem, produo de grficos, anlise espacial e visualizao de muitos tipos de dados. um software grtis produzido sob licena da GNU. Foi originalmente escrito pelos laboratrios de pesquisa e engenharia do exrcito dos Estados Unidos como uma ferramenta para gesto de territrio e planeamento ambiental usada pelos militares. O Grass transformou-se num utilitrio poderoso com um vasto alcance em diferentes reas de pesquisa cientfica. O Grass pode ser corrido usando quer uma linha de comandos quer uma interface grfica. Devido a ser um sistema open source a sua interface por comandos mais completa do que a interface grfica. Os novos mdulos que vo surgindo so disponibilizados primeiro na interface por comandos. Actualmente existe uma verso do Grass para correr no Windows NT/2000 mas ainda se encontra em fase experimental. A linguagem de desenvolvimento C. Os sistemas operativos que suportam o Grass so: Linux, Sun Solaris, Solaris x86 etc. O Grass permite anlise espacial e visualizao 2D e 3D tal como qualquer outro SIG e tem bastantes modelos de gerao de dados. Esses modelos assentam sobretudo nas reas de eroso e hidrologia. A principal desvantagem de se usar um sistema de informao

geogrfica como o Grass reside na muito fraca documentao visto ser um sistema em constante evoluo. Outra grande desvantagem o facto de o modo de interface por

comandos ser muito pesado para utilizadores ainda no ambientados com o Grass pois requer um grande treino e memorizao. Apesar de os comandos terem como prefixo uma letra que elucida o utilizador sobre qual a operao que pretende efectuar, no esconde de forma nenhuma a fraca usabilidade.

_______________________________________________________________________ Rui Martins, Lus de Sousa

23

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica Tabela 3.1 - Prefixos dos comandos existentes no Grass

30-09-2002

3.5 GEOMATICA
O Geomatica no pretende ser de modo algum um Desktop Mapper, este sistema a todos os nveis um SIG completo. Est projectado para grandes instituies onde o SIG ser uma ferramenta de trabalho de grande importncia, consumindo muitos recursos e uma quantidade significativa de tcnicos. No to pouco um nico programa, mas sim um agregado de diferentes aplicaes, cada qual com a sua funcionalidade especfica, dirigida a perfis de utilizadores diferentes. tambm um sistema inclinado para o trabalho com imagens de satlite, normalmente camadas raster, a partir das quais vo sendo criadas outras camadas, vectoriais e raster, e as bases de dados correspondentes. Ao iniciar o trabalho a equipa SIG, no tem s como objectivo criar as bases de dados e camadas especficas para posterior anlise, como tambm deve desenvolver o prprio sistema no sentido de facilitar esse trabalho. Vai ser dada agora uma viso geral dos principais mdulos do Geomatica e as suas funes caractersticas.
3.5.1 FOCUS

a janela principal, o nosso primeiro olhar para dentro do Geomatica. Aqui vemos os nossos mapas e camadas, e fazemos a maioria das operaes mais simples atravs de facilidades de apontar e clicar. Como interface, e principal janela para o sistema, est bem concebida, a esta altura o utilizador ainda no se apercebe do monstro que reside detrs desta janela. A janela dividese em trs partes, a zona de botes e menus (barras superiores), rvore de ficheiros e mapas (lateral esquerda), zona de visualizao de mapas (todo o resto, ocupa a maior parte da

_______________________________________________________________________ Rui Martins, Lus de Sousa

24

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

janela). Os menus so poucos mas os suficientes, os botes esto bem agrupados, as suas representaes so aceitveis e quando no esto disponveis aparecem desfocados.

Figura 3.5 Janela do FOCUS A sua principal funo visualizar os mapas e as suas respectivas camadas. Mas este visualizar bastante profundo, podem ser vistos um nmero indefinido de camadas sobrepostas, mapas de 8, 16 e 32 bits, de qualquer tamanho ou resoluo; estando todas as camadas adequadamente geo-referenciadas. Mas uma vez de realar que apesar de estarem muitos mapas carregados no Focus, no se chega a sentir confuso em lidar com todos eles, dado a ser relativamente navegar entre eles, na rvore de mapas, com a ajuda do rato. Outra funo importante o processamento e melhoramento grfico das imagens disponveis, normalmente fotografias de satlite. Est ao dispor do utilizador uma biblioteca de algoritmos de processamento de imagem, incluindo : ?? Algoritmos de filtragem de imagem; ?? Utilitrios de Interpolao; ?? Algoritmos de Classificao; ?? Anlise Espacial; ?? Anlise de Modelos Digitais de Elevao (DEM). Mas o Focus no se fica por aqui, permite fazer inspeco de dados atravs de histogramas, ou de gerao de perfis. Pode-se, por exemplo, calcular distncias ou permetros apenas com alguns cliques do rato; ou editar as tabelas de atributos directamente. Existem ainda algoritmos especficos para a depurao da classificao de imagens; algoritmos que _______________________________________________________________________ Rui Martins, Lus de Sousa

25

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

produzem mapas cartogrficos bastante avanados, com referencias de latitude e longitude muito apuradas, et coetra, et coetra.
3.5.2 OrthoEngine

a ferramenta que vai permitir criar mapas e extrair informao a duas e trs dimenses das fontes mais comuns de informao de um SIG, as imagens de Fotogrametria. As imagens fontes para um SIG so as fotografias tiradas em voo, dos satlites temos fotografias, assim como as imagens de radar e imagens digitais do terreno. O Orthoengine vai permitir, a partir destas fontes criar modelos digitais do terreno, modelos de elevao (DEM), assim como modelos a trs dimenses. Tudo isto de forma automtica, recorrendo a algoritmos de extraco de informao avanada. Este pacote vem ainda munido de um conjunto de funcionalidades, que, para alm de permitirem fazer este trabalho, tambm o facilitam poupando tempo e esforo.
3.5.3 PCI Modeler

Mais uma vez estamos perante um ambiente de programao grfica por filtros. A sua principal funo a mesma que o Macro Modeler do Idrisi, mas medida que explorado, torna-se claro que o seu mbito muito maior.

Figura 3.6 PCI Modeler O PCI Modeler comea pois por ser um ambiente que permite fazer anlise topolgica a partir de uma ou mais camadas, a partir das quais se pode gerar outras camadas, com o sistema de filtro j explicado, os mapas ou camadas so sadas ou entradas de filtros que so algoritmos de anlise. A primeira diferena que surge em relao ao Macro Modeler o facto de este aparecer como uma aplicao completamente independente, com uma janela prpria e menus prprios, este e outros factores vo dar uma maior usabilidade ao PCI Modeler. _______________________________________________________________________ Rui Martins, Lus de Sousa

26

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Graficamente o PCI Modeler bastante avanado, no s se pode montar um esquema de anlise com o rato, como as caixas que representam os filtros so de algum modo transparentes (os filtros do Macro Modeler so graficamente compactos), dando a possibilidade de definir alguns parmetros com apenas alguns cliques. Mas, conforme se vai aprendendo a trabalhar com o PCI Modeler, vai-se igualmente percebendo a dimenso das suas possibilidades. Em primeiro lugar est disposio uma biblioteca com mais de trezentos algoritmos, e s este factor marca a diferena, para alm de que nem todos eles se dedicam anlise topolgica. Existem algoritmos que importam ficheiros em formatos externos ao Geomatica, que os voltam a importar para outros formatos, algoritmos que ajudam e permitem fazer alguma classificao. claro que o factor mais importante a existncia de um nmero gigantesco de algoritmos disponveis. A nica forma de aproveitar todo este poder de anlise e processamento ter vrias pessoas a usar este mdulo do Geomatica.
3.5.4 FLY!

Este o mdulo que permite levar a cabo a anlise a trs dimenses. Tendo por base ficheiros DEM, ou mesmo vectores, o FLY! capaz de criar um modelo a trs dimenses do terreno em causa, do qual se podem visualizar diferentes perspectivas, quase em tempo real. A principal caracterstica que se deve salientar em relao a esta ferramenta de anlise 3D a simulao de voo. O FLY! d a possibilidade de explorar o modelo a trs dimenses do terreno, simulando que o utilizador voa por cima do mesmo. Com o auxlio do rato o utilizador controla a direco e velocidade de voo, escolhendo trajectrias e pontos de observao. Mas ainda possvel simular condies atmosfricas, ou por exemplo simular o efeito do nevoeiro na visibilidade do voo. Resta ainda referir que tudo isto feito recorrendo s mais recentes tcnicas de rendering.
3.5.5 EASI

Este o mdulo de desenvolvimento do Geomatica, que tal como todos os outros apresenta caractersticas que o levam para alm do desenvolvimento. Ao programador apresentada uma linguagem de programao baseada na sintaxe do C, o que de facto facilita o desenvolvimento. Para alm de esta linguagem poder ser usada para expandir o Geomatica e as suas funcionalidades, tambm uma excelente linguagem de scripting, dando a possibilidade de criar automatismos de trabalho de grande utilidade. _______________________________________________________________________ Rui Martins, Lus de Sousa

27

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

O EASI comea por ser um ambiente baseado numa linha de comandos que permite efectuar toda a interaco utilizador/sistema independentemente do sistema operativo envolvente. Serve de ponte entre os diferentes sistemas base (ex: Sun / Microsoft), eliminado diferenas de editores dos sistemas operativos e formatos de prprios entre outros. Daqui, como j referido, parte-se para a possibilidade de criar scripts, e para o desenvolvimento do ambiente propriamente dito. Assim descritos os principais mdulos do Geomatica, onde muito ficou por dizer, devem ser referidas algumas das principais extenses que podero fazer parte do pacote a adquirir, consoante as reas de interesse. EASI/PACE - Oferece funcionalidades avanadas no tratamento de imagens de satlite, quer de origem ptica, ou de radar. Incluindo: SPANS ou PAMAP - Permitem ir ainda mais alm na anlise geogrfica terrestre, em particular para bacias hidrogrficas e na rea da geologia. ACE - Extenso das funcionalidades de cartografia. O Geomatica j na sua base bastante poderoso neste captulo, com o ACE pode-se chegar ainda mas longe. Anlise Hyperspectral - possvel, usando uma extenso PACE, efectuar anlise terrestre baseada em espectros e ngulos espectrais. Esta extenso vem adicionar possibilidades de classificao diferentes das convencionais, podendo capturar informao que nos modos mais comuns (Anlise de radar e ptica), no ser possvel.
3.4.6 Concluses

Esta foi sem dvida a soluo de maiores dimenses que foi possvel estudar. Os trinta dias de avaliao foram evidentemente escassos para conhecer por completo todo o ambiente do Geomatica. Em primeiro lugar fica claro que a dimenso do Geomatica no se enquadra com aquilo que procuramos. De facto, para ter um sistema deste tipo a funcionar convenientemente so necessrios muitos tcnicos e operadores, sendo no s til ter vrios familiarizados com todo o sistema, como ter vrios especialistas para cada um dos mdulos de trabalho. Este dos factores que vai levar a que a escolha no recaia sobre o Geomatica. Finalmente, e mais relevante, sero os preos destes produtos. S o Geomatica Prime custa 7200 , custando cada uma das sua extenses 3200 . O preo das extenses para

_______________________________________________________________________ Rui Martins, Lus de Sousa

28

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

OrthoEngine varia entre os 3200 e os 4300 . O Sistema na sua totalidade com todas as extenses ora em mais de 40000 .

3.6 Estrutura do Mercado dos SIG


Segue-se agora uma curta anlise da Estrutura do Mercado SIG. Tentando-se perceber a evoluo deste mercado nos ltimos anos, de modo a tirar algumas concluses sobre o seu futuro, e o modo como este pode influenciar a deciso da compra de um produto.
3.6.1 Estrutura do Mercado em 1994

Mostrou-se bastante difcil encontrar dados slidos acerca da estrutura do Mercado SIG, mais ainda, reportando-se a anos mais afastados. Estes foram os dados mais antigos encontrados, retirados do International SIG Sourcebook de 1994. Baseiam-se no nmero de licenas emitidas e ainda activas, por cada fabricante. de notar que h altura existiam j algumas centenas de empresas em estado embrionrio, ou com expresso marginal no mercado, que aqui no aparecem quantificadas[6]. Tabela 3.2 - Nmero de Licenas Activas em 1994
Fabricante ESRI Intergraph Spans ERDAS Graphics Design System GenaMap Topologic Total Nmero 800000 100000 2500 2000 1200 350 30 906080 Quota 0,88 0,11 0,003 0,002 0,001 > 0,001 > 0,001

_______________________________________________________________________ Rui Martins, Lus de Sousa

29

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Estrutura de Mercado em n de Licenas em 1994

ESRI Intergraph Spans Graphics Design System ERDAS GenaMap topoLogic

Figura 3.7 Grfico da Estrutura de Mercado em 1994 O nmero de licenas activas pode no ser o melhor indicador da estrutura de Mercado, pois uma licena de ArcView no tm o mesmo preo que uma de Spans. Os valores de facturao monetria so indicadores mais correctos mas no foram encontrados para anos anteriores a 1994. H ainda a acrescentar que neste estava em actividade a empresa que fornecia o System 9, um SIG bastante difundido na poca, mas para qual no existia registo do nmero de licenas activas. Outro aspecto importante facto de a SmallWorld, apesar de estar j em actividade, no ter sido ainda sido adquirida pela General Electrics. Pode-se referir ainda que estava por esta altura eminente a compra da ERDAS pela ESRI, passando a haver um cooperao tecnolgica entre as duas empresas, embora continuando no mercado com os dois nomes. O Mercado assim caracterizado mostra claramente uma situao de Monoplio[17,18] por parte da ESRI, ressalvando novamente o facto de o nmero de licenas no ser o melhor indicador da sua estrutura. A ESRI declara ter, num dia normal, por volta de um milho de utilizadores dos seus produtos SIG. claro que o tipo de produtos influncia estes nmeros, a esta altura empresa como a ESRI ou a Intergraph, operavam sobretudo no mercado dos sistema Desktop, enquanto que outras como a Spans (empresa que veio a evoluir o Geomatica), operavam mais no mercado dos SIG de grande dimenso. Estes dados do incio da dcada de 1990 (poca ainda de alguma embrionagem no mercado SIG), so pouco conclusivos, mas para anos mais recentes foram encontrados dados mais slidos, baseados nas receitas anuais das empresas no Mercado. _______________________________________________________________________ Rui Martins, Lus de Sousa

30

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica


3.6.2 Estrutura do Mercado em 1999

30-09-2002

Os dados referentes a 1999 e 2000, foram publicados pela DaraTech, um organismo independente de anlise de alguns mercados de software[7]. As quotas de mercado aqui apresentadas referem-se s receitas de cada empresa no ano de 1999, que na globalidade do mercado perfizeram um valor de 845 milhes de dlares.

Figura 3.8 Grfico da Estrutura de Mercado em 1999 Passa-se agora a uma anlise mais cuidada, recorrendo ao clculo dos ndices de Mercado. ndice de Herfindahl [17,18] : H = 0.352 + 0.282 + 0.062 + 0.052 + 0.042 + 2x (0.032) 3x(0.022) = = 0,1225 + 0,0784 + 0,0036 + 0,0025 + 0,0016 + 0,0018 + 0,0012 = = 0,2116 ndices de Concentrao C1 = 0.35 C2 = 0.35 + 0.28 C3 = 0.35 + 0.28 + 0.06 C4 = 0.35 + 0.28 + 0.06 + 0.05 = 0.35 = 0.63 = 0.69 = 0.74 31

_______________________________________________________________________ Rui Martins, Lus de Sousa

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Por estes ndices se constata, que o mercado era em 1999 um Oligoplio [17,18]. O ndice de Herfindahl encontra-se ligeiramente acima de 0,2 mas mesmo assim acima. Pelos ndices de concentrao observa-se que as duas maiores empresas detm 63% do mercado, e as quatro maiores, quase trs quartos do mesmo. A liderana do mercado parece bastante slida, pela parte da ESRI e da Intergraph, mas no se aproxima em nada do Monoplio verificado pelo dados relativos a 1994. Tambm de sublinhar o aparecimento de bastantes empresas com quotas de mercado entre 2 e 10 por cento. Podem-se ento desenhar dois cenrios, as empresas de topo lideram o mercado generalista, apresentando solues flexveis e escalveis; por outro lado existe um grande conjunto de empresas que se movimentam num mercado de Concorrncia Monopolista, onde encontram pequenos nichos de mercado, que abarcam apresentando solues especficas. Estima-se mais uma vez que as empresas com quotas de mercado inferior a 2% sejam vrias centenas.
3.6.3 Estrutura do Mercado em 2000

As receitas totais do Mercado subiram neste ano para 939 milhes de dlares. No entanto d-se uma viragem na sua estrutura, uma vez que a Intergraph perde quase metade da sua quota.

Figura 3.9 Grfico da Estrutura de Mercado em 2000 _______________________________________________________________________ Rui Martins, Lus de Sousa

32

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica Mais uma vez calculam-se os ndices de Mercado [17,18]. ndice de Herfindahl H = 0.362 + 0.162 + 0.072 + 3x(0.062)+ 2x(0.032) + 3x(0.022) = = 0,1296 + 0,0256 + 0,0049 + 0,0108 + 0,0018 + 0,0012 = = 0,1739 ndices de Concentrao C1 = 0.36 C2 = 0.36 + 0.16 C3 = 0.36 + 0.16 + 0.07 C4 = 0.36 + 0.16 + 0.07 + 0.06 = 0.36 = 0.52 = 0.59 = 0.65

30-09-2002

Verifica-se ento uma mudana curiosa de 1999 para 2000, o mercado passa repentinamente de um Oligoplio, para um Mercado de Concorrncia Monopolista [17,18]. Aparentemente no se pe o caso de um Mercado de Concorrncia Perfeita, pois as receitas cresceram 94 milhes de dlares, mais de 10%, e no houve um aumento visvel do nmero de empresas a operar no mercado. Apesar de toda esta movimentao a ESRI conseguiu solidificar ainda mais a sua posio no mercado. Passou para os 36% de quota, mas este aumento traduziu-se em 34 milhes de dlares de ganho em relao ao ano anterior. De 304 milhes de dlares de receitas em 1999, passou para 338 milhes em 2000. A Intergraph parece estar a sofrer os efeitos da entrada de dois grandes gigantes do sector Electrotcnico no mercado, a General Electric, que anos antes tinha adquirido a SmallWorld e a Simens, com uma entrada de gigante nos sistemas SIG ligados distribuio elctrica. Esta ascendncia pode indicar que a situao de Mercado de Concorrncia seja apenas uma situao de transio, enquanto cai um dos gigantes e se espera que algum ocupe o seu lugar.
3.5.4 Outros dados referentes ao Mercado

J em 2001 foi publicado pela Geospatial Information and Technology Association (GITA) um estudo intitulado The Geospatial Technology Report 2001., que trouxe informaes interessantes acerca do mercado dos SIG. Este estudo teve em conta as respostas dadas a questionrios por parte de 147 empresas[8-9]. _______________________________________________________________________ Rui Martins, Lus de Sousa

33

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

O estudo d conta que a liderana de mercado varia de sector para sector, o que refora de algum modo a estrutura de Concorrncia Monopolista. Concretamente, no mercado do Gs, lidera a General Electrics, no mercado das Telecomunicaes a Intergraph, nos mercados da Electricidade, das Condutas e Hidrogrfico lidera a ESRI. No entanto a fatia de mercado fora destes segmentos, representa a fatia de leo, para o qual no h informao. O estudo apresenta tambm informao acerca dos sistemas operativos usados como suporte aos SIG. O Microsoft Windows lidera largamente com 77% do mercado, a seguir esto os sistemas hbridos Windows/UNIX com 16%, e os puramente UNIX com apenas 4%. O estudo conjectura ainda que com a introduo dos novos sistemas Windows XP e Windows.NET, desapaream do mercado os sistemas UNIX.
3.6.5 Concluses

O Mercado dos SIG constitudo por um pequeno grupo de empresas com bastante implantao no mercado e um sem nmero de pequenas empresas que lutam entre si pelos nichos de mercado onde no chegam os gigantes. Neste grupo maior frequente aparecerem e desaparecerem pequenas empresas que nunca chegam a adquirir quotas de mercado significantes. Surge ento aqui um primeira indicao, ao seleccionar um SIG que se pretenda usar durante um perodo de tempo relativamente grande, corre-se o risco de o seu fabricante sair do mercado entretanto. Ao optar-se por um SIG completo, que dever estar em constante evoluo, pode ser uma m deciso a parceria com uma empresa mais pequena. A situao do ano de 2000 muito certamente transitria, sendo de esperar a adaptao da estrutura do Mercado novamente a uma situao de Oligoplio. A ESRI lidera claramente o Mercado, mas deixa livre essa liderana em alguns sectores importantes, permitindo assim uma concorrncia algo saudvel. data da realizao deste texto no existiam ainda dados concretos acerca do ano de 2001, no entanto de referir que os primeiros nmeros apontavam j para um novo crescimento global do Mercado SIG na ordem dos 10%, ultrapassando claramente 1 bilio de dlares de receitas.[9]

3.7 Comparao e Escolha


Depois de tomado contacto com estes quatro sistemas, houve que optar por um como sistema de suporte fase seguinte do trabalho. Segue-se uma tabela onde esto equacionados os principais factores de escolha. _______________________________________________________________________ Rui Martins, Lus de Sousa

34

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica Tabela 3.2 - Factores de Escolha

30-09-2002

Factor de Escolha
Importao de dados do exterior Vectorizao Usabilidade Linguagem Prpria Nmero de operadores Assistncia Documentao Preo

IDRISI32

ARCINFO

GEOMATICA PRIME

GRASS

Bom Fraca Fraca No tem Reduzido Apenas nos EUA Boa Razovel

Bom Bom Muito Boa Tem, sintaxe prpria - AML Escalvel

Muito Bom Muito Boa Boa Tem, sintaxe comum - C Muito Alto

Inexistente Muito Fraca Muito Fraca No tem, open source- C/Java Muito Reduzido

Representado em Representado no No Portugal Reino Unido Representado Muito Boa Boa, dispersa Fraca Bom Mau, > 25000 E Grtis

Os sistemas que sobressaem primeira vista so o Geomatica e o ArcInfo, aparecendo como os nicos com dimenso suficiente para trabalho em vista. Os factores que determinaram a escolham entre estes dois foram o preo, sobremaneira, o nmero de operadores e tcnicos necessrios ao seu correcto funcionamento, a documentao e a assistncia. O Geomatica apesar de ser um sistema mais completo em algumas reas, como o processamento de imagem e a vectorizao, revelou-se um sistema muito pesado para as necessidades. O ArcInfo para actividades de Investigao e Ensino revela-se um sistema de custos muito inferiores. Em termos de nmero de pessoas envolvidas o Geomatica um sistema muito mais exigente, requerendo, como referido anteriormente grande nmero de tcnicos. Pelo contrrio o ArcInfo revela-se neste aspecto bastante flexvel, podendo ser explorado quer por um nmero muito reduzido de tcnicos (talvez mesmo s um), quer por um nmero grande de tcnicos ligados a uma Base de Dados centralizada, onde se ligam vrias estaes de trabalho. A juntar a todos estes elementos est a existncia da extenso ao ArcInfo, para interpolao de superfcies, o Geostatistical Analyst, que como se ver mais ser crucial para es trabalho. Apesar de existirem outras aplicaes de interpolao no mercado, o

Geostatistical Analyst neste momento o estado da arte no que diz respeito a aplicaes informticas de Geoestatstica [10]. Com estes elementos a escolha recaiu sobre o ArcInfo, que foi posteriormente adquirido com as extenses ArcGis Spatial Analyst, ArcGis 3D Analyst e ArcGis Geostatistical Analyst. _______________________________________________________________________ Rui Martins, Lus de Sousa 35

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

CAPTULO IV INTERPOLAO DE SUPERFCIES


Escolhido o sistema a usar passou-se a uma nova fase de trabalho, a integrao, anlise e tratamento dos dados em questo. Este conjunto de dados consiste numa coleco de leituras batimtricas de profundidade do mar, com o qual se pretende produzir uma representao da rea em causa. A melhor forma de conseguir tal representao criar uma superfcie com base nestas amostras. De seguida so discutidos alguns dos mtodos de interpolao de superfcies implementadas pela extenso ao ArcGIS, Geostatistical Analyst.

4.1 Introduo
Tendo um conjunto de amostras de elevao (ou de profundidade neste caso), e querendo gerar uma superfcie contnua, ha que definir um mtodo de preencher os espaos vazios onde no foi recolhida informao. Partindo dos pontos conhecidos necessrio atribuir valores aos pontos para os quais desconhecido o seu valor. Tal conseguido atravs de tcnicas de interpolao. No entanto esta interpolao deve ser o mais precisa possvel, de modo a ser gerada uma superfcie o mais prxima possvel da realidade, e de modo a ser usada correctamente noutros formas de anlise e modelao GIS, tal como na sua modelao a trs dimenses ( 3D ). Existem dois tipos de mtodos de interpolao usados na gerao de superfcies, os mtodos de interpolao Determinstica e os mtodos de interpolao Geoestatstica. As tcnicas Determinsticas calculam superfcies baseadas na extenso de semelhana entre os pontos, ou no grau de suavidade pretendido, atravs de funes matemticas. As tcnicas Geoestatsticas geram superfcies baseando-se em estatsticas e modelos de previso de superfcies que incluem erros e incerteza na previso[12].

4.2 Mtodos Determinsticos


A soluo dada por estes mtodos relativamente simples, a superfcie gerada atravs de uma funo matemtico que modele as variaes da mesma. Ao calcular o valor de um ponto consideram-se as vrias amostras em seu redor, e vlido assumir que os pontos mais prximos tm valores semelhantes ao do ponto desconhecido. Mas existem vrias questes a _______________________________________________________________________ Rui Martins, Lus de Sousa

36

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

considerar, incluem-se todos os pontos da amostra no clculo, ou apenas alguns? E nesse caso quantos pontos incluir? E devem ser todos os pontos considerados com igual influncia no clculo do valor do ponto em causa? possvel que um ponto demasiado afastado esteja numa zona completamente diferente da zona em causa. Dadas estas questes existem dois grandes grupos de mtodos Determinsticos, os Globais, que calculam a predio num dado ponto usando informao de todos os pontos conhecidos, e os Locais, que calculam a predio baseada numa dada vizinhana. Apresenta-se agora uma breve descrio de alguns dos mtodos Determinsticos.
4.2.1 Inverso da Potncia das Distncias (Inverse Distance Weighting IDW)

Esta soluo selecciona um certo nmero de pontos conhecidos em redor do ponto a estimar. Como indica o prprio nome, neste mtodo atribudo um peso a cada amostra considerada no clculo, em funo da sua distncia ao ponto a calcular. Quanto mais afastada a amostra estiver menor ser o seu peso, e vice-versa. O IDW assume que cada ponto exerce um influncia local que diminui com a distncia, desta forma este mtodo segue a assuno de que os valores medidos mais prximos uns dos outros tendem a ser mais semelhantes do que aqueles medidos a distncias maiores[11]. A frmula usada a que se segue:

(4.1) Onde Z(x0)* o valor que se est a calcular para a posio x0 , N o nmero de pontos conhecidos e considerados na vizinhana de , ? i so os pesos associados a cada ponto conhecido, e Z(xi) o valor observado no ponto conhecido si. A frmula que determina cada um dos pesos a seguinte:

(4.2)

_______________________________________________________________________ Rui Martins, Lus de Sousa

37

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

O valor di0 representa a distncia entre o ponto a calcular, X0, e os pontos de valor conhecido, si, com o aumento da distncia o peso reduzido por um factor p. Este factor indica a forma como varia o peso dos pontos com a distncia, quanto maior for o valor da potncia mais rapidamente decresce o peso dos pontos mais afastados. Neste mtodo, a soma dos pesos de todos os pontos considerados ajustada de modo a ser sempre 1. O nmero de pontos considerados na estimao deve ser suficiente para se obter um valor preciso, mas ao mesmo tempo prtico para a interpolao. Este nmero de pontos pode variar conforme a distribuio e nmero de amostras, e com a prpria configurao da superfcie. Se as amostras esto distribudas equitativamente e no houver mudanas drsticas das caractersticas da superfcie pode-se obter uma superfcie de preciso razovel. Antes de usar as frmulas e necessrio escolher qual o tipo de vizinhana a usar nos clculos. No caso de no serem conhecidas influncias direccionais nos dados recolhidos, o melhor ser considerar pontos de igual modo em todas as direces, sendo assim a vizinhana a usar ser um crculo. Mas se forem conhecidas influncias direccionais, como por exemplo o vento, j ser mais correcto usar outra forma de vizinhana. Usando o exemplo da influncia do vento, sendo a direco deste conhecida, a vizinhana ideal passaria a ser uma elipse com o eixo maior paralelo a esta direco. de esperar que amostras alinhadas com a direco do vento sejam mais semelhantes do que as alinhadas prependicularmente a este[11].

Figura 4.1 Vizinhana elptica Um superfcie gerada usando IDW influenciada pela escolha do factor p e pela forma da vizinhana escolhida. O IDW um interpolador exacto, onde os valores mximos e mnimos da superfcie so sempre valores da amostra.

_______________________________________________________________________ Rui Martins, Lus de Sousa

38

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 4.2 Superfcie gerada por IDW


4.2.2 Interpolao Polinomial Global

Este mtodo especialmente til quando existe uma variao tendencial nos dados recolhidos. Se por exemplo as amostras forem recolhidas numa encosta, tero valores mais baixos no sop da encosta e maiores no seu cume. Estas tendncias globais podem no ser detectadas em modelos Locais[11]. Numa Interpolao Polinomial Global, como o prprio nome indica, procurada um funo polinomial que melhor se enquadre no conjunto global de amostras. Para uma encosta com uma inclinao relativamente constante, ser usada um polinomial de primeira ordem, caso se esteja a modelar um vale, ser usada uma polinomial de segunda ordem positiva. Ou seja para modelar um superfcie com uma inflexo necessria uma polinomial de segunda ordem, duas inflexes, terceira ordem e assim por diante.

Figura 4.3 Superfcies geradas por polinomiais globais Este tipo de interpoladores no exacto, a superfcie gerada no coincide com todos os pontos recolhidos (pode at no coincidir com qualquer um). Embora estes mtodos obtenham resultados globais satisfatrios, ignoram pequenas alteraes como pequenas colinas ou pequenas depresses, caractersticas a que se d o nome de Variao Local[11]. De modo a evitar estas variaes recorre-se por vezes a polinomiais mais complexas, mas na maioria dos casos a complexidade crescente da polinomial tende a produzir resultados que no tm correspondncia nos fenmenos fsicos reais.

_______________________________________________________________________ Rui Martins, Lus de Sousa

39

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica


4.2.3 Interpolao Polinomial Local

30-09-2002

Imagine-se que foram colhidas amostras numa rea constituda por uma encosta que termina planalto, do qual parte um nova encosta. Uma predio Global seria aqui desastrosa. Mas se em vez de uma polinomial forem usadas vrias mais pequenas, obtm-se uma superfcie constituda por vrios planos adjacentes que modelaro mais aceitavelmente a zona de estudo. A interpolao Polinomial Global usa ento, no uma, mas vrias polinomiais, cada uma calcula numa dada vizinhana. Tal como visto na interpolao IDW, a configurao desta vizinhana pode ser ajustada, de acordo com a informao disponvel sobre a zona de estudo. Mais ainda, pode-se tambm, definindo um parmetro de potncia p, influenciar o peso de cada ponto da vizinhana no clculo da polinomial local, em funo da sua distncia ao centro da vizinhana[11]. Para cada ponto da superfcie a gerar so escolhidos quais os pontos vizinhos a considerar, mediante a configurao da vizinhana definida. De seguida so atribudos os pesos a estes pontos e calculada a polinomial de ordem definida. O valor da polinomial no centro da vizinhana o valor atribudo ao ponto da predio.

Figura 4.4 - Superfcie gerada por polinomiais locais Neste exemplo, na primeira seco do terreno, calculado o valor do ponto azul usando uma vizinhana que compreende os pontos vermelhos, que geraram polinomial de 1 ordem a vermelho. Numa localizao seguinte, o ponto amarelo, calcula uma nova polinomial, deste feita, embora a vizinhana compreenda os mesmo pontos, a polinomial produzida ligeiramente diferente, dado haver uma pequena mudana na distribuio dos pesos. A interpolao segue assim por diante, at chegar o um novo ponto, de cor laranja, onde a vizinhana passa a compreender outro conjunto de pontos, de cor verde, e onde gerada mais uma polinomial, tambm a verde. As superfcies geradas por interpolao Polinomial Local conseguem modelar variaes dos dados a curtas distncias, algo que no possvel com uma Polinomial Global. Apesar de

_______________________________________________________________________ Rui Martins, Lus de Sousa

40

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

tudo, este interpolador continua a no ser exacto, existindo amostras pelas quais as superfcies geradas no passam.
4.2.4 Funes de Base Radial (Radial Basis Functions -RBF)

Este mtodo permite criar superfcies que incluem as tendncias globais e as variaes locais. A ideia base torcer e esticar a superfcie de modo a que esta passe por todos os pontos da amostra. Existem vrias maneiras de encontrar a forma desta superfcie. Por exemplo, forar a superfcie a formar curvas suaves (thin-plate spline), ou controlar a forma como so puxadas as pontas da superfcie. Este mtodo pode ser exemplificado como ajustar uma membrana de borracha de forma a passar por todos os pontos da amostra[11].

Figura 4.5 Superfcie gerada por RBF Tal como o mtodo IDW, o mtodo RBF exacto, ao contrrio dos mtodos Polinomiais. Comparativamente ao IDW, a grande novidade que traz o RBF o facto de as amostras deixarem de ser os pontos mximos e mnimos da superfcie gerada. A superfcie gerada apresenta maior suavidade, e modela melhor certos fenmenos fsicos como a elevao do terreno.

Figura 4.6 RBF versus IDW Uma funo RBF uma funo que muda consoante a distncia, quanto maior a distncia, maior o seu valor. Na figura que se segue existem trs amostras (nos pontos de

_______________________________________________________________________ Rui Martins, Lus de Sousa

41

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

coordenadas (4,6), (6,5) e (6,6)), para os quais esto representadas as respectivas RBF, cones neste caso, que representam simplesmente a distncia ao ponto da amostra.

Figura 4.7 Exemplo RBF com 3 amostras Na parte de baixo da figura temos uma seco do espao no plano y=5, onde esto representadas as projeces das trs RBF. Imagine-se agora que se est a interpolar o valor do ponto (7,5), os valores de cada RBF so neste ponto representados por ? 1, ? 2, e? 3. O valor do ponto (7,5) ser a mdia ponderada dos valores de cada uma das RBF nesta localizao, w1 ? 1 + w2 ? 2 + w3 ? 3. Para completar os clculos falta apenas conhecer os valore dos diferentes pesos w1, w2, w3, para tal usa-se o conhecimento de que nos pontos de amostragem a predio exacta. Tendo N pontos conhecidos e N pesos desconhecidos, construdo um sistema de N equaes a N incgnitas, que pode ser resolvido calculando os valores correctos de cada peso w. Existem vrias realizaes possveis do mtodo RBF, variando a forma das funes usadas nas amostras. O exemplo aqui apresentado usa RBF multiquadrticas, calculadas

_______________________________________________________________________ Rui Martins, Lus de Sousa

42

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

simplesmente em funo da distncia, outras funes podem ser usada como as RBF multiquadrticas inversas, ou funes de spline[11].
4.3.5 Concluses

Estes mtodos, chamados determinsticos, baseados em funes puramente matemticas, ignoram todo um conjunto de factores que esto na origem dos fenmenos fsicos. O seu objectivo simplesmente obter uma interpolao espacial dos valores observados. Este um dos problemas que os mtodos geoestatsticos se propem solucionar, recorrendo a uma metodologia baseada em probabilidades[13]. Apesar desta caracterstica mtodos como o RBF e o Polinomial Local podem obter resultados interessantes em zonas de grande densidade de amostragem[11], no ficando muito atrs dos mtodos geoestatsticos, e apresentando um soluo mais simples, e menos pesada computacionalmente.

4.2 Geoestatstica
4.2.1 Introduo

Em geral, coisas que esto mais prximas tendem a ser mais semelhantes que coisas que esto mais afastadas. Este um princpio fundamental da Geografia. Tobler, 1970 Na natureza existem vrios fenmenos distribudos no espao, que devido sua complexidade apresentam um elevado grau de incerteza. O conhecimento existente em relao a estes fenmenos , em geral, bastante reduzido e resume-se a um conjunto de observaes[13]. Como exemplos, refere-se o nmero de rvores por hectare numa floresta, o nvel de poluente num aqufero, a medio da temperatura numa dada regio, ou como no caso em estudo, a profundidade do mar. A Geoestatstica surgiu nos anos 60, como uma metodologia para quantificar a incerteza espacial de variveis que caracterizam os fenmenos naturais no espao[13]. Foi inicialmente aplicada na industria mineira para a avaliao de jazigos naturais[14]. A Geoestatstica permite no s considerar a distncia entre as amostras e o seu peso na estimao, como tambm a disposio global das mesmas[11]. Os mtodos geoestatsticos incluem autocorrelao (relaes estatsticas entre as amostras), e podem dar medidas de certeza ou exactido da estimaes geradas[11]. _______________________________________________________________________ Rui Martins, Lus de Sousa

43

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Quando se pretende adquirir conhecimento acerca de um fenmeno fsico contnuo (como a profundidade, a elevao, a composio dos solos, ou do ar), no possvel, na grande maioria dos casos, medir valores para todos os pontos da rea da estudo (o nmero de pontos numa rea de estudo relativamente grande pode ser considerado infinito numervel). As medies so feitas num conjunto finito de N pontos, para os quais conhecida a sua localizao espacial. Estas variveis, que incorporam localizao espacial no so completamente aleatrias, pois apresentam um comportamento estruturado que reflecte a semelhana de valores medidos em posies prximas no espao [15]. A este tipo de variveis aleatrias, Matheron deu a designao de Variveis Regionalizadas (VR) que, para alm do aspecto aleatrio da variao imprevisvel dos valores entre os pontos e o espao, compreendem um aspecto estruturado que reflecte as ligaes (correlaes) entre os pontos do espao onde o fenmeno ocorre [16]. A partir de um conjunto restrito de valores que representam a realizao de uma ou mais VR e do conhecimento qualitativo adquirido sobre um fenmeno espacial em estudo (experincia pessoal, conselho de especialistas, etc), pode ser desenvolvido um modelo que descreve a aleatoriedade espacial do fenmeno e permite quantificar a sua incerteza espacial. Neste sentido, a Geoestatstica associa a aleatoriedade com a VR atravs de um modelo estocstico, considerando que a VR uma de vrias realizaes possveis de uma funo aleatria [15].
4.2.2 Modelo Geoestatstico

Como foi visto anteriormente, a abordagem determinstica associa a qualquer ponto do espao no amostrado uma nica estimativa sem fornecer uma medida de estimao; a abordagem probabilstica, por seu turno, associa estimao uma probabilidade de ocorrncia [14]. Enquanto os modelos deterministas geralmente assentam no conhecimento fsico do fenmeno, a informao utilizada nos modelos probabilistas proveniente, na maior parte dos casos, de dados experimentais [14]. Nos modelos geoestatsticos, os dados amostrais so interpretados como provenientes de um processo aleatrio. O facto de estes modelos incorporarem a incerteza na sua concepo no significa que o fenmeno em si tenha resultado de um processo aleatrio, mas serve somente de base metodolgica inferncia espacial ou estimao de grandezas em reas no amostradas e quantificao da incerteza associada ao estimador[13]. A geoestatstica baseada em processos aleatrios com dependncia. Num contexto espacial ou temporal, tal dependncia designada auto-correlao. Com apenas um conjunto _______________________________________________________________________ Rui Martins, Lus de Sousa

44

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

de valores medidos, no existe esperana de se conhecerem as regras de dependncia. Contudo, atravs de observaes contnuas de vrias amostras, as dependncias tornam-se aparentes. Um valor localizado espacialmente em x1 (denominao genrica de um conjunto de coordenadas geogrficas) interpretado como uma realizao z(x1) da varivel aleatria Z(x1). No espao A, no qual se dispersa o conjunto de amostras, temos as realizaes das N variveis aleatrias Z(x1), Z(x2), ..., Z(xn), correlacionadas entre si.
4.2.2.1 Funo Aleatria Estacionria

O conjunto de variveis aleatrias Z(xi), i=1, ..., N, correlacionadas entre si, constituem uma funo aleatria, da qual s se conhece uma realizao Z(xi) o conjunto dos dados experimentais. A soluo proposta no formalismo geoestatstico consiste em assumirem-se diversos graus de estacionariedade da funo aleatria, de modo a que a inferncia de alguns parmetros estatsticos seja possvel. Assim, se for admitido que todas as variveis aleatrias tm a mesma mdia, E{Z(x1)} = E{Z(x2)} = ... = E{Z(xi)} = E{Z(x)} = m, (4.3)

este parmetro, que passa a ser independente da localizao de xi, pode ser estimado custa de uma mdia aritmtica dos valores das realizaes das variveis aleatrias:

(4.4) Esta hiptese de estacionariedade da mdia parte integrante e fundamental do modelo probabilista geoestatstico e no pode nunca ser validada ou refutada na prtica, uma vez que, na realidade, s existe uma realizao da funo aleatria. Julgar esta hiptese de estacionariedade como apropriada julgar a mdia das amostras como representativa da rea A, ou que os valores das amostras so suficiente homogneos para validar aquela representatividade[13].
4.2.2.2 Estacionariedade do Semivariograma e da Covarincia espacial

A ideia da estacionariedade usada para se obter a replicao necessria[11]. Existem dois tipos de estacionariedade. O primeiro, como j foi visto, designado por estacionariedade da mdia, isto , a mdia constante entre amostras e independente da _______________________________________________________________________ Rui Martins, Lus de Sousa

45

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

localizao. O segundo tipo de estacionariedade designado por estacionariedade do 2 momento para a covarincia e estacionariedade intrnseca para semivariogramas. A estacionariedade do 2 momento a suposio de que a covarincia a mesma entre quaisquer dois pontos que estejam mesma distncia e direco. A covarincia dependente da distncia entre quaisquer dois valores e no da sua localizao. Para os semivariogramas, a estacionariedade intrnseca a suposio que a varincia da diferena a mesma entre quaisquer dois pontos que estejam mesma distncia e direco independentemente dos pontos que se escolham [11]. A hiptese de estacionariedade em relao a estas estatsticas definida do seguinte modo: a correlao (4.5) e a varincia (4.6) entre duas variveis aleatrias depende somente da distncia espacial que as separa e independente da sua localizao. Dado um vector h que distancia duas variveis aleatrias, temos que: C(Z(x1), Z(x2)) = C(Z(xi), Z(xi + h)) = C(h), ?(Z(x1), Z(x2)) = ?(Z(xi), Z(xi + h)) = ?(h) (4.5) (4.6)

Tal como para a mdia, a hiptese de estacionariedade do segundo momento permite a inferncia daquelas medidas o semivariograma (4.7) e a covarincia (4.8) com base nas N amostras Z(xa), a = 1, ..., N

(4.7)

(4.8)

sendo
4.2.3 Anlise Estrutural

O elemento estruturante Biponto (par de pontos separados por uma distncia h) um instrumento geoestatstico de medida da continuidade espacial das caractersticas de um recurso natural ou fenmeno espacial. Esta medida desempenha um papel crucial na

metodologia geoestatstica, cumprindo, fundamentalmente, dois objectivos: a caracterizao e a quantificao do modo como se dispersam espacialmente as caractersticas de um recurso _______________________________________________________________________ Rui Martins, Lus de Sousa

46

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

o grau de continuidade espacial, o modo diferencial como a grandeza se dispersa no espao (anisotropia) prtica que se denomina, na linguagem geoestatstica, anlise estrutural; por outro lado serve de base aos processos de inferncia espacial/estimao e simulao. O biponto apesar de no abranger a noo de conjunto conexo (dois pontos podem pertencer simultaneamente a X, e este no ser conexo), , no entanto, o elemento estruturante privilegiado na prtica geoestatstica de anlise de continuidade espacial de um recurso natural, quando este provem de um conjunto de amostras ou observaes, normalmente discreto, limitado e, na maioria das vezes, escasso. Para diferentes valores de h (designado em terminologia anglosaxnica por lag size) obtm-se as diferentes nuvens, que so representativas da correlao linear entre os valores Z(x) das amostras localizadas em x e os valores das amostras distanciadas de h, Z(x + h). O conjunto destas nuvens, para os diferentes passos h, contm a quase totalidade da informao disponvel, a partir do biponto, relativa ao grau de disperso/continuidade da varivel Z(x). No entanto, para uma melhor interpretao e posterior utilizao, necessrio sintetizar as nuvens em instrumentos que, resumindo a sua disperso, permitem visualizar a sua evoluo com h [13].
4.2.3.1 Parmetros do Semivariograma

A Figura 4.8 ilustra um semivariograma experimental com caractersticas muito prximas do ideal. O seu padro representa o que, intuitivamente, se espera de dados de campo, isto , que as diferenas {Z(xi) - Z(xi + h)} decresam medida que h, a distncia que os separa decresce. esperado que observaes mais prximas geograficamente tenham um comportamento mais semelhante entre si do que aquelas separadas por maiores distncias. Desta maneira, esperado que ? (h) aumente com a distncia h. Os parmetros do semivariograma podem ser observados directamente da Figura 4.8 : 1. Alcance (a): distncia dentro da qual as amostras se apresentam correlacionadas espacialmente. 2. Patamar (C): o valor do semivariograma correspondente ao seu alcance (a). Deste ponto em diante, considera-se que no existe mais dependncia espacial entre as amostras, porque a varincia da diferena entre pares de amostras (Var[Z(x) Z(x+h)]) torna-se invariante com a distncia.
3. Pepita (C0): idealmente, ? (0)=0. Na prtica, medida que h tende para 0 (zero), ? (h)

_______________________________________________________________________ Rui Martins, Lus de Sousa

47

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

aproxima-se de um valor positivo chamado Efeito Pepita, que revela a descontinuidade do

semivariograma para distncias menores do que a menor distncia entre as amostras. Parte desta
descontinuidade pode ser tambm devida a erros de medio [11], mas impossvel quantificar se a maior contribuio provm dos erros de medio ou da variabilidade de pequena escala no captada pela amostragem.

4. Contribuio (C1): a diferena entre o patamar (C) e o Efeito Pepita (Co).

Figura 4.8 Parmetros do Semivariograma O grfico do semivariograma experimental, ? (h) , calculado atravs da equao (4.7), formado por uma srie de valores, conforme ilustra a Figura 4.8, sobre os quais se objectiva ajustar uma funo. importante que o modelo ajustado represente a ? (h) em relao a h. Deste modo, as estimativas obtidas sero mais exactas e, portanto mais confiveis. Os modelos aqui apresentados so considerados modelos bsicos, denominados de modelos isotrpicos (quando uma funo depende apenas da distncia entre dois locais e no da posio relativa desse locais). Esto divididos em dois tipos: modelos com patamar e modelos sem patamar. Modelos do primeiro tipo so referenciados na geoestatstica como modelos transitivos. Alguns dos modelos transitivos atingem o patamar (C) assimptoticamente. Para tais modelos, o alcance (a) arbitrariamente definido como a distncia correspondente a 95% do patamar. Modelos do segundo tipo no atingem o patamar, e continuam a aumentar enquanto a distncia aumenta. Tais modelos so utilizados para modelar fenmenos que possuem capacidade infinita de disperso, o caso do modelo Potncia. Os modelos transitivos mais utilizados so: modelo esfrico, modelo exponencial e modelo gaussiano. Estes modelos esto apresentados na figura 4.9 com o mesmo alcance (a).

_______________________________________________________________________ Rui Martins, Lus de Sousa

48

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 4.9 Representao grfica de modelos transitivos normalizados


4.2.3.2 Modelo Esfrico

Trata-se de um dos modelos mais usados em geoestatstica, funo de dois parmetros: um patamar C, limite superior para o qual tendem os valores do semivariograma com o aumento dos valores de h (que neste exemplo toma o valor de 1), e o alcance (a), distncia a partir da qual os valores de ?(h) param de crescer e so iguais a um patamar que normalmente coincidente com a varincia de Z(x) [13]. O modelo esfrico tem a seguinte expresso:

(4.9)
4.2.3.3 Modelo Exponencial

uma funo dos mesmos parmetros do modelo esfrico. O patamar corresponde ao valor para o qual o semivariograma tende assimptoticamente. O valor do alcance (a) a distncia em que o modelo atinge 95% do patamar: ?(a) = 0.95C. O modelo exponencial tem a seguinte expresso:

(4.10)
4.2.3.4 Modelo Gaussiano

Os modelos apresentados anteriormente tm um crescimento relativamente rpido junto da origem, como se pode constatar pela figura 4.9, denunciando um comportamento tpico de fenmenos relativamente irregulares. No entanto existem outros fenmenos, bastante mais

_______________________________________________________________________ Rui Martins, Lus de Sousa

49

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

regulares e contnuos, que denunciam um crescimento lento de ?(h) originando um comportamento parablico na origem. O modelo Gaussiano tem a seguinte expresso:

(4.11) O alcance neste modelo igualmente a distncia para o qual o modelo atinge 95% do patamar.
4.2.3.5 Modelos de Anisotropia

A continuidade espacial de um recurso natural, por exemplo, pode variar com as diferentes direces do espao. Uma dada caracterstica de um recurso natural diz-se que tem uma estrutura de continuidade espacial istropa quando o semivariograma (ou covarincia) tem o mesmo comportamento em todas as direces (isto , ?(h) depende somente do mdulo do vector h). Na situao em que a varivel em estudo se estende preferencialmente, de um modo mais contnuo, numa direco particular, d origem a uma estrutura anistropa. A anisotropia estrutural pode ser entendida como a variabilidade ou continuidade diferencial dependente das direces do espao[13]. Os modelos mais comuns de anisotropia so: a anisotropia geomtrica e a anisotropia zonal. 1. Anisotropia Geomtrica Semivariogramas estimados para diferentes direces apresentam o mesmo modelo, o mesmo patamar, mas amplitudes diferentes a amplitude mxima verifica-se na direco perpendicular amplitude mnima.

Figura 4.10 - Representao grfica da anisotropia geomtrica

_______________________________________________________________________ Rui Martins, Lus de Sousa

50

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

2. Anisotropia Zonal Quando o patamar do semivariograma diferente para a direco perpendicular considerada.

Figura 4.11 - Representao grfica da anisotropia zonal


4.2.3.6 O que se v num Semivariograma

Com um simples exemplo grfico, pode-se perceber aquilo que a forma de um Semivariograma representa.

Figura 4.12 Semivariogramas em amostras diferentes No conjunto de amostras da esquerda existe uma grande diferena entre medies feitas em locais adjacentes, o que proporciona um Semivariograma quase horizontal e constante. No centro temos um conjunto de amostras com alguma correlao espacial, o efeito de pepita j quase zero, existe j um patamar quase definido. No conjunto da direita, a correlao espacial entre as amostras muito maior, pelo que o Semivariograma gerado quase perfeito.
4.2.4 Estimao algoritmos de interpolao de krigagem

A partir da definio do modelo global de semivariograma , ento, possvel estimar valores do fenmeno espacial em pontos desconhecidos da rea de estudo. Neste tipo de situaes habitual utilizarem-se os mtodos de interpolao de krigagem. O nome de krigagem designa um conjunto de algoritmos de regresso linear, com base num critrio de _______________________________________________________________________ Rui Martins, Lus de Sousa

51

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

mnimos quadrados, em homenagem ao investigador Daniel Kridge que se apercebeu, durante o seu trabalho de prospeco nas minas sul africanas, que a varincia de disperso dos teores reais de ouro num painel de pesquisa de uma mina sempre mais fraca que a varincia de disperso dos resultados de uma amostragem interior, estando subjacente um erro sistemtico da sobrestimao dos painis ricos e subestimao dos pobres. Apenas se poder evitar este tipo de erros, se a estimao do teor mdio de determinada zona incluir toda a informao disponvel e ponderada por coeficientes que tomem em considerao a estrutura espacial do fenmeno, e portanto a sua irregularidade[16]. Os algoritmos de krigagem tm por base o estimador linear de regresso [Z(x0)*], definido por:

(4.12) Onde ?i so ponderadores a afectar s amostras e Z(xi) representa os valores da VR em vrios pontos das amostras do espao i=1, 2, ..., N na vizinhana de x0. m e mi so os valores esperados de z(x0) e z(xi), respectivamente. seguintes condies: 1. A mdia dos desvios entre os valores reais e os estimadores deve ser nula condio de no enviezamento universal: E[Z(x0) Z(x0)*] = 0, de modo a desagregar os agrupamentos preferenciais de amostras. Amostras agregadas tm menos peso que amostras isoladas. 2. A varincia de estimao, s E2 = Var[Z(x0) Z(x0)*], deve ser mnima. A krigagem actualmente utilizada devido principalmente ao facto de requerer apenas a modelao do semivariograma e possibilitar o clculo da varincia de estimao atravs de ponderadores, no dependendo dos valores da VR. Apresenta como principais propriedades : 1) Exactido. As estimativas das amostras Z(xa) em locais conhecidos so idnticas aos seus valores experimentais: 2) Regularidade. Os interpoladores de krigagem fornecem sempre uma soluo nica e 3) Varincia de estimao no depende dos valores das amostras Z(xa). Isto significa que a mesma configurao amostral (com as mesmas relaes geomtricas entre amostras e o ponto a estimar) reproduz sempre a mesma varincia de estimao em Este estimador construdo com base nas

_______________________________________________________________________ Rui Martins, Lus de Sousa

52

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

qualquer parte da rea A. Assim, a varincia de estimao no mede a incerteza da estimao resultante da variabilidade local [13]. As diferenas existentes entre os interpoladores de krigagem assentam na definio do modelo de funo aleatria Z que habitualmente decomposta numa componente residual R e numa componente de deriva m: Z = R + m [14]. A componente residual modelada como uma funo aleatria estacionria de mdia zero e covarincia CR(h) = E[R(x)*R(x+h)], o que leva a que o valor esperado da FA Z na posio x0 seja dado pelo valor da componente de deriva naquele local, ou esperana de Z. Consoante o modelo de deriva m escolhido, trs variantes da krigagem podem ser consideradas: Krigagem Simples (KS); Krigagem Ordinria (KO) e Krigagem Universal (KU).
4.2.4.1 Krigagem Simples

Neste tipo de krigagem a componente de deriva modelada como a mdia estacionria dos valores da amostra. Esta mdia m conhecida e constante na rea de estudo. Deste modo, com base na expresso (4.12) podemos definir o estimador de krigagem simples como:

(4.13) Os N ponderadores ?iKS so determinados de modo a minimizar a varincia do erro s E2 de acordo com a segunda condio do estimador geral de krigagem. Este algoritmo normalmente aplicado em situaes em que o formalismo terico do modelo impe o conhecimento da mdia da funo aleatria, ou ento quando existe um bom conhecimento da tendncia (deriva) do fenmeno. Nestes casos podem assumir-se os valores dessa deriva (quando conhecida em todo o campo) como a mdia das variveis aleatrias referentes aos valores amostrados e aos pontos no espao no amostrado [13].

Figura 4.13 Krigagem Simples

_______________________________________________________________________ Rui Martins, Lus de Sousa

53

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

4.2.4.2 Krigagem Ordinria

Na KO a mdia m desconhecida e varia localmente na rea de estudo. Isto significa que a estacionariedade da mdia limitada a uma dada vizinhana V, centrada na posio a estimar x0 [14]. Apesar de desconhecida, a mdia m pode ser filtrada da estimao forando a que a soma dos ponderadores de krigagem seja igual a 1 [14]. Assim, o estimador de krigagem expresso por

(4.11)

Figura 4.14 Krigagem Ordinria


4.2.4.3 Krigagem Universal

Neste caso, o modelo de deriva considera que a mdia varia localmente dentro de uma determinada vizinhana V em funo das coordenadas, segundo a expresso geral

(4.15) onde as funes fk so conhecidas e os coeficientes ak desconhecidos e constantes. Deste modo a deriva fica modelada por uma polinomial. Assim, utilizando a expresso (4.12) podemos descrever o estimador de KU, como:

(4.16)

_______________________________________________________________________ Rui Martins, Lus de Sousa

54

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Contudo, para o clculo dos coeficientes de deriva ak necessrio impor os seguintes constrangimentos:

(4.17) com k=0, 1 ..., K; o que leva seguinte expresso para o estimador de KU

(4.18)

Figura 4.15 Krigagem Universal com deriva de 2 Ordem


4.2.5 Consideraes sobre os ponderadores do estimador de krigagem

A determinao dos ponderadores que iro ser usados na estimao do ponto desconhecido resumem dois factores: - A distncia estrutural (segundo membro): quanto mais prximas estiverem as amostras do ponto desconhecido maior peso tero no estimador; - A desagregao (primeiro membro): quanto mais correlacionadas estiverem as amostras, maior o efeito de agrupamento ou redundncia e menor ser o seu peso individual na construo do estimador. [13] [?] = [K]-1 * [M] (4.19)

O primeiro membro desta equao a inversa da matriz que resulta de se aplicar o modelo escolhido atravs do semivariograma. Essa matriz no mais do que a varincia existente entre todas as amostras vizinhas ao ponto que se pretende estimar.

_______________________________________________________________________ Rui Martins, Lus de Sousa

55

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

O segundo membro surge aplicando a cada ponto vizinho conhecido do ponto desconhecido o modelo determinado no semivariograma, em funo da distncia a cada amostra vizinha.

4.3 Concluso
Existem dois grupos de algoritmos de interpolao de superfcies, os Determinsticos e os Geoestatsticos. Enquanto que os primeiros tentam ajustar ao conjunto de pontos conhecidos uma funo matemtica que modele as caractersticas do fenmeno em causa, os segundos usam estatsticas e modelos de previso que podem modelar incerteza e erros de medio. A Geoestatstica compe-se de duas fases principais, a Variografia, onde se quantifica a forma como os dados variam consoante a distncia entre si, e a Predio, onde se estimam valores para os pontos desconhecidos. No primeiro processo tenta-se encontrar o modelo que melhor descreva a auto-correlao existente entre os dados, modelo esse que se traduz num Semivariograma. o Semivariograma que vai permitir estimar valores desconhecidos; existem diversos tipos de Semivariogramas, entre os quais se destacam trs, Esfrico, Exponencial e Gaussiano. Dentro dos mtodos Geostatsticos, consideraram-se a Krigagem Simples, a Krigagem Ordinria e a Krigagem Universal. A Krigagem Universal comporta derivas polinomiais, ao passo que os outros dois mtodos no, usando apenas mdias dos valores medidos. No entanto a Krigagem Ordinria considera mdias locais em redor do ponto de estimao, enquanto que a Krigagem Simples considera apenas a mdia global, para toda a rea de estimao. Por esta razo, a Krigagem Simples foi excluda dos modelos a usar, pois no se revelou realista em relao amostra deste estudo (este facto ser aprofundado no Captulo V). Os mtodos Geostatsticos comportam melhor as caractersticas de variveis que modelam fenmenos fsicos naturais, como o caso. Tome-se por exemplo a amostra da figura 4.16;

Figura 4.16 Diferenas entre mtodos Geostatsticos e Determinsticos

_______________________________________________________________________ Rui Martins, Lus de Sousa

56

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Existem cinco medies esquerda com valores baixos, e uma com um valor alto direita, de esperar que a amostra da direita tenha uma influncia maior na superfcie gerada. Usando um mtodo determinstico (IDW), a influncia dos pontos mais baixos estende-se bastante pela superfcie, e o ponto mais alto aparece como um pico no meio de uma zona de valores mdios. Com um mtodo Geoestatstico, no s dada maior influncia ao ponto medido isolado, como identificada uma deriva (uma inclinao) da que sobe da esquerda para a direita da superfcie.

_______________________________________________________________________ Rui Martins, Lus de Sousa

57

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

CAPTULO V GERAO DE SUPERFCIES


5.1 Integrao dos Dados
Como exemplo significativo de um conjunto de dados a processar com as ferramentas de SIG anteriormente discutidas, foram postos nossa disposio vrios conjuntos de dados, obtidos no mbito do projecto MAROV. Estes dados, dividem-se em trs grupos, primeiro um conjunto de shapefiles (layers vectoriais do ArcGIS), com a linha da costa das ilhas do Pico e do Faial, linhas de batimetria em torno das mesmas ilhas, e enrocamentos dos molhes e afloramentos rochosos na zona circundante ao Monte da Guia. Depois um conjunto de rasters com mapas hidrogrficos tanto das duas ilhas como pormenores da zona do Monte da Guia nas escalas 1:500 e 1:3500. Por ltimo um conjunto de mais de 400 mil leituras de profundidade recolhidas por sonar.

Figura 5.1 Shapefiles linha da costa, batimetria, enrocamento e afloramento rochoso.

_______________________________________________________________________ Rui Martins, Lus de Sousa

58

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

As shapefiles encontram-se numa projeco de Mercator no paralelo 383330, num Datum WGS84. O passo seguinte foi a georeferenciao do raster de um mapa do Monte da Guia e respectiva rea circundante numa escala de 1 para 3750. Esta georeferenciao foi levado a cabo em pontos de morfologia bem distinta como a ponta norte do molhe leste, a Ponta da Greta, a Ponta das Furnas, a ponta dos Peixes Reis e a Ponta das Garas.

Figura 5.2 Shapefiles e Mapa georeferenciado. Com estes dois elementos j integrados, ficou a faltar a incluso das amostras de profundidade no conjunto. As amostras encontravam-se inicialmente num ficheiro de texto, com quatro campos diferentes por amostra, um valor em longitude (eixo xx), um valor em latitude (eixo yy), a leitura de profundidade no ponto (eixo zz) e um valor de varincia. A primeira operao foi transportar estes dados para o formato ArcGIS, criando com eles uma Base de Dados prpria para a continuao do trabalho. O ArcGIS interpreta automaticamente os valores de x e y como medidas de posio e pode j a esta altura mostrar, cada registo da Base de Dados criada, como um ponto num layer vectorial. Apesar destes automatismos, a integrao deste conjunto de dados seria bem mais laboriosa, uma vez que no se poderia fazer atravs de uma georeferenciao como no raster, teria que ser efectuada uma projeco no espao dos dados j integrados. _______________________________________________________________________ Rui Martins, Lus de Sousa

59

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 5.3 Pontos de referncia para projeco Os valores de posio indicam a distncia, em metros, de cada amostra relativamente ao ponto de coordenadas 383048 Norte e 283806 Oeste. Este ponto coincide com o canto inferior esquerdo do mapa j integrado, e representa interseco dos eixos xx e yy, o ponto de coordenadas (0,0). Com esta informao adicionamos Base de Dados pontos de referncia nas interseces dos meridianos e paralelos representados no mapa raster. Tabela 5.1 Pontos auxiliares de projeco Longitude 28 38 06" W 28 38' 00" W 28 38' 00" W 28 37' 30" W 28 37' 30" W Latitude 38 30 48" N 38 31' 00" N 38 31' 30" N 38 31' 00" N 38 31' 30" N X 0 145,081519 145,081519 870,489113 870,489113 Y 0 371,0648 298,72691 371,06483 1298,72691

Tendo estes pontos como guias, passou-se projeco deste layer. Seguindo a projeco do layer do vector da linha da costa, usou-se uma Projeco de Mercator no paralelo 38 33' 30" Norte, no mesmo Datum, WGS84.

_______________________________________________________________________ Rui Martins, Lus de Sousa

60

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 5.4 Shapefiles, Mapa georeferenciado e Pontos de leitura. Como se pode observar pela figura, apesar de haver um grande quantidade de amostras, existiam ainda zonas considerveis sem informao de profundidade na Base de Dados, tanto no mar como em terra, sendo completamente inexistente na ltima. Recorrendo informao de altimetria e batimetria, presente no mapa raster sob a forma de curvas de nvel, foi enriquecida a Base de Dados com esta informao adicional. Foram introduzidos, entre outros, pontos sobre a linha da costa, nos 10, 50 e 100 metros de altura, e nos 20, 30, 50 e 100 metros de profundidade. Este conjunto final de amostras abrange uma zona com aproximadamente 2271 metros de ordenadas por 2612 metros de coordenadas.

_______________________________________________________________________ Rui Martins, Lus de Sousa

61

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 5.5 Shapefiles, pontos de leitura, pontos de batimetria e altimetria Com esta nova informao adicionada ao conjunto de informao puderam-se finalmente aplicar os modelos geoestatsticos explorados no captulo IV.

5.2 Anlise Exploratria Espacial


Antes de se dar incio interpolao de superfcies, parte integrante do trabalho de Geoestatstica a fase de anlise exploratria espacial. nesta primeira fase que tomado conhecimento com a distribudos os dados, sendo possvel chegar a algumas concluses acerca dos mtodos que se enquadram melhor no conjunto de amostras. De forma a facilitar este trabalho o ArcGIS Geostatistical Analyst pe ao dispor a ferramenta Exploratory Spatial Data Analysis (ESDA), que inclu um conjunto de utilitrios que mostram uma srie de facetas dos dados em estudo. O ESDA cria Histogramas, mapas de Voronoi, modelos a trs dimenses da distribuio de amostras, entre outros, que fornecem um conjunto vasto de caractersticas preciosas acerca dos dados. Infelizmente um destes utilitrios, o mapa de nuvens de Semivarincia/Covarincia, no pode ser usado dado que apenas est preparado para trabalhar com conjuntos de no mximo trezentos pontos, muito aqum dos quatrocentos mil em estudo. _______________________________________________________________________ Rui Martins, Lus de Sousa 62

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

De seguida apresentada e interpretada a informao dada pelo ESDA acerca da amostragem em estudo.
5.2.1 Descrio Univariada das amostras

A Mediana, na figura 5.6, indica que 50% dos valores esto acima de -15,16 metros e que os outros 50% esto abaixo de -15,16 metros, o meio da distribuio. A vantagem da mediana em relao mdia que a mediana no sensvel a valores extremos tambm denominados outliers. Como a mediana e a mdia, neste caso onde existe uma grande amostragem, esto relativamente prximas, indicam que no existem muitos desvios de valores nas amostras. Comprovado igualmente pelos valores mximo e mnimo presentes na amostragem.

Figura 5.6 Histograma inicial Analisando o desvio padro pode-se constatar que apesar da mdia ser de -18,749 metros, como existe um grande desvio padro pode-se garantir que existe alguma inclinao. Esta inclinao corresponde tendncia que as amostras tm de apresentar valores mais profundos medida que se afastam da costa. Pela anlise do coeficiente de assimetria (skewness) verifica-se que a distribuio no simtrica, caso em que a mdia menor que a mediana. Mais propriamente est-se perante uma distribuio assimtrica negativa com o valor de assimetria de -0,83206. Quando assim acontece as mdias locais baixam e as varincias aumentam pois existe maior discrepncia entre as amostras. Este fenmeno justificado pela influncia que tem a distncia a que esto o mximo e mnimo de uma distribuio assimtrica. So estas situaes caracterizadas por

_______________________________________________________________________ Rui Martins, Lus de Sousa

63

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

um aumento das varincias locais que normalmente implicam a inferncia espacial com maior incerteza e maiores erros [13]. Analisando agora os quartis pode-se concluir que as amplitudes entre o primeiro quartil e a mediana, e a mediana e o terceiro quartil so aproximadamente equidistantes. No entanto, o nmero de amostras no se encontra bem distribudo face ao intervalo considerado, isto , o intervalo entre o valor mximo e mnimo presentes nas amostras. Analisando ainda a

amplitude inter-quartil (Q - Q) conclu-se que 50% dos elementos do meio da amostra, esto contidos num intervalo com uma amplitude de 20,337 metros, o que vai de encontro rea de estudo do fenmeno fsico. O valor kurtosis uma medida que revela se a distribuio dos dados achatada ou pontiaguda quando comparada com a distribuio normal, cujo valor 3, e indica com que probabilidade a distribuio ir criar outliers. Em termos grosseiros indica a distncia a que esto os valores mximo e mnimo da mdia da distribuio. O valor kurtosis de uma distribuio normal de 3, e dado pela seguinte expresso:

(5.1) onde xi so os valores das amostras, x a mdia, N o nmero total de amostras e s o desvio padro. Com os dados em questo, verifica-se que o valor de kurtosis de 2,7929, o que representa uma distribuio relativamente achatada quando comparada com uma distribuio normal. Aps terem sido introduzidos os 6203 pontos adicionais, mostrados na figura 5.6, verificou-se que as nicas alteraes significativas foram, por um lado o aumento do valor de kurtosis e por outro um pequeno aumento quer do primeiro quartil, quer da mediana. Os pontos introduzidos foram alguns pontos de batimetria, altimetria e pontos da linha da costa onde a cota zero. A alterao que se verificou no valor do kurtosis foi pouco significativa e apenas tornou a distribuio ligeiramente pontiaguda quando comparada com uma distribuio normal. As alteraes ocorridas com o primeiro quartil e com a mediana podem ser justificadas com a diferente proporo de valores que foram introduzidos. Foram introduzidos mais valores de altimetria e da linha da costa, valores esses que so superiores mediana, e que provocaram um ligeiro desvio desta, de -15,16 para -14,813.

_______________________________________________________________________ Rui Martins, Lus de Sousa

64

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 5.7 Histograma aps a introduo de pontos


5.2.2 Descrio Espacial

Uma das ferramentas que includa no ESDA para descrio espacial o analisador de derivas. Esta ferramenta aps por no plano xy as amostras faz uma projeco dos pontos nos planos xz e yz. De seguida ajusta funes polinomiais que permitam descrever as derivas a que os dados esto sujeitos. Com os dados iniciais, figura 5.8, constata-se a existncia de derivas, quer no sentido Norte Sul (linha azul) quer no sentido Este - Oeste (linha verde) pois as linhas no so horizontais.

Figura 5.8 Deriva nos dados iniciais Com a incluso dos pontos de batimetria, altimetria e linha da costa, figura 5.9, as derivas continuaram a ser claramente visveis. De modo a apurar em que sentido se faz sentir exactamente a deriva, rodaram-se os dados, no sentido contrrio ao dos ponteiros do relgio, e verificou-se que a deriva existe e se faz sentir no sentido Noroeste Sudoeste, claramente

_______________________________________________________________________ Rui Martins, Lus de Sousa

65

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

visvel na figura 5.10. Pela sua forma em U o melhor ajustamento ser atravs de um polinmio de segunda ordem.

Figura 5.9 Deriva aps a incluso de pontos

Figura 5.10 Deriva Noroeste - Sudoeste A existncia de uma deriva igualmente confirmada se for tido em linha de conta o campo onde estas amostras foram recolhidas. No campo, podemos observar, medida que nos deslocamos de Noroeste para Sudeste, que comeamos com valores de altimetria bastante elevados e chegamos a valores de profundidade que vo aumentando gradualmente nesse sentido. Uma das implicaes imediatas desta concluso a ineficcia do mtodo de Krigagem Simples para este conjunto de dados, pois existe uma deriva. Este mtodo trabalha com um mdia constante ao longo de toda a rea de estudo, o que irreal quando existe uma tendncia clara nos dados.

_______________________________________________________________________ Rui Martins, Lus de Sousa

66

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica


5.2.3 Mapas de Voronoi

30-09-2002

Os mapas de Voronoi so compostos por uma srie de polgonos formados em torno de cada ponto de amostragem. Os polgonos de Voronoi so criados de tal maneira que, cada ponto dentro do polgono esteja mais perto do ponto de amostragem contido no polgono, do que de qualquer outro. Depois de criados os polgonos so definidos os vizinhos, sendo estes todos os que partilham arestas com o polgono da a amostra em causa.

Figura 5.11 Exemplo de um Mapa de Voronoi Neste exemplo podemos ver uma amostra a amarelo cercada por um polgono de Voronoi a vermelho. Os polgonos azuis so os vizinhos da amostra amarela. Todos os pontos do polgono vermelho esto mais perto da amostra amarela do que qualquer outra. Usando estas definies podem-se calcular uma srie de diferentes estatsticas teis. Por exemplo a mdia local encontra-se calculando a mdia dos pontos nos polgonos azuis e vermelho, ou seja a mdia local num polgono mdia do seu valor e dos valores dos seus vizinhos. Seguidamente apresentam-se os mtodos de clculo dos mapas de Voronoi utilizados neste estudo. Simples o valor atribudo a um polgono o mesmo do ponto de amostragem nele contido. D indicaes acerca da influncia local de cada ponto. Alcance Inter-Quartil (IQR) so calculados o primeiro e terceiro quartil a partir da distribuio dos valores das amostras do polgono e dos seus vizinhos. O valor atribudo ao polgono de Voronoi a diferena entre o valor do primeiro e do terceiro quartis. D indicaes acerca da variabilidade local. Aglomerado os polgonos so todos agrupados em cinco classes, se a classe de um polgono for diferente de todas as dos seus vizinhos este considerado neutro (representado a cinzento). Este mtodo permite identificar outliers.

_______________________________________________________________________ Rui Martins, Lus de Sousa

67

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Mdia o polgono toma o valor da mdia do seu valor com os dos seus vizinhos. Permite asseverar da suavidade local. Foram usados alguns dos tipos de mapas de Voronoi gerados pelo ESDA, quer para tomar conhecimento das caractersticas dos dados, quer para perceber o modo como a incluso de valores de altitude e batimetria afectaram estas caractersticas.

Figura 5.12 Mapas Voronoi Simples, inicial (esquerda) e com pontos adicionais (direita) A introduo dos novos dados vem, como esperado, tirar influncia a algumas das amostras do conjunto inicial. Principalmente em terra, onde a informao era totalmente ausente, as novas amostras vm retirar peso a algumas das amostras obtidas perto da linha da costa, que como tal dariam um indicao bastante errada acerca da evoluo da superfcie em terra. Daqui se conclu que neste captulo a incluso de amostras adicionais foi bem sucedida.

Figura 5.13 Mapas Voronoi IQR, inicial (esquerda) e com pontos adicionais (direita) Outro dos objectivos da incluso de amostras adicionais fica igualmente patente como bem sucedido, olhando para os mapas de Voronoi IQR. Em praticamente todo o espao da amostragem h uma diminuio da variabilidade local.

_______________________________________________________________________ Rui Martins, Lus de Sousa

68

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 5.14 Mapas Voronoi Aglomerado, inicial (esquerda) e pontos adicionais (direita) Tal como visto na anlise dos histogramas, a introduo de novos dados no mudou significativamente a probabilidade de existncia de outliers. Pode-se no entanto constatar, nos mapas de Voronoi Aglomerado, que a existncia destes deixa de ser tendencialmente no mar para passarem a estar em terra.

Figura 5.15 Mapas Voronoi Mdia, inicial (esq) e com pontos adicionais (dir) Nestes mapas fica patente que as novas amostras includas propiciam uma superfcie mais suave, dado que vo adicionar informao em zonas para as quais no existia. Este era igualmente um dos objectivos da incluso de amostras adicionais, e pode ser dado como cumprido.

5.3 Gerao de Superfcies


Depois de concluda a anlise exploratria espacial dos dados passou-se gerao de superfcies de acordo com os conhecimentos obtidos nesta anlise. Os tipos de Krigagem usados foram a Krigagem Ordinria e a Krigagem Universal com derivas de Primeira e de Segunda Ordem. Cada um destes mtodos foi usado com trs modelos de Semivariograma diferentes, Esfrico, Exponencial e Gaussiano, e ainda um modelo de combinao dos trs. _______________________________________________________________________ Rui Martins, Lus de Sousa

69

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Todos estes modelos foram usados com Anisotropia. As polinomiais de deriva usadas nos mtodos de Krigagem Universal, foram as geradas pela ferramenta ESDA, que como se pode ver nas figuras 5.9 e 5.10, seguem a deriva identificada anteriormente na anlise de estrutura espacial. Para a exucuo dos algoritmos de interpolao foi usada uma mquina com um processador INTEL Pentium III, com uma frequncia de relgio de 933 MHz, e com 512 Mbytes de memria RAM. Este sub-captulo mostra o caminho levado desde a escolha dos modelos de Semivariograma a usar at s superfcies finais, passando pelos processos de Validao e Validao Cruzada, quer permitem seleccionar os modelos mais correctos para a amostra em causa.
5.3.1 Modelos de Semivariograma

Depois de se ter chegado concluso que no seria realstico aplicar a krigagem simples, restaram trs hipteses: krigagem ordinria, krigagem universal de segunda ordem e krigagem universal de primeira ordem. Apesar de se ter verificado que para se tratar a forma em U da deriva seria mais correcto utilizar um polinmio de segundo grau, decidiu-se fazer tambm algumas experincias com a primeira ordem, visto que a estimao um processo interactivo e que varia muito de caso de estudo para caso de estudo. Na krigagem ordinria verificou-se que o maior alcance o mesmo para todos os modelos e que s o menor alcance varia. O modelo que apresenta um valor maior para este ltimo o modelo exponencial, seguido do modelo esfrico e sendo o menor deles no modelo gaussiano. Este fenmeno, devido a existir uma anisotropia mais acentuada no modelo guassiano, provoca uma forma elptica mais acentuada porque a amplitude entre o maior e menor alcance maior, como se observa na figura 5.16.

_______________________________________________________________________ Rui Martins, Lus de Sousa

70

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 5.16 Krigagem ordinria com modelo exponencial e com modelo gaussiano A esta reduo incremental do menor alcance quando percorremos os modelos do exponencial para o gaussiano passando pelo modelo esfrico, corresponde um aumento incremental do efeito de pepita quando se percorrem os diferentes modelos no mesmo sentido. Quanto maior for o alcance de menor raio menor ser o efeito de pepita fazendo com que as amostras vizinhas exeram uma maior influncia nos pontos a estimar.

Figura 5.17 Modelo gaussiano esquerda e modelo exponencial direita Quanto menor for o efeito de pepita menor ser a influncia do conjunto total de amostras. Zonas onde exista uma grande quantidade de pontos o modelo exponencial (com menor efeito de pepita logo sofre uma maior influncia de pontos vizinhos) ser o melhor a aplicar, tal como se poder verificar em cima pela figura da direita. Na zona do monte da Guia onde existe uma grande amostragem de pontos foi notrio o desaparecimento de algum do padro de amostragem que o mapa tinha junto da linha da costa. Por outro lado zonas onde se dever fazer sentir uma maior influncia do conjunto total de amostras, o modelo gaussiano dever ser o melhor modelo. Neste caso, onde se deveria ter em linha de conta um conjunto de pontos mais dispersos, o modelo exponencial realou o padro de amostragem na zona onde foi feita uma viagem mais longe da costa e j em alto mar. Nesta zona o modelo _______________________________________________________________________ Rui Martins, Lus de Sousa 71

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

gaussiano foi claramente superior pois conseguiu esconder esse padro de amostragem aproveitando melhor a influncia dispersa que o conjunto de amostras naquela zona consegue oferecer. Na krigagem Universal de primeira ordem observou-se o mesmo efeito, isto , os modelos que tm um efeito de pepita mais elevado apresentam um valor maior no alcance menor. Nesta experincia o resultado que saltou mais vista foi o do modelo exponencial ser praticamente isotrpico. No modelo gaussiano a direco da elipse variou cerca de 342 onde se verificou tambm uma diminuio do patamar alcanado, que provavelmente indicar que num patamar entre a dos modelos exponencial e esfrico e entre a do modelo gaussiano a auto-correlao sofre uma alterao na direco em que se faz sentir, figura 5.18.

Figura 5.18 Krigagem Universal com deriva de primeira ordem Na krigagem Universal mas agora com uma deriva de segunda ordem, verificou-se o mesmo efeito que anteriormente, ou seja, o modelo que apresenta um menor raio de menor alcance tem um efeito de pepita superior. Nesta experincia foi no modelo exponencial que se verificou uma alterao de 315 na direco da elipse. Tal ocorrncia pode-se dever ao facto de o seu alcance ser maior, mas como apresenta uma isotropia quase perfeita, a direco da elipse no ir influenciar a escolha da melhor linha para modelar o semivariograma, como se pode ver na figura 5.19.

_______________________________________________________________________ Rui Martins, Lus de Sousa

72

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 5.19 Krigagem Universal com deriva de segunda ordem De modo a encontrar o modelo mais adequado aos dados em questo recorreu-se aos valores de Validao Cruzada, proporcionados pela ferramenta ESDA.
5.3.2 Validao Cruzada

A Validao Cruzada construda usando todos os dados conhecidos do modelo. Para cada ponto de amostragem conhecido retira-se o seu valor do conjunto de pontos, aplica-se ento o modelo nesta localizao espacial e estima-se um valor hipottico, ignorando que a amostra existe. Finalmente compara-se este valor com o valor medido. Este procedimento repetido para todos os pontos da amostragem, um de cada vez, obtendo-se no final uma regresso linear com os valores medidos contrapostos aos valores estimados para as mesmas localizaes.

Figura 5.20 Grfico de Validao Cruzada Nos testes de validao cruzada o ESDA apresenta um conjunto de estatsticas que permitem comparar formalmente diferentes modelos. Segue-se uma breve descrio das indicaes dadas por estes valores. _______________________________________________________________________ Rui Martins, Lus de Sousa

73

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Erro Mdio (EM) deve estar perto de zero e indica se a estimao ou no imparcial. No entanto este erro depende da escala dos dados. Raiz da Mdia Quadrada (RMQ) raiz quadrada da mdia das distncias quadradas da estimao recta da regresso linear da validao cruzada. Este valor d uma indicao da proximidade a que esto os valores estimados dos medidos. Quanto menor for melhor o modelo empregue. Mdia dos Erros Padro (MEP) Deve estar igualmente o mais perto de zero possvel. No entanto d tambm uma preciosa indicao de como est a ser tratada a variabilidade na estimao, se esta mdia estiver perto do Raiz da Mdia Quadrada. Se a MEP estiver acima do RMQ est a ser sobrestimada a variabilidade das estimaes, caso contrrio (MEP < RMQ) a variabilidade est a ser subestimada. Erro Mdio Aferido (EMA) a mdia dos erros de estimao aferidos. Deve estar perto de zero, d igualmente indicao da imparcialidade da estimao, mas agora no dependente da escala dos dados (erro aferido o resultado da diviso do erro de estimao pelo seu erro de estimao padro). Raiz da Mdia Quadrada Aferida (RMQA) outra forma de perceber a forma como est a ser tratada a variabilidade. Divide-se cada erro de estimao pelo seu erro padro estimado, o resultado destas divises deve ser, em mdia, semelhante, e a Raiz da Mdia Quadrada Aferida deve estar perto de um. Se este valor estiver acima de um est a ser subestimada a variabilidade, caso contrrio (RMQA < 1) est a ser sobrestimada. Como primeiro contacto com os valores de validao cruzada, passa-se a analisar os resultados obtidos por cada tipo de Semivariograma usado.
5.3.3 Semivariograma Esfrico

Para este tipo de Semivariograma a Krigagem Universal de 2 Ordem a que apresenta melhores resultados, este revelar-se- mesmo como o melhor modelo nesta fase. o modelo que obtm estimaes mais prximas dos valores medidos e o que trata melhor a variabilidade dos dados. Neste captulo a proximidade entre a RMQ e a MEP e a RMQP do os melhores valores de todas as simulaes levadas a cabo.

_______________________________________________________________________ Rui Martins, Lus de Sousa

74

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Tabela 5.2 Validao Cruzada para Semivariograma Esfrico


KO Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP -0,02277 2,075 3,058 -0,00753 0,6701 0,983 Melhor KU 1 Ord 0,01581 1,779 0,3561 0,02003 6,224 1,4229 Mdio KU 2 Ord -0,01863 1,732 2,124 -0,01045 0,8294 0,392 Pior

Quanto aos outros mtodos de Krigagem, o mtodo Ordinrio obteve aqui diferenas grandes entre valores estimados e medidos, mas revelou uma melhor considerao de variabilidade e incerteza que a Krigagem Universal de 1 Ordem. Em relao imparcialidade da estimao embora a KU 1 ordem tenha um EM mais baixo, este valor empolado depois de aferido, passando a KO a ter o melhor valor, no entanto de assinalar a igual descida do EM para o EMA verificado na KU de 2 ordem. A incluso do factor de deriva de 2 Ordem beneficia aqui bastante a KU, tal como aferido na anlise espacial. No entanto, como vamos ver esta situao apenas se verifica para o Semivariograma Esfrico.
5.3.4 Semivariograma Exponencial

Para este Semivariograma a KO revela-se novamente menos eficaz que a KU, entre os dois mtodos de KU o de 1 ordem revela-se agora ligeiramente melhor. Apesar de o EM e o EMA serem menores para a KU de 2 ordem, tambm existe um decrescimento para o valor aferido na KU de 1 ordem, se bem que no to acentuado. A RMQ menor para a KU de 1 ordem, sendo este ltimo valor o mais acertado acerca da proximidade entre valores medidos e estimados. Quanto variabilidade o modelo de KU de 1 ordem claramente o melhor, mas todos obtm um valor de RMQA bastante alto, dando a indicao de que este tipo de Semivariograma subestima em demasia a variabilidade dos dados.

_______________________________________________________________________ Rui Martins, Lus de Sousa

75

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica Tabela 5.3 - Validao Cruzada para Semivariograma Exponencial
KO Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP 0,01697 1,847 0,4988 0,01523 4,591 1,3482 Melhor KU 1 Ord 0,0165 1,758 0,4663 0,01549 4,712 1,2917 Mdio KU 2 Ord 0,009902 1,813 0,5121 0,002979 5,633 1,3009 Pior

30-09-2002

5.3.5 Semivariograma Gaussiano

Mais uma vez a KO fica claramente atrs da KU, e novamente a KU de 1 ordem obtm melhores resultados que a KU de 2 ordem. A KU de 2 ordem tem agora um valor mais baixo de RMQ, mas tem uma diferena muito grande deste valor para a MEP. Em relao imparcialidade das estimaes se bem que a KU tem o melhor EM, melhor EMA pertence, por pouca margem, KO; no entanto de realar a descida drstica do EM para o EMA, que se verifica nos trs modelos. Tabela 5.4 - Validao Cruzada para Semivariograma Gaussiano
KO Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP -0,01608 2,433 6,043 -0,00268 0,4022 3,61 Melhor KU 1 Ord -0,01171 2,152 4,035 -0,00283 0,5329 1,883 Mdio KU 2 Ord -0,01733 1,801 4,82 -0,00537 0,4956 3,019 Pior

Com o Semivariograma Gaussiano existe uma tendncia para a subestimao da variabilidade dos dados, por oposio ao que acontece com o Semivariograma Exponencial. No entanto de verificar como a KU de 1 ordem lida bastante melhor com esta caracterstica deste Semivariograma, obtendo valores bem razoveis de variabilidade.
5.3.6 Semivariograma Combinado

Com a combinao dos trs Semivariogramas so esbatidos alguns dos problemas encontrados na aplicao dos Semivariogramas Exponencial e Gaussiano, no entanto a KU de 2 Ordem falha redondamente. Tal como tinha lidado melhor com os Semivariogramas _______________________________________________________________________ Rui Martins, Lus de Sousa

76

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

anteriores a KU de 1 ordem mostra-se mais uma vez eficaz, e finalmente so obtidos resultados para a KO que no ficam muito atrs dos valores da KU. Nomeadamente o valor da RMQ bastante abonatrio para a KO, o que no acontece com a KU de 2 ordem. A KU de 2 ordem falha igualmente na imparcialidade da estimao, registando um EMA bastante acima do EM, ao contrrio do que se passa nos outros dois modelos. Tabela 5.5 - Validao Cruzada para Semivariograma Combinado
KO Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP 0,00943 1,73 0,7035 0,005621 2,373 1,0265 Melhor KU 1 Ord 0,009045 1,705 0,5785 0,005567 2,87 1,1265 Mdio KU 2 Ord 0,00072 1,782 0,5908 -0,01245 3,675 1,1912 Pior

5.3.7 Melhores Modelos depois da Validao Cruzada

Seguem-se os modelos com melhores resultados de Validao Cruzada, escolhidos entre os doze aqui apresentados anteriormente. A escolha dos melhores segue uma lgica de eliminao de modelos com valores anormalmente altos, maioritariamente encontrados para a MEP e a RMQA. So tambm eliminados modelos com valores de RMQ acima de 2,1 (neste caso s um esteve acima deste valor, nos testes subsequentes, no Monte da Guia, este valor ser mais alto). Tabela 5.6 - Resultados mais significativos
Semivariograma Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP KO Combin. 0,00943 1,73 0,7035 0,005621 2,373 1,0265 -Melhor KU 1 Ord Combin. 0,009045 1,705 0,5785 0,005567 2,87 1,1265 -Segundo KU 2 Ord Esfrico -0,01863 1,732 2,124 -0,01045 0,8294 0,392 -Terceiro

So estes os modelos que melhores resultados de Validao Cruzada obtiveram, sendo igualmente os trs com valores mais baixos de RMQ. De destacar ainda um valor

_______________________________________________________________________ Rui Martins, Lus de Sousa

77

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

relativamente alto da MEP no modelo de KU de 2 Ordem com Semivariograma Esfrico, e valores tambm no muito bons de RMQA para os outros dois modelos aqui presentes.
5.5.8 Validao

A Validao, tal como a validao cruzada, fornece uma ideia de como o modelo prev valores para as localizaes desconhecidas. A validao cruzada no demonstra que o modelo de semivariograma correto, meramente que ele no est grosseiramente incorreto[17]. A validao por sua vez fornece uma viso mais apropriada da exactido do modelo. Do conjunto inicial de pontos criam-se dois conjuntos de pontos os quais somados so exactamente o conjunto de pontos inicial. Esses conjuntos de pontos criados designam-se por conjunto de teste e conjunto de treino. De seguida criam-se os modelos desejados utilizando o conjunto de treino. Ao contrrio da validao cruzada, no apenas retirado um ponto mas um conjunto de pontos (conjunto de teste). Para calcular a preciso da estimao comparamse os conjuntos de pontos (teste e treino) e determinam-se os erros provenientes da estimao. Para amostra completa foi feita a validao para os modelos que tinham apresentado melhores resultados na validao cruzada, ou seja, KO com semivariograma combinado, KU com deriva de primeira ordem com semivariograma combinado e KU com deriva de segunda ordem com semivariograma esfrico. Tabela 5.7 Validao para melhores modelos
KO Comb. Erro Mnimo Erro Mximo Mdia do Erro Soma do Erro Desvio Padro 0 45,565 0,601 37910,137 1,589 Melhor KU 1 Comb KU 2 Esf 0 46,739 0,599 37779,538 1,616 Mdio 0 49,917 0,667 42068,418 1,633 Pior

Na validao com a amostra completa foram utilizados para o conjunto de teste 63072 pontos, cerca de 15% do conjunto total de pontos. Os valores apresentados tentam dar alguma estatstica sobre o erro decorrente da validao. Assim verifica-se que o modelo que apresenta um erro mdio menor a KU com deriva de primeira ordem com um valor de 0,598991 metros. O modelo de KU com deriva de segunda ordem esfrico revelou-se o pior modelo apesar de ter tido uma validao cruzada _______________________________________________________________________ Rui Martins, Lus de Sousa 78

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

muito boa. Ao revelar-se o pior modelo nesta fase veio confirmar o facto de na gerao da superfcie ter introduzido zonas onde o erro de estimao foi de cerca de 1000 metros. Onde notrio o pior desempenho deste modelo na soma dos erros de estimao. Com este modelo a soma foi de 42608 metros contra os 37780 metros da Krigagem Universal com deriva de 1 ordem. A validao na Krigagem Ordinria deu um resultado muito semelhante ao melhor modelo, o que vem confirmar mais uma vez que existe uma deriva acentuada nos dados e que deve ser tida em conta na gerao de superfcies.

5.4 Zona Circundante do Monte da Guia


5.4.1 Amostra

O conjunto de dados inicial compreende uma rea bastante extensa, composta por subreas com caractersticas bastante diversas. Algumas destas sub-reas esto claramente pouco caracterizadas, e no so, de todo, o objectivo central do amostragem. Parte-se agora para um exame mais pormenorizado da rea objectivo desta amostragem, a caldeira e zonas circundantes do vulco adormecido do Monte da Guia.

Figura 5.21 Sub-amostra do Monte da Guia O subconjunto obtido com esta seleco de amostras compreende 303040 pontos, cobrindo uma rea com 1200 por 1214 metros de lado, apresentando uma densidade bastante maior de informao conhecida.

_______________________________________________________________________ Rui Martins, Lus de Sousa

79

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica


5.4.2 Descrio univariada e espacial da zona do Monte da Guia

30-09-2002

Na figura 5.22 podemos observar a descrio univariada dos dados na zona do Monte da Guia. Observamos que nos 303040 pontos includos o ponto mximo de altimetria tem 145 metros e o mximo de batimetria tem -145 metros. Os valores de kurtosis e do coeficiente de assimetria (skewness), bem como as outras medidas de variabilidade no sofrem alteraes significativas relativamente ao histograma gerado depois de se introduzirem os pontos de batimetria, altimetria e linha da costa existentes no raster.

Figura 5.22 Histograma da sub-amostra do Monte da Guia Mais uma vez a deriva calcula pela ferramenta de anlise de derivas existente no ESDA, comprova que o fenmeno em estudo apresenta um tendncia na amostragem. As amostras medida que nos afastamos da linha da costa comeam a ser mais profundas. Em particular, forma em U particularmente acentuada pois atravessamos o Monte da Guia.

Figura 5.23 Deriva dos dados na zona do Monte da Guia Os mapas de Voronoi apresentaram algumas mudanas em relao ao conjunto global de amostras. O mapa de Aglomerado volta a identificar a possibilidade de ocorrncia de outliers em terra, desta vez mais demarcadamente. Mas a existirem so pontos com valores muito _______________________________________________________________________ Rui Martins, Lus de Sousa

80

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

longe da mdia, e positivos sendo natural que apresentem este comportamento nos mapas Voronoi. O mapa IQR apresenta um variabilidade bastante diferente da original, tal deve-se existncia, mais uma vez, de pontos com valores muito longe da mdia, quer em terra quer no mar.

Figura 5.24 Mapas Voronoi Aglomerado (esquerda) e IQR (direita) Os outros mapas de Voronoi no apresentaram informao significantemente diferente da encontrada nos mapas do conjunto completo de amostras.
5.4.3 Resultados da Validao Cruzada

Apesar de existirem algumas semelhanas com as caractersticas do conjunto de dados completo, os resultados obtidos para este subconjunto so algo diversos. Em primeiro lugar h a assinalar um aumento do valor RMQ em todos os modelos aplicados. Tal deve-se ao facto de haver amostras com bastante influncia local, como se pde ver nos mapas de Voronoi, e de haver amostras em terra com valores muito distantes dos valores encontrados no grosso das amostras. Depois igualmente de realar o facto de o Semivariograma Esfrico obter melhores resultados para a KU de 1 Ordem do que com a KU de 2, tal como acontecera com o conjunto global. Esta mudana pode se explicar pela deriva que se registou para esta zona, embora semelhante na orientao e forma encontrada para o conjunto completo de dados, menos acentuada. A maioria dos pontos de maior profundidade no se encontram nesta rea, o que aplana a forma da deriva.

_______________________________________________________________________ Rui Martins, Lus de Sousa

81

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica Tabela 5.8 Resultados mais significativos no Monte da Guia
KO Semivariograma Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP Esfrico -0,02561 2,26 2,796 -0,00938 0,7955 0,536 Combin. 0,01033 1,921 0,7135 0,005419 2,557 1,2075 KU 1 Ord. Esfrico 0,003497 1,893 0,8208 -0,000898 2,207 1,0722 -Melhor

30-09-2002

KU 2 Ord Esfrico Combin. -0,01303 1,93 0,9409 -0,02022 2,104 0,9891 -Segundo -0,02476 1,946 1,384 -0,02008 1,391 0,562 -Terceiro

Mantm-se as caractersticas do conjunto completo neste subconjunto, zonas com grande profuso de informao e zonas com esparsa densidade de amostras. As dificuldades mantmse para os Semivariogramas Exponencial e Gaussiano, tal como visto na rea de estudo anterior. Os modelos com a KO continuaram a ter pouco sucesso, salvo mais uma vez no Semivariograma Combinado, nico com o qual a RMQ chega abaixo de 2. O Semivariograma Combinado funciona tambm, desta feita, com a KU de 2 Ordem, e no com a KU de 1 Ordem, ao contrrio do que se passou no conjunto de dados completo. Mais uma vez aparece um modelo que se destaca de certo modo de todos os outros, desta vez a KU de 1 Ordem, que apenas apresenta um valor de RMQA um pouco alto (2,207), mas com excelentes resultados em todos os outros parmetros. Aparentemente d-se, para este subconjunto das amostras, uma troca de posies entre os modelos de KU de 1 Ordem e o de 2 Ordem, deixando todo o resto muito parecido. Antes de se avanar na anlise de resultados necessrio responder a uma questo. Porque razo na amostra completa o modelo com melhores resultados foi com uma deriva de 1 ordem e no Monte da Guia o modelo com melhores resultados foi com uma deriva de 2 ordem? A razo desta mudana exactamente o Monte da Guia. A deriva considerada nos mapas global, isto , no foi considerada a existncia de derivas locais. Quando se faz esta restrio, o que antes era modelado com uma deriva de 1 ordem (devido ao mapa estender-se de uma zona montanhosa a uma zona com alguma profundidade) melhor modelado com uma deriva de 2 ordem, precisamente pela transio ao passar-se a linha da costa (efeito U).

_______________________________________________________________________ Rui Martins, Lus de Sousa

82

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica


5.4.4 Validao

30-09-2002

Nesta experincia foram utilizados 151760 pontos, cerca de 50% dos 303520 pontos includos nesta sub-amostra. Tabela 5.9 Validao para a zona do monte da Guia
KO Esf. Erro Mnimo Erro Mximo Mdia do Erro Soma do Erro Desvio Padro 0 79,742 0,929 141106,438 2,143 KO Comb. 0 70,695 0,753 114341,637 1,983 Melhor KU 1 Esf 0 83,967 0,719 109183,053 2,021 2 melhor KU 2 Esf 0 281,433 0,803 121824,561 2,221 Mau

Numa primeira anlise tabela de Validao da zona do Monte da Guia, o que se verifica que o melhor modelo foi o da KU de 1 ordem seguido pela KO com semivariograma combinado. A KO com semivariograma esfrico e a KU com deriva de 2 ordem mostraram resultados anormais, pelo que foram nesta fase descartados. Apesar de se ter verificado nos teste de Validao Cruzada uma melhor adequao da deriva de 2 ordem para esta sub-amostra, este modelo falha novamente os teste de Validao. Os valores de erro anormais (so estimados valores positivos em zonas onde a profundidade deveria rondar os 100 metros!), so provavelmente gerados por um aumento do nmero de ponderadores negativos. Assim sendo podem ser estimados valores muito para alm dos mximos e mnimos admissveis do ponto de vista do fenmeno fsico[13]. De modo a perceber melhor o que se passa em zonas mais densamente amostradas, partiuse para a anlise de uma rea contendo apenas amostras originais.

5.5 Zona de Amostragem Exaustiva a Leste


5.5.1 Amostra

A primeira seleco de amostras no revelou grandes novidades, apesar de se reportar a uma rea mais estrita. As caractersticas essenciais do conjunto de amostras manteve-se aproximadamente o mesmo, registando-se apenas um ligeiro esbatimento da deriva, o que veio a permitir aos modelos de KU de 1 Ordem obter melhores resultados.

_______________________________________________________________________ Rui Martins, Lus de Sousa

83

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Parte-se agora para a anlise de uma nova sub-amostra, ainda mais reduzida, compreendendo apenas pontos conhecidos originais, numa zona onde a amostragem foi exaustiva. Este conjunto compreende 18853 pontos de leitura, numa rea de 128 por 323 metros de lado, batendo as profundidades a Leste do Monte da Guia.

Figura 5.25 Sub-amostra a Leste do Monte da Guia


5.5.2 Descrio univariada e espacial da zona a leste do Monte da Guia

Nesta experincia foi utilizada uma pequena amostra do conjunto de pontos totais, 18853 pontos. Os seus valores mximo e mnimo so de -2,1939 m e -57,615 m respectivamente, j que esta sub-amostra foi restringida a amostras de profundidade. No entanto apesar de este intervalo entre o valor mximo e mnimo ser relativamente elevado, metade das amostras esto entre os -46,463 m e os -38,417m. As amostras apresentam pois uma mediana de 42,139m e uma mdia muito prxima de -41,973m. O valor de kurtosis de 9,7799 e indica precisamente que esta distribuio pontiaguda relativamente a uma distribuio normal, isto , apresenta um pico de valores e depois decresce muito rapidamente tendo valores muito afastados da mdia. O valor do coeficiente de assimetria (skewness) de 1,6835, isto , justifica o facto de a distribuio apresentar uma assimetria positiva.

_______________________________________________________________________ Rui Martins, Lus de Sousa

84

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 5.26 Histograma do zona leste do Monte da Guia Quanto existncia de derivas claro pelas figuras que se est presente uma deriva em que a modelao mais correcta passa por polinmio de primeiro grau.

Figura 5.27 Deriva dos dados no zona leste do Monte da Guia


5.5.3 Resultados da Validao Cruzada

As primeiras impresses retiradas dos valores de Validao Cruzada mostram mais ligeira subida dos valores da RMQ, mas por contraponto, uma melhor adaptao dos modelos variabilidade das amostras da rea de estudo. Mas o facto mais significativo o sucesso do modelo com Semivariograma Exponencial, face ao modelo com Semivariograma Esfrico. Tabela 5.10 Resultados mais significativos na Zona a Leste
Semivariograma Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP KO Combin. 0,06138 2,274 2,53 0,02432 0,8989 0,256 KU 1 Ord. Esfrico Exponen. 0,01783 2,085 2,388 0,007697 0,875 0,303 -Melhor 0,008738 1,999 2,12 0,004981 0,9487 0,121 -Segundo KU 2Ord. Combin. 0,0349 1,919 2,822 0,0134 0,6852 0,903 -Terceiro

_______________________________________________________________________ Rui Martins, Lus de Sousa

85

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

O Semivariograma Exponencial tm um melhor desempenho em reas onde a amostragem mais exaustiva, tal como apresentado no sub-captulo 5.3.1, o seu sucesso aqui total, apresentando os melhores valores para quase todos os parmetros de Validao Cruzada. Embora o Semivariograma Esfrico no seja to bom, continua a mostrar bons resultados, demonstrando mais uma vez a sua flexibilidade. O mesmo se pode constatar para o Semivariograma Combinado, que consegue at o valore mais baixo de RMQ. Por ltimo, de referir a superioridade dos modelo de KU de 1 Ordem face aos outros. Tal como seria de esperar nem o modelo de KO, nem o modelo de KU de 2 Ordem se adaptam to bem ao tipo de deriva encontrada, que define relativamente bem um plano inclinado de Noroeste para Sudoeste. Como referido no captulo 4, neste tipo de amostragem de esperar que alguns dos mtodos Determinsticos consigam bons resultados, nomeadamente o mtodo de Polinomiais Locais e o RBF. Foram ento usados estes mtodos, e tambm o IDW, para calcular superfcies que se pudessem comparar com as geradas pelos mtodos de Krigagem. Em seguida apresentam-se os resultados de Validao Cruzada para estes modelos. Tabela 5.11 Validao Cruzada para Mtodos Determinsticos
IDW Erro Mdio Raiz da Mdia Quadrada -0,08143 2,083 RBF -0,03817 2,025 Pol. Local -0,00623 1,879

Estes valores so bastante interessantes, em especial para a Polinomial Local, onde a RMQ inferior a qualquer das calculadas para os modelos de Krigagem. O modelo IDW j tem valores menores, como esperado, mas mesmo assim que no esto ao nvel dos valores obtidos para a Krigagem. No entanto as comparaes que se possam fazer entre estes mtodos e os de Krigagem so sempre deficientes dado que a Validao Cruzada d apenas valores de EM e RMQ para os primeiros.

_______________________________________________________________________ Rui Martins, Lus de Sousa

86

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 5.28 RBF (esquerda), Polinomial Local (centro) e KU 1 Ordem (direita) Na figura percebe-se claramente uma evoluo, no sentido da esquerda para a direita, da suavidade da superfcie gerada. No existem, na superfcie gerada pelo mtodo de Krigagem, mudanas bruscas de profundidade, a evoluo dos valores interpolados sempre suave e progressiva, mais prxima do fenmeno fsico real. Fica aqui bem patente a grande diferena entre mtodos Determinsticos e Geoestatsticos.
5.5.4 Validao

Na zona a Leste do Monte da Guia, para fazer os testes de validao foram utilizados 9427 pontos, cerca de 50% dos pontos existentes nesta sub-amostra. Tabela 5.12 Validao para a zona Leste
Semivariograma Erro Mnimo Erro Mximo Mdia do Erro Soma do Erro Desvio Padro KO Comb. 0,001 28,562 1,359 12815,548 2,118 KU 1 Esf 0,001 29,635 1,284 12107,818 1,962 -Melhor KU 1 Exp 0,001 29,157 1,263 11906,844 1,896 -Segundo KU 2 Comb 0,001 36,627 1,131 10660,658 1,652 -Terceiro

Aqui os resultados a que se chegaram no foram de modo algum surpreendentes. Como a zona tem dimenses reduzidas, o grau da deriva tem menos influncia da que atrs da KU de 2 ordem com semivariograma combinado os melhores resultados tenham sido alcanados com KU de 1 ordem. Entre o segundo e terceiro melhores modelos nesta experincia (ambos _______________________________________________________________________ Rui Martins, Lus de Sousa

87

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

com deriva de 1 ordem) o que apresentou melhores resultados foi o que utilizou um semivariograma exponencial, indicado para zonas de intensa amostragem pois apresenta menor efeito de pepita. O modelo que utilizou semivariograma esfrico no ficou muito atrs, o que indica a boa adequabilidade do semivariograma esfrico para a maioria das ocasies. Em ltimo lugar ficou o modelo, KO com semivariograma combinado, que no utiliza qualquer espcie de deriva para a estimao dos pontos. Os diferentes desempenhos alcanados pelos quatro mtodos tambm so claramente visveis nos grficos. medida que o mtodo vai baixando de desempenho as cores nos grficos no se sobrepem tanto.

5.6 Erro de Medio


Trs dos mtodos de Krigagem, ordinrio, simples e universal, permitem a modelao do erro de medio. O erro de medio ocorre quando se tm vrias observaes na mesma localizao e elas diferem. No entanto, quando a varincia da preciso do instrumento documentada pode-se introduzir directamente a variao da medio no ArcGis Geostatistical Analyst. Nos modelos com erro de medio, o efeito de pepita ento modelado como a soma de dois componentes; a micro-estrutura e o erro de medio. A micro-estrutura corresponde ao efeito de pepita a que se chega quando se aplica um modelo de semivariograma. O segundo componente pode ser calculado directamente pelo ArcGis, quando se tem mais do que uma medio para a mesma localizao, ou ento introduzido directamente como uma varincia proveniente do aparelho de medio. Essa varincia menor quanto mais pontiaguda for a distribuio e quanto mais perto estiverem os valores mximo e mnimo da mdia dessa distribuio; o que indica que o desvio de valores em relao mdia pequeno e que o aparelho de medio bastante preciso. Quando no modelado o erro, a krigagem exacta. Quer isto dizer que quando feita uma predio para um local onde tenha sido medido o valor, o resultado ser o mesmo. Falta referir que para cada uma das componentes possvel escolher a percentagem que vo ter para o calculo final do efeito de pepita. No caso de estudo foram detectadas doze localizaes, com a mesma latitude e longitude. Cada uma dessas localizaes apresenta uma segunda leitura para a mesma localizao perfazendo um total de vinte e quatro pontos, como se v na figura 5.29.

_______________________________________________________________________ Rui Martins, Lus de Sousa

88

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 5.29 Conjunto de pontos com igual latitude e longitude Como so muito poucas as leituras que temos para a mesma localizao, a estimao efectuada pelo ArcGis no muito realstica dando uma valor irrisrio na ordem dos nanometros. A moda da Varincia situa-se no intervalo [0,5 0,55], onde se situam os valores para mais de trezentas mil leituras; valores desta ordem so igualmente irrisrios para serem usados como erros de medio. Ao contrrio a mdia da Varincia da ordem de 1023, nmero completamente inadequado para ser usado como erro de medio (este valor esta muito acima de qualquer patamar dos modelos de Semivariograma vistos at aqui). Tal valor de mdia, deve-se a registos muito altos de Varincia, para um conjunto restrito de pontos. Para determinar um valor realstico para o erro de medio fez-se uma anlise da varincia de cada ponto e verificou-se o seguinte: Tabela 5.13 Tratamento da varincia fornecida para amostra completa VARINCIA MXIMA 1000 10000 20000 100000 200000 500000 MDIA DA VARINCIA 5,014262 8,127179 9,415062 11,647405 13,795281 15,931938 NMERO DE PONTOS 518 77 22 9 5 3

Esta tabela foi obtida dando igual valor de Varincia para todos os pontos com valores superiores ao mostrado na coluna da esquerda. Desta forma foi possvel baixar drasticamente _______________________________________________________________________ Rui Martins, Lus de Sousa

89

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

a mdia da Varincia, para os valores que se podem ver na coluna do centro. Na coluna da direita est registado o nmeros de pontos encontrados com varincia superior ao tecto assumido na coluna da esquerda. Com varincias acima de mil ainda se encontra um nmero razovel de pontos, mas acima de cem mil este nmero quase residual. Podem-se considerar estes valores acima de cem mil como meros casos pontuais, para os quais a varincia infinita. Seguindo este raciocnio, pode-se considerar a Varincia Mdia deste conjunto de pontos como estando no intervalo [9,4 11,6], antes do qual se ignoram alguns pontos com varincias no infinitas, e para l do qual a Varincia Mdia comea a comportar pontos de varincia infinita. Neste intervalo optou-se, empiricamente, pelo valor de Varincia Mdia de dez. No entanto de salientar que qualquer outro valor escolhido dentro do intervalo [9,4 11,6] chegaria a resultados muito semelhantes aos apresentados seguidamente.
5.6.1 Amostra Completa

Depois de chegar a um valor de Varincia, com o qual se poderiam obter resultados visveis, foi aplicado este valor nos modelos de Krigagem mais bem sucedidos. A tabela 5.14 mostra as diferenas de Validao Cruzada obtidas para estes modelos, relativamente aos valores sem erro. Tabela 5.14 Validao Cruzada com e sem Erro de Medio na Amostra Completa
Semivariograma KO Combinado Com Erro Sem Erro -0,02693 2,008 3,296 -0,0082 0,6017 1,288 0,00943 1,73 0,7035 0,005621 2,373 1,0265 KU 1 Ord. Comb. Com Erro Sem Erro -0,01664 2,025 3,275 -0,00498 0,614 1,25 0,009045 1,705 0,5785 0,005567 2,87 1,1265

Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP

Claramente se percebe uma evoluo negativa dos valores de Validao Cruzada. Como seria de esperar, o aumento do efeito de pepita faz igualmente aumentar os valores da RMQ, pois vai produzir uma superfcie mais lisa, que no passa exactamente por todos os pontos medidos. H ainda a registar uma melhoria dos valores de RMQA, dando a entender uma melhor modelao da variabilidade, mas esta melhoria resulta em grande parte do grande aumento dos valores da MEP.

_______________________________________________________________________ Rui Martins, Lus de Sousa

90

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica Tabela 5.15 Validao com Erro de Medio na Amostra Total
KO Comb. Sem Erro Erro Mnimo Erro Mximo Mdia do Erro Soma do Erro Desvio Padro 0 45,565 0,601 37910,137 1,589 Com Erro 0 36,507 0,834 52596,393 1,842 KU 1 Comb Sem Erro 0 46,739 0,599 37779,538 1,616 Com Erro

30-09-2002

0 36,835 0,821 51764,867 1,818

Na tabela 5.15 esto os resultados de Validao dos modelos com erro de medio, e o mtodo de Krigagem Universal de 1 ordem com semivariograma combinado continuou a apresentar melhores resultados face Krigagem Ordinria. No entanto com a introduo do erro verificou-se que no existiu melhoria, muito pelo contrrio a soma dos erros de estimao passou de 37780 metros para 51765 metros. Tal deve-se ao facto de o efeito de pepita ter aumentado, o que gera superfcies mais lisas e logo com maior impreciso.
5.6.2 Monte da Guia

Para este conjunto de dados, foram utilizados os mesmos mtodos de anlise da Varincia. Novamente se deparou com alguns pontos de varincia infinita, em condies muito semelhantes s encontradas na Amostra Completa; moda da Varincia muito perto de 0,5; mdia na ordem de 1023, e diferenas irrisrias em pontos com mais de uma medio. Esta semelhana quase total levou escolha do mesmo valor de Varincia Mdia a aplicar como Erro de Medio. Tabela 5.16 - Validao Cruzada com e sem Erro de Medio na zona do Monte da Guia
Semivariograma KO Esfrico Com Erro Sem Erro -0,03048 2,305 3,299 -0,00934 0,6895 0,994 -0,02561 2,26 2,796 -0,00938 0,7955 0,536 KO Combinado Com Erro Sem Erro -0,03413 2,227 3,296 -0,01039 0,6668 1,069 0,01033 1,921 0,7135 0,005419 2,557 1,2075 KU 1 Ord. Comb. Com Erro Sem Erro -0,01876 2,0201 3,293 -0,00564 0,6616 1,2729 0,003497 1,893 0,8208 -0,0009 2,207 1,0722

Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP

_______________________________________________________________________ Rui Martins, Lus de Sousa

91

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

As semelhanas continuam nos resultados de Validao Cruzada, com uma igual subida dos valores de RMQ e MEP, e no caso da KO com Semivariograma Combinado, uma ligeira melhoria de modelao da variabilidade. Na tabela 5.17 so apresentados os resultados de Validao para os modelos com erro de medio do zona do Monte da Guia. Ao se introduzir um erro de dez, o efeito de pepita aumentou, e a consequncia imediata a maior influncia do conjunto total de amostras na estimao de um ponto. O facto de ser modelado com uma deriva de 1 ordem faz com que supere os resultados alcanados com os modelos de Krigagem Ordinria. Tabela 5.17 Validao com Erro de Medio para o Monte da Guia
KO Comb. Sem Erro Erro Mnimo Erro Mximo Mdia do Erro Soma do Erro Desvio Padro 0 70,695 0,753 114341,637 1,983 Com Erro 0 77,426 1,026 155730,236 2,258 KU 1 Esf Sem Erro 0 83,967 0,719 109183,053 2,021 Com Erro 0 84,701 0,998 151458,293 2,226

A introduo do erro de medio continua a gerar resultados piores em toda a linha. Tal como nos modelos usados para a amostra completa, os efeitos de pepita iniciais eram todos muito baixos, pelo que este erro diminui consideravelmente a influncia de medies mais prximas do ponto de estimao.
5.6.3 Zona Leste

Por ltimo foi feita a mesma experincia com o erro para a zona a leste do Monte da Guia e os resultados a que se chegou esto apresentados nas tabelas que se seguem. O erro utilizado foi de 1,125, pois desta feita no foram encontrados pontos de varincia infinita. Este valor a mdia aritmtica das varincias de todos os pontos da sub-amostra da zona Leste.

_______________________________________________________________________ Rui Martins, Lus de Sousa

92

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Tabela 5.18 - Validao Cruzada com e sem Erro de Medio na Zona Leste
Semivariograma KO Combinado Com Erro Sem Erro -0,06118 2,274 2,464 -0,02488 0,9225 0,19 0,06138 2,274 2,53 0,02432 0,8989 0,256 KU 1 Ord. Esfrico Com Erro Sem Erro -0,01737 2,079 2,337 -0,0077 0,8919 0,258 0,01783 2,085 2,388 0,007697 0,875 0,303 KU 1 Ord. Exponen. Com Erro Sem Erro -0,0062 0,008738 1,971 1,915 1,999 2,12

Erro Mdio Raiz da Mdia Quadrada Mdia dos Erros Padro Erro Mdio Aferido RMQ Aferida Diferena RMQ MEP

-0,0045 0,004981 1,038 0,056 0,9487 0,121

Ao contrrio do que de passava nos casos anteriores, o ArcGis fez simplesmente um ajuste ao efeito de pepita quando se introduziu directamente o erro. Nos casos anteriores, onde o erro de dez era superior ao efeito de pepita calculado atravs do modelo do semivariograma, era atribudo dez ao efeito de pepita. Sendo o valor do Erro de Medio bastante baixo, poucas alteraes se verificaram, no entanto em alguns casos registaram-se pequenas melhorias em algubs dos valores de Validao Cruzada. Tabela 5.19 Validao com Erro Medio na zona Leste
KO Comb. Sem Erro Erro Mnimo Erro Mximo Mdia do Erro Soma do Erro Desvio Padro 0,001 28,562 1,359 12815,548 2,118 KU 1 Exp. Sem Erro Erro Mnimo Erro Mximo Mdia do Erro Soma do Erro Desvio Padro 0,001 29,157 1,263 11906,844 1,896 Com Erro 0,001 25,112 1,172 11052,218 1,717 Com Erro 0,001 28,539 1,356 12810,675 2,116 KU 1 Esf Sem Erro 0,001 29,635 1,284 12107,818 1,962 KU 2 Comb. Sem Erro 0,001 36,627 1,131 10660,658 1,652 Com Erro 0,001 23,532 1,184 11163,306 1,668 Com Erro 0,001 27,114 1,254 11822,451 1,892

Os resultados de Validao tambm no apresentam grandes mudanas causadas pela introduo do Erro de Medio. Na KO com semivariograma Combinado, no existem quase

_______________________________________________________________________ Rui Martins, Lus de Sousa

93

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

diferenas; para os modelos de KU de 1 existem melhorias ligeiras ao ser introduzido o erro; enquanto que para a KU de 2 ordem o erro provoca pequenos aumentos dos valores. Em todos os modelos, para os quais foi introduzido erro de medio, no se obtiveram superfcies finais com diferenas visveis. Na zona a Leste do Monte da Guia, as superfcies geradas, so mesmo idnticas, no se observando quaisquer mudanas com a introduo do erro.

5.7 Concluso
Depois de estudados os mtodos a usar na interpolao de superfcies, foram seleccionados a KO e a KU cm derivas de primeira e segunda ordem. A estes mtodos foram aplicados quatro semivariogramas diferentes, Esfrico, Exponencial, Gaussiano e Combinado (dos anteriores trs). Estes diferentes mtodos foram aplicados a trs reas diferentes (todos no mesmo espao de estudo), tendo sido observados resultados distintos em cada uma delas. De forma a apreciar a adequao dos mtodos empregues em cada rea de estudo, foram usadas a Validao Cruzada e a Validao. Atravs da gerao de superfcies conseguiu-se perceber e chegar a alguns resultados, sobre a influncia do efeito de pepita na produo de superfcies. Verificou-se que zonas onde o padro de amostragem mais intenso consegue-se camuflar melhor esse padro utilizando um modelo de semivariograma com um efeito de pepita maior (a superfcie resultante mais polida). Quando o efeito de pepita menor o conjunto total das amostras tem uma influncia menor na gerao da superfcie. No caso de estudo est-se perante uma rea onde existem zonas com um intenso padro de amostragem e zonas onde a amostragem mais dispersa, da que no seja de estranhar que os modelos do semivariograma que apresentaram melhores resultados na validao cruzada, tenham sido aqueles onde se combinaram os modelos com menor e maior efeito de pepita, exponencial e gaussiano respectivamente, juntamente com o modelo esfrico. O modelo esfrico revela-se uma escolha equilibrada, pois como tem um crescimento intermdio consegue gerar melhores superfcies. Este semivariograma revela-se a melhor escolha, quando existe pouca informao sobre a distribuio espacial das amostras, confirmando-se assim a razo de ser o mais usado. Por ltimo resta referir que o semivariograma Combinado gerado

_______________________________________________________________________ Rui Martins, Lus de Sousa

94

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

pelo Geostatistical Analyst obteve resultados satisfatrios em quase todas as situaes, apresentando-se como o mais verstil dos semivariogramas usados. Aps a validao teve-se a confirmao que existe uma deriva e que deve ser considerada, pois o KU de 1 ordem apresentou melhores resultados que a KO. Finalmente de realar que a validao, na rea de trabalho, descartou a KU de 2 ordem comprovando assim que existiam estimaes incorrectas nas superfcies geradas. Na aproximao ao Monte da Guia, os melhores resultados alcanados foram a KO com o modelo de semivariograma combinado e a KU com deriva de 1 ordem esfrica, visto aqui tambm existirem zonas que tm muitas amostras e zonas onde as amostras esto mais dispersas. Assim sendo, na validao, os melhores modelos foram os que conseguem que a influncia das amostras seja intermdia ao longo da rea em estudo. de salientar que novamente a KU de 2 ordem foi o pior interpolador pois apresentou erros muito elevados na estimao. Na zona de amostra intensiva a leste do Monte da Guia, o melhor resultado na validao cruzada foi alcanado com o semivariograma exponencial, que se adequa melhor a zonas onde se deve fazer sentir mais a influncia de amostras na sua vizinhana, precisamente porque tem a tendncia para ter um menor efeito de pepita. O algoritmo de Krigagem que melhor resultados apresentou com este semivariograma foi o KU de 1 ordem, o que prova que existe uma deriva e que deve ser tida em conta. Na validao o melhor resultado foi alcanado com a KU de 2 ordem com semivariograma combinado. Pode-se justificar este resultado devido essencialmente zona de amostragem estar numa vertente, ou seja, uma deriva modelada com um polinmio de 2 grau constitui uma melhor aproximao realidade, sendo por isso o modelo que apresenta um erro mdio menor. Por fim, resta referir o efeito que a introduo do erro teve nestes trs casos de estudo. Nos dois primeiros casos de estudo, rea de trabalho e aproximao zona do Monte da Guia, a introduo do erro piorou os modelos pois o efeito de pepita aumentou diminuindo a influncia de medies mais prximas do ponto de estimao. Deste facto resultam superfcies mais lisas e logo com maior impreciso. Na zona a leste do Monte da Guia s em alguns casos da validao se notaram ligeiras melhorias, muito pouco significativas, e que se devem aos ajustes dos efeitos de pepita nos modelos com a introduo dos erros, feitos pelo ArcGis.

_______________________________________________________________________ Rui Martins, Lus de Sousa

95

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

CAPTULO VI CONCLUSO
6.1 Estudo de Mercado
A primeira parte deste relatrio, onde foi tomada uma deciso de qual o melhor SIG a adoptar, acabou por ser uma parte primordial no desenvolvimento deste TFC. A escolha, que recaiu sobre o ArcGis, revelou-se uma escolha acertada por inmeras razes; o ArcGis possu um leque de ferramentas que possibilitam realizar bastantes operaes em voga nos SIG. Alm disso traz consigo uma enorme quantidade de documentao, que descreve as funcionalidades e bastantes exerccios que se revelaram indispensveis na compreenso de todas essas funcionalidades. Aliada a isto, vem igualmente, toda uma interface de alto nvel e de fcil manuseamento e que se enquadra nas chamadas WYSIWYG. Outro dos factores que contribuiu para o ArcGis deixar de ser uma opo e passar a ser uma escolha foi a sua enorme escalabilidade. possvel percorrer toda a gama de produtos existentes na famlia ArcGis sem nunca ser perceptvel essa mudana, tal como possvel adoptar um sistema de informao persistente, que pode ir de um simples sistemas de ficheiros a uma base de dados com mltiplos utilizadores, acessvel inclusive pela internet. Para chegar a esta escolha, foi feito um estudo do mercado. Chegou-se concluso que o mercado est em expanso e que actualmente liderado pela ESRI . No deixa contudo, de existir uma grande quantidade de empresas de pequenas dimenses que exploram solues especficas para alguns sectores e que se conseguem manter activas nesses nichos de mercado. No entanto a adopo de um SIG, que est em constante evoluo, com uma empresa de pequenas dimenses poder revelar-se uma escolha fatal. O ArcGis adquirido inclui com trs extenses: o 3D Analyst, o Geostatistical Analyst e o Spatial Analyst. Cedo se tornou claro que a ferramenta que iria ser preponderante no trabalho seria o Geostatistical Analyst.

6.2 Interpolao de Superfcies


Para se compreender a melhor maneira de modelar os dados que foram cedidos, no captulo IV, foi apresentado o modelo das funes aleatrias. este modelo que vai guiar o

_______________________________________________________________________ Rui Martins, Lus de Sousa

96

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

processo de estimao ou simulao de valores da varivel, identificada com o atributo em estudo, em zonas no amostradas. O conjunto discreto e limitado de dados interpretado como uma realizao de um conjunto de variveis aleatrias, mais precisamente de uma funo aleatria estacionria. Julgar a hiptese de a funo aleatria ser estacionria em relao ao primeiro momento julgar a mdia das amostras como representativa de toda a rea. A KS impe a todos os pontos estimados uma mdia conhecida e constante, ao

contrrio da KO, no reproduzindo to bem as variaes locais de Z(x), isto , tende a atenuar os valores estimados em torno da mdia conhecida. A KO reproduz bastante melhor as mdias locais e, por este motivo, o algoritmo mais usado na prtica geoestatstica. A verso estacionria da KS usada somente, quando se pretende impor uma mdia global para os valores estimados. Por outro lado, julgar a hiptese de a funo aleatria ser estacionria em relao aos segundos momentos, a covarincia e o semivariograma, decidir que o instrumento usado para medir a continuidade ou variabilidade espacial das amostras, o semivariograma experimental, vlido e representativo de toda a rea coberta pelas amostras[13]. As amostras deixam assim de estar relacionadas por uma mdia constante em toda a rea de trabalho e passam a estar correlacionadas. Ainda neste captulo foram apresentados os interpoladores determinsticos e geoestatsticos. Logo a ficou demonstrado a superioridade destes ltimos pois alm de terem em conta a aproximao aos pontos vizinhos, tm em conta tambm o modo como os pontos vizinhos esto correlacionados. No captulo seguinte procedeu-se gerao de superfcies e a todo o processo de iterao na determinao das melhores superfcies. Foram usados quatro semivariogramas (Esfrico, Exponencial, Gaussiano e Combinado), para trs mtodos de Krigagem (Ordinria, Universal com deriva de 1 ordem e Universal com deriva de 2 ordem). Mais uma vez as ferramentas do ArcGis Geostatiscal Analyst revelaram-se de grande importncia, pois permitiram efectuar a triagem de modo a que se chegasse s melhores superfcies. Como primeiro filtro usou-se a Validao Cruzada, apesar deste mtodo no asseverar exactamente a correco de um modelo, permite identificar modelos errados, para a amostragem em causa. Desta feita a Validao Cruzada permitiu identificar a inadquao dos modelos com semivariograma Gaussiano a todos as amostragens estudadas. Permitiu tambm perceber que o semivariograma Exponencial se enquadra melhor em reas mais densamente amostradas. Ficou nesta fase clara a versatilidade dos semivariogramas Esfrico e Combinado que passaram os testes de Validao Cruzada em todas as diferentes reas de estudo. _______________________________________________________________________ Rui Martins, Lus de Sousa

97

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 6.1 Superfcie final gerada com KO e semivariograma Combinado. Uma segunda filtragem foi efectuada usando a Validao, sendo desta feita identificadas incorreces nos mtodos de Krigagem Universal. Estes mtodos tendem a gerar valores extraordinariamente fora do intervalo de amostragem, em zonas de fraca amostragem. Todos os modelos de Krigagem Universal com deriva de 2 ordem foram aqui descartados, e mesmo com deriva de 1 ordem se encontraram anomalias deste gnero. A identificao destas anomalias permite chegar a duas concluses, primeira, a inadquao da Krigagem Universal a amostragens esparsas, e segunda, a limitao, j enunciada da Validao Cruzada. Ficou aqui patente que a Validao Cruzada no avalia por si s, a qualidade das superfcies geradas. por isso imperioso usar, em qualquer processo geoestatstico semelhante, os testes de Validao, mesmo sendo estes muito mais morosos.

_______________________________________________________________________ Rui Martins, Lus de Sousa

98

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 6.2 - Superfcie final gerada com KU 1 ordem e semivariograma Combinado. Os melhores resultados na rea de trabalho completa foram alcanados com a KO e com a KU com deriva de 1 ordem. Ambos os modelos utilizaram semivariogramas combinados, que tendem a simular melhor o facto de existirem zonas com grande intensidade de amostragem e zonas onde a amostragem mais dispersa. Na KU, a deriva, isto , a tendncia que os dados mostram, revelou que este caso de estudo, ser modelada mais correctamente com um polinmio de 1 grau. Na zona do Monte da Guia, os melhores modelos produzidos foram alcanados com a Krigagem Ordinria e semivariograma Combinado e com a Krigagem Universal com deriva de 1 ordem e semivariograma Esfrico. As caractersticas desta amostragem revelaram-se bastante semelhantes amostragem completa, com a Krigagem Universal de 2 ordem a ser mais uma vez descartada pela existncia de valores interpolados anmalos.

_______________________________________________________________________ Rui Martins, Lus de Sousa

99

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 6.3 Monte da Guia gerado com KO e semivariograma Combinado.

Figura 6.4 Monte da Guia gerado com KU 1 ordem e semivariograma Esfrico. Na zona de amostragem intensiva a Leste do Monte da Guia encontraram-se condies algo diversas dos conjuntos de amostras anteriores. As anomalias provocadas pelo mtodo de Krigagem Universal foram bastante menores, obtendo este mtodo bons resultados com _______________________________________________________________________ Rui Martins, Lus de Sousa 100

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

deriva de 1 ordem e semivariograma Exponencial, e com deriva de 2 ordem e semivariograma Combinado. Novamente a Krigagem Ordinria com semivariograma Combinado apresentou bons resultados. O aumento da intensidade de amostragem permitiu aos mtodos que anteriormente falharam obter aqui os melhores resultados, sendo de destacar os sucessos do semivariograma Exponencial e da deriva de 2 ordem, que apenas se registaram nestas condies.

Figura 6.5 Resultados na zona a Leste do Monte da Guia Depois da triagem terminada de destacar o sucesso, em todos os diferentes conjuntos de amostras, da Krigagem Ordinria com semivariograma Combinado. Este o mais verstil de todos modelos, tendo bons desempenhos em condies, quer de grande, quer de fraca intensidade de amostragem. O semivariograma Combinado tinha sido j identificado como tal, dado combinar da melhor maneira as caractersticas dos semivariogramas Exponencial e Gaussiano. A versatilidade do mtodo de Krigagem Ordinria vem do facto de ser considerada a deriva apenas numa vizinhana limitada, que se vai adaptando, ao longo da rea de interpolao, s caractersticas dessa mesma vizinhana.

_______________________________________________________________________ Rui Martins, Lus de Sousa 101

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

Figura 6.6 TIN gerado com KO e semivariograma Combinado Por ltimo, foram gerados os melhores modelos para cada conjunto de amostras, considerando um erro de medio com base na varincia registada para cada amostra. Como seria de esperar, a introduo do erro permitiu aplainar as superfcies geradas, mas com o custo de resultados piores quer de Validao quer de Validao Cruzada. Na zona a Leste do Monte da Guia a introduo do erro teve resultados diferentes, no se registando um impacto negativo na qualidade dos modelos, mas as melhorias observadas foram diminutas.

Figura 6.7 TIN do Monte da Guia gerado com KO e semivariograma Combinado

_______________________________________________________________________ Rui Martins, Lus de Sousa 102

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

6.3 Trabalho Futuro


Pode-se concluir que os objetivos traados no incio deste estudo foram alcanados, no entanto muitas questes foram levantadas, que podem ser desenvolvidas. Primeiramente podem-se referir os tectos de definio alcanados nas reas de estudo maiores, na zona do Monte da Guia, as superfcies finais apresentam uma clula de aproximadamente 1,2 metros de lado; na rea total as superfcies finais tm uma clula de 1,7 metros. Estes tectos existem no s pelo tempo que necessrio ao calculo da superfcie (cerca de 12 horas nos piores casos), como na quantidade de memria virtual necessria. Para resolues maiores pode-se facilmente esgotar a memria virtual da mquina usada, bem como chegar a estados onde no possvel ter toda a memria virtual mapeada na memria RAM da mquina. Neste caso a interpolao pode gerar acessos ininterruptos ao disco rgido. Ser interessante estudar a gerarao das superfcies finais em mquinas diferentes da usada.

Figura 6.8 TIN gerado com KU de 1 ordem e semivariograma Combinado A questo mais importante levantada foi o falhano da Krigagem Universal com deriva de 2 ordem nas reas de amostragem maiores. Especialmente na zona envolvente do Monte da Guia seria de esperar que este modelo obtivesse os melhores modelos, dado existir um ponto de altitude dominante. Mas este mtodo gerou aqui valores anmalos, muito para alm do admitido. Estes anomalias esto documentadas nos manuais de Geoestatstica, e praticamente incapacita a Krigagem Universal para conjuntos de amostras mais esparsos. Mais grave ainda _______________________________________________________________________ Rui Martins, Lus de Sousa 103

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

o facto de no estudo do fundo dos oceanos a informao ser quase sempre pouco abrangente devido sua extenso. pois pertinente o estudo aprofundado de formas de contornar esta incapacidade da Krigagem Universal. A representao digital da elevao em terra, estudada ha bastante tempo, tendo sido uma das primeiras reas de interesse no mundo dos SIG. Nos dias de hoje, com o auxlio de tcnicas como a Fotografia Area, poucas sero as reas terrestres no documentadas digitalmente. Mas para o fundo do Mar, passa-se quase o oposto. Primeiro, s recentemente se tornou possvel registar informao no Mar, como se faz em terra com fotografia area, e s recorrendo a satlites. Depois h o facto de existirem ainda reas considerveis de fundo dos oceanos por explorar, e acerca dos quais a informao muito escassa, ou mesmo inexistente. Por estas razes o estudo de formas de representar e guardar informao do fundo dos oceanos poder estar ainda nos primeiros passos.

_______________________________________________________________________ Rui Martins, Lus de Sousa 104

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

ANEXO A

BREVE HISTRIA DOS SIG

A histria dos SIG comea com as primeiras tentativas de representar o mundo num mapa, inicialmente em placas de barro que seriam posteriormente cozidas. Da se evoluiu para os mapas em papiro e mais tarde em papel. Entretanto foram ficando na Histria nomes como Erathotenes (raio da Terra sec. II A.C.), Ptolomeu (mapa Mediterrneo sec. II D.C.), at chegada da era das descobertas. Nos sculos XV e XVI, sucedem uma srie de inovaes que culminam no Atlas de Mercator, considerado como o pai da Cartografia Moderna. No sculo XVIII novas informaes so recolhidas um pouco por todo Mundo, as viagens martimas de investigao levadas a cabo por Cook, a explorao do continente Americano nas colnias que vo tornando independentes, e as primeiras exploraes do corao do continente Africano. No sculo seguinte, do-se uma nova srie de progressos, impulsionados pela disseminao dos Caminhos de Ferro, tanto na Europa como na Amrica. No final deste sculo fundada a National Geografic Society, e so produzidos os primeiros mapas com informao demogrfica em nveis de cor, em 1890 fundada a International Business Machines Cooporation (IBM). No incio do sculo XX comeam a ser usados mapas no estudos das cincias sociais, apoiando reas como a Educao e Economia. Ainda antes da Primeira Guerra Mundial comea a ser usada a tcnica de Fotografia Area, originalmente de bales ou dirigveis, viria a permitir a produo dos primeiros Fotomosaicos. Depois de 1918 d-se a primeira grande revoluo automvel, a sua rpida implantao leva ao aparecimento dos primeiros mapas de estradas. Durante a Segunda Guerra Mundial criado o Colossus, considerado o primeiro computador da Histria, totalmente mecnico, em 1946 fica pronto o ENIAC o primeiro computador elctrico. Em 1949 inventado o primeiro transstor, na dcada de cinquenta dse a primeira fase de miniaturizao electrnica e aparecem os primeiros dispositivos de digitalizao. _______________________________________________________________________ Rui Martins, Lus de Sousa 105

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

No incio da dcada de sessenta, ao se deparar com grandes dificuldades em lidar com o crescente volume informao geogrfica disponvel, e necessitando de tomar decises acerca da gesto de recursos naturais, o Governo do Canad inicia um processo que vai levar ao desenvolvimento de um conjunto de programas informticos para compilar toda esta informao. Este considerado o primeiro Sistema de Informao Geogrfica (SIG), e levou criao do Canada Geographic Information Systems. Comeam a ser desenvolvidos uma srie de aplicaes de gesto de recursos e de modelao de fenmenos fsicos, ainda nesta dcada aparecem os primeiros programas de desenho assistido por computador. Nos anos setenta comea a implantar-se a rea de investigao SIG, aparecem as primeiras grandes companhias como a ESRI e ERDAS, so lanados vrios programas de investigao em conjunto com Universidades nos Estados Unidos e so levadas a cabo as primeiras conferncias de SIG. Em 1982 posto venda o primeiro SIG comercial o ARC/INFO 1.0, em 1986 este programa passa a estar disponvel para computadores pessoais, em 1987 saem para o mercado o SPANS e o IDRISI. Em 1992 est venda o ArcView 1.0, os SIG comeam a estar abertos a pessoas sem formao SIG. Quatro anos depois aparece o ArvView 2.0, entra-se em definitivo no poca dos Desktop Mappers, proliferam inmeras empresas especializadas em SIG, em especial nos Estados Unidos. Por esta altura os SIG de maior dimenso j possuem sistemas de gesto de base de dados prprios. Em 1999 os SIG comeam a tornar-se sistemas distribudos, funcionando com bases de dados centralizados a que se ligam inmeras estaes de trabalho. No incio do sculo XXI, os SIG tomam a internet como suporte de trabalho. Aparecem inmeros sites informativos, e so disponibilizadas bases de dados com mapas detalhados de todo o planeta. Esto a ser desenvolvidos projectos no sentido de aproveitar a tecnologia UMTS, para a criao uma nova gerao de SIG prontos a serem usados para qualquer tarefa onde quer que se esteja.

_______________________________________________________________________ Rui Martins, Lus de Sousa 106

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

ANEXO B SEMIVARIOGRAMAS
B.1 rea de Trabalho Completa
Nas figuras que se seguem os Semivariogramas Combinado, Exponencial, Gaussiano e Esfrico, so apresentados pela mesma ordem, de cima para baixo e da direita para esquerda.
B.1.1 Krigagem Ordinria

Figura B.1 Semivariogramas usados com KO na rea de trabalho completa. Tabela B.1 Parmetros dos Semivariogramas de KO na rea de trabalho completa REA DE TRABALHO Semivariograma Semivariograma Semivariograma Esfrico Exponencial Gaussiano 0.020056 0.020056 0.020056 0.0095428 0.011081 0.0076693 223.85 224.49 204.02 8.5899 0 34.768 Semivariograma Combinado 0.019207 0.019207 0 0.23304

Maior Alcance Menor Alcance Patamar Efeito Pepita

_______________________________________________________________________ Rui Martins, Lus de Sousa 107

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica


B.1.2 Krigagem Universal com deriva de 1 ordem

30-09-2002

Figura B.2 Semivariogramas usados com Krigagem Universal com deriva de 1 ordem.

Tabela B.2 Parmetros dos Semivariogramas de KU com deriva de 1 ordem. REA DE TRABALHO Semivariograma Semivariograma Semivariograma Esfrico Exponencial Gaussiano 0.010306 0.010306 0.0097127 0.0074095 0.0089625 0.0052593 133.95 127.56 119.43 0 0 15.385 Semivariograma Combinado 0.0098703 0.0098703 0 0.13562

Maior Alcance Menor Alcance Patamar Efeito Pepita

_______________________________________________________________________ Rui Martins, Lus de Sousa 108

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica


B.1.3 Krigagem Universal com deriva de 2 ordem

30-09-2002

Figura B.3 Semivariogramas usados com Krigagem Universal com deriva de 2 ordem.

Tabela B.3 - Parmetros dos Semivariogramas de KU com deriva de 2 ordem. Semivariograma Esfrico 0.0074085 0.0043351 59.933 3.3551 REA DE TRABALHO Semivariograma Semivariograma Exponencial Gaussiano 0.0074085 0.0074085 0.0063232 0.0033424 63.55 54.144 0 10.685 Semivariograma Combinado 0.0037369 0.001813 20.992 0.062849

Maior Alcance Menor Alcance Patamar Efeito Pepita

_______________________________________________________________________ Rui Martins, Lus de Sousa 109

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

B.2 Zona do Monte da Guia


B.2.1 Krigagem Ordinria

Figura B.4 Semivariogramas usados com KO na rea do Monte da Guia.

Tabela B.4 Parmetros dos Semivariogramas de Krigagem Ordinria. ZONA DO MONTE DA GUIA Semivariograma Semivariograma Semivariograma Esfrico Exponencial Gaussiano 0.017384 0.017384 0.017384 0.0084002 0.0096678 0.0065841 237.15 232.37 220.73 7.0924 0 31.887 Semivariograma Combinado 0.016648 0.016648 0 0.24218

Maior Alcance Menor Alcance Patamar Efeito Pepita

_______________________________________________________________________ Rui Martins, Lus de Sousa 110

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica


B.2.2 Krigagem Universal de 1 Ordem

30-09-2002

Figura B.5 Semivariogramas da KU com deriva de 1 ordem na zona do Monte da Guia.

Tabela B.5 Parmetros dos Semivariogramas da KU com deriva de 1 ordem. ZONA DO MONTE DA GUIA Semivariograma Semivariograma Semivariograma Esfrico Exponencial Gaussiano 0.0074069 0.0074069 0.0074069 0.00609 0.0070905 0.0042725 117.52 110.42 111.11 0.44582 0 12.591 Semivariograma Combinado 0.0070934 0.0070934 0 0.11914

Maior Alcance Menor Alcance Patamar Efeito Pepita

_______________________________________________________________________ Rui Martins, Lus de Sousa 111

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica


B.2.3 Krigagem Universal com deriva de 2 ordem

30-09-2002

Figura B.6 Semivariogramas da KU com deriva de 2 ordem na zona do Monte da Guia.

Tabela B.6 Parmetros Semivariogramas da KU com deriva de 2 ordem. ZONA DO MONTE DA GUIA Semivariograma Semivariograma Semivariograma Esfrico Exponencial Gaussiano 0.0028607 0.0028607 0.0022594 0.0023854 0.0028607 0.0018525 39.0323 37.805 34.547 0.49078 0 4.5651 Semivariograma Combinado 0.0028607 0.0028607 27.425 1.4184

Maior Alcance Menor Alcance Patamar Efeito Pepita

_______________________________________________________________________ Rui Martins, Lus de Sousa 112

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

B.3 Zona a Leste do Monte da Guia


B.3.1 Krigagem Ordinria

Figura B.7 Semivariogramas da Krigagem Ordinria da zona a Leste do Monte da Guia.

Tabela B.7 Parmetros dos Semivariogramas da Krigagem Ordinria. ZONA A LESTE DO MONTE DA GUIA Semivariograma Semivariograma Semivariograma Esfrico Exponencial Gaussiano 319.24 319.24 319.24 245.34 319.24 219.98 60.239 56.723 60.65 0 0 6.0902 Semivariograma Combinado 305.74 305.74 0 6.0902

Maior Alcance Menor Alcance Patamar Efeito Pepita

_______________________________________________________________________ Rui Martins, Lus de Sousa 113

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica


B.3.1 Krigagem Universal com deriva de 1 ordem

30-09-2002

Figura B.8 Semivariogramas da Krigagem Universal com deriva de 1 ordem.

Tabela B.8 Parmetros Semivariogramas da KU com deriva de 1 ordem. ZONA A LESTE DO MONTE DA GUIA Semivariograma Semivariograma Semivariograma Esfrico Exponencial Gaussiano 133.06 133.06 133.06 111.14 97.473 98.681 7.8781 9.144 8.2389 5.236 3.8914 5.773 Semivariograma Combinado 133.06 98.681 8.2389 5.773

Maior Alcance Menor Alcance Patamar Efeito Pepita

_______________________________________________________________________ Rui Martins, Lus de Sousa 114

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica


B.3.3 Krigagem Universal com deriva de 2 ordem

30-09-2002

Figura B.9 Semivariogramas da Krigagem Universal com deriva de 2 ordem.

Tabela B.9 Parmetros dos Semivariogramas da KU com deriva de 2 ordem. ZONA A LESTE DO MONTE DA GUIA Semivariograma Semivariograma Semivariograma Exponencial Gaussiano Esfrico 27.522 27.522 27.522 4.2299 4.2299 4.2299 0.38251 0.65663 0.41985 6.1571 6.395 Semivariograma Combinado 26.357 26.357 0 6.395

Maior Alcance Menor Alcance Patamar Efeito Pepita

_______________________________________________________________________ Rui Martins, Lus de Sousa 115

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

ANEXO C DERIVAS

C.1 rea de Trabalho Completa

Figura C.1 Derivas usadas nos modelos da amostragem completa

C.2 Zona do Monte da Guia

Figura C.2 Derivas usadas nos modelos da zona do Monte da Guia

_______________________________________________________________________ Rui Martins, Lus de Sousa 116

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

C.3 Zona a Leste do Monte da Guia

Figura C.3 Derivas usadas nos modelos da zona a Leste do Monte da Guia

_______________________________________________________________________ Rui Martins, Lus de Sousa 117

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

REFERNCIAS
[1] Kenneth E. Foote e Margaret Lynch. The Geographer's Craft Project, Department of Geography, The University of Colorado at Boulder. Geographic Information Systems as an Integrating Technology: Context, Concepts, and Definitions, 1995. [2] R. Chorley Handling Geographic Information. Report to the Committee of Enquiry, chaired by Lord Chorley HM Stationary Office publication, 1987. [3] Clarke, K. C. Analytical and Computer Cartography, Prentice-Hall, Englewood Cliffs, NJ, 1990. [4] http://www.cesga.es/ [5] David Cowen. NCGIA Notional Conference for Geographical Information Analysis, International Journal of Geographic Information Systems, pp117-136, 1989. [6] 1994 International GIS Sourcebook, GIS World, Inc., Fort Collins, CO., 1994. [7] http://www.daratech.com [8] The Geospatial Technology Report 2001 -GITA [9] Joe Francica, A review of the Geospatial Technology Report 2001 by GITA, Directions Magazine, 16 de Janeiro 2002. [10] C. A. Felgueiras, A. V. Monteiro, E. G. Camargo, G. C. Neto e S. D. Fuks. Integrating Geostatistical Tools in Geographical Information Systems. Em I Brazilian Workshop on GeoInformatics GEO-INFO, Outubro 1999. [11] Kevin Johnston, Jay M. Ver Hoef, Konstantin Krivoruchko, Neil Lucas. Using ArcGis Geostatistical Analyst, ESRI, 2001. [12] ArcGIS Geostatistical Analyst: Statistical Tools for Data Exploration, Modeling, and Advanced Surface Generation. An ESRI White Paper, ESRI, Redlands, CA, Agosto 2001. [13] Amlcar Soares, Geoestatstica para as cincias da terra e do ambiente. Coleco ensino da cincia e da tecnologia, IST Press, Lisboa, 2000. [14] P. Goovaerts, Geostatistic for natural resources evaluation. Oxford University Press, New York, 1997.

_______________________________________________________________________ Rui Martins, Lus de Sousa 118

Sistemas de Informao Geogrfica para aplicaes de Robtica Oceanogrfica

30-09-2002

[15] J. P. Chils e P. Delfiner, Geostatistics. Modeling Spatial Uncertainty. Wiley Series in Probability and Statistics. Wiley Interscience Publication, 1999. [16] A .J. Sousa. e F. Muge, Elementos de geoestatstica. Laboratrio de Mineralugia e Planeamento Mineiro, Instituto Superior Tcnico, Universidade Tcnica de Lisboa, 1990. [17] N. Cressie, The Origins of Kriging. Journal Mathematical Geology 22, pp. 239 252, 1990. [18] Jos Mata, Economia da Empresa, Fundao Caloueste Gulbenkian, Lisboa, 2000. [19] Paul A. Samuelson e William D. Nordhaus, Economia, McGraw Hill, Amadora, 1999. [20] Pat Halpin e outros, http://www.env.duke.edu/landscape, Landscape Ecology Lab Janeiro 2002.

Alguns dos stios consultados na internet que contriburam para o desenvolvimento deste trabalho: http://www.gis.com http://www.marinegis.com http://www.gisportal.com http://www.opengis.org http://www.cesga.es http://www.usgs.gov http://www.esri.com http://www.pcigeomatics.com http://www.clarklabs.org http://www3.baylor.edu/grass http://www.intergraph.com http://www.manifold.net http://www.gepower.com

_______________________________________________________________________ Rui Martins, Lus de Sousa 119